КРАСНЫЙ ЖЕЛТЫЙ ЗЕЛЕНЫЙ СИНИЙ
 Архив | Страны | Персоны | Каталог | Новости | Дискуссии | Анекдоты | Контакты | PDARSS  
 | ЦентрАзия | Афганистан | Казахстан | Кыргызстан | Таджикистан | Туркменистан | Узбекистан |
ЦентрАзия
  Новости и события
| 
Понедельник, 19.06.2023
22:56  В батискафе у "Титаника" похоже склеил ласты британский олигарх Хардинг
21:30  Минюст РФ сообщил о невозможности признать "Ельцин Центр" иноагентом. И смех... и грех
21:26  На хрена кыргызам Моргенштерн? - Канат Кожоев
20:53  Единая валюта для стран БРИКС должна быть цифровой
20:47  Узбекистан договорился с Россией о покупке 2,8 млрд кубометров газа в год
20:46  Казахстанский футболист впервые догнал по стоимости самого дорогого узбекского игрока
20:28  Китай запустил первую климатическую суперстанцию в Центральной Азии
20:19  Вода довела Афганистан до вооруженного столкновения с Ираном, - НГ
20:09  Белый дом предложил Тегерану сделку за спиной Кремля, - Игорь Субботин
19:33  Израильские танки пойдут на Украину: жертвы Холокоста помогают наследникам своих мучителей, - МК
19:31  Возле "Титаника" пропала подлодка с амер-туристами. Гиблое место
19:23  Вне-возрастная узб-гимнастка Оксана Чусовитина завоевала "серебро" на ЧА
19:19  Мирзиеев в Тегеране подписал 16 важных документов
19:05  Международный арбитраж отклонил иск российского МТС к Туркменистану
19:03  За казнь кошки через аутодафе трех ферганских идиотов оштрафовали на 3 БРВ
19:00  Мышка за репку, репка - за дедку... В КазМинэкологии полный раздрай и срач в руководстве
18:57  Провал украинского контр-наступа уже всем очевиден, - Юрий Борисов
16:07  Еще один город может появиться в Кыргызстане - Шамалды-Сай
16:05  Си немножко испек Блинкена, - "Синьхуа"
15:14  Украина является главным мировым тупиком, в котором решается судьба американской власти, - С.Вуячич
14:46  Якобы по протесту жителей Конаева казвласти запретили концерт Лепса. Симпатизируют Украине
14:07  Митрополит Александр подарил Токаеву впервые изданный на казахском языке христианский молитвослов. Оно ему надо?
13:08  КырСудом отпущен вице-премьер Разаков. Не крал $1,2 млн
12:01  КырГКНБ задержан замминистра энергетики Жакыпов. Крал уголь
11:58  Страшно жить: в Канаде резко выросло количество операций по эвтаназии
06:55  История казахов и как ее переписывали. Новая книга Данияра Ашимбаева
06:44  ЦентрАзия продолжает решать энергетические проблемы за счет Москвы, - Виктория Панфилова
06:41  Токаев обнаружил основы государственности в мудрости ханов и биев, - НГ
00:58  Гуантанамо по-европейски. В тюремных камерах мучают даже высокопоставленных политиков, - Игорь Веремеев
00:50  От управленческих импотентов – к коалиционному правительству, - каздепутат Смирнова
00:23  Современный либерализм как отрицание мечты человечества, - Михаил Магид
00:19  Вашингтон исчерпал лимит на эскалацию, - Михаил Макаров
00:15  Блинкен в Китае: Что ищет он в краю далеком? - СП
00:12  Коллапс ИИ: чем грозит самообучение на искусственных данных
Воскресенье, 18.06.2023
21:37  В Туркменистане 29 июня откроют город Аркадаг
21:09  КырЦИК окончательно аннулировал результаты довыборов в Парламент по Ленинскому округу Бишкека
15:39  Они хотят повернуть эволюцию вспять. 12 целей мировой элиты, - Андрей Фурсов
15:30  Пробитый как дуршлаг "Леопард" поставили в фойе Петербургского эконом-форума. И это правильно, - А.Проханов
15:24  Депутат сейма Литвы Жемайтайтис обвинил евреев в "холокосте литовцев"
14:51  Акылбек Камалдинов - новый посол Казахстана в Хорватии, Нургали Арыстанов - в Южной Корее
14:38  Названа деликатная миссия визита Блинкена в Китай: "Придержать компромат на Байдена"
14:27  "Неразумно выстраивать внешнюю политику России, опираясь на мифических братушек", - И.Шумейко
13:42  Псих захватил заложников в отделении Астанинского банка
13:01  Как Принц Саудовской Аравии обвел США вокруг пальца
12:56  В Казахстане запущена Большая Алматинская кольцевая платная автомобильная дорога
12:48  В Ташкенте представлена книга "Любовь, дружба, вечность Усто Мумина"
11:30  Герман-президент Штайнмайер летит в Казахстан. Крепить "стратегическое партнерство"
11:22  Зачем (кому) Путин достал текст секретного и вполне себе предательского "договора" с Украиной от марта 22 года?
08:31  Как преодолеть водный дефицит в Центральной Азии? - Вл.Прохватилов
08:28  Не ссать! НАТО "сорвалось с цепи"? и готова к войне с Россией? - Владимир Овчинский
08:19  Блинкен все-таки долетел до Пекина, Дележка Тайваня продолжается
07:43  Глава Укрразведки Буданов скорее мертв, чем жив
00:38  Современные т.н. "элиты общества" - это сущее дерьмо, - Михаил Синельников-Оришак
Суббота, 17.06.2023
21:49  Токаев принял "важное решение" - восстановить три ранее упраздненных района
21:39  Путин вспомнил о каком-то проекте договора Абрамовича и К с Украиной
20:01  "Полезное" беззаконие: США не оставляют в покое Латинскую Америку, - Сергей Кожемякин
13:39  "Язык массовой коммуникации и информационная война", - новая книга военных лингвистов
12:26  Экс-директор сети кыргызско-турецких лицеев "Сапат" Орхан Инанды приговорен к 21 году лишения свободы
12:16  Найден и вернулся в Казахстан Коран, подаренный Кенесары хану Маралом ишаном
11:51  "Я знаю, что у народа есть претензии к работе госаппарата", - Токаев на курултае увлекся самокритикой
08:48  Российские железнодорожники готовы помочь в строительстве Трансафганской дороги... из ниоткуда в никуда
Архив
  © CentrAsiaВверх  
    ЦентрАзия   | 
Коллапс ИИ: чем грозит самообучение на искусственных данных
00:12 19.06.2023

Что случится, если нейросети начнут обучаться на данных, которые они же и сгенерировали? Одно из возможных последствий - скорая деградация моделей ИИ

РБК Тренды приводят перевод статьи The AI feedback loop: Researchers warn of "model collapse" as AI trains on AI-generated content, опубликованной на сайте издания VentureBeat.

ИИ в замешательстве

Создание контента при помощи нейросетей уже стало массовой практикой - так, половина сотрудников McKinsey применяют в своей работе инструменты генеративного ИИ, и эта тенденция только усиливается. Сегодня основная часть исходных данных, на которых обучаются нейросети, в основном создана людьми - это книги, статьи, фотографии и так далее. Но что произойдет, когда ИИ начнет обучаться на контенте, сгенерированном другим ИИ?

Группа исследователей из Великобритании и Канады опубликовала статью, в которой рассматривается именно этот вопрос. Их выводы неутешительны: использование для обучения ИИ данных, сгенерированных другими ИИ, приводит к необратимым дефектам в результирующих моделях.

Исследователи обратили особое внимание на вероятностные распределения для текстовых и генеративных моделей ИИ, генерирующих изображения. Выяснилось, что обучение на данных, произведенных другими моделями, вызывает "коллапс моделей" - дегенеративный процесс, при котором со временем модели забывают истинное распределение исходных данных. И происходит это довольно быстро.

Постепенно ошибки в сгенерированных данных накапливаются, в результате чего модели, обучающиеся на таких данных, начинают еще больше искажать реальность. Это приводит к тому, что они все больше ошибаются в своих ответах и генерируемом контенте, а также производят все меньше неповторяющегося, непротиворечивого контента.

"Аналогично тому, как мы заполнили океаны пластиковым мусором и атмосферу углекислым газом, мы собираемся заполнить Интернет бессмысленной болтовней. Это усложнит обучение новых моделей путем парсинга веб-сайтов, давая преимущество компаниям, которые уже это сделали, или которые контролируют доступ к человеческим интерфейсам", - заявил один из авторов статьи, профессор безопасности инженерии в Кембриджском университете и Университете Эдинбурга Росс Андерсон.

Почему происходит коллапс

Проблему деградации качества ИИ можно сравнить с увеличением артефактов при многократном копировании изображения в формате JPEG. В качестве другой аналогии можно привести комедию 1996 года "Множество", в которой главный герой клонирует себя, а затем клонирует клонов, что приводит к экспоненциальному снижению уровня интеллекта у каждого нового клона

Коллапс моделей происходит, когда данные, сгенерированные моделями ИИ, загрязняют тренировочный набор для последующих моделей. "Оригинальные антропогенные данные лучше отражают реальный мир, поскольку содержат, в том числе, неправдоподобную информацию, - объяснил Илья Шумайлов, один из авторов работы, - генеративные модели, однако, имеют тенденцию к переобучению на популярных данных и часто неправильно понимают или интерпретируют менее популярные".

Если модель обучается на дата-сете c 10 изображениями синих котов и 90 желтых, ИИ запоминает, что желтые коты преобладают и показывает даже синих котов желтоватыми, а на запрос о новых данных выдает зеленых котов. С последующими циклами синий и вовсе заменяется зеленоватым, затем переходя в желтый.

"Загрязнение" данными, сгенерированными ИИ, приводит к искажению восприятия реальности моделями. Даже когда исследователи обучали модели не создавать слишком много повторяющихся ответов, они обнаружили, что коллапс все равно происходит, поскольку ИИ начинает выдавать ошибочные ответы, чтобы избежать частого повторения данных.

Как решить проблему

Исследователи выделили два пути, которые позволяют избежать коллапса модели.

Первый - сохранение оригинального дата-сета, полностью или в основном созданного людьми, и предотвращение его смешивания с данными от ИИ. В этом случае модель можно периодически переобучать на этих данных или полностью обновлять с их использованием. Второй путь, который может уберечь от деградации в качестве ответов и сократить количество ошибок - повторное введение в обучение ИИ нового очищенного антропогенного дата-сета.

Исследователи отмечают, что это потребует создания некого механизма массовой маркировки или же усилий со стороны создателей контента или ИИ-компаний, которые позволят разделить данные от людей и машин. Также важно обеспечить справедливое представление менее популярной информации в датасете как с точки зрения количества, так качества и точного описания характеристик. Это серьезный вызов, поскольку модели сложно обучать на редких событиях.

Источник - РБК Тренды
Постоянный адрес статьи - https://centrasia.org/newsA.php?st=1687122720


Новости Казахстана
- Рабочий график главы государства
- Спикер Сената встретился с Председателем ОБСЕ – Министром иностранных дел Финляндии
- Третье заседание Совета межпарламентского сотрудничества Казахстана и Кыргызстана прошло в Астане
- Год рабочих профессий: Олжас Бектенов обозначил приоритетные задачи по обеспечению безопасных условий труда на производстве
- Комфортное и безопасное пребывание туристов - в Правительстве рассмотрели меры по исполнению поручений Президента
- Как сформировалась токаевская "гвардия"
- Олжас Бектенов принял участие в IV Ташкентском инвестиционном форуме
- Главы МИД Казахстана и Финляндии подтвердили курс на конструктивное взаимодействие и укрепление двустороннего партнерства и сотрудничества в ОБСЕ
- В Астане обсудили развитие двусторонней кооперации между Казахстаном и Ираном в аграрной сфере
- Осужден руководитель отдела городского Управления занятости и социальных программ
 Перейти на версию с фреймами
  © CentrAsiaВверх