Китай добивает западную ИИ-индустрию: появилась нейросеть "мощнее DeepSeek" 21:22 29.01.2025
Alibaba представила свою модель ИИ Qwen 2.5 Max после триумфа DeepSeek
Евгений АРСЮХИН
29 января 2025
На днях Китай потряс мир, выпустив нейросеть DeepSeek. Мощь нового продукта и то, что его создали за копейки (12 миллионов долларов против сотен миллионов у американских конкурентов) произвели наимрачнейшее впечатление на Силиконовую долину. Вниз полетели акции западных ИИ-компаний, например, производитель чипов Nvidia потерял одномоментно 600 миллиардов долларов. Но беда (для Запада) не приходит одна. В первый день китайского нового года крупный ИИ-игрок Alibaba презентовал нейросеть Qwen 2.5 Max, и она еще мощнее. С такими темпами лидерство Китая становится неоспоримым.
НЕ С ЧИСТОГО ЛИСТА
Alibaba – это в Китае, как Open AI в США, компания давно и успешно создает сетки. Весной прошлого года на технологический горизонт Поднебесной ворвалась новая (создана в 2023-м) компания DeepSeek. На Западе появление первой версии их нейросети не заметили (а теперь кусают локти). А вот в Китае она нашумела. В той же Alibaba созывали совещания и антикризисные штабы. Молодежь нас обходит!
И вот новый поворот. Сеть от Alibaba рвет внутренний рынок, а вместе с DeepSeek они прямо-таки разделывают под орех рынок международный.
QWEN 2.5 MAX: ЧТО ЭТО ТАКОЕ
Продукт от Alibaba обошел DeepSeek во всех тестах (бенчмарках), на которых обычно испытывают возможности нейросети. Сеть оказалась лучше в точности ответов, скорости обработки данных и в адаптивности. Что немудрено: учили ее на совесть.
На самом деле создатели нейросетей давно соревнуются именно в обучении. Если верить американской Open AI, это очень дорого и долго. Так, на обучение следующего поколения GPT, GPT5, Open AI планирует потратить миллиард. Компании приобретают целые электростанции, чтобы запитывать центры обучения. А воровство контента где угодно (в Сети, в социальных сетях, даже в персональных данных) давно стало предметом споров и разбирательств. Но контент остро нужен, ведь ИИ требуются примеры, чтобы изучить жизнь людей.
DeepSeek потому стала великой нейросетью, что умудрилась обучиться всего за 5,5 миллионов долларов (впрочем, говорят, что в сумму не включили некоторые расходы; все равно дешево), а получилось в общем-то неплохо. Нейросеть точно не хуже GPT4, а обошлась в сотни раз дешевле.
Qwen учили не на минималках. В нее закачали 20 триллионов единиц информации (токенов), но дополнительно задействовали методологии тонкой настройки (SFT), а также обратную связь с человеком (RLHF), то есть применили самые современные приемы. Это не будет так быстро, как с DeepSeek, но это будет лучше. Неудивительно, что Qwen превзошла и существующие американские аналоги.
Alibaba не утверждает, что обучила сеть за копейки. Но дает понять: не так дорого, как американцы. Компания подробно рассказала, как именно учили. Что больше всего поразило экспертов в этом рассказе – оптимизация на каждом этапе. В результате для обучения (и потом для работы) требуется минимум вычислительных мощностей.
КАК ПОЛЬЗОВАТЬСЯ QWEN 2.5 MAX
Сообщается, что Qwen в состоянии однократно переварить 1 миллион единиц информации. Это все равно, как если бы вы могли в моменте, дословно, держать в голове 10 романов объема "Властелина колец". Эксперты пишут, что это переломный момент в развитии ИИ. Большинство нейросетей едва в состоянии помнить 120 тыс. единиц информации.
Разработчики уже кинулись тестировать: сетка доступна для экспериментов по свободной лицензии.
Хотя у Qwen, как и у DeepSeek, есть чат, и с нейронкой можно поболтать (после регистрации), главным образом Qwen – это набор инструментов, из которых продвинутые пользователи могут ваять решения под себя, например, создавать картинки, анализировать компьютерные коды, решать инженерные и научные задачи, и так далее.
Собственно, так работает и тот GPT, который мы знаем. Вы наверняка обращались за помощью к GPT, но где вы ее нашли? Явно не сами скачали, а, например, в телеграме, на каком-то сайте. Это значит: кто-то купил доступ к основной системе, адаптировал и теперь предлагает воспользоваться рядовым юзерам. Его интерес – как правило, реклама, которая вставляется в тг-канал или на сайт, или авторские права на созданные ИИ картинки-тексты.
Отзывов от российских пользователей пока немного, на Западе новинка понравилась.
ПРЕКРАСНЫЙ НОВЫЙ МИР
Выход DeepSeek удостоился внимания президента США: Дональд Трамп сказал, что мировая конкуренция усиливается, и американским компаниям нужно еще поднажать, чтобы опередить.
Команда Трампа рассматривает ИИ-технологии крайне серьезно. Там понимают: владеющий мощным ИИ владеет современным миром. ИИ в руках твоего врага раскрывает все твои секреты, как на ладони. Не говоря о том, что мощный ИИ – это быстрая разработка нового лекарства, техники, оружия.
Что может сделать Америка? Эксперты сходятся на том, что американские компании оказались не в лучшей ситуации. Во-первых, они были первопроходцами, и потратили кучу денег на то, что сейчас "очевидно". Это как с сотовой связью: первые телефоны и тарифы дороги. Во-вторых, большие компании уже обросли жирком и потеряли темп. Колоссальные траты на зарплаты и необязательные проекты, приоритет управленца над инженером – все как всегда.
Сможет ли Запад выставить когорту молодых, злых старапов и ввязаться в гонку с новыми силами? Скорее всего да, но им придется пройти через кризис.
Так или иначе, 2025-й в самом деле становится годом ИИ, но вовсе не потому, что Open AI выпускает некую потрясающую основы нейросеть. Все намного интереснее.
|