Alibaba бросила вызов DeepSeek, выпустив новую модель ИИ

Фото: Pexels
Китайская технологическая компания Alibaba выпустила новую версию своей модели искусственного интеллекта Qwen 2.5-Max, которая, по ее заявлению, превосходит разработку DeepSeek-V3.
Интересно, что релиз состоялся в первый день празднования Китайского Нового года, когда большинство жителей страны отдыхают. Это может свидетельствовать о давлении, которое вызвал стремительный успех DeepSeek за последние три недели, заставляя Alibaba и других китайских разработчиков ускорять обновление своих моделей, передает Reuters.
По данным облачного подразделения Alibaba, модель Qwen 2.5-Max "почти по всем показателям" превосходит GPT-4o, DeepSeek-V3 и Llama-3.1-405B — самые современные модели от OpenAI и Meta.
В последнее время китайский стартап DeepSeek вызвал ажиотаж в мире технологий. Его модель DeepSeek-V3, представленная 10 января, а также выпущенная 20 января R1, всколыхнули рынок и вызвали беспокойство в Кремниевой долине. Инвесторы начали сомневаться в необходимости многомиллиардных вложений в разработку искусственного интеллекта, поскольку DeepSeek предлагает значительно более дешевые решения.
На фоне успеха DeepSeek конкуренты пытаются улучшить собственные модели. ByteDance, владелец TikTok, всего через два дня после запуска DeepSeek-R1 выпустила обновление к своей флагманской модели искусственного интеллекта. По словам компании, ее модель превзошла OpenAI o1 в тесте AIME, который оценивает способность ИИ выполнять сложные задачи.
Ранее, в мае 2023 года, DeepSeek выпустила DeepSeek-V2, что стало причиной ценовой войны в Китае. Благодаря открытому коду и беспрецедентно низкой стоимости — всего 1 юань ($0,14) за 1 млн токенов — другие китайские компании, включая Alibaba, Baidu и Tencent, были вынуждены значительно снизить цены на свои модели.
Основатель DeepSeek Лян Вэньфэн в редком интервью китайскому медиа Waves в июле заявил, что компания не занимается ценовыми войнами, поскольку ее основная цель — достижение AGI (искусственного общего интеллекта). В отличие от технологических гигантов с их сложными управленческими структурами, DeepSeek работает как исследовательская лаборатория с небольшой командой молодых выпускников и докторантов.
Лян также отметил, что крупные корпорации могут быть не лучшими игроками в будущем развитии искусственного интеллекта, ведь их расходы высоки, а инновации имеют ограничения.
Подготовил: Сергей Дага