Китайська технологічна компанія Alibaba представила оновлену версію своєї моделі штучного інтелекту Qwen 2.5-Max, яка, за словами розробників, перевершує DeepSeek-V3.
Реліз нової версії штучного інтелекту від Alibaba відбувся 29 січня, у перший день китайського Нового року, повідомляє Reuters. Це свідчить про конкурентний тиск, який DeepSeek створив для китайських технологічних гігантів з початку року. За заявами Alibaba Cloud, Qwen 2.5-Max перевершує OpenAI GPT-4o, DeepSeek-V3 та Llama-3.1-405B від Meta за більшістю показників.
Запуск DeepSeek-V3 (10 січня) та DeepSeek-R1 (20 січня) викликав шок у Кремнієвій долині. Він спричинив обвал технологічних акцій і змусив інвесторів переглядати великі витрати на розробку штучного інтелекту. Водночас конкуренція між китайськими ШІ-компаніями загострюється. Одразу після запуску DeepSeek-R1, ByteDance оновила свою флагманську модель, заявивши, що вона перевершує OpenAI o1 у тестах AIME.
Попередня версія DeepSeek-V2, випущена у травні 2024 року, була відкритою та рекордно дешевою — лише 1 юань ($0,14) за 1 мільйон токенів. Це змусило Alibaba Cloud знизити ціни на свій штучний інтелект на 97%, а також вплинуло на такі компанії, як Baidu та Tencent. Засновник DeepSeek Лян Веньфен заявляв, що його компанія не зважає на цінові війни, адже її головна мета – досягнення AGI (штучного загального інтелекту).
На відміну від Alibaba, яка має сотні тисяч працівників, DeepSeek працює як дослідницька лабораторія, залучаючи молодих випускників топових китайських університетів. Лян Веньфен критикує підхід великих корпорацій до розвитку ШІ: «Створення фундаментальних моделей потребує постійних інновацій. Техногіганти мають свої обмеження».