Технологии

LongCat 2.0 обошла GPT-5.5 в программировании без чипов Nvidia

Susan Hill

LongCat 2.0 — модель с 1,6 триллиона параметров, контекстным окном в миллион токенов, обогнавшая GPT-5.5 от OpenAI на главном бенчмарке по реальной разработке программного обеспечения. Её создала Meituan — компания, которую за пределами Китая знают, если вообще знают, как приложение для доставки еды.

Модель набрала 59,5 балла на SWE-bench Pro против 58,6 у GPT-5.5. Разрыв выглядит небольшим, но контекст этого достижения — вот что по-настоящему впечатляет. Meituan обучила LongCat 2.0 на более чем 50 000 отечественных китайских ИИ-ускорителей, без какого-либо оборудования Nvidia, которое Китай не может импортировать в значительных объёмах с 2022 года. Производитель чипов официально не раскрывается, однако техническое сообщество указывает на Huawei Ascend 910B. Если это подтвердится, будет первый случай, когда модель, обученная на чипах Huawei, достигает рубежных показателей в открытых верифицированных бенчмарках.

LongCat 2.0 построена на архитектуре Mixture-of-Experts: при каждом запросе активируется лишь от 33 до 56 миллиардов параметров, что обеспечивает быстрый инференс без требований к профессиональному железу. Контекстное окно в миллион токенов позволяет загрузить целую кодовую базу за одну сессию. На SWE-bench Multilingual модель получила 77,3 балла; на Terminal-Bench, оценивающем навигацию в реальной среде Unix, — 70,8.

До официального релиза модель несколько месяцев работала на OpenRouter под псевдонимом «Owl Alpha». Разработчики, которые её использовали, замечали необычные способности к программированию, не зная об её происхождении. Meituan подтвердила после релиза, что Owl Alpha — это ранняя версия LongCat 2.0.

Лицензия MIT описывает только часть картины. Несмотря на то что это одна из самых открытых и коммерчески разрешительных лицензий, веса модели пока не опубликованы. Репозиторий на GitHub и карточка на Hugging Face сообщают «скоро». Сейчас LongCat 2.0 доступна только через облачный API: загрузка, дообучение и локальный запуск невозможны.

Meituan ежедневно обрабатывает более 50 миллионов заказов на еду и разработала внутреннюю языковую модель Zhichi до выхода в открытый рынок. LongCat 2.0 — первая публичная модель компании и, судя по результатам бенчмарков, одна из наиболее мощных систем программирования под открытой лицензией.

Когда веса будут опубликованы, LongCat 2.0 вступит в прямое сравнение с Llama 4.1 от Meta и DeepSeek-V4 Pro. Вопрос о том, какие отечественные чипы позволили добиться этих результатов, будет иметь значение далеко за пределами ИИ-сообщества.

Теги: , , , , ,

Обсуждение

Имеется 0 комментариев.