DeepSeek готовится составить конкуренцию ИИ гигантам с моделью V4

Технология mHC может обойти GPT и Claude

230
1
DeepSeek готовится составить конкуренцию ИИ гигантам с моделью V4

Китайская компания DeepSeek анонсировала скорый релиз новой языковой модели V4, которая, по инсайдерским данным, способна превзойти решения OpenAI и Anthropic в задачах программирования. Как сообщает The Information со ссылкой на источники внутри компании, официальный запуск запланирован на середину февраля 2026 года — ориентировочно 17 февраля, в период празднования китайского Нового года.

Ключевая особенность V4 — выдающиеся способности в обработке кода, особенно при работе с очень длинными промптами. По результатам внутренних тестов DeepSeek, новая модель превосходит Claude от Anthropic и серию GPT от OpenAI в задачах программирования. Чтобы стать лидером в этой области, V4 должна превзойти текущий рекорд Claude Opus 4.5 в бенчмарке SWE‑bench Verified, где модель Anthropic демонстрирует результат 80,9%.

По данным источников, прорыв может быть обеспечен за счёт технологии Manifold‑Constrained Hyper‑Connections (mHC), описанной в недавней исследовательской работе DeepSeek от 1 января 2026 года. Метод решает фундаментальную проблему масштабирования больших языковых моделей: как расширять архитектуру без потери стабильности при обучении. В отличие от предшествующей концепции Hyper‑Connections (HC) от ByteDance, mHC добавляет математические ограничения на перераспределение информации между слоями нейросети. Благодаря этому удаётся сохранять стабильность обучения даже при значительном увеличении числа слоёв, предотвращать взрывы градиентов и эффективно масштабировать модель без пропорционального роста требований к вычислительным ресурсам.

Вэй Сунь (Wei Sun), главный аналитик по ИИ в Counterpoint Research, назвала mHC «поразительным прорывом», который позволяет DeepSeek «обходить ограничения вычислительных мощностей и совершать скачки в интеллекте» даже в условиях американских экспортных ограничений на поставку передовых чипов.

DeepSeek уже демонстрировала впечатляющие результаты с предыдущими релизами. В декабре 2024 года модель V3 показала 90,2% на бенчмарке MATH‑500, значительно превзойдя результат Claude, который составил 78,3%. В январе 2025 года модель R1 обошла решение o1 от OpenAI по бенчмаркам математики и рассуждений. Примечательно, что разработка R1 обошлась компании всего в $6 млн — в 68 раз дешевле, чем у конкурентов.

На данный момент DeepSeek официально не подтвердила информацию о превосходстве V4 над конкурентами, а публичные бенчмарки ещё не опубликованы. Однако ожидания вокруг релиза высоки: если заявленные характеристики подтвердятся, модель может стать серьёзным игроком на глобальном рынке ИИ.

Другие публикации по теме
OpenAI собирает новый датасет из работ подрядчиков — есть риски утечки конфиденциальных данных
OpenAI собирает новый датасет из работ подрядчиков — есть риски утечки конфиденциальных данных
По информации издания Wired, компания OpenAI нашла ещё один способ пополнять набор данных для обучения своих ИИ‑систем. Как сообщают источники, компания начала собирать датасет на основе задач, которые подрядчики выполняли в рамках других проектов.
Вчера в 18:45
271
0
Форум
Запрещенная в России Meta делает ставку на атомную энергию для питания ИИ: зарезервированы огромные мощности
Запрещенная в России Meta делает ставку на атомную энергию для питания ИИ: зарезервированы огромные мощности
Meta заказала 6,6 ГВт атомной энергии у Vistra, TerraPower и Oklo для питания своих ИИ-систем к 2035 году, став крупнейшим корпоративным покупателем в США.
10 января в 13:30
1453
7
Форум
Samsung усиливает Bixby за счёт интеграции с передовыми ИИ‑моделями
Samsung усиливает Bixby за счёт интеграции с передовыми ИИ‑моделями
Вместо того чтобы кардинально перерабатывать Bixby на собственной технологической базе, Samsung выбрала стратегию, во многом перекликающуюся с подходом Apple. Компания подключила к своему голосовому ассистенту мощные большие языковые модели (LLM) от внешних разработчиков — в частности, от Perplexity и DeepSeek.
9 января в 19:30
143
0
Форум