DeepSeek сможет работать с меньшим потреблением памяти

101
0
DeepSeek сможет работать с меньшим потреблением памяти

Китайская лаборатория DeepSeek, стоящая за одними из самых эффективных открытых ИИ-моделей, представила технологию под названием Engram. Этот новый модуль «условной памяти» призван решить фундаментальную проблему современных нейросетей — их зависимость от дорогой видеопамяти графических процессоров. Технология уже доступна в виде открытого кода на GitHub и, по слухам, станет основой для будущей модели DeepSeek V4.

Суть Engram заключается в структурном разделении вычислительной логики и накопленных фактов. Традиционные модели тратят огромные ресурсы на то, чтобы "вычислить" простые данные, заложенные в их параметрах. Engram же работает как сверхбыстрая справочная библиотека: вместо того чтобы заново восстанавливать статичные паттерны, модель мгновенно извлекает их из таблицы поиска. Это освобождает основные слои нейросети для выполнения действительно сложных задач по рассуждению и анализу.

Для индустрии это означает возможность тренировать и запускать гигантские модели на гораздо более скромном и доступном железе. В будущем это может привести к созданию ИИ-ассистентов, которые идеально помнят контекст разговоров месячной давности и обладают энциклопедическими знаниями, не требуя при этом целых ферм из топовых GPU.

Другие публикации по теме
В суд за воровство нейрокартинки — в Японии решили защитить авторским правом ИИ-изображение
В суд за воровство нейрокартинки — в Японии решили защитить авторским правом ИИ-изображение
Полиция префектуры Тиба в Японии 20 ноября приняла решение о передаче дела в суд в отношении 27-летнего мужчины. Он подозревается в нарушении закона об авторском праве, используя изображение, созданное с помощью ИИ
24 ноября 2025
608
2
Форум
Крупнейший сервис по продаже иллюстраций и манги для взрослых начал бороться с ИИ-контентом
Крупнейший сервис по продаже иллюстраций и манги для взрослых начал бороться с ИИ-контентом
Fanza Doujin, онлайн-сервис, продающий иллюстрации и мангу для взрослых, недавно объявил о введении более строгих мер по ограничению количества работ, созданных с помощью ИИ, распространяемых на платформе
13 ноября 2025
657
1
Форум
Tencent показала ИИ Hunyuan-GameCraft для интерактивных игровых видео — его натаскали на сотне ААА-проектов
Tencent показала ИИ Hunyuan-GameCraft для интерактивных игровых видео — его натаскали на сотне ААА-проектов
Развитие генеративных ИИ продолжается, и Tencent не осталась в стороне: китайский гигант представил модель Hunyuan-GameCraft, предназначенную для создания интерактивных игровых видео.
25 июня 2025
1889
1
Форум