ИИ при длительном общении с человеком тупеет

467
10
ИИ при длительном общении с человеком тупеет

Исследование Microsoft Research и Salesforce подтвердило, что при длительном общении языковые модели склонны к деградации. Аналитики изучили более 200 тысяч диалогов с участием GPT-4.1, Gemini 2.5 Pro, Claude 3.7 Sonnet, o3, DeepSeek R1 и Llama 4. Выяснилось, что при одиночных запросах точность ответов достигает 90%, но в многоходовых беседах падает до 65%.

Причина — так называемая «преждевременная генерация»: модели пытаются ответить, не дочитав сообщение до конца. В длинном диалоге ошибки накапливаются, а бот начинает опираться на собственные предыдущие ответы, даже если те были абсурдны. Также зафиксирован эффект «раздувания»: к концу разговора сообщения становятся длиннее на 20–300%, и чем больше слов, тем выше вероятность галлюцинаций. Модели с дополнительными токенами мышления вроде o3 и DeepSeek R1 также не справились с ловушкой.

Исследователи предупреждают: при детализации задач в долгой беседе велик риск принять за факты то, что нейросеть выдумала несколькими репликами ранее.

Другие публикации по теме
KRAFTON использует ИИ для создания "живых" NPC в своих играх
KRAFTON использует ИИ для создания "живых" NPC в своих играх
Южнокорейский разработчик и издатель KRAFTON объявил о назначении Канвука Ли на должность Chief AI Officer. Ли работает в компании с 2022 года — до повышения он занимал пост главы подразделения KRAFTON AI. Назначение подчёркивает курс компании на активное развитие исследований и разработок в области искусственного интеллекта.
Вчера в 19:10
410
0
Форум
Anthropic обвиняет китайские компании в масштабных атаках на ИИ‑модель Claude
Anthropic обвиняет китайские компании в масштабных атаках на ИИ‑модель Claude
Компания Anthropic выступила с заявлением, в котором обвинила три китайские организации — DeepSeek, Moonshot и MiniMax — в проведении масштабных атак на свою ИИ‑модель Claude. По версии компании, целью злоумышленников было незаконное извлечение возможностей модели для обучения собственных систем.
Вчера в 18:30
232
3
Форум
Новый интерфейс Chrome: Gemini поселился в Chrome слева и научился рисовать в браузере
Новый интерфейс Chrome: Gemini поселился в Chrome слева и научился рисовать в браузере
Google продолжает агрессивно внедрять ИИ в свои продукты: в версии Chrome 145 пользователи обнаружили не просто косметическое обновление, а совершенно новый интерфейс взаимодействия с Gemini.
23 февраля в 11:45
2079
2
Форум