ИИ врет вам в 30% случаев — и это лучший результат!

Сегодня в 14:15

158

ИИ врет вам в 30% случаев — и это лучший результат!

Новое исследование Google FACTS показало, что современные ИИ-чат-боты часто ошибаются в фактах. Даже лучшая модель, Gemini 3 Pro, дала лишь 69% верных ответов в тестах на достоверность. ChatGPT-5, Claude 4.5 и другие показали результат 51–62%.

Каждый третий ответ таких систем может содержать ошибку, причем боты выдают их с большой уверенностью. Хуже всего ИИ справляется с анализом графиков и изображений — там точность падает ниже 50%.

Исследование подчеркивает: текущие тесты ИИ проверяют умение выполнить задачу, а не истинность ответов. Это означает, что информацию от ботов необходимо перепроверять, особенно в серьезных вопросах. Однако такая проверка может отнять больше времени, чем самостоятельный поиск решения.

Другие публикации по теме

Copilot не нужен, родной: Microsoft осознала, что ее нейросеть пользуется низким спросом

Microsoft сократила планы по продажам ИИ-продуктов на 50% из-за низкого спроса. Несмотря на лидерство ChatGPT, ни один из флагманских ИИ-инструментов, включая Copilot, пока не приносит прибыли.

Вчера в 14:30

993

Форум

Runway представила ИИ-модель для создания реалистичных виртуальных миров

Runway представила модель GWM-1 для создания интерактивных 3D-симуляций в реальном времени, а также обновила Gen 4.5 возможностями редактирования видео и генерации звука.

13 декабря в 21:00

804

Форум

OpenAI начала глубокое тестирование проверки возраста в ChatGPT — всё ради виртуального секса с нейросетью

OpenAI тестирует систему определения возраста для ChatGPT, чтобы в будущем снять часть ограничений для взрослых пользователей. Обновление ожидается в 2026 году.

13 декабря в 13:30

875

Форум