ИИ врет вам в 30% случаев — и это лучший результат!

158
6
ИИ врет вам в 30% случаев — и это лучший результат!

Новое исследование Google FACTS показало, что современные ИИ-чат-боты часто ошибаются в фактах. Даже лучшая модель, Gemini 3 Pro, дала лишь 69% верных ответов в тестах на достоверность. ChatGPT-5, Claude 4.5 и другие показали результат 51–62%.

Каждый третий ответ таких систем может содержать ошибку, причем боты выдают их с большой уверенностью. Хуже всего ИИ справляется с анализом графиков и изображений — там точность падает ниже 50%.

Исследование подчеркивает: текущие тесты ИИ проверяют умение выполнить задачу, а не истинность ответов. Это означает, что информацию от ботов необходимо перепроверять, особенно в серьезных вопросах. Однако такая проверка может отнять больше времени, чем самостоятельный поиск решения.

ИИ врет вам в 30% случаев — и это лучший результат!
Другие публикации по теме
Copilot не нужен, родной: Microsoft осознала, что ее нейросеть пользуется низким спросом
Copilot не нужен, родной: Microsoft осознала, что ее нейросеть пользуется низким спросом
Microsoft сократила планы по продажам ИИ-продуктов на 50% из-за низкого спроса. Несмотря на лидерство ChatGPT, ни один из флагманских ИИ-инструментов, включая Copilot, пока не приносит прибыли.
Вчера в 14:30
993
13
Форум
Runway представила ИИ-модель для создания реалистичных виртуальных миров
Runway представила ИИ-модель для создания реалистичных виртуальных миров
Runway представила модель GWM-1 для создания интерактивных 3D-симуляций в реальном времени, а также обновила Gen 4.5 возможностями редактирования видео и генерации звука.
13 декабря в 21:00
804
0
Форум
OpenAI начала глубокое тестирование проверки возраста в ChatGPT — всё ради виртуального секса с нейросетью
OpenAI начала глубокое тестирование проверки возраста в ChatGPT — всё ради виртуального секса с нейросетью
OpenAI тестирует систему определения возраста для ChatGPT, чтобы в будущем снять часть ограничений для взрослых пользователей. Обновление ожидается в 2026 году.
13 декабря в 13:30
875
9
Форум