NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады

4949
9
NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады

Расследование Proof News и Wired показало, что богатейшие компании в мире в лице Apple, NVIDIA и многих других использовали 173 000 видео с YouTube для тренировки своих искусственных интеллектов. При этом информация о таком использовании видео компаниями вроде NVIDIA, Apple и Salesforce является официальной.

NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады

Пак использованных видео называется The Pile, имеет размер в 800 Гб и содержит в себе подготовленные для обучения ИИ данные, которые собраны за счет YouTube-видео компанией EleutherAI для, как заявляется, "рядовых кодеров". Вместе с этим стало известно и об использовании тренировочных данных YouTube Subtitles, которые содержат 173 536 текстовых транскрипций для различных видео. При этом в данном наборе есть более 12 000 давно удаленных с YouTube файлов.

Среди попавших в тренировочные данные видео значится 1862 видео Crash Course, 146 видео Philosophy Tube, 2 видео MrBeast, 337 видео Pewdiepie, 7 видео Marques Brownlee и 90 видео Linus Tech Tips. Некоторые авторы уже успели негативно высказаться о произошедшем. С помощью инструмента по ссылке можно проверить попало ли какое-либо видео в тренировочные данные.

При этом, как заявляется, оба этих пака тренировочных данных нарушают правила пользования YouTube. Кто именно во всем виноват? Никто не признается, и все показывают пальцами друг на друга. Apple и NVIDIA не виноваты потому, что данные собирали не они, а сами сборщики данных на претензии отвечать отказываются.

Другие публикации по теме
ЕС запускает собственную сеть спутниковой связи IRIS2
ЕС запускает собственную сеть спутниковой связи IRIS2
Европейский союз начал реализацию амбициозного проекта по созданию независимой системы спутниковой связи. Запущено развёртывание сети IRIS2 — европейской альтернативы американской системе Starlink от SpaceX. Первые спутники уже вышли на орбиту и функционируют, однако на данном этапе их эксплуатация ограничена.
3 февраля в 16:40
170
0
Форум
SpaceX открыла доступ к системе Stargaze для контроля космической обстановки
SpaceX открыла доступ к системе Stargaze для контроля космической обстановки
Компания SpaceX объявила о предоставлении доступа к системе Stargaze — инновационной платформе для мониторинга околоземного космического пространства. Система отслеживает объекты на орбите и предупреждает операторов спутников о потенциальных столкновениях. Уже этой весной данные о сближениях станут доступны всем заинтересованным сторонам на безвозмездной основе.
2 февраля в 18:20
195
0
Форум
Эпштейна просили похитить Алину Рин, когда она была в Японии
Эпштейна просили похитить Алину Рин, когда она была в Японии
В ходе изучения архивных документов по делу Джеффри Эпштейна была обнаружена тревожная деталь, касающаяся известной российской стримерши Алины Рин.
2 февраля в 10:24
6576
29
Форум