NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады

4923
9
NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады

Расследование Proof News и Wired показало, что богатейшие компании в мире в лице Apple, NVIDIA и многих других использовали 173 000 видео с YouTube для тренировки своих искусственных интеллектов. При этом информация о таком использовании видео компаниями вроде NVIDIA, Apple и Salesforce является официальной.

NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады

Пак использованных видео называется The Pile, имеет размер в 800 Гб и содержит в себе подготовленные для обучения ИИ данные, которые собраны за счет YouTube-видео компанией EleutherAI для, как заявляется, "рядовых кодеров". Вместе с этим стало известно и об использовании тренировочных данных YouTube Subtitles, которые содержат 173 536 текстовых транскрипций для различных видео. При этом в данном наборе есть более 12 000 давно удаленных с YouTube файлов.

Среди попавших в тренировочные данные видео значится 1862 видео Crash Course, 146 видео Philosophy Tube, 2 видео MrBeast, 337 видео Pewdiepie, 7 видео Marques Brownlee и 90 видео Linus Tech Tips. Некоторые авторы уже успели негативно высказаться о произошедшем. С помощью инструмента по ссылке можно проверить попало ли какое-либо видео в тренировочные данные.

При этом, как заявляется, оба этих пака тренировочных данных нарушают правила пользования YouTube. Кто именно во всем виноват? Никто не признается, и все показывают пальцами друг на друга. Apple и NVIDIA не виноваты потому, что данные собирали не они, а сами сборщики данных на претензии отвечать отказываются.

Другие публикации по теме
За вас всё решили: теперь заходить на «Госуслуги» возможно только через мессенджер MAX — SMS больше не приходят
За вас всё решили: теперь заходить на «Госуслуги» возможно только через мессенджер MAX — SMS больше не приходят
Вход на «Госуслуги» теперь требует мессенджера MAX для безопасности. SMS-коды уходят в прошлое, но пока есть возможность обойти это требование.
Вчера в 12:51
1124
26
Форум
LEGO опубликовала статистику достижений за 30 лет, но она вызвала много вопросов и сомнений
LEGO опубликовала статистику достижений за 30 лет, но она вызвала много вопросов и сомнений
Официальный список ключевых игр LEGO за 30 лет вызвал споры. Компания назвала LEGO City Undercover (2013) первой игрой с открытым миром, игнорируя LEGO Batman 2 (2012) с той же чертой и полной озвучкой, что многие считают несправедливым.
5 декабря в 14:05
362
1
Форум
Snapchat — в бан! РКН последние два дня натурально лютует
Snapchat — в бан! РКН последние два дня натурально лютует
Роскомнадзор заблокировал Snapchat, обвинив его в использовании для планирования терроризма. Позже были ограничены также FaceTime и детская платформа Roblox.
5 декабря в 12:35
826
12
Форум