NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады

4923
9
NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады

Расследование Proof News и Wired показало, что богатейшие компании в мире в лице Apple, NVIDIA и многих других использовали 173 000 видео с YouTube для тренировки своих искусственных интеллектов. При этом информация о таком использовании видео компаниями вроде NVIDIA, Apple и Salesforce является официальной.

NVIDIA и Apple тренировали свои ИИ на видео с YouTube — авторы этому не рады

Пак использованных видео называется The Pile, имеет размер в 800 Гб и содержит в себе подготовленные для обучения ИИ данные, которые собраны за счет YouTube-видео компанией EleutherAI для, как заявляется, "рядовых кодеров". Вместе с этим стало известно и об использовании тренировочных данных YouTube Subtitles, которые содержат 173 536 текстовых транскрипций для различных видео. При этом в данном наборе есть более 12 000 давно удаленных с YouTube файлов.

Среди попавших в тренировочные данные видео значится 1862 видео Crash Course, 146 видео Philosophy Tube, 2 видео MrBeast, 337 видео Pewdiepie, 7 видео Marques Brownlee и 90 видео Linus Tech Tips. Некоторые авторы уже успели негативно высказаться о произошедшем. С помощью инструмента по ссылке можно проверить попало ли какое-либо видео в тренировочные данные.

При этом, как заявляется, оба этих пака тренировочных данных нарушают правила пользования YouTube. Кто именно во всем виноват? Никто не признается, и все показывают пальцами друг на друга. Apple и NVIDIA не виноваты потому, что данные собирали не они, а сами сборщики данных на претензии отвечать отказываются.

Другие публикации по теме
LEGO опубликовала статистику достижений за 30 лет, но она вызвала много вопросов и сомнений
LEGO опубликовала статистику достижений за 30 лет, но она вызвала много вопросов и сомнений
Официальный список ключевых игр LEGO за 30 лет вызвал споры. Компания назвала LEGO City Undercover (2013) первой игрой с открытым миром, игнорируя LEGO Batman 2 (2012) с той же чертой и полной озвучкой, что многие считают несправедливым.
Вчера в 14:05
311
1
Форум
Snapchat — в бан! РКН последние два дня натурально лютует
Snapchat — в бан! РКН последние два дня натурально лютует
Роскомнадзор заблокировал Snapchat, обвинив его в использовании для планирования терроризма. Позже были ограничены также FaceTime и детская платформа Roblox.
Вчера в 12:35
537
10
Форум
У вас на днях перестал работать VPN? Это неслучайный сбой — РНК нанес новый удар
У вас на днях перестал работать VPN? Это неслучайный сбой — РНК нанес новый удар
Роскомнадзор заблокировал новые протоколы VPN, включая VLESS, что привело к перебоям у пользователей в ряде регионов России.
Вчера в 11:31
1053
36
Форум