Разное

Google, OpenAI и другие технологические корпорации собирают данные пользователей вопреки законам

Издание New York Times сообщает, что разработчики искусственного интеллекта от компаний OpenAI, Google и Meta*, используют данные из интернета, включая миллионы часов видеоконтента с YouTube, для обучения своих систем, несмотря на то что подобное использование контента противоречит правилам YouTube. По информации источников, эти компании нарушали не только корпоративные нормы, но и обсуждали пути обхода законодательства о защите авторских прав в процессе поиска данных для обучения своих передовых AI-систем.

Например, обучение инструмента распознавания речи Whisper от OpenAI осуществлялось через анализ видео с YouTube, что вызвало обсуждения внутри компании о потенциальном нарушении правил платформы. Сообщается, что команда OpenAI проанализировала свыше миллиона часов видео. Примечательно, что в этом процессе принимал участие даже президент компании Грег Брокман.

Отмечается также, что в Meta* были готовы к судебным разбирательствам в связи с использованием контента, защищенного авторским правом, из различных источников в интернете, поскольку переговоры о лицензиях с различными правообладателями могли занять много времени.

По словам источников, Google также использовала видеоматериалы с YouTube для извлечения текста для своих AI-моделей, что потенциально могло нарушить авторские права создателей контента.

* Компания Meta признана экстремистской в России, её деятельность запрещена.