Главная IT-инновации Сбор данных OpenAI одерживает крупную победу, поск...

Сбор данных OpenAI одерживает крупную победу, поскольку иск Raw Story об авторских правах отклонен судом Нью-Йорка

Южный округ Нью-Йорка отклонил иск о нарушении авторских прав, поданный Raw Story Media, Inc. и AlterNet Media, Inc., альтернативными левыми новостными интернет-изданиями, против OpenAI, фактически прекратив обвинения в том, что компания, занимающаяся разработкой искусственного интеллекта, нарушила авторские права, используя скопированный новостной контент в своих обучающих данных.

Это отклонение можно рассматривать как важный момент в продолжающейся борьбе за авторские права и инструменты искусственного интеллекта, особенно в соответствии с разделом 1202(b) Закона об авторском праве в цифровую эпоху (DMCA), но стоит отметить, что в других случаях также не удалось доказать успешность исков в соответствии с этим положением.Давайте разберемся, что произошло, почему судья отклонил дело и что это означает для будущего ИИ, авторских прав и законности того, что технологические компании изымают контент из сети без прямого разрешения или компенсации создателей.

Понимание раздела 1202(b) DMCA

Судебный процесс вращался вокруг раздела 1202(b) DMCA, положения, направленного на защиту «информации об управлении авторскими правами» (CMI).

Сюда входят любые имена авторов, названия и другие метаданные, которые идентифицируют защищенные авторским правом работы. Раздел 1202(b) запрещает удаление или изменение такой информации без разрешения, особенно если это способствует нарушению авторских прав.

В этом случае Raw Story и AlterNet утверждали, что OpenAI использовала статьи с их веб-сайтов для обучения ChatGPT и других моделей без сохранения CMI, нарушая раздел 1202(b).

OpenAI — не единственная компания ИИ, которая, вероятно, извлекала такой материал из сети — в то время как поставщики моделей ИИ, как правило, тщательно охраняют свои наборы данных для обучения, отрасль в целом, несомненно, извлекала большие участки сети для обучения своих различных моделей (практика, похожая на ту, которую Google использовала для сканирования и индексирования результатов поиска в своем основном поисковом продукте). Таким образом, некоторые создатели рассматривают извлечение данных как «первородный грех» ИИ.

В этом случае истцы Raw Story и Alternet утверждали, что результаты ИИ OpenAI — ответы, сгенерированные моделями — иногда основывались на их статьях, и компания сознательно нарушала авторские права после удаления CMI.

Почему суд отклонил иски Raw Story

Судья Коллин Макмахон удовлетворила ходатайство OpenAI о прекращении дела по причине отсутствия процессуальной правоспособности. В частности, судья установил, что истцы не смогли доказать, что они понесли конкретный, фактический ущерб от действий OpenAI — обязательное требование в соответствии со статьей III Конституции США для продолжения любого судебного разбирательства.

Судья Макмахон также рассмотрела развивающийся ландшафт интерфейсов большой языковой модели (LLM), отметив, что обновления этих систем еще больше усложняют атрибуцию и отслеживаемость. Она подчеркнула, что итеративные улучшения генеративного ИИ снижают вероятность того, что контент будет воспроизведен дословно, что делает претензии истцов еще более спекулятивными.

Судья отметил, что «вероятность того, что ChatGPT выведет плагиатный контент из одной из статей истцов, кажется маловероятной». Это отражает ключевую трудность в таких типах дел: генеративный ИИ предназначен для синтеза информации, а не для ее дословного копирования. Истцы не смогли представить убедительных доказательств того, что их конкретные работы были напрямую нарушены таким образом, что это привело к идентифицируемому вреду.

Постановление согласуется с аналогичными делами, в которых суды боролись за применение традиционного закона об авторском праве к генеративному ИИ. Например, дело Doe 1 против GitHub, касающееся Copilot от Microsoft, также рассматривало иски в соответствии с разделом 1202(b). Там суд установил, что код, сгенерированный Copilot, не был «идентичной копией» оригинала, а скорее фрагментами, которые были переконфигурированы, что затрудняло доказательство нарушения требований CMI.