Разработчики искусственного интеллекта в значительной степени полагаются на незаконное получение материалов, защищенных авторским правом, из новостных изданий и журналистов для обучения своих моделей, утверждает группа новостной индустрии.
30 октября News Media Alliance (NMA) опубликовал 77-страничный технический документ и сопровождающее его заявление в Бюро регистрации авторских прав США, в котором утверждается, что наборы данных, которые обучают модели ИИ, используют значительно больше контента издателей новостей по сравнению с другими источниками.
В результате поколения ИИ «копируют и используют контент издателей в своих продуктах», что нарушает их авторские права и ставит новостные агентства в конкуренцию моделям ИИ.
«Многие разработчики генеративного искусственного интеллекта решили без разрешения собирать контент издателей и использовать его для обучения моделей, а также в режиме реального времени для создания конкурирующих продуктов», — подчеркнула NMA в заявлении от 31 октября.
On Monday, the News/Media Alliance published a White Paper and a technical analysis and submitted comments to the @CopyrightOffice on the use of publisher content to power generative artificial intelligence technologies (#GAI). https://t.co/Zr05e7nZTS
— News/Media Alliance (@newsalliance) October 31, 2023
Группа утверждает, что в то время как издатели новостей инвестируют и берут на себя риски, разработчики ИИ получают вознаграждение «в виде пользователей, данных, создания бренда и рекламных долларов».
Сокращение доходов, возможности трудоустройства и испорченные отношения со зрителями — это еще одни неудачи, с которыми сталкиваются издатели, говорится в сообщении NMA, поданном в Бюро регистрации авторских прав.
Чтобы бороться с этими проблемами, NMA рекомендовало Бюро авторских прав объявить, что использование контента публикации для монетизации систем искусственного интеллекта наносит вред издателям. Группа также призвала к использованию различных моделей лицензирования и мер прозрачности для ограничения использования материалов, защищенных авторским правом.
NMA также рекомендует Ведомству авторских прав принять меры по удалению защищенного контента со сторонних веб-сайтов.
The Guardian has accused Microsoft of damaging its journalistic reputation by publishing an AI-generated poll speculating on the cause of a woman’s death next to an article by the news publisher. https://t.co/tOie87HSyA
— News/Media Alliance (@newsalliance) November 1, 2023
NMA признала преимущества генеративного ИИ и отметила, что публикации и журналисты могут использовать ИИ для корректуры, генерации идей и поисковой оптимизации.
ChatGPT от OpenAI, Bard от Google и Claude от Anthropic — три чат-бота с искусственным интеллектом, использование которых за последние 12 месяцев возросло. Однако методы обучения этих моделей ИИ подверглись критике, и все они столкнулись с исками о нарушении авторских прав в суде.
По теме: Как юридическая защита Google от искусственного интеллекта может изменить защиту произведений искусства и авторских прав
В июле комик Сара Сильверман подала в суд на OpenAI и Meta, утверждая, что эти две фирмы без разрешения использовали ее работу, защищенную авторским правом, для обучения своих систем искусственного интеллекта.
На OpenAI и Google были поданы отдельные коллективные иски по поводу утверждений, что они извлекли личную информацию пользователей из Интернета.
Google заявила, что возьмет на себя юридическую ответственность, если ее клиенты будут обвинены в нарушении авторских прав при использовании ее продуктов генеративного искусственного интеллекта в Google Cloud и Workspace.
«Если вас оспаривают на основании авторских прав, мы возьмем на себя ответственность за возможные юридические риски.
Однако на поисковый инструмент Google Bard не распространяется гарантия юридической защиты.
OpenAI и Google не сразу ответили на запрос о комментариях.