Иск против OpenAI: авторские права и использование текстовых данных в ИИ

OpenAI снова оказалась в суде из-за использования литературных произведений в качестве обучающих данных для своих искусственных интеллектов. Два известных писателя подали иск против компании, которая разработала ChatGPT и Bing Chat, обвиняя ее в нарушении авторских прав. По мнению истцов, OpenAI использовала их работы в качестве материала для обучения своих алгоритмов. Это первый иск такого рода, когда речь идет о тексте вместо изображений или кода.

openai

Пол Тремблей (Paul Tremblay) и Мона Авад (Mona Awad), подавшие иск, утверждают, что компания и ее подразделения нарушили их авторские права, нарушили Закон об авторском праве в цифровую эпоху (DMCA) и нарушили калифорнийские и федеральные законы, касающиеся недобросовестной конкуренции.

Юридическую поддержку писателям предоставили Джозеф Савери (Joseph Saveri) и Мэтью Баттерик (Matthew Butterick), те же адвокаты, которые представляли интересы в недавних исках против Stable Diffusion AI и GitHub. В иске утверждается, что роман «Хижина на краю света» Пола Тремблея и два романа Моны Авад, «13 способов посмотреть на толстую девушку» и «Зайка», были использованы в качестве обучающих данных для систем GPT-3.5 и GPT-4. Хотя OpenAI не разглашала конкретные материалы, используемые в обучении (поскольку они являются коммерческой тайной), истцы считают, что их работы должны были быть включены в обучающий набор, поскольку ChatGPT способен давать подробные резюме сюжетов и отвечать на вопросы, требующие знания содержания книг.

Поскольку языковые модели OpenAI не могут функционировать без выразительной информации, извлечённой из произведений истцов (и других лиц) и сохранённой в них, языковые модели OpenAI сами являются нарушающими авторские права производными произведениями, созданными без разрешения истцов и в нарушение их исключительных прав по Закону об авторском праве.

говорится в жалобе

Все три книги, которые были использованы в обучении систем OpenAI, содержат информацию, связанную с защитой авторских прав (CMI), такую как номера ISBN и регистрации авторских прав. Закон об авторском праве в цифровую эпоху (DMCA) устанавливает, что удаление или подделка CMI является незаконным. Истцы утверждают, что поскольку ответы, созданные ChatGPT, не содержат этой информации, OpenAI нарушила закон, касающийся CMI, помимо нарушения авторских прав.

книги

На данный момент иск был подан только двумя писателями, однако их адвокаты намерены сделать его коллективным, чтобы другие авторы, чьи произведения также были использованы OpenAI, могли претендовать на компенсацию. В иске требуется выплата денежной компенсации, возмещение судебных расходов и судебный запрет, который принудит OpenAI изменить свое программное обеспечение и деловые практики в отношении авторских материалов. На веб-сайте юридической фирмы LLM Litigation подробно объясняется позиция истцов и причины подачи иска.

Они также критикуют концепцию генеративного ИИ, утверждая:

Генеративный искусственный интеллект — это просто человеческий интеллект, переупакованный и проданный как новый продукт. Это не новый вид интеллекта. Это просто новый способ использования чужого интеллекта без разрешения или компенсации.

Они отмечают, что, хотя OpenAI заявляет, что не знает, какие именно книги использовались для обучения ИИ, это не имеет значения, поскольку:

OpenAI знает, что она использовала множество книг, и она знает, что она не получила разрешения от их авторов.

OpenAI уже не впервые сталкивается с подобными обвинениями, однако новый иск, связанный с использованием текстовых данных, является значимым прецедентом и может оказать влияние на будущие судебные дела, касающиеся нарушения авторских прав в области искусственного интеллекта.

Добавить комментарий