Використання фотографій для навчання штучного інтелекту: німецький судовий прецедент
27.09.2024 німецький земельний суд (Landgericht) Гамбурга ухвалив рішення у справі за позовом фотографа Роберта Кнешке (Robert Kneschke) до організації LAION про заборону відтворення творів для утворення наборів даних для навчання ШІ (справа № 310 O 227/23). Мовою оригіналу рішення тут.
Це перше рішення суду в державі-члені ЄС щодо застосування винятків з права на відтворення для TDM (Text and Data Mining) для навчання ШІ. Вказані винятки містяться у статті 5(1) Директиви 2001/29/ЄС та у статтях 3 та 4 Директиви 2019/790/ЄС. Німеччина імплементувала ці норми до Закону про авторське право (UrhG).
Термін “Text and Data Mining” перекладається як “глибинний аналіз тексту та даних” та означає будь-який автоматизований аналітичний метод, призначений для аналізу тексту та даних у цифровій формі з метою отримання інформації, яка охоплює, серед іншого, моделі, тенденції та кореляції (ч.2 ст.2 Директиви 2019/790/ЄС).
Щодо порівняння європейського підходу до випадків вільного відтворення для TDM з Законом України “Про авторське право і суміжні права” (далі: “ЗУАіСП”), див. у статті “Штучний інтелект та авторське право”.
Далі по тексту, поруч із номером статті німецького закону ми будемо для зручності приводити номер відповідної статті Директиви ЄС та статті ЗУАіСП.
Фабула справи
Фотографію, автором якої є фотограф Robert Kneschke (Позивач) було законно розміщено на веб-сайті постачальника стокових фотографій, якому було надано невиключні права на використання фотографії.
Організація LAION (Відповідач) завантажила (відтворила) фотографію з цього веб-сайту з метою утворення набору даних для навчання ШІ. Таке відтворення відбулось незважаючи на розміщене на сторінці веб-сайту оголошення щодо заборони використання веб-скрейпінгу (web scraping) стосовно контенту, розміщеного на цьому веб-сайті. Оголошення про заборону використання було написано англійською мовою.
Відповідач відтворив фотографію з метою перевірки опису вмісту зображень на відповідність зображенням, що містились у наборі даних, утвореному стороннім постачальником (з США). Вказаний набір даних [стороннього постачальника] складався з зображень, їх URL-адрес та текстових описів відповідного вмісту зображень.
Після перевірки, зображення, що були завантажені, були негайно видалені відповідачем.
Утворений відповідачем набір даних є табличним документом, який містить гіперпосилання на зображення або файли зображень загальнодоступні в Інтернеті, а також додаткову інформацію про відповідні зображення, включаючи опис зображення, який надає інформацію про вміст зображення у текстовій формі. Набір даних містить 5,85 мільярда відповідних пар зображення-текст. Набір даних можна використовувати для навчання моделей генеративного ШІ.
Утворений відповідачем набір даних є загальнодоступним та безплатним.
Отже, відповідач сам не займається навчанням моделей генеративного ШІ, а лише утворює набори даних для такого навчання.
Позивач, вважаючи свої авторські права на фотографію порушеними шляхом незаконного відтворення фотографії відповідачем, звернувся з позовом про заборону відповідачеві в майбутньому відтворювати фотографії позивача для утворення наборів даних для навчання штучного інтелекту.
На перший погляд, справа виглядала як спір про тлумачення норми про виняток з права на відтворення творів для TDM, щодо того, чи є оголошення написане природною мовою таким, що є машиночитаним.
Ця норма міститься у частині 3 статті 4 Директиви 2019/790/ЄС.
Аналізуючи винятки з права на відтворення для TDM, німецький суд дійшов висновку, що дії відповідача не підпадають під виняток для тимчасового відтворення (§ 44a UrhG; ст.5(1) Директиви 2001/29/ЄС; ст.27 ЗУАіСП).
Далі, суд дійшов висновку, що дії відповідача є науковим дослідженням, відтак до нього має застосовуватись виняток з права на відтворення для TDM, що не передбачає можливості обмеження з боку правоволодільців (§ 60d UrhG; ст.3 Директиви 2019/790/ЄС; *).
______________________________________
* ЗУАіСП не містить такого самого винятку. Виняток з права на відтворення “з метою пошуку тексту і даних, для дослідницьких цілей”, що міститься у п.14 ч.2 ст.22 ЗУАіСП фактично являє собою суміш з винятків зі ст.3 та ст.4 Директиви 2019/790/ЄС, та має обов’язкову умову про право застереження суб’єктами авторського права про заборону такого відтворення. Натомість, згідно з ч.4 ст.4 Директиви 2019/790/ЄС, наявність такого застереження не впливатиме на застосування винятку зі ст.3 Директиви 2019/790/ЄС.
______________________________________
Суд вказав, що оскільки до відповідача застосовується виняток з § 60d UrhG (ст.3 Директиви 2019/790/ЄС), не потрібна остаточна оцінка того, чи відповідач може додатково посилатися на виняток з § 44b UrhG (ст.4 Директиви 2019/790/ЄС).
І, хоча в цьому вже не було потреби (оскільки відповідач підпадав під дію винятку § 60d UrhG; ст.3 Директиви 2019/790/ЄС), суд також визнав, що обмеження використання, оголошене природною мовою (англійською) на сторінці веб-сайту, є машиночитаним.
Отже, суд відмовив у позові.
На нашу думку, найбільш цікавим в цьому Рішенні є висновок суду про те, що створення набору даних, який може стати основою для навчання систем ШІ, безумовно, можна розглядати як наукове дослідження у вказаному вище значенні (див. §114 Рішення). Тут йдеться про § 60d UrhG; ст.3 Директиви 2019/790/ЄС.
Цей висновок означає, що застереження правоволодільців про заборону відтворення для TDM не впливають на застосування такого винятку.
До речі, вперше про цю справу я дізнався прочитавши стенограму онлайн-вебінару, що провело Бюро авторського права США (U.S. Copyright Office) на тему Міжнародні проблеми авторського права та ШІ (International Copyright Issues and Artificial Intelligence).
У стенограмі ця справа згадувалась у контексті можливого її попадання до Суду Справедливості ЄС (Court of Justice of the European Union, CJEU).
Отже, подивимось, чи попаде ця справа до Суду Справедливості.