Генеративний штучний інтелект: правове регулювання
Про використання творів під час навчання ШІ та генерування об’єктів, а також про те, чи може бути об’єкт згенерований ШІ твором
Українське законодавство не містить відповідної термінології наразі, тому визначення термінів для цієї статті запозичені з проєкту закону ЄС про штучний інтелект (EU Artificial Intelligence Act).
Генеративний штучний інтелект (англ. Generative AI), це різновид “систем штучного інтелекту”, спеціально призначений для генерування об’єктів, таких як складний текст, зображення, аудіо або відео – див. визначення “generative AI” у проєкті закону ЄС про штучний інтелект: Поправка 399 до статті 28 b, частина 4 [Amendment 399, Proposal for a regulation Article 28 b (new)].
Система штучного інтелекту (англ. AI system), це “машинна система” (machine-based system), яка може генерувати вихідні дані: див. Поправка 165 до пункту 1 параграфу 1 статті 3 [Amendment 165, Proposal for a regulation Article 3 – paragraph 1 – point 1].
Термін “машинний” означає той факт, що системи штучного інтелекту працюють на машинах: “The term “machine-based” refers to the fact that AI systems run on machines.” – див. Поправка 18 до пункту 6 Преамбули [Amendment 18, Proposal for a regulation Recital 6].
Генеративний штучний інтелект, як система, складається з (1) комп’ютерної програми та (2) бази даних (базова модель).
Комп’ютерна програма управляє базою даних (базовою моделлю) і генерує об’єкти.
Базова модель (англ. Foundation model), це модель, при розробці якої для її навчання використовується великий набір даних (зокрема, творів).
Базова модель може бути одномодальною [unimodal] або багатомодальною [multimodal], навчатися за допомогою різних методів.
Кожну базову модель можна повторно використати в незліченних системах штучного інтелекту.
Про “foundation model” див. Поправка 99 до пункту 60 e Преамбули [Amendment 99, Proposal for a regulation Recital 60 e (new)]; та Поправка 399 до статті 28 b [Amendment 399, Proposal for a regulation Article 28 b (new)].
З точки зору авторського права базова модель є спеціальною базою даних.
Отже, генеративний штучний інтелект, як система, складається з (1) комп’ютерної програми, яка управляє базою даних (базова модель), і генерує об’єкти, та (2) бази даних (базова модель).
Комп’ютерні програми та бази даних (якщо вони відповідають вимогам оригінальності) є об’єктами авторського права. Неоригінальні бази даних є об’єктами права особливого роду (sui generis).
У процесі створення та діяльності генеративного ШІ найбільший інтерес для авторського права складають три питання:
(1) використання творів під час навчання базової моделі;
(2) використання творів під час генерування об’єктів системою ШІ;
(3) результат генерування системою ШІ.
(1) Використання творів під час навчання базової моделі
Під час створення базової моделі для її навчання використовуються великі набори даних (англ. Big Data). Такі дані обробляються методом “глибинного аналізу тексту та даних” (“Text and Data Mining” (TDM)).
Термін “глибинний аналіз тексту та даних” (далі: TDM) означає будь-який автоматизований аналітичний метод, призначений для аналізу тексту та даних у цифровій формі з метою отримання інформації, яка охоплює, серед іншого, моделі, тенденції та кореляції (див. ст.2(2) Директиви 2019/790/ЄС).
Термін “глибинний аналіз тексту та даних” не використовується у Законі України “Про авторське право і суміжні права” (далі: ЗУАіСП), але саме так перекладено термін “Text and Data Mining” (TDM) в офіційному перекладі Директиви 2019/790/ЄС.
Перш ніж здійснити TDM, необхідно зібрати дані, що підлягатимуть аналізу. Під час збирання даних відбувається відтворення таких даних (для подальшого їх аналізу з метою навчання базової моделі). Серед таких відтворених даних можуть бути також твори.
Аби розробникам базових моделей не доводилось отримувати дозволи від усіх правовласників творів, що відтворюються для TDM (що практично неможливо), деякі законодавці встановлюють виняток з права на відтворення для TDM. В різних країнах обсяг такого винятку для TDM може бути не однаковим.
Після навчання базової моделі не потрібно зберігати великі набори даних, що використовувалися для навчання такої моделі, оскільки генеративний ШІ буде використовувати базову модель (інформацію, що отримана внаслідок аналізу великих наборів даних), та не буде використовувати власне великі набори даних.
Разом з тим, великі набори даних у подальшому (після закінчення TDM) можуть використовуватись для перенавчання базових моделей, їх перевірки, а також для навчання нових (інших) базових моделей. Зібрані для TDM дані, перш ніж бути використаними для аналізу з метою навчання базової моделі, очищуються, впорядковуються та індексуються. Отже, великі набори даних – це цінний актив. Можливість збереження великих наборів даних вже після закінчення TDM не в останню чергу залежить від того, чи дозволяє законодавство подальше збереження даних, що були відтворені для TDM.
Для ілюстрації можна навести приклад європейського підходу до винятків для TDM.
Так, копії творів чи інших об’єктів, зроблені для TDM з метою наукових досліджень можна зберігати з метою наукових досліджень, у тому числі для перевірки результатів досліджень (ч.2 ст.3 Директиви 2019/790/ЄС).
Натомість відтворені та витягнуті, відповідно, з комерційною метою дані для TDM можна зберігати протягом часу, необхідного для TDM (ч.2 ст.4 Директиви 2019/790/ЄС).
Отже, у випадку TDM з метою наукових досліджень великі набори даних можуть бути збережені після закінчення TDM (зокрема для перевірки результатів досліджень). У випадку TDM з комерційною метою дані можна зберігати “протягом часу, необхідного для TDM”. Оскільки визначення TDM не включає етапи перевірки отриманої базової моделі, це означає, що у випадку TDM з комерційною метою після закінчення TDM дані зберігати не можна – їх треба видалити.
Стаття 5(1) Директиви 2001/29/ЄС, що передбачає виняток щодо тимчасових актів відтворення, що мають короткочасний або епізодичний характер і є невід’ємною і важливою частиною технологічного процесу, і які не мають самостійного економічного значення, може застосовуватися до TDM, але виключно у межах сфери застосування такого винятку. Тобто цей виняток не дає права на збереження відтворених для TDM творів після закінчення TDM.
Український закон про використання творів під час навчання базової моделі (TDM) та після TDM
В ЗУАіСП виняток з права на відтворення творів для TDM міститься у п.14 ч.2 ст.22. Саме так ця норма розглядається у Дослідженні ВОІВ (WIPO SCCR/44/4, див. посилання #56, p.24).
Цей виняток дозволяє без дозволу суб’єкта авторського права “виготовлення копій творів” з метою пошуку тексту і даних за таких умов:
(1) твори мають бути з законного джерела;
(2) текст і дані [мають бути] включені до наукових публікацій або пов’язаних з ними;
(3) такий пошук тексту і даних має здійснюватись для дослідницьких цілей;
(4) використання творів не було прямо заборонено суб’єктами авторського права відповідним чином, зокрема за допомогою засобів, придатних для зчитування комп’ютером з цифрового контенту, що є доступним у мережі Інтернет.
Крім цього ЗУАіСП для застосування винятку для TDM вимагає зазначення імені автора і джерела запозичення.
Для TDM з комерційною метою – не для дослідницьких цілей – ЗУАіСП винятків не робить. Отже, для TDM з комерційною метою твори використовуються на загальних умовах.
Виняток, встановлений п.14 ч.2 ст.22 ЗУАіСП, стосується лише відтворення творів з метою пошуку тексту і даних та, відповідно, не стосується відтворення об’єктів суміжного права та відтворення неоригінальних баз даних, що охороняються правом особливого роду (sui generis).
ЗУАіСП містить ще дві норми, що можуть бути віднесені до винятків з права на відтворення для TDM, це стаття 27 та п.4 ч.1 ст.43 ЗУАіСП – вільне тимчасове відтворення творів та об’єктів суміжних прав, які є аналогом статті 5(1) Директиви 2001/29/ЄС. Але застосування цих винятків для TDM в Україні не є очевидним.
Хоча Директива 2019/790/ЄС прямо вказує на можливість застосування винятку зі статті 5(1) Директиви 2001/29/ЄС для TDM, Україна ще не є державою-членом ЄС, відтак, законодавство ЄС не є джерелом права української правової системи, скоріш, це “дороговказ” на шляху гармонізації українського законодавства до права ЄС.
Отже, теза щодо застосовування винятків зі статей 27 та п.4 ч.1 ст.43 ЗУАіСП до навчання базових моделей генеративного штучного інтелекту, в українському суді потребуватиме доведення. Однієї лише аргументації, типу, оскільки так написано у Директиві ЄС, а Україна прямує до ЄС, відтак, в Україні ці норми мають тлумачитись так само, в суді буде недостатньо. Адже судове рішення повинно бути законним, тобто ухвалене судом відповідно до норм матеріального права (див. ч.2 ст.236 ГПК та ч.2 ст.263 ЦПК). Натомість поки що матеріальне право України мовчить про можливість застосування вільного тимчасового відтворення творів для TDM.
Отже, для доведення в суді вказаної тези доведеться застосовувати аргументацію, що використав Європейський Суд Справедливості при тлумаченні статті 5(1) Директиви 2001/29/ЄС, а також аргументацію, що використали автори Директиви 2019/790/ЄС, розповсюджуючи застосування винятку зі статті 5(1) Директиви 2001/29/ЄС на випадок TDM. Такий шлях.
(2) Використання творів під час генерування об’єктів системою ШІ
Коли користувач заходить на веб-сайт із генеративним ШІ, він [користувач] дає текстове завдання (промпт) [Prompt]. Виконуючи текстове завдання користувача генеративний ШІ буде використовувати інформацію, яка була отримана внаслідок аналізу великих наборів даних. Така інформація міститься у базовій моделі. Результатом такого виконання текстового завдання користувача буде генерування тексту, зображення, звуків або зображення разом із звуком.
Отже, твори, що були відтворені під час TDM для навчання базової моделі, при виконанні генеративним ШІ завдання користувача не використовуватимуться.
Однак генеративний ШІ може генерувати об’єкти не лише на основі текстового завдання (промпт) користувача, а також – на основі текстового завдання (промпт) разом з зображеннями (звуками тощо), що надаються користувачем (або, які ШІ може брати онлайн). Це, так звані, багатомодальні моделі [Multimodal AI].
Багатомодальна модель не передбачає перенавчання (додаткове TDM) базової моделі, отже, зображання (звук тощо) використовується генеративним ШІ безпосередньо (як є). На основі такого зображення (звуку тощо), виконуючи текстове завдання (промпт) користувача, та, використовуючи інформацію, що міститься у базовій моделі, ШІ генеруватиме об’єкт.
Під час завантаження зображення (звуку тощо), наданого користувачем, відбувається відтворення (п.1 ч.1 ст.12; п.14 ст.1 ЗУАіСП). Під час генерування штучним інтелектом об’єкту на основі зображення (звуку тощо), наданого користувачем, відбувається утворення нового об’єкту, але на основі іншого існуючого об’єкту, тобто переробка (п.9 ч.1 ст.12; ч.1 ст.17 ЗУАіСП).
Відтворення у процесі генерування не охоплюється винятком з права на відтворення для TDM.
ЗУАіСП містить норму, яка регулює ситуацію, коли твір або об’єкт суміжних прав використовується у процесі генерування неоригінального об’єкта, це ч.7 ст.33 ЗУАіСП: користування правом на згенерований неоригінальний об’єкт залежить від дотримання прав на твір або об’єкт суміжних прав, що зазнав використання у процесі генерування такого неоригінального об’єкту.
(3) Результат генерування системою ШІ
Відповідно до ЗУАіСП результатом генерування комп’ютерною програмою без безпосередньої участі фізичної особи в утворенні цього об’єкта, є неоригінальний об’єкт (ч.1 ст.33). Неоригінальні об’єкти, згенеровані комп’ютерною програмою, охороняються правом особливого роду (sui generis).
Тобто, користувач дає генеративному ШІ текстове завдання (промпт), а генеративний ШІ генерує, наприклад, зображення. Безпосередньої участі користувач в утворенні цього зображення не брав, користувач лише дав генеративному ШІ текстове завдання (промпт), а генеративний ШІ для виконання цього завдання використав інформацію, що міститься у базовій моделі, відтак, утворене зображення є неоригінальним об’єктом.
А якщо користувача не влаштує результат згенерований ШІ і він дасть генеративному ШІ наступне текстове завдання (промпт) – вдосконалити отримане зображення, що згенероване ШІ. А потім ще раз і ще, допоки результат не буде відповідати вимогам користувача.
Чи буде в такому випадку діяльність користувача вважатись достатньо творчою для того, аби отримане зображення вважалось твором, створеним з використанням комп’ютерної технології.
Таке питання вирішував китайський суд у справі за позовом про порушення авторських прав на згенероване ШІ зображення.
27 листопада 2023 року Інтернет-суд Пекіна виніс рішення про визнання авторських прав на зображення, створені ШІ. Автентичний текст рішення тут (中文).
У цій справі позивач використовував Stable Diffusion (генеративний ШІ) для створення зображень та опублікував їх на платформі Xiaohongshu (китайський аналог Instagram); відповідач, блогер на Baijiahao, використав ці зображення для супроводу статті, і позивач подав до суду.
Аби відповісти на питання, чи захищаються дані зображення авторським правом, суду необхідно було дати відповідь на питання, чи є ці зображення творами.
Дослідивши обставини, суд дійшов висновку, що позивач доклав творчих зусиль до створення зображень, зображення відповідають вимогам “оригінальності” та відображають оригінальні інтелектуальні внески людини, відтак, зображення мають бути визнані творами та захищені законом про авторське право.
До речі, схожий підхід застосувало Відомство з патентів і товарних знаків США (USPTO) щодо використання генеративного ШІ для винаходів.
Для того, щоб мати можливість зареєструвати патент, людина, яка використовує ШІ, повинна зробити значний внесок у розробку концепції винаходу. Людина, яка просто просить генеративний ШІ створити щось і спостерігає за цим, не стає винахідником. “Однак значний внесок може бути продемонстрований тим, як людина будує підказку з огляду на конкретну проблему, щоб отримати конкретне рішення від системи штучного інтелекту”, – вказали у звіті USPTO.
Український закон містить норму, яка не виключає можливості створення твору з використанням комп’ютерних технологій. В такому випадку твір не вважатиметься неоригінальним об’єктом, згенерованим комп’ютерною програмою (абз.2 ч.1 ст.33 ЗУАіСП).
Отже, якщо користувач докладе достатньо творчих зусиль, використовуючи комп’ютерну технологію (генеративний ШІ), результатом використання такої комп’ютерної технології може бути твір. Але, за умови наявності творчої діяльності користувача (автора).
Якщо ШІ встановлено у комп’ютерну програму
Останнім часом деякі компанії заявляють про плани щодо додавання функцій ШІ до своїх комп’ютерних програм. Базова модель може бути в хмарі (онлайн) і комп’ютерна програма буде комунікувати з нею онлайн або базова модель може бути інтегрована у комп’ютерну програму, яка встановлена на локальний комп’ютер користувача.
Так, компанія Adobe планує додати функції ШІ до редактору Adobe Photoshop. Йдеться про нові функції: “Генеративна заливка” та “Генеративне розширення” на базі Adobe Firefly. Це означає, що кожний власник останньої версії графічної програми Adobe Photoshop отримує доступ до нейромережі (базова модель), що розташована на сервері Creative Cloud.
Виникає питання, чи буде вважатись об’єкт – створений за допомогою комп’ютерної програми з використанням функцій ШІ – об’єктом згенерованим ШІ, чи цей об’єкт буде вважатись твором, створеним фізичною особою з використанням комп’ютерної технології.
Зрозуміло, що ситуація, коли система ШІ (комп’ютерна програма, яка управляє базовою моделлю) генерує об’єкт, відрізняється від ситуації, коли комп’ютерна програма за допомогою базової моделі генерує окремий елемент створюваного об’єкта.
На нашу думку, відповідь на вищезгадане питання залежатиме від того, чи зможе комп’ютерна програма функціонувати без функцій ШІ.
Наприклад, у випадку Adobe Photoshop з Firefly, якщо відключити функції ШІ “Генеративна заливка” та “Генеративне розширення” (якщо банально зникне доступ (підключення) до Інтернету), Adobe Photoshop перетвориться на звичайний Adobe Photoshop зі звичайними функціями “заливка” та “розширення” та продовжить функціонувати. Якщо ж уявити, що буде відключено доступ до базової моделі у Stable Diffusion (генерує зображення) або у ChatGPT (генерує текст) або у якогось генератора музики з ШІ, система ШІ опиниться в колапсі та не зможе виконувати свої функції.
- Історичний кіт у мішку: чому піврічні торги деревиною обурили деревообробників Юрій Дюг 07:32
- Доплата за фактичні квадратні метри об`єкту інвестування Євген Морозов вчора о 14:52
- "Компостер подій" Кремля: будьте пильними Євген Магда вчора о 11:28
- З 1 грудня зміняться правила бронювання: з'явилася Постанова Кабміну Віталій Соловей 23.11.2024 20:23
- Бюджет-2025 прийнятий, але це не точно Любов Шпак 23.11.2024 18:55
- Час затягувати паски Андрій Павловський 23.11.2024 17:27
- Строк нарахування 3% річних від суми позики Євген Морозов 23.11.2024 13:52
- Судовий захист при звернені стягнення на предмет іпотеки, якщо таке майно не відчужено Євген Морозов 22.11.2024 13:02
- Система обліку немайнової шкоди: коли держава намагається залікувати невидимі рани війни Світлана Приймак 22.11.2024 11:36
- Чому енергетичні та газові гіганти обирають Нідерланди чи Швейцарію для бізнесу Ростислав Никітенко 22.11.2024 08:47
- 1000+ днів війни: чи достатньо покарати агрессора правовими засобами?! Дмитро Зенкін 21.11.2024 21:35
- Горизонтальний моніторинг як сучасний метод податкового контролю Юлія Мороз 21.11.2024 13:36
- Ієрархія протилежних правових висновків суду касаційної інстанції Євген Морозов 21.11.2024 12:39
- Чужий серед своїх: право голосу і місце в політиці іноземців у ЄС Дмитро Зенкін 20.11.2024 21:35
- Сталий розвиток рибного господарства: нові можливості для інвестицій в Україні Артем Чорноморов 20.11.2024 15:59
-
24 листопада в Україні відключатимуть світло – деталі
Бізнес 8479
-
Банки в ОАЕ, Туреччині та Таїланді не обслуговують видані Газпромбанком картки UnionPay
Фінанси 8426
-
Відстрочки, видані Мінекономіки та через Дію, анулюють 28 лютого
Бізнес 7304
-
В Україні фальсифіковані до 25% молочних продуктів: голова Спілки молочних підприємств
Бізнес 5710
-
Найвища гора Західної Європи та найефектніша гора Франції: неперевершений Монблан — фото
Життя 3430