Кожного року на розвиток штучного інтелекту виділяються колосальні кошти. Його починають додавати в телефони, роботизовані пилососи і навіть у холодильники. З допомогою ШІ шукають інформацію, редагують зображення або просто спілкуються з чат-ботом. Це дуже зручний засіб... на перший погляд. Але ви коли-небудь задумувалися про небезпеку, яка таїться в нейронних мережах? У цій серії статей спробую розповісти на прикладах про темну сторону цієї технології.
У цій серії статей, хочу розібрати, як нейросети впливають на наше життя і яких небезпек варто остерігатися.
Розпочнемо з чогось «лайтового». Авторське право. У більшості випадків воно захищає автора від крадіжки його праць та їх безкоштовного використання. Авторське право (АП) поширюється на книги, музику, картини, програми тощо. Тобто на продукти інтелектуальної праці. Навіть на фото-стоках картинка не є вашою, поки її не купите. А тепер повернемося до нейросетей. Щоб красиво намалювати захід сонця біля річки, ШІ повинен розуміти, як виглядають «захід» і «річка». Для цього він навчається на великому масиві даних, з зображеннями заходів сонця і рік, щоб виявити закономірності і надати на основі цих даних результат.
Але звідки беруться масиви для навчання? Якщо це одинак, який захотів налаштувати локальний Stable Diffusion для особистого використання, то він може зібрати сподобалися фото з пошуковика, не переживаючи про всякі авторські права і ліцензії. Адже навіть у найгіршому випадку, коментар зі згенерованим Ілоном Маском в образі вусатого трубопроводчика, що сидить у KFC — просто знесуть, але судитися навряд чи будуть. А от у великих компаній з цим справи йдуть трохи складніше.
Давайте розберемо, звідки компанії беруть датасети для навчання. Наприклад, можна згадати, як у 2021 році в Оксфорді була конференція з участю Megatron-Turing NLG. Він був навчений на англомовних статтях з «Вікіпедії», новинах за 2016-2019 роки та архівах Reddit обсягом у 38 ГБ. До речі, він зробив досить лякаючі заяви.
Не слід забувати, що ваші промти (запити до ШІ) також використовуються для навчання. А у Google і Майкрософт, є окрім них набагато більше інформації про вас. Хоча це тема для наступної статті.
У Midjourney в ліцензії говориться, що ви даєте їй, її правонаступникам і правонаступникам їх правонаступників «бессрочну, всесвітню, невиключну, субліцензовану, безкоштовну, безвідкличну ліцензію» на весь контент, який ви в неї завантажуєте.
Також є найбільший набір даних YFCC100M, що належить Yahoo. Він містить у собі, згідно з офіційним сайтом, «99,2 мільйона фотографій і 0,8 мільйона відео з Flickr, всі з яких були опубліковані під однією з різних ліцензій Creative Commons». Flickr — це сайт для розміщення користувацьких фотографій. Чи означає це, що всі зображення, опубліковані там, будуть скормлені нейросетям? Ні, адже при завантаженні фотографій, можна налаштувати тип ліцензії. На вибір надається 9 варіантів:
Тепер, розібравшись з типами ліцензій (вони нам у майбутньому знадобляться... напевно), давайте розберемося, які з них точно не можуть використовуватися для навчання ШІ. Ліцензії з типом NonCommercial не можуть бути використані тільки для навчання комерційних моделей, а NoDerivs — взагалі ні в яких, оскільки будь-яка нейро-мазня, зроблена на основі зображень, вже вважається похідною роботою, що суперечить ліцензії. Що стосується Attribution , то вона може бути використана, тільки якщо в звітах компанії, яка навчає нейросіть, є згадка авторів і посилання на оригінали, звідки були запозичені зображення (в разі з локальними моделями, в репозиторій має бути включений документ з переліком усіх використаних робіт з даною ліцензією). Але тут постає питання в тому, як проконтролювати, щоб в навчальну базу не потрапили дані, захищені авторським правом. Для цього спочатку розберемося, як проходить навчання.
В нейросеті дані про зображення не зберігаються в початковому вигляді. Вони «перетравлюються» в ваги та зміщення. Опис цього процесу займе не одну статтю, тому коротко опишу, як це працює (більш детально дивіться у Шаріфова та на Вікі-сторінці, присвяченій Китайській кімнаті).
Нейросеті подається набір даних з правильними відповідями на них, і на основі цього будуються взаємозв'язки. Це все одно що нам показати тисячі картинок сонця і незрозумілу нам кракозябру, потім показати дощ і іншу загогуліну. Ми не маємо уявлення, на якій це мові, але підозрюємо, що одне значення означає сонце, а інше — дощ (для нейросеті це все ще два незрозумілих об'єкта, які пов'язані з іншими двома незрозумілими об'єктами). Ваги означають вагу елементів. Наприклад, у першого ієрогліфа, після 300 фотографій сонця в різних варіаціях (малюнок/фото з супутника/знімок), раптом з'явиться малюнок будинку і сонця. У такому випадку вага «сонця» буде вищою, тому будинок ми проігноруємо. Чим частіше зустрічається елемент, тим він вагоміший.
Тепер, коли в цьому розібралися, можна перейти до методів перевірки.
У дослідженні «Extracting Training Data from Diffusion Models», проведеному співробітниками Google, DeepMind, ETH Zurich, Princeton і UC Berkeley, з'ясували, що за певних обставин нейросеть може видавати зображення дуже близькі до оригіналу. Наприклад:
Дослідники змогли отримати тисячі прикладів, починаючи від фотографій окремих людей і закінчуючи логотипами компаній, які захищені авторським правом.
До речі, це до слова про те, що не можна нейросеті розповідати конфіденційну інформацію. Але це тема для іншої статті.
Ще іноді нейросеті видають зображення з деталями, що нагадують водяні знаки. Ось кілька прикладів, знайдених на Reddit.
На останок хотілося б показати дослідження «DIAGNOSIS: Detecting Unauthorized Data Usages in Text-to-image Diffusion Models». Ось що вони пропонують:
«Зокрема, ми модифікуємо захищені зображення, додаючи на них унікальний контент за допомогою прихованих функцій деформації зображень, які майже непомітні для людини, але можуть бути захоплені та запам'ятовані дифузійними моделями. Аналізуючи, запам'ятала чи модель впроваджений контент (тобто обробляються чи згенеровані зображення впровадженою функцією постобробки), ми можемо виявити моделі, які незаконно використовували несанкціоновані дані».
До речі, код можна знайти на GitHub, посилання є на сторінці дослідження.
Також, якщо у моделі відкритий вихідний код, можна проаналізувати її «внутрішності» та супутню документацію на предмет відомостей про датасети, на яких вона була навчена.
Добре, з цим розібралися. А чи цікавилися ви, як авторське право поширюється на твори нейромереж?. Але для початку (не)велике відступлення.
2011 рік. Фотограф Девід Слейтер вирушив до Індонезії, щоб зробити знімки хохлатих павіанів, що мешкають у заповіднику. Поки фотограф був зайнятий своїми справами, мавпа заволоділа камерою і натиснула на кнопку. Звук привернув увагу мавпи, і вона продовжила натискати на неї. Було зроблено багато знімків, але хороших вийшло мало. По прибутті з заповідника, Слейтер ліцензував зображення Caters News Agency, на тій підставі, що він є автором ідеї та спеціально хотів, щоб мавпи пограли з камерою. Він стверджував, що все було в його полі зору, і все вийшло так, як і задумувалося. Спочатку стаття про це з'явилася на DailyMail, а потім викликала обговорення на сайті Techdirt, коли там вийшла стаття про те, чи може фото, зроблене мавпою, бути об'єктом авторського права. У статті було присутнє 3 фото мавпи.
Тиждень потому на Techdirt вийшов інший пост, в якому говорилося, що представник компанії, якій належить фото, зв'язався з автором і попросив видалити їх, оскільки вони використані без дозволу. На що автор був в подиві, адже повідомлення було написано як звичайний лист, без використання юридичних термінів і згадування авторського права. І чи може знімок, який зробила мавпа, взагалі бути ліцензованим, адже тварина не може бути суб'єктом авторського права? Навіть якщо і може, зображення були показані в рамках добросовісного використання (оскільки стаття була новинним репортажем), і проблем бути не повинно. Він майже подумав, що це може бути жарт, але все ж надіслав відповідь, в якій детально роз'яснив свою позицію.
Від Caters News Agency прийшла відповідь:
«Незалежно від того, хто володіє авторськими правами, а хто ні, — на 100% ясно, що власник авторських прав — це не ви самі».
Автор статті був в ще більшому подиві. Так як за логікою листа, будь-хто, хто не володіє авторським правом, може подати скаргу, якщо і опублікувавший теж ними не володіє (що є порушенням закону в деяких місцях). Він все ще наполягав, що навіть якщо Caters володіє правами (в чому він сильно сумнівався), його використання зображень є «квінтесенцією добросовісного використання», оскільки пост був присвячений не стільки самим фотографіям, скільки роздумам на тему належності авторського права творам, створеним тваринами. Тому автор залишив фото в пості.
Наступний виток відбувся, коли фотографії були завантажені на Вікісховище (один з проектів Вікімедіа). Особливість ресурсу полягала в тому, що завантажені фотографії повинні бути під вільними ліцензіями. Цього разу до Вікімедії звернувся сам Слейтер і просив або видалити фото, або платити за використання. На що отримав відмову та пояснення, що твори зроблені не людиною, тому вони вважаються суспільним надбанням. Після цього Слейтер звернувся до BBC, з заявою, що поніс від дій Вікімедії фінансові втрати (приблизно 10 000 £), оскільки ніхто не хоче купувати фотографії, поки вони вважаються суспільним надбанням. Після цього почалися судові тяжби.
Думки юристів розділилися. Одні підтримували точку зору Вікімедії, інші стверджували, що авторське право можна приписати за фактом володіння камерою, на яку були зроблені знімки. Оскільки в такому випадку фотограф міг налаштувати світло, фокус, кут зйомки та інші дії, а тварині всього лише потрібно було натиснути на кнопку. Викладач у сфері права інтелектуальної власності, Андрес Гуадамуз, посилався на іншу прецедентну справу, в якій був достатній сам факт відбору фотографії з масиву, для вираження особистості фотографа, а отже, і приписування йому АП.
Все вирішилося 22 грудня 2014 року, коли Бюро авторського права США винесло рішення, пояснивши, що твори, не створені людьми, не є об'єктами авторського права, і навело в якості прикладів «фотографії, зроблені мавпами».
У 2015 році до суду подало вже товариство по захисту прав тварин (People for the Ethical Treatment of Animals, PETA, відоме своїми сумнівними рішеннями). Вони просили про надання мавпам можливості виступати суб'єктами авторського права та дозволити PETA займатися адмініструванням коштів, отриманих від фотографій цього, і всіх інших хохлатих павіанів з заповідника. Пізніше стало відомо, що вони, можливо, переплутали мавпу і вказали в заяві не того павіана, який зображений на знімку. Вони заявляли, що це дівчинка Наруто, в той час як Слейтер стверджував, що це був інший примат, і взагалі самець.
11 вересня 2017 року суд відхилив апеляцію PETA. Слейтер зробив добровільне пожертвування у розмірі 25 відсотків від усіх коштів, зароблених за рахунок цих знімків, на користь фонду захисту хохлатих макак.
Що ж, ми трохи відійшли від теми, давайте повернемося до нейромереж. Як видно з прикладу з макакою, на момент 2017 року авторське право поширювалося тільки на людей. Але що щодо комп'ютерів? Точної правової бази поки що немає, тому правила відрізняються в залежності від моделі. Наприклад:
Нейромережі більш дбайливо ставляться до збереження своїх прав на згенерований контент, ніж до дотримання авторських прав на твори, на основі яких цей контент згенеровано.
У наступній статті розглянемо більш детально, що про вас збирає нейромережа і як це може бути використано проти вас. Тут не було прикладів з використанням DeepSeek, якраз тому, що вона більше підходить для наступної частини.
Якщо є якісь зауваження або пропозиції — з інтересом прочитаю їх у коментарях.
Про историю с макакой, которой дали в руки фотоаппарат и она сделала селфи, поэтому авторских прав на неё нет — обезьянам не присваивают. Это такой выпад против авторских прав. Люди, связанные с искусством изобретательны в смысле подобных выходок, принятых называть перформансами. Не знаю, насколько правозащитники и вообще юристы эти заявления всерьёз воспримут.
Так уже суд был (и тяжбы до 17 года велись), где и обсуждался данный вопрос
Жаль что в пользовательском редакторе нет кнопки для опросов. Не понятно зашло ли людям или нет. Заметил что на опросы отвечают куда охотнее чем комментируют. То ли длина отпугивает, то ли заумная тема