După o perioadă în care OpenAI a încercat să convingă pe toată lumea că nu foloseşte materiale cu copyright pentru a îşi antrena AI-ul dedicat lui ChatGPT, iată că acum recunoaşte că lucrurile nu stau chiar aşa. De altfel are o dispută legală cu The New York Times fix în această privinţă.
Asta ridică întrebări cu privire la practicile responsabile şi transparente din lumea chatboților cu AI. Copyright-ul din ziua de azi, drepturile de autor acoperă o sumedenie de exprimări umane, de la postări pe blog, fotografii, postări pe forumuri, bucăţi de cod software şi documente guvernamentale. Asta argumentează OpenAI, afirmând apoi şi că ar fi imposibil de antrenat un model AI fără a folosi materiale cu copyright. Dacă se limitează doar la creaţii de nivelul domeniului public şi desene de acum un secol nu va obţine un bot capabil.
E nevoie de mai multă transparență a modului în care AI-urile sunt antrenate şi din ce surse. OpenAI nu a fost cea mai transparentă în această privinţă, e drept. Aici apar două probleme: fie OpenAI nu ştie de unde vin toată materialele procesate sau nu vrea să ne spună asta. Pe 2 ianuarie 2024 The New York Times a dat în judecată OpenAI pentru că i-a folosit conţinutul şi a cerut daune. Se încercase o negociere cu Microsoft în aprilie 2023, dar fără succes.
AI-ul Midjourney a fost şi el atacat pentru că a "spălat" munca artiştilor fără ca ei să ştie şi să îşi dea aprobarea. De altfel în aprilie 2023 Italia a interzis ChatGPT şi a ameninţat OpenAI cu milioane de euro amendă. Motivul? Colectarea de date ale cetăţenilor italieni, ceea ce e mai grav decât încălcarea de copyright.