Modele sztucznej inteligencji, takie jak ChatGPT i Bard, są szkolone przy użyciu danych tworzonych przez ludzi. Im więcej danych pochłaniają, tym mądrzejsi stają się w naśladowaniu ludzkiej inteligencji i kreatywności. Wielcy gracze w branży sztucznej inteligencji, tacy jak OpenAI i Meta, wdrożyli duże modele językowe wytrenowane poprzez pobieranie tekstu i książek dostępnych online w celu wyodrębnienia danych.

Ze względu na sposób szkolenia LLM nieunikniony był konflikt między prawem autorskim a sztuczną inteligencją. Teraz kurczaki wracają do domu, aby grzędować, ponieważ Sarah Silverman i inni artyści pozywają OpenAI i Meta za naruszenie praw autorskich.

W pozew zbiorowy [PDF] złożony w Kalifornii, komik Sarah Silverman i inni pisarze (Christopher Golden i Richard Kadrey) starają się odzyskać odszkodowanie od OpenAI i Meta za naruszenie praw autorskich. W pozwie zarzuca się, że OpenAI i Meta zeskrobały książki chronione prawem autorskim z pirackich stron internetowych, aby wyszkolić swoje modele AI. Jest to odpowiednik modelu AI, który pobiera swoje zestawy danych treningowych z Piratebay bez wynagrodzenia dla autorów.

instagram viewer

Przypadkowo, A odrębny pozew zbiorowy [PDF] przeciwko OpenAI twierdzi, że firma wykorzystała nieautoryzowane prywatne informacje do szkolenia ChatGPT. Google stoi również w obliczu podobnego procesu sądowego w związku z rzekomym wykorzystaniem skradzionych danych do szkolenia Google Bard. Dlatego powinieneś wyrób sobie nawyk ochrony swoich danych osobowych, chociaż publikacja pracy i prywatne dane osobowe to nie to samo.

Jakie są szanse, że Sarah Silverman wygra proces?

Źródło obrazu: freepik

Silverman i inni artyści twierdzą, że ChatGPT może dokładnie podsumować ich książki, gdy zostanie o to poproszony. W skardze argumentuje, że nie byłoby to możliwe, gdyby model AI nie miał dostępu do materiału chronionego prawem autorskim. Jeśli jednak ChatGPT został przeszkolony przy użyciu miliardów tekstów internetowych, prawdopodobnie natrafił na artykuły, komentarze i posty w mediach społecznościowych omawiające książki.

Co więcej, Meta ujawniła, skąd nabyła książki, których używała do trenowania swojego modelu sztucznej inteligencji – źródło pochodziło z witryny torrent z e-bookami. Podobnie pozew zbiorowy przeciwko OpenAI wspomina również o nielegalnych stronach internetowych, na których podejrzewa się, że OpenAI uzyskało materiały chronione prawem autorskim, ale OpenAI jeszcze nie potwierdziło swoich źródeł.

Jeśli zostanie udowodnione, że OpenAI i Meta korzystały z nielegalnych stron z torrentami w celu zdobycia materiałów chronionych prawem autorskim w celu trenowania swoich modeli sztucznej inteligencji, Silverman może mieć szansę na wygranie procesu. Jednak modele AI to niezbadane terytorium bez precedensu, na którym sądy mogłyby się oprzeć, wydając orzeczenie w oparciu o naruszenie praw autorskich AI. W rzeczywistości jest to jeden z powodów UE zaproponowała ustawę o sztucznej inteligencji.

Jaka jest przyszłość modeli AI i prawa autorskiego?

Wciąż jesteśmy na początku sztucznej inteligencji, aby wiedzieć, jak dostosuje się do prawa autorskiego. Próba zrozumienia jest jeszcze bardziej skomplikowana kto jest właścicielem praw autorskich do tworzenia AI. Jednak w przypadku twórców-ludzi istnieją przepisy chroniące ich przed dostępem osób trzecich do ich materiałów chronionych prawem autorskim bez wynagrodzenia, zgody lub uznania. Jeśli zasady istnieją dla ludzi, czy będą miały zastosowanie do modeli AI?

Parlament UE sporządził najbliższe spojrzenie na to, w jaki sposób modele AI będą zgodne z prawem autorskim. Jeśli ustawa UE o sztucznej inteligencji zostanie przyjęta, modele sztucznej inteligencji, takie jak ChatGPT i Bard, będą musiały publikować wszystkie swoje źródła danych i dane chronione prawem autorskim wykorzystywane do szkolenia. Pomoże to wyjaśnić wszelkie nieporozumienia, jeśli modele AI uzyskiwały dostęp do chronionych prawem autorskim książek, filmów, muzyki i zdjęć w celu szkolenia za pośrednictwem nielegalnych pirackich stron internetowych.

Orzeczenie w sprawie pozwu zbiorowego AI ustanowi precedens prawny

Duże modele językowe mogą przeszukać wszystkie zakamarki internetu w poszukiwaniu danych wykorzystywanych w szkoleniu. Ale czy byliby odpowiedzialni za naruszenie praw autorskich, gdyby uzyskali dostęp do nielegalnych stron z torrentami w celu zdobycia danych? A jeśli tak, czy możesz to udowodnić?

Niezależnie od wyniku pozwy zbiorowe przeciwko firmom technologicznym, które są właścicielami najpopularniejszych modeli sztucznej inteligencji, stworzą precedens, który będzie miał znaczenie w przyszłości.