Po uruchomieniu ChatGPT w listopadzie 2022 r. fenomenalny chatbot AI stał się jednym z najbardziej zaufanych narzędzi do pisania w Internecie. Jest prosty w użyciu; opisz, co chcesz napisać, a ChatGPT wydrukuje to na ekranie w ciągu kilku sekund.

Jednak w epoce, w której tekst generowany przez sztuczną inteligencję jest przekazywany jako napisany przez człowieka i wykorzystywany do uzyskania nieuczciwej przewagi, identyfikacja treści AI jest bardzo ważna. Ale ChatGPT nie może dokładnie wykryć treści AI, nawet własnej pracy – ale dlaczego?

Czy istnieje różnica między tekstem AI a pismem ludzkim?

Warunkiem wstępnym, aby ChatGPT mógł wykryć swój własny tekst lub jakikolwiek tekst wygenerowany przez sztuczną inteligencję, jest różnica między nim a tekstem napisanym przez człowieka. Czy jest więc jakaś znacząca różnica między tekstem napisanym przez człowieka a treścią generowaną przez sztuczną inteligencję? Jeśli istnieje, z pewnością narzędzie takie jak ChatGPT powinno być w stanie je rozpoznać.

Napisaliśmy krótką historię bez żadnego wkładu z żadnego narzędzia AI, a następnie zapytaliśmy ChatGPT, czy historia jest treścią napisaną przez AI. ChatGPT pewnie oznaczył to jako tekst wygenerowany przez sztuczną inteligencję.

Następnie poprosiliśmy ChatGPT o wygenerowanie historii i w tym samym wątku na czacie skopiowaliśmy i wkleiliśmy wygenerowany tekst i zapytaliśmy ChatGPT, czy tekst został stworzony przez sztuczną inteligencję. Odpowiedź ChatGPT? Pewne „nie”.

ChatGPT nie udało się zidentyfikować tekstu napisanego przez człowieka lub wygenerowanego przez sztuczną inteligencję w obu przypadkach. Dlaczego więc ChatGPT nie może wykryć własnego tekstu? Czy to oznacza, że ​​nie ma różnicy między sztuczną inteligencją a tekstem ludzkim?

Cóż, jest. O różnicach między nimi można by napisać całą książkę, ale nie będzie to miało większego znaczenia. Jeśli więc istnieje różnica, dlaczego ChatGPT lub jakiekolwiek inne narzędzie sztucznej inteligencji nie jest w stanie zidentyfikować tych różnic i dokładnie wskazać tekstu wygenerowanego przez sztuczną inteligencję od tekstu napisanego przez człowieka? Odpowiedź leży w jak działa ChatGPT i jak generuje tekst.

Jak ChatGPT generuje tekst

Gdy poprosisz ChatGPT o wygenerowanie tekstu, próbuje on naśladować proces pisania człowieka. Po pierwsze, model ChatGPT — Generative Pre-trained Transformer (GPT) — został przeszkolony na dużym zbiorze tekstu ludzkiego. Wszystko, od e-maili, artykułów zdrowotnych, artykułów technicznych, esejów szkolnych i prawie każdego tekstu, który można znaleźć w Internecie, zostało przekazane modelowi podczas szkolenia. Dlatego ChatGPT rozumie, jak należy pisać każdy z tych typów tekstów.

Jeśli poprosisz ChatGPT o napisanie e-maila do twojego szefa, wie on, jak taki e-mail powinien wyglądać, ponieważ został przeszkolony na podobnych e-mailach — prawdopodobnie tysiące z nich. Podobnie, jeśli poprosisz go o napisanie eseju do szkoły średniej, wie również, jak powinien brzmieć esej do szkoły średniej. ChatGPT spróbuje napisać wszystko, co chcesz, aby napisał w sposób, w jaki zrobiłby to człowiek.

Ale jest pewien haczyk. W przeciwieństwie do tego, jak piszą ludzie, ChatGPT tak naprawdę nie rozumie, co pisze, w sposób, w jaki zrobiłby to człowiek. Zamiast tego chatbot próbuje przewidzieć, jakie będzie najbardziej prawdopodobne następne słowo w zdaniu, dopóki nie zakończy zapisywania.

Jak ChatGPT pisze według przewidywań

Załóżmy, że prosisz ChatGPT o napisanie historii o fikcyjnym mieście o nazwie Volkra. Istnieje duże prawdopodobieństwo, że chatbot rozpocznie historię od słów „Pewnego razu”. Dzieje się tak, ponieważ chatbot nie myśli sam, ale próbuje przewidzieć, co napisałby człowiek na podstawie tego, czego nauczył się z tysięcy historii, którymi był karmiony szkolenie.

Tak więc, wierząc, że człowiek prawdopodobnie zacząłby historię od słów „Pewnego razu”, ChatGPT próbowałby następnie przewidzieć następne logiczne słowo, które być „a”, po którym następuje „czas”. Więc miałbyś wtedy „Dawno, dawno temu…”, po którym następowałoby następne logiczne słowo i następne, aż do zakończenia historii. ChatGPT zasadniczo pisze, przewidując, jakie słowo naturalnie (lub przynajmniej ma największe prawdopodobieństwo) pojawi się jako następne w zdaniu i wstawi je.

Tak więc, gdy narzędzie sztucznej inteligencji próbuje wykryć, czy tekst jest generowany przez sztuczną inteligencję, jednym z kryteriów, które próbuje zważyć, jest przewidywalność tekstu, ponieważ narzędzia sztucznej inteligencji piszą na podstawie przewidywań. Ta miara przewidywalności nazywana jest zakłopotaniem w żargonie sztucznej inteligencji. Teraz, gdy prezentowany jest tekst, narzędzie AI, takie jak ChatGPT, próbuje przeanalizować tekst, aby zmierzyć przewidywalność sekwencji słów lub zdań w tekście. Większa przewidywalność lub niski poziom zakłopotania zwykle oznaczają, że tekst jest prawdopodobnie generowany przez sztuczną inteligencję. Mniejsza przewidywalność lub większe zakłopotanie zazwyczaj oznacza, że ​​tekst jest prawdopodobnie napisany przez ludzi.

Kryteria te, wraz z innymi czynnikami, takimi jak poziom kreatywności tekstu, niestety nie wystarczają, aby stwierdzić z całą pewnością, czy tekst został napisany przez narzędzie AI, czy nie. Dzieje się tak, ponieważ ludzie mogą pisać z większą wariancją, jak w przykładowym tekście, którego użyliśmy do demonstracji na początku tego artykułu.

Chatboty AI, takie jak ChatGPT, są zaprojektowane tak, aby w jak największym stopniu naśladować naturalny ludzki język. Tak więc, chociaż tekst AI może mieć dostrzegalne wzorce, wzorce te nie są tak oczywiste nawet dla potężnego narzędzia, takiego jak ChatGPT. Właśnie dlatego ChatGPT nie może wykryć własnego pisma, jak również dlaczego narzędzia do wykrywania tekstu AI nie działają.

Czy ChatGPT rozpozna w przyszłości własne pismo?

Obecnie narzędzia takie jak ChatGPT nie mogą wykryć, czy tekst został napisany samodzielnie, czy przez inne narzędzie AI, ponieważ nie ma wyraźnego, dostrzegalnego wzorca w treści generowanej przez AI. Jest jednak duża szansa, że ​​wkrótce może się to zmienić. Dzięki staraniom firm takich jak ChatGPT, aby wprowadzić cyfrowe znaki wodne do treści generowanych przez ChatGPT, tekst generowany przez chatbota będzie bardziej rozpoznawalny.