Istnieje kilka kluczowych różnic między starszym modelem GPT-3.5 a nowym, błyszczącym modelem GPT-4.
Po wszystkich spekulacjach i twierdzeniach dotyczących możliwości GPT-4, długo oczekiwana czwarta iteracja rodziny modeli językowych GPT została uruchomiona 14 marca 2023 r.
GPT-4 nie był wyposażony w niektóre z często reklamowanych funkcji, które podobno miał. Jednak najnowszy model znacznie poprawia GPT-3.5 i jego poprzedników. Ale czym różni się GPT-4 od GPT-3.5? Omówimy kilka kluczowych różnic między GPT-4 i GPT-3.5.
1. GPT-4 vs. GPT-3.5: Kreatywność
Jedną z najbardziej wyraźnych zalet modelu GPT-4 w porównaniu z GPT-3.5 jest jego zdolność do udzielania bardziej kreatywnych odpowiedzi na monity. Nie zrozum mnie źle; GPT-3.5 jest bardzo kreatywny. Jest długa lista kreatywne rzeczy, które możesz zrobić z ChatGPT, który używa tego modelu. Jednak już teraz przewyższa wiele dużych modeli językowych pod względem kreatywności.
Jednak GPT-4 jeszcze bardziej podnosi poprzeczkę. Chociaż twórcza przewaga GPT-4 może nie być oczywista przy próbie rozwiązania podstawowych problemów, różnica w kreatywność między obydwoma modelami staje się widoczna, gdy zadanie staje się trudniejsze i wymaga wyższego poziomu kreatywność.
Na przykład, jeśli poprosisz obie modelki o wykonanie kreatywnego zadania, takiego jak napisanie wiersza, używając zarówno angielskiego, jak i francuskiego w każdym wersie wiersza, ChatGPT obsługiwany przez najnowszy model GPT-4 przyniesie lepsze rezultaty. Podczas gdy odpowiedź GPT-4 używałaby obu języków w każdym wierszu, GPT-3.5 zamiast tego zmieniałby oba języki, przy czym każdy wiersz używałby jednego języka, a następny drugiego.
2. GPT-4 vs. GPT-3.5: Obraz lub dane wizualne
Podczas gdy GPT-3.5 może akceptować tylko monity tekstowe, GPT-4 jest multimodalny i może akceptować zarówno tekst, jak i wizualne dane wejściowe. Aby było jasne, kiedy mówimy o wizualnych danych wejściowych, obraz nie musi być obrazem wpisanego monitu — może to być obraz dowolnego elementu. Tak więc, od obrazu odręcznego problemu matematycznego po memy Reddit, GPT-4 może zrozumieć i opisać prawie każdy obraz.
W przeciwieństwie do GPT-3, GPT-4 jest zarówno językiem, jak i wizualnym modelem.
Podczas transmisji na żywo z zapowiedzią GPT-4 inżynier OpenAI przesłał modelowi zrzut ekranu serwera Discord. GPT-4 mógł opisać każdy szczegół, w tym nazwiska użytkowników online w tym czasie. Obraz ręcznie rysowanej makiety żartobliwej strony internetowej został również przesłany do modelu wraz z instrukcjami przekształcić go w stronę internetową i, co zaskakujące, GPT-4 dostarczył działający kod dla strony internetowej, która pasowała do obraz.
3. GPT-4 vs. GPT-3.5: Bezpieczniejsze odpowiedzi
Chociaż GPT-4 nie jest doskonały, środki, które podejmuje w celu zapewnienia bezpieczniejszych reakcji, są mile widzianym ulepszeniem w stosunku do modelu GPT-3.5. W przypadku GPT-3.5 firma OpenAI przyjęła podejście do bezpieczeństwa bardziej oparte na moderacji. Innymi słowy, niektóre środki bezpieczeństwa były raczej refleksją. OpenAI monitorowało działania użytkowników i zadawane przez nich pytania, identyfikowało wady i próbowało je naprawić w drodze.
W przypadku GPT-4 większość środków bezpieczeństwa jest już wbudowana w system na poziomie modelu. Aby zrozumieć różnicę, przypomina to budowanie domu z solidnych materiałów od samego początku w porównaniu z używaniem wszystkiego, co się da, a następnie próbowaniem łatania rzeczy w miarę pojawiania się usterek. Według Raport techniczny GPT-4 OpenAI [PDF], GPT-4 wytwarza reakcje toksyczne tylko w 0,73% przypadków w porównaniu z 6,48% odpowiedzi toksycznych GPT-3.5.
4. GPT-4 vs. GPT-3.5: Faktyczność odpowiedzi
Jedną z wad GPT-3.5 jest skłonność do generowania bezsensownych i nieprawdziwych informacji. W żargonie sztucznej inteligencji nazywa się to „halucynacją sztucznej inteligencji” i może powodować brak zaufania do informacji generowanych przez sztuczną inteligencję.
W GPT-4 halucynacje nadal stanowią problem. Jednak zgodnie z raportem technicznym GPT-4, nowy model ma od 19% do 29% mniejsze prawdopodobieństwo wystąpienia halucynacji w porównaniu z modelem GPT-3.5. Ale nie chodzi tylko o raport techniczny. Odpowiedzi z modelu GPT-4 na ChatGPT są zauważalnie bardziej rzeczowe.
5. GPT-4 vs. GPT-3.5: Okno kontekstowe
Rzadziej omawianą różnicą między GPT-4 a GPT-3.5 jest okno kontekstowe i rozmiar kontekstu. Okno kontekstowe określa, ile danych model może przechowywać w swojej „pamięci” podczas sesji czatu i jak długo. GPT-4 ma znacznie lepszy rozmiar kontekstu i okno niż jego poprzedni model.
W praktyce oznacza to, że GPT-4 lepiej i dłużej zapamiętuje kontekst rozmowy, a także instrukcje wydawane podczas rozmowy.
Problem z GPT-3.5 polega na skłonności modelu do odejścia od tematu lub nieprzestrzegania instrukcji w miarę postępów w trakcie rozmowy. Możesz na przykład powiedzieć modelowi, aby zwracał się do ciebie po imieniu, i robiłby to przez chwilę, ale potem nie postępowałby zgodnie z instrukcjami po drodze. Chociaż problem ten nadal występuje w przypadku modelu GPT-4, jest on mniejszy ze względu na lepsze okno kontekstowe.
Inną kwestią jest ograniczenie ilości tekstu, którego można użyć jednocześnie w monicie. Podsumowanie długiego tekstu za pomocą GPT-3 zwykle oznacza podzielenie tekstu na wiele fragmentów i podsumowanie ich kawałek po fragmencie. Poprawa długości kontekstu w modelu GPT-4 oznacza, że możesz natychmiast wklejać całe pliki PDF i uzyskać podsumowanie modelu bez dzielenia go na części.
GPT-4: krok naprzód w stosunku do GPT-3.5
Bez wątpienia GPT-4 jest znaczącym krokiem naprzód w stosunku do swoich poprzednich modeli. Chociaż nadal jest nękany niektórymi ograniczeniami GPT-3.5, znaczącymi ulepszeniami w kilku obszarach i dodanie nowych możliwości sprawia, że model jest ekscytującym nowym krokiem w dążeniu do prawdziwie inteligentnego języka sztucznej inteligencji modele.