Modele GPT OpenAI zrewolucjonizowały przetwarzanie języka naturalnego (NLP), ale chyba że płacisz za premium dostęp do usług OpenAI, nie będziesz w stanie dostroić i zintegrować ich modeli GPT ze swoimi Aplikacje. Co więcej, OpenAI będzie mieć dostęp do wszystkich Twoich rozmów, co może stanowić problem z bezpieczeństwem, jeśli korzystasz z ChatGPT w celach biznesowych i innych bardziej wrażliwych obszarach swojego życia. Jeśli nie masz na to ochoty, możesz wypróbować GPT4All.

Czym dokładnie jest GPT4All? Jak to działa i dlaczego używać go w ChatGPT?

Co to jest GPT4All?

GPT4All to ekosystem typu open source służący do integracji LLM z aplikacjami bez płacenia za subskrypcję platformy lub sprzętu. Został stworzony przez Nomic AI, firmę zajmującą się kartografią informacji, której celem jest poprawa dostępu do zasobów AI.

GPT4All został zaprojektowany do działania na nowoczesnych i względnie nowoczesnych komputerach bez potrzeby połączenia z Internetem, a nawet GPU! Jest to możliwe, ponieważ większość modeli dostarczonych przez GPT4All została skwantyzowana do wielkości zaledwie kilku gigabajtów, wymagając jedynie 4–16 GB pamięci RAM do działania.

instagram viewer

Dzięki temu mniejsze firmy, organizacje i niezależni badacze mogą używać i integrować LLM dla określonych aplikacji. A dzięki łatwej instalacji GPT4All za pomocą instalatora jednym kliknięciem ludzie mogą teraz używać GPT4All i wiele swoich LLM do tworzenia treści, pisania kodu, rozumienia dokumentów i informacji zgromadzenie.

Dlaczego warto używać GPT4ALL zamiast ChatGPT?

Źródło obrazu: bruce mars/Nierozpryskiwany

Istnieje kilka powodów, dla których możesz chcieć używać GPT4All przez ChatGPT.

  • Ruchliwość: Modele dostarczane przez GPT4All wymagają tylko od czterech do ośmiu gigabajtów pamięci, nie wymagają GPU do działania i można je łatwo zapisać na dysku flash USB za pomocą instalatora GPT4All jednym kliknięciem. To sprawia, że ​​GPT4All i jego modele są naprawdę przenośne i użyteczne na prawie każdym nowoczesnym komputerze.
  • Prywatność i ochrona: Jak wyjaśniono wcześniej, jeśli nie masz dostępu do ChatGPT Plus, wszystkie Twoje konwersje ChatGPT są dostępne przez OpenAI. GPT4All koncentruje się na przejrzystości danych i prywatności; twoje dane będą zapisywane tylko na twoim lokalnym sprzęcie, chyba że celowo udostępnisz je GPT4All, aby pomóc w rozwijaniu ich modeli.
  • Tryb offline: GPT to zastrzeżony model wymagający dostępu do interfejsu API i stałego połączenia z Internetem w celu wysłania zapytania lub uzyskania dostępu do modelu. Jeśli utracisz połączenie internetowe lub wystąpią problemy z serwerem, utracisz dostęp do ChatGPT. Inaczej jest w przypadku GPT4All. Ponieważ wszystkie dane są już przechowywane w pakiecie o pojemności od czterech do ośmiu gigabajtów, a wnioskowanie odbywa się lokalnie, dostęp do modeli w GPT4All nie wymaga połączenia internetowego. Możesz nadal rozmawiać i dostrajać swój model nawet bez połączenia z Internetem.
  • Darmowe i otwarte oprogramowanie: Kilka LLM dostarczonych przez GPT4All jest objętych licencją GPL-2. Dzięki temu każdy może dostroić i zintegrować własne modele do użytku komercyjnego bez konieczności płacenia za licencje.

Jak działa GPT4All

Jak wspomniano wcześniej, GPT4All to ekosystem używany do szkolenia i wdrażania LLM lokalnie na komputerze, co jest niesamowitym wyczynem! Zazwyczaj ładowanie standardowego LLM o pojemności 25–30 GB wymagałoby 32 GB pamięci RAM i procesora graficznego klasy korporacyjnej.

Dla porównania, LLM, których możesz używać z GPT4All, wymagają tylko 3 GB-8 GB pamięci i mogą działać na 4 GB-16 GB pamięci RAM. Dzięki temu możliwe jest uruchomienie całego LLM na urządzeniu brzegowym bez potrzeby korzystania z GPU lub zewnętrznej pomocy w chmurze.

Wymagania sprzętowe do uruchamiania LLM na GPT4All zostały znacznie zmniejszone dzięki kwantyzacji sieci neuronowej. Zmniejszając wagę precyzji i liczbę aktywacji w sieci neuronowej, wiele modeli dostarczonych przez GPT4All można uruchomić na większości stosunkowo nowoczesnych komputerów.

Dane treningowe używane w niektórych dostępnych modelach zostały zebrane za pomocą „stosu”, który jest po prostu zeskanowanymi danymi z publicznie udostępnianych treści w Internecie. Dane są następnie przesyłane do bazy danych Atlas AI Nomic AI, którą można zobaczyć na podstawie korelacji na łatwej do zobaczenia mapie wektorowej 2D (znanej również jako wektorową bazę danych AI).

Dzięki szkoleniu modelu Groovy przez Nomic AI i wykorzystaniu publicznie dostępnych danych, Nomic AI było w stanie udostępnić model na otwartej licencji GPL, która pozwala każdemu go używać, nawet w zastosowaniach komercyjnych.

Jak zainstalować GPT4All

Instalacja GPT4All jest prosta, a teraz, gdy została wydana wersja 2 GPT4All, jest jeszcze łatwiejsza! Najlepszym sposobem na zainstalowanie GPT4All 2 jest pobranie instalatora jednym kliknięciem:

Pobierać:GPT4All dla Windows, macOS lub Linux (bezpłatny)

Poniższe instrukcje dotyczą systemu Windows, ale GPT4All można zainstalować w każdym głównym systemie operacyjnym.

Po pobraniu kliknij dwukrotnie instalator i wybierz zainstalować. Program Windows Defender może uznać instalację za złośliwą, ponieważ proces nadawania prawidłowych podpisów przez firmę Microsoft dla aplikacji innych firm może zająć dużo czasu. Jednak wkrótce powinno to zostać naprawione. W chwili pisania tego tekstu, o ile pobrałeś aplikację GPT4All z oficjalnej strony internetowej, powinieneś być bezpieczny. Kliknij Zainstaluj mimo wszystko zainstalować GPT4All.

Po otwarciu aplikacji musisz wybrać model, którego chcesz użyć. GPT4ALL zapewnia kilka modeli, z których każdy będzie miał swoje mocne i słabe strony. Aby dowiedzieć się, który model pobrać, oto tabela przedstawiająca ich mocne i słabe strony.

Model

Rozmiar

Notatka

Parametry

Typ

Kwantyzacja

Hermesa

7,58 GB

  • Oparte na instrukcjach
  • Daje długie odpowiedzi
  • Wyselekcjonowany z 300 000 nieocenzurowanych instrukcji
  • Nie można używać komercyjnie

13 miliardów

Lama

q4_0

GPT4All Falcon

3,78 GB

  • Szybkie odpowiedzi
  • Oparte na instrukcjach
  • Licencjonowany do użytku komercyjnego

7 miliardów

Sokół

q4_0

Groovy

8 GB

  • Szybkie odpowiedzi
  • -Twórcze odpowiedzi
  • Oparte na instrukcjach
  • Licencjonowany do użytku komercyjnego

7 miliardów

GPT-J

q4_0

CzatGPT-3.5 Turbo

Minimalny

  • Wymaga osobistego API
  • Wyśle twoje czaty do OpenAI
  • GPT4All służy wyłącznie do komunikacji z OpenAI

?

GPT

NA

CzatGPT-4

Minimalny

  • Wymaga osobistego API
  • Wyśle twoje czaty do OpenAI
  • GPT4All służy wyłącznie do komunikacji z OpenAI

?

GPT

NA

Drzemka

7,58 GB

  • Oparte na instrukcjach
  • Wolniejszy niż Groovy, ale z wyższą jakością odpowiedzi
  • Nie można używać komercyjnie

13 miliardów

Lama

q4_0

Czat MPT

4,52 GB

  • Szybkie odpowiedzi
  • Oparte na czacie
  • Nie można używać komercyjnie

7 miliardów

MPT

q4_0

Orka

3,53 GB

  • Oparte na instrukcjach
  • Wyjaśnia dostrojone zestawy danych
  • Podejścia do konstrukcji zbioru danych Orca Research Paper
  • Licencjonowany do użytku komercyjnego

7 miliardów

OpenLLaMA

q4_0

Wigoń

3,92 GB

  • Oparte na instrukcjach
  • Nie można używać komercyjnie

7 miliardów

Lama

q4_2

Czarodziej

3,92 GB

  • Oparte na instrukcjach
  • Nie można używać komercyjnie

7 miliardów

Lama

q4_2

Czarodziej bez cenzury

7,58 GB

  • Oparte na instrukcjach
  • Nie można używać komercyjnie

13 miliardów

Lama

q4_0

Pamiętaj, że oferowane modele mają różne poziomy ograniczeń. Nie wszystkie modele mogą być używane komercyjnie za darmo; niektóre będą wymagały więcej zasobów sprzętowych, podczas gdy inne będą potrzebować klucza API. Najmniej restrykcyjne modele dostępne w GPT4All to Groovy, GPT4All Falcon i Orca.

Czy można trenować modele GPT4All?

Tak, ale nie skwantyzowane wersje. Aby skutecznie dostroić modele GPT4All, musisz pobrać surowe modele i użyć procesorów graficznych klasy korporacyjnej, takich jak Akceleratory Instinct firmy AMD lub procesory graficzne NVIDIA Ampere lub Hopper. Ponadto będziesz musiał wyszkolić model za pomocą platformy szkoleniowej AI, takiej jak LangChain, co będzie wymagać pewnej wiedzy technicznej.

Precyzyjne dostrojenie modelu GPT4All będzie wymagało pewnych zasobów finansowych, a także pewnej wiedzy technicznej, ale jeśli chcesz podawać tylko niestandardowe dane modelu GPT4All, możesz kontynuuj szkolenie modelu poprzez pobieranie rozszerzonej generacji (która pomaga modelowi językowemu uzyskać dostęp i zrozumieć informacje poza podstawowym szkoleniem, aby ukończyć zadania). Możesz to zrobić, prosząc GPT4All o modelowanie niestandardowych danych przed zadaniem pytania. Niestandardowe dane powinny być zapisywane lokalnie, a po wyświetleniu monitu model powinien być w stanie dostarczyć Ci informacje, które kiedyś podałeś.

Czy powinieneś używać GTP4All?

Ideą GPT4All jest zapewnienie bezpłatnej platformy typu open source, na której ludzie mogą uruchamiać duże modele językowe na swoich komputerach. Obecnie GPT4All i jego skwantyzowane modele doskonale nadają się do eksperymentowania, uczenia się i wypróbowywania różnych LLM w bezpiecznym środowisku. W przypadku profesjonalnych obciążeń nadal zalecamy korzystanie z ChatGPT, ponieważ model jest znacznie bardziej wydajny.

Ogólnie rzecz biorąc, nie ma powodu, aby ograniczać się do jednego. Ponieważ ich przypadki użycia nie pokrywają się, powinieneś spróbować użyć obu.