Chcesz udostępnić ChatGPT swoje niestandardowe dane? Oto krok po kroku, jak to zrobić!

Udostępniając technologię GPT w potężnym i łatwym w obsłudze chatbocie, ChatGPT stał się najpopularniejszym narzędziem AI na świecie. Wiele osób używa ChatGPT do prowadzenia angażujących konwersacji, odpowiadania na pytania, oferowania kreatywnych sugestii oraz pomocy w kodowaniu i pisaniu. Jednak ChatGPT jest ograniczony, ponieważ nie możesz przechowywać swoich danych do długoterminowego użytku osobistego, a jego punkt odcięcia danych wiedzy we wrześniu 2021 r.

Aby obejść ten problem, możemy użyć API OpenAI i LangChain, aby zapewnić ChatGPT niestandardowe dane i zaktualizowane informacje po 2021 r., aby utworzyć niestandardową instancję ChatGPT.

Dlaczego warto dostarczać ChatGPT z niestandardowymi danymi?

Dostarczanie ChatGPT niestandardowymi danymi i dostarczanie zaktualizowanych informacji poza datą graniczną wiedzy zapewnia kilka korzyści w porównaniu ze zwykłym używaniem ChatGPT. Oto kilka z nich:

  • Spersonalizowane interakcje:
    instagram viewer
    Udostępniając ChatGPT niestandardowe dane, użytkownicy mogą stworzyć bardziej spersonalizowane doświadczenie. Model można trenować na określonych zestawach danych odpowiednich dla poszczególnych użytkowników lub organizacji, co daje odpowiedzi dostosowane do ich unikalnych potrzeb i preferencji.
  • Specjalna wiedza specjalistyczna: Niestandardowa integracja danych pozwala ChatGPT specjalizować się w określonych domenach lub branżach. Można go przeszkolić w zakresie wiedzy branżowej, terminologii i trendów, umożliwiając dokładniejsze i wnikliwsze odpowiedzi w tych konkretnych obszarach.
  • Aktualne i dokładne informacje: Dostęp do aktualnych informacji zapewnia, że ​​ChatGPT jest na bieżąco z najnowszymi osiągnięciami i wiedzą. Może dostarczać dokładnych odpowiedzi na podstawie ostatnich wydarzeń, wiadomości lub badań, dzięki czemu jest bardziej wiarygodnym źródłem informacji.

Teraz, gdy rozumiesz, jak ważne jest dostarczanie niestandardowych danych do ChatGPT, oto krok po kroku, jak to zrobić na komputerze lokalnym.

Krok 1: Zainstaluj i pobierz oprogramowanie i gotowy skrypt

Należy pamiętać, że poniższe instrukcje dotyczą komputera z systemem Windows 10 lub Windows 11.

Aby dostarczać niestandardowe dane do ChatGPT, musisz zainstalować i pobrać najnowszą wersję Python3, Git, Microsoft C++ oraz skrypt pobierania ChatGPT z GitHub. Jeśli masz już zainstalowane oprogramowanie na swoim komputerze, upewnij się, że jest ono zaktualizowane do najnowszej wersji, aby uniknąć problemów podczas procesu.

Zacznij od zainstalowania:

  • Pobierać:Python3 (Bezpłatny)
  • Pobierać:Git (Bezpłatny)
  • Pobierać:Narzędzia Visual Build firmy Microsoft (Bezpłatny)

Uwagi dotyczące instalacji Python3 i Microsoft C++

Podczas instalowania Pythona 3 upewnij się, że zaznaczyłeś opcję Dodaj python.exe do PATH opcję przed kliknięciem Zainstaluj teraz. Jest to ważne, ponieważ umożliwia dostęp do Pythona w dowolnym katalogu na komputerze.

Podczas instalacji Microsoft C++ będziesz chciał zainstalować Narzędzia kompilacji Microsoft Visual Studio Pierwszy. Po zainstalowaniu możesz zaznaczyć Tworzenie desktopów w C++ opcję i kliknij zainstalować ze wszystkimi opcjonalnymi narzędziami automatycznie zaznaczonymi na prawym pasku bocznym.

Teraz, po zainstalowaniu najnowszych wersji Python3, Git i Microsoft C++, możesz pobrać skrypt Pythona, aby łatwo wysyłać zapytania do niestandardowych danych lokalnych.

Pobierać: Skrypt pobierania ChatGPT (Bezpłatny)

Aby pobrać skrypt, kliknij Kod, następnie wybierz Pobierz ZIP. To powinno pobrać skrypt Pythona do domyślnego lub wybranego katalogu.

Po pobraniu możemy teraz skonfigurować środowisko lokalne.

Krok 2: Skonfiguruj środowisko lokalne

Aby skonfigurować środowisko, musisz otworzyć terminal w pobranym folderze chatgpt-retrieval-main. Aby to zrobić, otwórz chatgpt-retrieval-main folder, kliknij prawym przyciskiem myszy i wybierz Otwórz w Terminalu.

Po otwarciu terminala skopiuj i wklej to polecenie:

pip install langchain openai chromadb tiktoken bez struktury

To polecenie używa menedżera pakietów Pythona do tworzyć i zarządzać wirtualnym środowiskiem Pythona potrzebne.

Po utworzeniu środowiska wirtualnego musimy dostarczyć klucz API OpenAI, aby uzyskać dostęp do ich usług. Najpierw musimy wygenerować klucz API z pliku Witryna kluczy OpenAI API klikając na Utwórz nowy tajny klucz, dodając nazwę klucza, a następnie naciskając Utwórz przycisk tajnego klucza.

Otrzymasz ciąg znaków. To jest Twój klucz API OpenAI. Skopiuj go, klikając ikonę kopiowania z boku klucza API. Pamiętaj, że ten klucz API powinien być utrzymywany w tajemnicy. Nie udostępniaj go innym, chyba że naprawdę chcesz, aby używali go razem z tobą.

Po skopiowaniu wróć do głównego folderu chatgpt-retrieval-main i otwórz stałe za pomocą Notatnik. Teraz zastąp symbol zastępczy swoim kluczem API. Pamiętaj o zapisaniu pliku!

Po pomyślnym skonfigurowaniu środowiska wirtualnego i dodaniu klucza API OpenAI jako zmiennej środowiskowej. Możesz teraz podać swoje niestandardowe dane do ChatGPT.

Krok 3: Dodawanie danych niestandardowych

Aby dodać niestandardowe dane, umieść wszystkie niestandardowe dane tekstowe w pliku dane folder w chatgpt-retrieval-main. Format danych tekstowych może mieć postać PDF, TXT lub DOC.

Jak widać na powyższym zrzucie ekranu, dodałem plik tekstowy zawierający wymyślony osobisty harmonogram, artykuł, który napisałem Akceleratory Instinct firmy AMDoraz dokument PDF.

Krok 4: Wysyłanie zapytań do ChatGPT przez terminal

Skrypt w języku Python pozwala nam wyszukiwać dane z niestandardowych danych, które dodaliśmy do folderu danych i Internetu. Innymi słowy, będziesz mieć dostęp do zwykłego zaplecza ChatGPT i wszystkich danych przechowywanych lokalnie w folderze danych.

Aby użyć skryptu, uruchom python chatgpt.py script, a następnie dodaj swoje pytanie lub zapytanie jako argument.

pyton chatgpt.py "TWOJE PYTANIE"

Pamiętaj, aby umieścić pytania w cudzysłowie.

Aby sprawdzić, czy udało nam się przekazać ChatGPT naszymi danymi, zadam osobiste pytanie dotyczące Osobisty plan.txt plik.

Zadziałało! Oznacza to, że ChatGPT był w stanie odczytać podany wcześniej plik Personal Sched.txt. Zobaczmy teraz, czy udało nam się nakarmić ChatGPT informacjami, których nie zna ze względu na datę graniczną wiedzy.

Jak widać, poprawnie opisał AMD Instinct MI250x, który został wydany po dacie odcięcia wiedzy ChatGPT -3.

Ograniczenia niestandardowego ChatGPT

Chociaż zasilanie GPT-3.5 niestandardowymi danymi otwiera więcej sposobów stosowania i używania LLM, istnieje kilka wad i ograniczeń.

Po pierwsze, musisz samodzielnie podać wszystkie dane. Nadal możesz uzyskać dostęp do całej wiedzy GPT-3.5 aż do daty granicznej wiedzy; należy jednak podać wszystkie dodatkowe dane. Oznacza to, że jeśli chcesz, aby Twój lokalny model miał wiedzę na określony temat w Internecie, którego GPT-3.5 jeszcze nie zna, będziesz musiał przejść do Internetu i samodzielnie zeskrobać dane i zapisać je jako tekst w folderze danych chatgpt-retrieval-main.

Innym problemem jest to, że wysyłanie zapytań ChatGPT w ten sposób zajmuje więcej czasu w porównaniu do bezpośredniego zapytania ChatGPT.

Wreszcie, jedynym obecnie dostępnym modelem jest GPT-3.5 Turbo. Więc nawet jeśli masz dostęp do GPT-4, nie będziesz mógł go użyć do zasilania swojej niestandardowej instancji ChatGPT.

Niestandardowy ChatGPT jest niesamowity, ale ograniczony

Dostarczanie niestandardowych danych do ChatGPT to skuteczny sposób na lepsze wykorzystanie modelu. Dzięki tej metodzie możesz zasilać model dowolnymi danymi tekstowymi i monitować go tak, jak zwykły ChatGPT, aczkolwiek z pewnymi ograniczeniami. Zmieni się to jednak w przyszłości, ponieważ łatwiej będzie zintegrować nasze dane z LLM, wraz z dostępem do najnowszego modelu GPT-4.