W przeciwieństwie do pliku tekstowego nie można bezpośrednio edytować pliku PDF. Istnieje wiele sposobów generowania plików PDF przy użyciu tekstu. Ale co, jeśli chcesz pójść w drugą stronę i przekonwertować pliki PDF na pliki tekstowe?

Na szczęście Linux pozwala łatwo modyfikować te pliki z terminala. Ten artykuł pokaże, jak przekonwertować plik PDF na dokument tekstowy w systemie Linux.

Konwertuj PDF na tekst z terminala

Poppler to biblioteka oprogramowania używana do renderowania i modyfikowania plików PDF. Zawiera narzędzie znane jako pdftotekst, który umożliwia użytkownikom generowanie plików tekstowych z plików PDF. Od poppler-utils nie jest częścią standardowych pakietów Linuksa, będziesz musiał zainstalować go ręcznie za pomocą menedżera pakietów.

W Ubuntu i Debianie:

sudo apt install poppler-utils

Aby zainstalować Popplera na Arch Linux:

sudo pacman -S poppler

Instalowanie poppler-utils pakiet na CentOS, Fedora i innych dystrybucjach opartych na RHEL jest łatwy.

sudo dnf zainstaluj poppler-utils
sudo mniam zainstaluj poppler-utils
instagram viewer

Konwertuj cały plik PDF na tekst

Podstawowa składnia polecenia pdftotext to:

pdftotext [opcje] pdffile plik tekstowy

...gdzie plik PDF to bezwzględna lub względna ścieżka do pliku PDF, oraz plik tekstowy to nazwa pliku wyjściowego.

Na przykład, aby przekonwertować lorem-ipsum.pdf do pliku tekstowego:

pdftotext lorem-ipsum.pdf tekst.txt

Jeśli konwertowany plik zawiera znaki wodne lub niewyrównany tekst, możesz je odrzucić w wyniku, używając -nodiag flaga.

pdftotext -nodiag lorem-ipsum.pdf random.text

Przetwarzaj strony w określonym zakresie

Użyj -fa i -I flagę, jeśli chcesz przekonwertować strony mieszczące się w określonym zakresie. Na przykład, aby przekonwertować strony od pierwszego do pięciu w lorem-ipsum.pdf pisać:

pdftotext -f 1 -l 5 lorem-ipsum.pdf output.txt

Aby przekonwertować tylko pierwszą stronę pliku PDF:

pdftotext -f 1 -l 1 lorem-ipsum.pdf output.txt

Konwertuj pliki PDF chronione hasłem na tekst

Pdftotext może nawet konwertować pliki PDF chronione hasłem na pliki tekstowe. -upw i -opw flagi, które oznaczają hasło użytkownika i hasło właściciela odpowiednio zadbaj o proces uwierzytelniania podczas konwersji plików PDF.

pdftotext -upw hasło lorem-ipsum.pdf output.txt
pdftotext -opw hasło lorem-ipsum.pdf output.txt

Pamiętaj, aby wymienić to hasło z hasłem pliku PDF.

Możesz także łączyć wiele flag, aby uzyskać pożądane wyniki. Na przykład, aby przekonwertować strony od pierwszej do trzeciej chronionego hasłem pliku PDF na tekst:

pdftotext -f 1 -l 3 -upw hasło lorem-ipsum.pdf output.txt

Związane z: Jak przekonwertować plik PDF na obrazy w systemie Linux?

Graficznie konwertuj PDF na plik tekstowy

Jeśli praca z wierszem poleceń nie jest twoją filiżanką herbaty, możesz konwertować pliki PDF na pliki tekstowe za pomocą oprogramowania graficznego, takiego jak Calibre. Jest to aplikacja do zarządzania e-bookami, której można używać do przeglądania, organizowania i modyfikować pliki PDF w twoim systemie.

Calibre jest dostępny w oficjalnych repozytoriach dystrybucji Linuksa i każdy może go pobrać za pomocą menedżera pakietów.

Aby zainstalować Calibre na Ubuntu i Debianie:

sudo apt zainstaluj kaliber

W Arch Linuksie:

sudo pacman -S kaliber

W dystrybucjach opartych na RHEL, takich jak CentOS i Fedora, możesz pobrać Calibre za pomocą DNF lub Yum.

sudo dnf zainstaluj kaliber
sudo mniam zainstaluj kaliber

Jak używać Calibre do konwersji plików PDF PDF

Po zainstalowaniu uruchom Calibre w swoim systemie za pomocą Menu aplikacji. Alternatywnie możesz uruchomić Calibre z terminala, wpisując:

kaliber

Aby wygenerować pliki tekstowe za pomocą PDF z Calibre:

  1. Kliknij na Dodaj książki opcja z menu.
  2. Znajdź i wybierz plik PDF, który chcesz przekonwertować.
  3. Zaznacz plik PDF na środkowym panelu i wybierz Konwertuj książki z menu.
  4. Od Format wyjściowy rozwijane, wybierz tekst.
  5. Na koniec kliknij dobrze kontynuować.

Calibre rozpocznie teraz konwersję określonego pliku PDF na dokument tekstowy. Możesz sprawdzić status procesu, klikając Oferty pracy opcję znajdującą się w prawym dolnym rogu okna.

Praca z plikami PDF w systemie Linux

Jeśli chcesz udostępnić komuś dokument, najskuteczniejszym sposobem jest przekonwertowanie go na plik PDF przed udostępnieniem. Wcześniej użytkownicy musieli instalować dedykowaną przeglądarkę plików PDF w swoim systemie, aby wyświetlać pliki PDF, ale teraz prawie każda przeglądarka ma wbudowaną przeglądarkę plików PDF.

Możesz znaleźć kilka aplikacji, które umożliwiają użytkownikowi łatwe przeglądanie i edycję plików PDF. Wiele instalacji systemu Linux jest dostarczanych z LibreOffice, pakietem oprogramowania biurowego, którego można używać jako edytora PDF.

E-mail
5 najlepszych edytorów PDF dla systemu Linux, które powinieneś wypróbować

Chcesz edytować plik PDF w systemie Linux? Te edytory PDF dla systemu Linux można zainstalować bezpłatnie i są łatwe w użyciu.

Czytaj dalej

Powiązane tematy
  • Linux
  • PDF
  • Edytor PDF
  • Linux
O autorze
Deepesh Sharma (63 opublikowane artykuły)

Deepesh to Junior Editor dla Linuksa w MUO. Od ponad 3 lat pisze treści informacyjne w internecie. W wolnym czasie lubi pisać, słuchać muzyki i grać na gitarze.

Więcej od Deepesha Sharma

Zapisz się do naszego newslettera

Dołącz do naszego newslettera, aby otrzymywać porady techniczne, recenzje, bezpłatne e-booki i ekskluzywne oferty!

Jeszcze jeden krok…!

Potwierdź swój adres e-mail w e-mailu, który właśnie do Ciebie wysłaliśmy.

.