W przeciwieństwie do pliku tekstowego nie można bezpośrednio edytować pliku PDF. Istnieje wiele sposobów generowania plików PDF przy użyciu tekstu. Ale co, jeśli chcesz pójść w drugą stronę i przekonwertować pliki PDF na pliki tekstowe?
Na szczęście Linux pozwala łatwo modyfikować te pliki z terminala. Ten artykuł pokaże, jak przekonwertować plik PDF na dokument tekstowy w systemie Linux.
Konwertuj PDF na tekst z terminala
Poppler to biblioteka oprogramowania używana do renderowania i modyfikowania plików PDF. Zawiera narzędzie znane jako pdftotekst, który umożliwia użytkownikom generowanie plików tekstowych z plików PDF. Od poppler-utils nie jest częścią standardowych pakietów Linuksa, będziesz musiał zainstalować go ręcznie za pomocą menedżera pakietów.
W Ubuntu i Debianie:
sudo apt install poppler-utils
Aby zainstalować Popplera na Arch Linux:
sudo pacman -S poppler
Instalowanie poppler-utils pakiet na CentOS, Fedora i innych dystrybucjach opartych na RHEL jest łatwy.
sudo dnf zainstaluj poppler-utils
sudo mniam zainstaluj poppler-utils
Konwertuj cały plik PDF na tekst
Podstawowa składnia polecenia pdftotext to:
pdftotext [opcje] pdffile plik tekstowy
...gdzie plik PDF to bezwzględna lub względna ścieżka do pliku PDF, oraz plik tekstowy to nazwa pliku wyjściowego.
Na przykład, aby przekonwertować lorem-ipsum.pdf do pliku tekstowego:
pdftotext lorem-ipsum.pdf tekst.txt
Jeśli konwertowany plik zawiera znaki wodne lub niewyrównany tekst, możesz je odrzucić w wyniku, używając -nodiag flaga.
pdftotext -nodiag lorem-ipsum.pdf random.text
Przetwarzaj strony w określonym zakresie
Użyj -fa i -I flagę, jeśli chcesz przekonwertować strony mieszczące się w określonym zakresie. Na przykład, aby przekonwertować strony od pierwszego do pięciu w lorem-ipsum.pdf pisać:
pdftotext -f 1 -l 5 lorem-ipsum.pdf output.txt
Aby przekonwertować tylko pierwszą stronę pliku PDF:
pdftotext -f 1 -l 1 lorem-ipsum.pdf output.txt
Konwertuj pliki PDF chronione hasłem na tekst
Pdftotext może nawet konwertować pliki PDF chronione hasłem na pliki tekstowe. -upw i -opw flagi, które oznaczają hasło użytkownika i hasło właściciela odpowiednio zadbaj o proces uwierzytelniania podczas konwersji plików PDF.
pdftotext -upw hasło lorem-ipsum.pdf output.txt
pdftotext -opw hasło lorem-ipsum.pdf output.txt
Pamiętaj, aby wymienić to hasło z hasłem pliku PDF.
Możesz także łączyć wiele flag, aby uzyskać pożądane wyniki. Na przykład, aby przekonwertować strony od pierwszej do trzeciej chronionego hasłem pliku PDF na tekst:
pdftotext -f 1 -l 3 -upw hasło lorem-ipsum.pdf output.txt
Związane z: Jak przekonwertować plik PDF na obrazy w systemie Linux?
Graficznie konwertuj PDF na plik tekstowy
Jeśli praca z wierszem poleceń nie jest twoją filiżanką herbaty, możesz konwertować pliki PDF na pliki tekstowe za pomocą oprogramowania graficznego, takiego jak Calibre. Jest to aplikacja do zarządzania e-bookami, której można używać do przeglądania, organizowania i modyfikować pliki PDF w twoim systemie.
Calibre jest dostępny w oficjalnych repozytoriach dystrybucji Linuksa i każdy może go pobrać za pomocą menedżera pakietów.
Aby zainstalować Calibre na Ubuntu i Debianie:
sudo apt zainstaluj kaliber
W Arch Linuksie:
sudo pacman -S kaliber
W dystrybucjach opartych na RHEL, takich jak CentOS i Fedora, możesz pobrać Calibre za pomocą DNF lub Yum.
sudo dnf zainstaluj kaliber
sudo mniam zainstaluj kaliber
Jak używać Calibre do konwersji plików PDF PDF
Po zainstalowaniu uruchom Calibre w swoim systemie za pomocą Menu aplikacji. Alternatywnie możesz uruchomić Calibre z terminala, wpisując:
kaliber
Aby wygenerować pliki tekstowe za pomocą PDF z Calibre:
- Kliknij na Dodaj książki opcja z menu.
- Znajdź i wybierz plik PDF, który chcesz przekonwertować.
- Zaznacz plik PDF na środkowym panelu i wybierz Konwertuj książki z menu.
- Od Format wyjściowy rozwijane, wybierz tekst.
- Na koniec kliknij dobrze kontynuować.
Calibre rozpocznie teraz konwersję określonego pliku PDF na dokument tekstowy. Możesz sprawdzić status procesu, klikając Oferty pracy opcję znajdującą się w prawym dolnym rogu okna.
Praca z plikami PDF w systemie Linux
Jeśli chcesz udostępnić komuś dokument, najskuteczniejszym sposobem jest przekonwertowanie go na plik PDF przed udostępnieniem. Wcześniej użytkownicy musieli instalować dedykowaną przeglądarkę plików PDF w swoim systemie, aby wyświetlać pliki PDF, ale teraz prawie każda przeglądarka ma wbudowaną przeglądarkę plików PDF.
Możesz znaleźć kilka aplikacji, które umożliwiają użytkownikowi łatwe przeglądanie i edycję plików PDF. Wiele instalacji systemu Linux jest dostarczanych z LibreOffice, pakietem oprogramowania biurowego, którego można używać jako edytora PDF.
Chcesz edytować plik PDF w systemie Linux? Te edytory PDF dla systemu Linux można zainstalować bezpłatnie i są łatwe w użyciu.
Czytaj dalej
- Linux
- Edytor PDF
- Linux
Deepesh to Junior Editor dla Linuksa w MUO. Od ponad 3 lat pisze treści informacyjne w internecie. W wolnym czasie lubi pisać, słuchać muzyki i grać na gitarze.
Zapisz się do naszego newslettera
Dołącz do naszego newslettera, aby otrzymywać porady techniczne, recenzje, bezpłatne e-booki i ekskluzywne oferty!
Jeszcze jeden krok…!
Potwierdź swój adres e-mail w e-mailu, który właśnie do Ciebie wysłaliśmy.