Chcesz wiedzieć, jak przechwycić stronę internetową i zapisać ją jako dokument PDF lub obraz za pomocą terminala? Na szczęście Linux ma mnóstwo narzędzi, których można użyć do zautomatyzowania zadania konwersji dokumentów HTML na pliki PDF i obrazy.

Ten artykuł wprowadzi Cię do wkhtmltopdf i wkhtmltoimage, narzędzi, których potrzebujesz, aby ułatwić sobie pracę.

Jak przekonwertować HTML na PDF

Jeśli chcesz przechwycić strony internetowe i przekonwertować je na plik PDF, pomoże Ci narzędzie wkhtmltopdf. Wkhtmltopdf to narzędzie wiersza polecenia typu open source służące do renderowania stron internetowych w dokumentach PDF.

Ponieważ narzędzie działa bezmyślnie w terminalu Linux, nie potrzebujesz żadnego sterownika internetowego ani platformy automatyzacji przeglądarki, takiej jak Selenium.

Zainstaluj wkhtmltopdf w systemie Linux

Wkhtmltopdf nie jest jednym ze standardowych pakietów preinstalowanych w systemie Linux. Będziesz musiał zainstalować go ręcznie za pomocą menedżera pakietów swojego systemu.

instagram viewer

Aby zainstalować wkhtmltopdf w dystrybucjach opartych na Ubuntu i Debianie:

sudo apt install wkhtmltopdf

W dystrybucjach opartych na Arch, takich jak Manjaro Linux:

sudo pacman -S wkhtmltopdf

Instalacja wkhtmltopdf w dystrybucjach opartych na RHEL, takich jak Fedora i CentOS, jest również łatwa.

sudo dnf zainstaluj wkhtmltopdf

Podstawowa składnia

Podstawowa składnia polecenia to:

wkhtmltopdf nazwa pliku strony internetowej

...gdzie Strona internetowa to adres URL strony internetowej, którą chcesz przekonwertować i Nazwa pliku to nazwa wyjściowego pliku PDF.

Aby przekonwertować stronę główną Google na dokument PDF:

wkhtmltopdf https://google.com google.pdf

Wynik:

Po otwarciu pliku PDF zauważysz, że wkhtmltopdf precyzyjnie wyrenderował stronę internetową do dokumentu.

Wydrukuj wiele kopii strony internetowej

--kopie flaga ratuje życie, jeśli chcesz, aby plik wyjściowy zawierał wiele kopii strony internetowej. Zwróć uwagę, że podczas drukowania wielu kopii wkhtmltopdf nie wygeneruje wielu plików PDF, ale zamiast tego doda dodatkowe strony do jednego dokumentu.

Aby utworzyć trzy kopie strony głównej Google:

wkhtmltopdf -- kopie 3 https://google.com google.pdf

Wyjściowy plik PDF będzie zawierał trzy strony określone w powyższym poleceniu.

Dodaj filtr skali szarości do wyjścia

Aby dodać filtr skali szarości do pliku PDF, użyj przycisku -sol lub --skala szarości flaga z poleceniem:

wkhtmltopdf -g https://google.com google.pdf
wkhtmltopdf --skala szarości https://google.com google.pdf

Plik wyjściowy:

Zmień orientację pliku PDF

Domyślnie wkhtmltopdf generuje plik PDF w układzie pionowym, czyli pionowym. Aby zmienić to domyślne zachowanie i zamiast tego przechwytywać strony internetowe w orientacji poziomej, użyj przycisku --orientacja flaga z poleceniem:

wkhtmltopdf -- orientacja pozioma https://google.com google.pdf

Wynik:

Zwróć uwagę, że pozioma wersja dokumentu ma większy obszar białych znaków w porównaniu z wersją pionową.

Nie dołączaj obrazów podczas konwersji

Podczas generowania danych wyjściowych, jeśli nie chcesz, aby wkhtmltopdf renderował obrazy obecne na stronie internetowej, użyj --brak-obrazów flaga:

wkhtmltopdf --no-images https://google.com google.pdf

Wynik:

Związane z: Najlepsze narzędzia do edycji pliku PDF w dowolnym miejscu

Jak przekonwertować stronę internetową na obrazy

Narzędzie wkhtmltoimage jest częścią pakietu wkhtmltopdf. Jeśli pracujesz nad raportem i chcesz dołączyć obrazy witryny, to narzędzie będzie działać na Twoją korzyść. Terminal Linux nie tylko ułatwia przechwytywanie obrazów, ale także oferuje szereg opcji umożliwiających dostosowanie wyników.

Podstawowa składnia

Wkhtmltoimage ma składnię podobną do wkhtmltopdf:

wkhtmltoimage nazwa pliku strony internetowej

...gdzie Strona internetowa to adres URL strony internetowej i Nazwa pliku to nazwa obrazu wyjściowego.

Konwertuj stronę internetową na obraz

Kontynuując powyższy przykład, przekonwertujmy stronę główną Google na obrazy.

wkhtmltoobraz https://google.com google.png

Wynik:

Możesz także określić niestandardowy format pliku, który ma mieć obraz wyjściowy. Wkhtmltoimage obsługuje następujące rozszerzenia plików:

  • JPEG/JPG
  • PNG
  • SVG

Na przykład, jeśli chcesz wygenerować obraz JPG, po prostu zamień rozszerzenie pliku na JPG w poleceniu:

wkhtmltoobraz https://google.com google.jpg

Związane z: JPG a JPEG: jaka jest różnica między tymi formatami plików obrazów?

Przechwytywanie stron internetowych za pomocą terminala Linux

Musisz mieć zainstalowaną przeglądarkę plików PDF w systemie Linux, jeśli chcesz przeglądać pliki PDF generowane przez wkhtmltopdf. Podczas gdy większość dystrybucji Linuksa ma preinstalowany edytor PDF, możesz ręcznie wybrać i zainstalować edytor PDF, który odpowiada Twoim potrzebom.

E-mail
5 najlepszych edytorów PDF dla systemu Linux, które powinieneś wypróbować

Chcesz edytować plik PDF w systemie Linux? Te edytory PDF dla systemu Linux można zainstalować bezpłatnie i są łatwe w użyciu.

Czytaj dalej

Powiązane tematy
  • Linux
  • PDF
  • Linux
O autorze
Deepesh Sharma (67 opublikowanych artykułów)

Deepesh to Junior Editor dla Linuksa w MUO. Od ponad 3 lat pisze treści informacyjne w internecie. W wolnym czasie lubi pisać, słuchać muzyki i grać na gitarze.

Więcej od Deepesha Sharma

Zapisz się do naszego newslettera

Dołącz do naszego newslettera, aby otrzymywać porady techniczne, recenzje, bezpłatne e-booki i ekskluzywne oferty!

Jeszcze jeden krok…!

Potwierdź swój adres e-mail w e-mailu, który właśnie do Ciebie wysłaliśmy.

.