Chcesz wiedzieć, jak przechwycić stronę internetową i zapisać ją jako dokument PDF lub obraz za pomocą terminala? Na szczęście Linux ma mnóstwo narzędzi, których można użyć do zautomatyzowania zadania konwersji dokumentów HTML na pliki PDF i obrazy.
Ten artykuł wprowadzi Cię do wkhtmltopdf i wkhtmltoimage, narzędzi, których potrzebujesz, aby ułatwić sobie pracę.
Jak przekonwertować HTML na PDF
Jeśli chcesz przechwycić strony internetowe i przekonwertować je na plik PDF, pomoże Ci narzędzie wkhtmltopdf. Wkhtmltopdf to narzędzie wiersza polecenia typu open source służące do renderowania stron internetowych w dokumentach PDF.
Ponieważ narzędzie działa bezmyślnie w terminalu Linux, nie potrzebujesz żadnego sterownika internetowego ani platformy automatyzacji przeglądarki, takiej jak Selenium.
Zainstaluj wkhtmltopdf w systemie Linux
Wkhtmltopdf nie jest jednym ze standardowych pakietów preinstalowanych w systemie Linux. Będziesz musiał zainstalować go ręcznie za pomocą menedżera pakietów swojego systemu.
Aby zainstalować wkhtmltopdf w dystrybucjach opartych na Ubuntu i Debianie:
sudo apt install wkhtmltopdf
W dystrybucjach opartych na Arch, takich jak Manjaro Linux:
sudo pacman -S wkhtmltopdf
Instalacja wkhtmltopdf w dystrybucjach opartych na RHEL, takich jak Fedora i CentOS, jest również łatwa.
sudo dnf zainstaluj wkhtmltopdf
Podstawowa składnia
Podstawowa składnia polecenia to:
wkhtmltopdf nazwa pliku strony internetowej
...gdzie Strona internetowa to adres URL strony internetowej, którą chcesz przekonwertować i Nazwa pliku to nazwa wyjściowego pliku PDF.
Aby przekonwertować stronę główną Google na dokument PDF:
wkhtmltopdf https://google.com google.pdf
Wynik:
Po otwarciu pliku PDF zauważysz, że wkhtmltopdf precyzyjnie wyrenderował stronę internetową do dokumentu.
Wydrukuj wiele kopii strony internetowej
--kopie flaga ratuje życie, jeśli chcesz, aby plik wyjściowy zawierał wiele kopii strony internetowej. Zwróć uwagę, że podczas drukowania wielu kopii wkhtmltopdf nie wygeneruje wielu plików PDF, ale zamiast tego doda dodatkowe strony do jednego dokumentu.
Aby utworzyć trzy kopie strony głównej Google:
wkhtmltopdf -- kopie 3 https://google.com google.pdf
Wyjściowy plik PDF będzie zawierał trzy strony określone w powyższym poleceniu.
Dodaj filtr skali szarości do wyjścia
Aby dodać filtr skali szarości do pliku PDF, użyj przycisku -sol lub --skala szarości flaga z poleceniem:
wkhtmltopdf -g https://google.com google.pdf
wkhtmltopdf --skala szarości https://google.com google.pdf
Plik wyjściowy:
Zmień orientację pliku PDF
Domyślnie wkhtmltopdf generuje plik PDF w układzie pionowym, czyli pionowym. Aby zmienić to domyślne zachowanie i zamiast tego przechwytywać strony internetowe w orientacji poziomej, użyj przycisku --orientacja flaga z poleceniem:
wkhtmltopdf -- orientacja pozioma https://google.com google.pdf
Wynik:
Zwróć uwagę, że pozioma wersja dokumentu ma większy obszar białych znaków w porównaniu z wersją pionową.
Nie dołączaj obrazów podczas konwersji
Podczas generowania danych wyjściowych, jeśli nie chcesz, aby wkhtmltopdf renderował obrazy obecne na stronie internetowej, użyj --brak-obrazów flaga:
wkhtmltopdf --no-images https://google.com google.pdf
Wynik:
Związane z: Najlepsze narzędzia do edycji pliku PDF w dowolnym miejscu
Jak przekonwertować stronę internetową na obrazy
Narzędzie wkhtmltoimage jest częścią pakietu wkhtmltopdf. Jeśli pracujesz nad raportem i chcesz dołączyć obrazy witryny, to narzędzie będzie działać na Twoją korzyść. Terminal Linux nie tylko ułatwia przechwytywanie obrazów, ale także oferuje szereg opcji umożliwiających dostosowanie wyników.
Podstawowa składnia
Wkhtmltoimage ma składnię podobną do wkhtmltopdf:
wkhtmltoimage nazwa pliku strony internetowej
...gdzie Strona internetowa to adres URL strony internetowej i Nazwa pliku to nazwa obrazu wyjściowego.
Konwertuj stronę internetową na obraz
Kontynuując powyższy przykład, przekonwertujmy stronę główną Google na obrazy.
wkhtmltoobraz https://google.com google.png
Wynik:
Możesz także określić niestandardowy format pliku, który ma mieć obraz wyjściowy. Wkhtmltoimage obsługuje następujące rozszerzenia plików:
- JPEG/JPG
- PNG
- SVG
Na przykład, jeśli chcesz wygenerować obraz JPG, po prostu zamień rozszerzenie pliku na JPG w poleceniu:
wkhtmltoobraz https://google.com google.jpg
Związane z: JPG a JPEG: jaka jest różnica między tymi formatami plików obrazów?
Przechwytywanie stron internetowych za pomocą terminala Linux
Musisz mieć zainstalowaną przeglądarkę plików PDF w systemie Linux, jeśli chcesz przeglądać pliki PDF generowane przez wkhtmltopdf. Podczas gdy większość dystrybucji Linuksa ma preinstalowany edytor PDF, możesz ręcznie wybrać i zainstalować edytor PDF, który odpowiada Twoim potrzebom.
Chcesz edytować plik PDF w systemie Linux? Te edytory PDF dla systemu Linux można zainstalować bezpłatnie i są łatwe w użyciu.
Czytaj dalej
- Linux
- Linux
Deepesh to Junior Editor dla Linuksa w MUO. Od ponad 3 lat pisze treści informacyjne w internecie. W wolnym czasie lubi pisać, słuchać muzyki i grać na gitarze.
Zapisz się do naszego newslettera
Dołącz do naszego newslettera, aby otrzymywać porady techniczne, recenzje, bezpłatne e-booki i ekskluzywne oferty!
Jeszcze jeden krok…!
Potwierdź swój adres e-mail w e-mailu, który właśnie do Ciebie wysłaliśmy.