Audiobooki zyskują coraz większą popularność w porównaniu z tradycyjnymi eBookami. Są wygodniejsze, ponieważ możesz ich słuchać zawsze i wszędzie.

Możesz przekonwertować eBook PDF na audiobook za pomocą prostego skryptu Pythona. Korzystając z prostych bibliotek, możesz opracować projekt, który odczyta plik PDF i zapisze książkę audio jako nowy plik.

Instalowanie wymaganych pakietów

Musisz zainstalować PyPDF3, pyttsx3, oraz pdfhydraulik pakiety na początek. Możesz zainstalować te pakiety za pomocą menedżera pakietów pip. Upewnij się, że już zainstalowany pip w twoim systemie. Uruchom następujące polecenie w wierszu polecenia, aby zainstalować pakiety:

pypeć zainstalować PyPDF3 pyttsx3 pdfhydraulik
  • Możesz użyć PyPDF3 biblioteka do czytania i edycji plików PDF w Pythonie.
  • The pyttsx3 biblioteka zapewnia konwersję tekstu na mowę.
  • pdfhydraulik to biblioteka, która pozwala wyodrębnić tekst i tabele z plików PDF.

Kod użyty w tym projekcie jest dostępny w Repozytorium GitHub i jest darmowy do użytku na licencji MIT.

instagram viewer

Konwertowanie pliku PDF na audiobook za pomocą Pythona

Po zainstalowaniu powyższych pakietów możesz zaimportować je do pliku Pythona:

import PyPDF3
import pyttsx3
import pdfhydraulik

Musisz podać nazwę i lokalizację pliku PDF, który chcesz przekonwertować. Dla uproszczenia możesz użyć dowolnego przykładowego pliku PDF. Skopiuj go do tego samego katalogu, co skrypt i zapisz jego nazwę w zmiennej; jeśli to się nazywa Lorem.pdf, na przykład:

plik = 'Lorem.pdf'

Następnie utwórz obiekt pliku dla pliku PDF i obiekt czytnika PDF:

książka = otwórz (plik, 'rb')
pdfReader = PyPDF3.PdfFileReader (książka)

Później przejdziesz przez wszystkie strony pliku PDF. Aby znaleźć łączną liczbę stron, użyj numPages własność:

strony = pdfReader.numPages

Teraz jesteś gotowy, aby wyodrębnić tekst z pliku PDF:

tekst końcowy = ""

z pdfhydraulik.otwarty(plik) jak pdf:
dla i w zakresie (0, strony):
strona = pdf.strony[i]
tekst = strona.wyciąg_tekst()
końcowy tekst += tekst

Użyj pętli for, aby przejść przez wszystkie strony i wyodrębnić tekst z pliku PDF. Możesz użyć pakietu pdfhydraulik, aby otworzyć plik pdf i ekstrakt_tekstu metoda pobierania tekstu ze strony.

Mając pełny tekst zapisany w zmiennej, możesz go dalej przetwarzać, w zależności od wymagań. Jeśli chcesz przekonwertować tekst na dźwięk i zapisać go w nowym pliku, użyj następującego kodu:

silnik = pyttsx3.init()
silnik.zapisz_do_pliku (tekst końcowy, 'lorem.mp3')
silnik.uruchom i czekaj()

Kiedy ty uruchom ten kod Pythona, utworzy plik audiobooka w swoim katalogu.

Jeśli nie chcesz zapisywać audiobooka i na przykład chcesz wyrecytować plik PDF, możesz użyć następującego kodu:

silnik = pyttsx3.init()
silnik.mówić(tekst końcowy)
silnik.uruchom i czekaj()

Po uruchomieniu tego skryptu wyrecytuje on plik PDF.

Twórz projekty za pomocą Pythona

Python jest znany ze swojej wszechstronności. Możesz łatwo tworzyć projekty z praktycznymi aplikacjami za pomocą Pythona.

Jeśli chcesz ubrudzić sobie ręce kodem Pythona, możesz zacząć od tworzenia mini-projektów. Dobrymi pomysłami na początek są aplikacja quizu, chatbot, gra w węża, skracacz adresów URL, skrobak sieciowy lub konwerter jednostek.