Jeśli jesteś studentem lub Twoja praca wymaga pracy z dużą ilością obrazów i plików PDF, w pewnym momencie poczujesz potrzebę wyodrębnienia tekstu z obrazu lub dokumentu.
Na szczęście jest to możliwe dzięki ekstrakcji tekstu. Istnieje kilka narzędzi, których możesz użyć, aby to zrobić. gImageReader to jedno z wielu narzędzi. Jest darmowy i działa zarówno z plikami graficznymi, jak i dokumentami PDF.
Przyjrzyjmy się szczegółowo gImageReaderowi i zobaczmy, jak można go używać do wyodrębniania tekstu z obrazów i plików PDF.
Co to jest gImageReader?
gImageReader to aplikacja, która pozwala wyodrębnić tekst z obrazów i plików PDF w systemie Linux. Jest to zasadniczo GUI lub front-end do silnik Tesseract OCR, jakiś otwarte źródło silnik opracowany przez firmę Hewlett-Packard, który jest uważany za jeden z najlepszych dostępnych silników OCR.
Dzięki gImageReader możesz łatwo i dość dokładnie wyodrębnić tekst z obrazów lub dokumentów PDF za pomocą kilku prostych kliknięć. Wyodrębniony tekst można następnie wyeksportować do pliku tekstowego lub PDF w celu dalszego wykorzystania.
Funkcje gImageReader
gImageReader zawiera następujące funkcje:
- Importuj dokumenty PDF i obrazy z różnych źródeł (dysk, urządzenia skanujące, schowek i zrzuty ekranu)
- Przetwarzaj wsadowo obrazy lub dokumenty, tj. Wyodrębnij tekst z wielu obrazów lub dokumentów jednocześnie
- Rozpoznawaj fragmenty tekstu jako zwykły tekst lub dokumenty HOCR
- Wbudowane sprawdzanie pisowni
- Automatyczne wykrywanie obszaru tekstu
- Podstawowa edycja obrazu/dokumentu
- Zapisz wynik jako plik tekstowy
Jak zainstalować gImageReader w systemie Linux
gImageReader jest dostępny na większość głównych dystrybucji Linuksa. Ale zanim przystąpisz do jego instalacji, musisz zainstalować w swoim systemie silnik Tesseract OCR.
Aby to zrobić, otwórz Menedżer oprogramowania w swoim systemie i wyszukaj teserakt. Gdy zwróci listę wyników, zainstaluj tesseract-ocr oraz tesseract-ocr-eng pakiety. Możesz również użyć menedżerów pakietów wiersza poleceń, aby zainstalować pakiet, jeśli jesteś bardziej komfortowy z terminalem.
Następnie zapoznaj się z instrukcjami instalacji w poniższych sekcjach, aby zainstalować gImageReader na swoim komputerze.
Jeśli korzystasz z Debiana lub Ubuntu, otwórz terminal i uruchom poniższe polecenia, aby zainstalować gImageReader:
sudo add-apt-repository ppa: sandromani/gimagereader
sudo apt-Dostawać aktualizacja
sudo apt zainstalować gimagereader
W Fedorze, CentOS lub Red Hat Enterprise Linux (RHEL):
sudo dnf zainstalować gimagereader-qt
Na Arch Linux lub Manjaro:
sudo pacman -S gimagereader
Użytkownicy openSUSE mogą zainstalować gImageReader za pomocą:
sudo zamek zainstalować gimagereader
Jeśli używasz innej dystrybucji Linuksa, możesz zbudować gImageReader ze źródła, postępując zgodnie z instrukcjami na GitHub gImageReader.
Jak korzystać z gImageReader w systemie Linux
gImageReader jest dość łatwy w użyciu i działa ze wszystkimi rodzajami plików graficznych, a także z dokumentami PDF. Postępuj zgodnie z poniższymi instrukcjami, aby wyodrębnić tekst z obrazów lub plików PDF w systemie Linux.
Otwórz menu aplikacji, wyszukaj gImageReaderi uruchom aplikację. Uderz w Wyolbrzymiać w oknie gImageReader, aby otworzyć go w widoku pełnoekranowym.
Teraz kliknij Dodaj obrazy w lewym okienku pod paskiem narzędzi i użyj przeglądarki plików, aby wybrać obraz lub pliki PDF, z których chcesz wyodrębnić tekst.
Kliknij Ok aby zaimportować obraz(y) lub PDF(y) do gImageReader. Lub, jeśli chcesz wyodrębnić tekst z tego, co jest wyświetlane na ekranie, kliknij menu rozwijane obok Dodaj obrazy przycisk i wybierz Zrobić zrzut ekranu. gImageReader wykona zrzut ekranu zawartości ekranu.
Po dodaniu obrazu do gImageReader kliknij przycisk Przełącz okienko wyjściowe przycisk (jeden z ikoną notatnika), aby wywołać okienko wyjściowe. Tutaj pojawia się tekst wyodrębniony z obrazów lub plików PDF.
W zależności od tego, jak chcesz postępować, możesz teraz automatycznie lub ręcznie zidentyfikować tekst na obrazie lub pliku PDF. Aby zrobić to automatycznie, kliknij Automatyczne wykrywanie układu i podświetli wszystkie bloki tekstu w wybranym obrazie lub dokumencie PDF.
Następnie dotknij Rozpoznaj zaznaczenie > Bieżąca strona aby rozpocząć proces wyodrębniania tekstu.
Alternatywnie, aby zaznaczyć tekst ręcznie, najedź kursorem na tekst, który chcesz wyodrębnić, i za pomocą krzyżyka narysuj ramkę wokół obszaru, z którego chcesz wyodrębnić tekst. Następnie naciśnij Rozpoznaj wybór przycisk, aby kontynuować.
Jeśli jest to dokument PDF i chcesz wyodrębnić tekst z różnych stron, dotknij Plus (+), aby odwrócić strony.
Aby wrócić, naciśnij Minus (-) przycisk. A następnie wybierz tekst, który chcesz wyodrębnić i naciśnij Rozpoznaj wybór przycisk, aby go wyodrębnić.
Chociaż rzadko, może się zdarzyć, że gImageReader zwróci wyodrębniony tekst w języku innym niż angielski. Kiedy tak się stanie, po prostu dotknij przycisku rozwijanego obok Rozpoznaj wybór i wybierz jedną z opcji w języku angielskim.
Na koniec, aby zapisać wyodrębniony tekst, kliknij Zapisz dane wyjściowe przycisk. Spowoduje to wyświetlenie okna Zapisz. Tutaj nadaj nazwę plikowi i naciśnij Ok.
Co jeszcze możesz zrobić z gImageReaderem?
Jak wspomniano wcześniej, gImageReader daje również możliwość modyfikowania niektórych aspektów importowanych obrazów lub dokumentów, takich jak ich jasność, kontrast i rozdzielczość. Dodatkowo, w razie potrzeby, możesz również odwrócić kolory lub obrócić obrazy lub dokumenty.
Większość z tych opcji może okazać się przydatna, gdy tekst w obrazie lub dokumencie nie jest czytelny dla gImageReader i dlatego uniemożliwia narzędziu rozpoznanie tekstu.
Aby uzyskać dostęp do dowolnej z tych opcji edycji, kliknij Sterowanie obrazem i pokaże mini pasek narzędzi poniżej głównego paska narzędzi. Stąd wybierz odpowiednie przyciski, aby wykonać żądaną operację edycji na obrazie lub dokumencie.
Ekstrakcja tekstu w systemie Linux jest łatwa dzięki gImageReader
Wyodrębnianie tekstu często wymaga odpowiedniego narzędzia: takiego, które wykorzystuje niezawodny i dokładny silnik OCR, który umożliwia skuteczną identyfikację tekstu na obrazie lub dokumencie, dzięki czemu można go wydajnie wyodrębnić bez żadnych dokuczać.
gImageReader robi to ładnie, dzięki silnikowi Tesseract OCR, którego używa w tle. Biorąc pod uwagę łatwość użycia, gImageReader jest niewątpliwie jednym z najlepszych narzędzi do ekstrakcji tekstu dostępnych dla systemu Linux.
Alternatywnie, jeśli szukasz prostszego rozwiązania, możesz wypróbować TextSnatcher, który jest szybki i dość łatwy w użyciu.