Reklama
Jeśli chcesz przekonwertować dowolny wydrukowany tekst na tekst cyfrowy, który możesz kopiować, wklejać, edytować i wyszukiwać, musisz użyć skanerów optycznego rozpoznawania znaków (OCR).
Jeśli zdecydujesz się zeskanować lub zrobić zdjęcie dokumentu, zostanie ono zapisane w formacie takim jak JPEG lub PDF. Oprogramowanie OCR może rozpoznać litery i cyfry w tych dokumentach i przekonwertować je na PDF do przeszukiwania 4 metody tworzenia i edycji plików PDF za darmoSpośród wszystkich popularnych typów plików występujących w naszym świecie komputerowym, PDF jest prawdopodobnie jednym z najbardziej restrykcyjnych, a jednocześnie jest dostępny dla wszystkich (przede wszystkim do czytania) ... Czytaj więcej lub do pliku, który można edytować w programach takich jak Microsoft Word.
Problem polega na tym, że niektóre skanery OCR działają o wiele lepiej niż inne, przy czym najlepsze są dość ciężkie dla portfela.
Na przykład Omnipage18 kosztuje 150 USD, ale jest szczególnie dobry w rozpoznawaniu różnych języków.
Adobe Acrobat Pro DC kosztuje oszałamiające 400 $, ale ma niesamowitą dokładność. ABBYY FineReader kosztuje 150 USD, ale doskonale nadaje się do konwertowania dokumentów, takich jak czasopisma i broszury, na tekst z możliwością wyszukiwania. W dalszej części tego artykułu będziemy testować ofertę online ABBYY.Jeśli jednak szukasz bezpłatnych alternatyw, które możesz pobieranie i użyj w systemie Windows lub OS X, powinieneś wypróbuj te narzędzia OCR 5 najlepszych narzędzi OCR do wydobywania tekstu z obrazówKiedy masz ryz papieru, jak przekształcić cały wydrukowany tekst w coś, co program cyfrowy będzie w stanie rozpoznać i zindeksować? Trzymaj dobre oprogramowanie OCR w pobliżu. Czytaj więcej . Ale jeśli wolisz skorzystać z bezpłatnego, online Narzędzie OCR, czytaj dalej, ponieważ wypróbowaliśmy kilka pierwszych, z wynikami poniżej.
Test
Wygląda na to, że większość ludzi używa ich teraz smartfony do ich skanowania Skanuj i zarządzaj swoimi pokwitowaniami, oszczędzaj miejsce, papier i czasParagony papieru można łatwo zgubić i trudno je znaleźć, gdy są najbardziej potrzebne. Na szczęście przejście na technologię cyfrową rozwiązuje oba te problemy. Czytaj więcej , Zdecydowałem się użyć Skanowana aplikacja Evernote (Bezpłatny na iOS i Androida). Przeskanowałem pierwszą stronę Richarda Dawkina Wspinaczka nieprawdopodobna, aby zobaczyć, jakie wyniki możemy uzyskać przy bardzo podstawowym formatowaniu. Przeskanowałem także stronę Tima Ferrissa 4-godzinny szef kuchni wypróbować skanery z nieco bardziej skomplikowanym formatowaniem. Każdy z tych plików zapisałem jako plik PDF.
Dokumenty te zostały następnie przejrzane przez niektóre z rzekomo najlepszych narzędzi OCR online, aby sprawdzić, jak dobrze sobie radzą.
Darmowy OCR online [już niedostępny]
Na szczęście nie jest wymagana rejestracja, aby móc korzystać z bezpłatnego OCR online. Byłem pod podwójnym wrażeniem, gdy zobaczyłem ich roszczenia do zachowania formatowania i układu mojego dokumentu.
Witryna twierdzi, że jest w stanie obsługiwać pliki PDF, GIF, BMP, JPEG, TIFF i PNG jako dane wejściowe. Wyjściami mogą być DOC, dokument tekstowy PDF, RTF i TXT. Niestety nie mogłem się dowiedzieć, czy mają limit rozmiaru pliku.
Dokument podstawowy do pliku PDF
Przekształcony absolutnie idealnie. Nie ma nic więcej do powiedzenia! Jedziemy do bardzo Dobry początek.
Dokument podstawowy do DOC
Rzeczywiste słowa wydają się bezbłędnie nawracać, z wyjątkiem „ount” z „Mount Rushmore”, które jakoś idą AWOL. Formatowanie to jednak inna historia. Wiele przecinków zastąpiono podkreśleniami, a losowe spacje zostały wstawione w punktach w całym dokumencie. Gdy później zobaczysz, jak radziło sobie oprogramowanie premium w tym teście, nie jest to zły wysiłek w ogóle.
Skomplikowany dokument do pliku PDF
Konwersja dokumentu zajęła aż 120 sekund! Po zakończeniu cały tekst został przekonwertowany z około 95% dokładnością, chociaż tekst w oddzielnym polu w prawym górnym rogu strony był niemożliwy do przeszukania. Kilka innych znaków w pliku PDF również było niepoprawnych.
Skomplikowany dokument do DOC
Tym razem konwersja zajęła tylko 10 sekund, a tekst ponownie przekonwertowany z około 95% dokładnością. Wystąpiły dziwne problemy z odstępami, a oprogramowanie miało problem z konwersją czcionki w prawym górnym rogu dokumentu i pominęło kilka znaków tu i tam.
Werdykt
Jeśli chcesz przekonwertować dokumenty w prostym formacie na PDF, jest to fantastyczne narzędzie. Jeśli chodzi o konwersję do DOC, nie było o czym pisać.
i2OCR przedstawia imponujące twierdzenia. Narzędzie rozpoznaje ponad 60 języków, może obsługiwać układy wielokolumnowe (poprzez usunięcie formatowania), nie ma ograniczeń rozmiaru plików, może konwertować przesłane pliki i z adresów URL. Nie musisz się też rejestrować, aby korzystać z tego narzędzia.
Usługa polega na wyodrębnieniu tekstu z obrazu, a następnie wyprowadzeniu niesformatowanego tekstu. Możesz szybko poprawić wszelkie błędy w widoku obok siebie, przed skopiowaniem tekstu do innych programów lub pobraniem jako DOC, PDF lub HTML.
Uwaga: kiedy próbowałem załadować moje dokumenty PDF, zostały one odrzucone przez i2OCR, więc musiałem przekonwertować je na JPEG (wykonując ich zrzut ekranu, a następnie przesyłając pliki).
Dokument podstawowy do zwykłego tekstu
Ze względu na sposób działania tego narzędzia całe formatowanie jest tracone, chociaż konwersja obrazu do tekstu była prawie idealna. Wystąpiły drobne błędy, takie jak odstępy między akapitami, a niektóre przecinki zostały zastąpione kropkami, ale są to małe drobiazgi.
Złożony dokument na zwykły tekst
Większość tekstu została przekonwertowana bez zbyt wielu błędów, z wyjątkiem tytułu i przepisu w prawym górnym rogu, co było nieczytelne dla tego narzędzia. Sposób konwersji kolumn na zwykły tekst był daleki od ideału. Jeśli chcesz, aby ta konwersja była wykonalna, potrzeba dużo czasu, aby zmienić linie w spójne zdania.
Werdykt
W przypadku podstawowych dokumentów i2OCR działa świetnie. Możliwość edycji tekstu przed pobraniem jest również bardzo miłym akcentem. Jednak w przypadku bardziej skomplikowanych dokumentów konwersja jest nadal dość dokładna, ale sposób, w jaki tekst jest wyprowadzany, nie ułatwi ci życia.
Online OCR obsługuje obecnie 46 różnych języków i może konwertować pliki PDF, JPG, BMP, TIFF i GIF do formatu Word, Excel lub Zwykły tekst. Witryna twierdzi, że „przekonwertowane dokumenty wyglądają dokładnie tak jak oryginał - tabele, kolumny i grafika”.
Wersja, z której można korzystać bez rejestracji, umożliwia konwersję do 15 obrazów na godzinę (limit 5 MB). Jeśli założysz konto, możesz zakupić więcej stron powyżej tego limitu, a także możesz konwertować wielostronicowe dokumenty i archiwa ZIP.
Dokument podstawowy do DOC
Dokument podstawowy przekonwertowany bezbłędnie poza cyfrą rzymską ja nie odbierane. Zgodnie z obietnicą witryny formatowanie było dokładnie takie, jak w książce. Wyrazy uznania dla tego narzędzia.
Skomplikowany dokument do DOC
Po rozczarowaniu poprzednimi narzędziami OCR w konwersji złożonego dokumentu, byłem pod ogromnym wrażeniem Online OCR. Układ był prawie idealny, jak widać powyżej. Ponownie jednak przepis nie został zbyt dobrze przyjęty, ale wszelkie inne drobne błędy były nieistotne.
Werdykt
Absolutnie fantastyczne wyniki z Online OCR. Jedynym minusem, jaki widzę, jest to, że nie ma sposobu, aby pobrać przekonwertowane dokumenty jako pliki PDF, ponieważ wspomniane formaty wyjściowe obejmują tylko DOCX, XLSX i TXT.
Jak wspomniano wcześniej, ABBYY jest jednym z liderów rynku oprogramowania OCR, którego pełny program do pobrania kosztuje około 150 USD. Oni oferują 10-stronicowy darmowy okres próbny ich narzędzia online (wymagana rejestracja). W przypadku subskrypcji za 5 USD ich narzędzie online pozwoli Ci na konwersję 200 stron co miesiąc.
Akceptowane pliki mogą mieć rozmiar do 100 MB w dowolnym z następujących formatów: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP i PNG. ABBYY rozpoznaje także prawie 200 języków. Wyjścia są szczególnie imponujące, z wyborem między DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 i EPUB.
Możesz nawet wypróbować kilka funkcji BETA podczas okresu próbnego. Pierwszą jest opcja przetłumaczenia dokumentu na inny język. Drugi polega na wyeksportowaniu przekonwertowanego dokumentu na konto magazynu w chmurze, niezależnie od tego, czy jest to Dropbox, Dysk Google, Evernote, Microsoft OneDrive lub Box.
Dokument podstawowy do DOCX
Ogólne wyniki były dobre, ale nie niesamowite, biorąc pod uwagę, że jest to produkt premium. Zamieniono wiele przecinków i kropek, kilka odwróconych przecinków zastąpiono gwiazdką, brakowało kilku wielkich liter, a jedno słowo (literalista) zostało napisane niepoprawnie.
Skomplikowany dokument do DOCX
Po przekonwertowaniu tekstu w dokumencie było bardzo mało błędów (oprócz OCR walczącego z czcionką tego przepisu!), Ale formatowanie pozostawiło wiele do życzenia.
Trzy kolumny zajmowały w jakiś sposób dwie strony, z kolumną środkową tylko pojawiające się na drugiej stronie. Jeśli tak naprawdę chciałeś robić cokolwiek z tym skonwertowanym dokumentem, w końcu wyciągniesz włosy.
Dokument podstawowy do pliku PDF
Przeglądając przekonwertowany plik PDF, nie mogłem znaleźć żadnej wady. Być może odkryliśmy, gdzie wyróżnia się ABBYY. Fantastyczne wyniki.
Skomplikowany dokument do pliku PDF
Znów nie mogę znaleźć żadnych błędów w tym przekonwertowanym pliku. ABBYY oczywiście doskonale potrafi konwertować do formatu PDF.
Werdykt
Jeśli jesteś zadowolony z płacenia kilku dolarów, konwersja do formatu PDF wydaje się działać fenomenalnie dobrze z tą usługą możliwość zsynchronizowania przekonwertowanych plików do pamięci w chmurze jest szczególnie przydatna, jeśli skanujesz dużą liczbę plików dokumenty Podobnie jak w przypadku innych opcji, ABBYY wciąż nie wymyślił, jak bezbłędnie konwertować dokumenty do DOC w celu łatwej edycji.
Ostateczny wynik
Jeśli, jak większość ludzi, chcesz tylko zeskanować kilka artykułów z czasopism i rachunki domowe, nie musisz edytować tych dokumentów. Dlatego konwersja bezpośrednio do pliku PDF będzie dla Ciebie odpowiednia, ponieważ nadal będziesz mógł przeszukiwać te dokumenty. W tym celu Free Online OCR było zdecydowanie najlepszym darmowym narzędziem, które przetestowaliśmy. Biorąc to pod uwagę, jeśli chcesz zapłacić 5 USD miesięcznie za niemal perfekcję, FineReader online firmy ABBYY był nieco dokładniejszy.
Jeśli chodzi o konwersję dokumentów do DOC, nie udało nam się znaleźć żadnego rozwiązania, które byłoby idealne, ale zdecydowanie najlepsze wyniki przyniosły OCR online. Konwersja nie była idealna, ale integralność formatowania była w dużej mierze nienaruszona, a błędy były nieistotne. Porównując te wyniki z ofertą „premium” firmy ABBYY, nie można nie być pod wielkim wrażeniem.
Nie uwzględniliśmy Możliwości OCR Dysku Google w tym poście; trochę za wszechstronność Google, ale jeszcze bardziej za to, że chcieliśmy przetestować kilka innych bezpłatnych internetowych usług OCR.
Do Ciebie: Jakie inne narzędzia OCR online poleciłbyś naszym czytelnikom? A których próbowałeś, których nigdy więcej nie użyjesz?
Rob Nightingale ukończył filozofię na University of York w Wielkiej Brytanii. Od ponad pięciu lat pracuje jako menedżer mediów społecznościowych i konsultant, prowadząc warsztaty w kilku krajach. Przez ostatnie dwa lata Rob był również pisarzem technologii, a także MakeUseOf, menedżerem mediów społecznościowych i redaktorem biuletynu. Zazwyczaj znajdziesz go podróżującego…