Reklama
ì´ ì›¹ì‚¬ì´íŠ¸ì— 환ì˜. ì´ê²ƒì€ 보기 ì›ë³¸ì´ë‹¤
Jaki to język? Chiński? Język japoński?
Właściwie to koreański. Wykrycie tego ręcznie zajęłoby mi dużo czasu. Na szczęście znalazłem kilka bardzo dokładnych narzędzi, które potrafią to zrobić automatycznie. Wszystkie są wymienione poniżej.
Eksperyment: Strony testowałem na przykładowych tekstach (1-2 zdania po 8 słów) z następujących języków: portugalski, rosyjski, koreański, wietnamski, włoski, turecki, polski, ukraiński, azerbejdżański, słoweński, macedoński, holenderski, filipiński (tagalski), grecki, galicyjski, czeski, białoruski, fiński, tatarski i Norweski.
W sumie przetestowałem 20 różnych języków.
3 narzędzia do wykrywania tekstu w nieznanym języku
1. LangId (zaliczył 18 z 20 sprawdzianów, nie zdał tatarskiego i białoruskiego)
Plusy: Ogólnie świetne narzędzie online. Oferuje podstawową funkcjonalność wykrywania tekstu, a także Świergot i boty do wykrywania wiadomości e-mail, aby uzyskać jeszcze szybsze wyniki.
Cons: Ich silnik jest oparty na Google API, ale wydaje się, że mają lepsze wyniki niż opisany poniżej detektor Google. Wygląda na to, że bardzo dobrze wiedzą, jak to wykorzystać. Nie podobało mi się, że nie mają własnego, unikalnego algorytmu do wykrywania języków.
2. Wykrywacz języka Google [nie jest już dostępny] (zdał 17 z 20 testów, nie zdał portugalskiego, taglogu i białoruskiego)
Plusy: Google ma jeden z najlepszych na świecie interfejsów API do wykrywania języka. Dobrą rzeczą jest to, że możesz zobaczyć prawdopodobieństwo, że wyświetlany wynik jest prawdziwy. Byli w stanie przejść większość próbnych testów.
Cons: Byłem dość zaskoczony, że nie zdali testu portugalskiego. Wygląda na to, że mają (mam nadzieję, tymczasowy) błąd w tym języku. Ponadto z pewnością mogą wykonać lepszą pracę w ulepszaniu projektu strony.
3. Jaki to język (zdał 11 z 20 testów, nie zdał rosyjskiego, koreańskiego, ukraińskiego, azerbejdżańskiego, macedońskiego, tagalskiego, greckiego, galicyjskiego i tatarskiego)
Plusy: Niektóre języki, takie jak języki południowosłowiańskie (serbski, chorwacki, słoweński) są dość podobne. Jeśli wprowadzisz jakiś tekst w języku chorwackim, powiedzmy, ta strona poinformuje Cię, że tekst może być również serbski lub słoweński.
Cons: Muszą popracować nad ulepszeniem swojego systemu wykrywania. Myślałem o wstawieniu Translated.net (kolejna witryna do wykrywania języków) zamiast tej, ale Translated obiecało wykrywanie większej liczby języków i faktycznie wypadło gorzej niż WhatLanguageIsThis.com.
2 narzędzia do wykrywania stron internetowych w nieznanych językach
4. tłumacz Google z Wykryj język jako pierwsza opcja
Przeszedł: 18 na 20 nie wyprzedziło Białorusinów i Tatarów.
Plusy: To narzędzie bardzo dobrze wykonuje swoją pracę. To, w czym lubię tłumacz Google Google Translate 2.1 pojawia się z natywną klawiaturą iOS 7 i większą obsługą językówZaktualizuj do Tłumacza Google 2.1 na urządzeniu z systemem iOS i korzystaj z obsługi tłumaczenia i wprowadzania pisma odręcznego w nowych językach. Tłumacz Google w końcu otrzymuje nową klawiaturę iOS 7, która wykonuje wszystkie... Czytaj więcej jest to, że jeśli nie obsługuje określonego języka, wyświetla następujący ekran:
To świetny wykrywacz języka, jeśli mnie o to poprosisz!
5. Tłumacz Microsoft Bing z Automatyczne wykrywanie jako pierwsza opcja.
Przeszedł: 8 na 20, nie zdał języka holenderskiego, wietnamskiego, tureckiego, ukraińskiego, azerbejdżańskiego, słoweńskiego, macedońskiego, tagalskiego, greckiego, galicyjskiego, czeskiego i białoruskiego
Plusy: Obsługuje ograniczoną liczbę języków. W przypadku tych języków dobrze spełnia swoją rolę.
Cons: Jestem bardzo rozczarowany Microsoftem. Mają bardzo ograniczoną liczbę języków do wykrywania& tłumaczenie Zapomnij o Tłumaczu Google: 3 sposoby na dokładne i szybkie tłumaczenieNiezależnie od tego, czy planujesz ubiegać się o pracę lub mieszkanie za granicą, czy też chcesz przetłumaczyć swoją stronę internetową, musisz mieć wszystko dobrze, nawet w obcym języku. Czytaj więcej a ich funkcja automatycznego wykrywania jest okropna. Jeśli wpiszesz język, którego nie obsługują, otrzymasz błędny wynik zamiast informować, że nie obsługują tego języka.
Myśli
Ogólnie moim zdaniem powyższe narzędzia idą w dobrym kierunku. Obecnie najlepiej sprawdzają się w wykrywaniu języków online i całkiem dobrze wykonują swoją pracę, jeśli chodzi o popularne języki. Muszą jednak popracować nad dodaniem bardziej niejasnych języków (żadne z narzędzi nie potrafiło rozpoznać języka tatarskiego) i jestem pewien, że wszystkie, a zwłaszcza Google, pójdą w tym kierunku w niedalekiej przyszłości.
Kredyt obrazu: Kanko*
Nazywam się Darko (pseudonim Darren.) Lubię Web 2.0, tworzę niszowe strony internetowe (mój najnowszy projekt to wyszukiwanie osób) i tak dalej... co jeszcze mogę o mnie powiedzieć w tak krótkim profilu, śledź mój na Twitterze jeśli chcesz dowiedzieć się więcej :)