Prawdopodobnie widziałeś aplikacje, które twierdzą, że tłumaczą to, co mówi twój kot. Ale czy naprawdę mogą przetłumaczyć miauczenie kota na angielski? Krótka odpowiedź brzmi: tak, w pewnym sensie. Jest to trudne ze względu na to, jak wyjątkowy jest „język” każdego kota, ale dzięki nowoczesnej technologii mogą być całkiem blisko.

Aplikacje do tłumaczenia dla kotów, takie jak MeowTalk, wykorzystują formę rozpoznawania mowy, która kładzie nacisk na uczenie maszynowe. Przyjrzyjmy się bliżej.

Rozpoznawanie mowy i uczenie maszynowe

Mary Theresa McLean /Pixabay

Rozpoznawanie mowy działa poprzez nagrywanie mowy i przekształcanie dźwięku w cyfrowy plik danych. Koduje dane, takie jak wysokość i głośność, jako punkty danych, które aplikacja może analizować i dopasowywać do znaczeń. Mikrofony DPA wyjaśnia, że ​​te punkty danych mogą wyglądać bardzo różnie w zależności od dźwięków tła i sposobu wymawiania słowa.

Czasami uważamy, że rozpoznawanie głosu jest czymś oczywistym, ale to niesamowity wyczyn technologiczny. Zwłaszcza biorąc pod uwagę, jak złożona jest mowa ludzka. Tak jak

instagram viewer
Naukowiec wyjaśnia, każde słowo zawiera szeroką gamę dźwięków lub „fonemów” połączonych ze sobą. Sprawienie, by komputer rozumiał mowę jest bardzo trudne. Nowa granica odgłosów kotów będzie jeszcze trudniejsza.

Aplikacje korzystające z rozpoznawania mowy są programowane za pomocą „słownika” słów zwanego zbiorem danych. Następnie aplikacja dopasowuje Twoją mowę do najbliższej opcji w swoim słowniku danych.

Kiedy popełnia błąd, poprawiasz go i zapisuje te dane na następny raz. To część uczenia maszynowego. W ten sposób program uczy się rozpoznawać mowę, nawet jeśli nie jest ona identyczna ze zbiorem danych, od którego zaczął.

Związane z: Co to są algorytmy uczenia maszynowego? Oto jak one działają

Rozpoznawanie głosu nadal ma problemy, szczególnie w przypadku wad wymowy i akcentów. Niektóre firmy są doskonalenie uczenia maszynowego w celu przezwyciężenia tych problemów, chociaż. Z biegiem czasu uczenie maszynowe może zmienić rozpoznawanie mowy w potężne narzędzie.

Tak działa rozpoznawanie mowy u ludzi. Ale czy to działa w przypadku kotów?

Rozpoznawanie mowy vs. Rozpoznawanie miau

Ariana Suárez /Unsplash

Po pierwsze, musimy zrozumieć, dlaczego tłumaczenie pewnego rodzaju miauczenia jako „Jestem głodny” różni się od analizy ludzkiej mowy. Problem polega głównie na tym, że komunikacja kotów w większym stopniu opiera się na niewerbalnych wskazówkach, takich jak postawa. Innym problemem jest brak uniwersalnego „kociego języka”.

Według ASPCA, dorosłe zdziczałe koty nigdy nie miauczą na siebie, tylko na ludzi. Inne badania autorstwa Humane Society dodaje, że te dźwięki „nie pojawiają się w próżni”. Musimy je interpretować obok języka ciała i innych kontekstów. W wielu przypadkach te ciche sygnały są jedyną różnicą między miauczeniem, które oznacza „Jestem głodny”, a takim, które oznacza „Chcę się bawić”.

Dodając do tego ten problem, żadne dwa koty nie mają tego samego języka. Koty rozwijają spersonalizowane „języki” dla swoich właścicieli. Są one częściowo oparte na naśladowaniu głosu właściciela, a częściowo na osobowości kota. Żadne dwa koty nie brzmią tak samo, nawet jeśli wyrażają to samo pragnienie lub potrzebę. Jak więc można przetłumaczyć słownictwo mowy jednej aplikacji dla nich wszystkich?

Elastyczne uczenie maszynowe dla kotów

Darmowe w użyciu dźwięki /Unsplash

Chociaż kilku wirtualnych asystentów lubi Oto próbować zrozumieć ton i emocje, rozpoznawanie mowy jest nadal straszne przy sygnałach niewerbalnych. Ale to nie znaczy, że nie można ich zinterpretować.

MeowTalk wykorzystuje bardziej elastyczny rodzaj uczenia maszynowego, aby pomóc przezwyciężyć te problemy.

Ściągnij: MeowTalk dla Android | iOS (Darmowy)

Meowtalk został stworzony przez Javiera Sancheza, który również pracował w zespole Alexa. Wyobraził sobie aplikację jako krok w kierunku inteligentnych obroży. Te obroże tłumaczyłyby dźwięki kota na ludzką mowę, opierając się na złożonych strategiach uczenia maszynowego, aby pomóc ludziom lepiej rozumieć i dbać o swoje koty.

Zespół MeowTalk zrekompensował problemy z wyjątkowością, tworząc bardziej szczegółowe profile dla każdego kota. W aplikacji rejestrujesz każdego kota osobno. Science Norway informuje, że kocięta miauczą inaczej niż dorosłe koty, więc aplikacja zapyta również o datę urodzin kota. Każdy profil generuje unikalną sieć danych dla kota, obejmującą odrobinę głębokiego uczenia się w uczeniu maszynowym.

Związane z: Głębokie uczenie vs. Machine Learning vs. AI: Jak idą razem?

Jeśli chodzi o słownictwo, MeowTalk zaczyna od 10 profili dźwiękowych w swoim zestawie danych. Każdy ma inne znaczenie, np. „Szczęśliwy” lub „polowanie”. Gdy aplikacja usłyszy dźwięk i pomyli się, możesz go poprawić lub stworzyć nową interpretację.

Dane CATSOUNDS zebrane z Akvelon

Poprawianie nakazuje aplikacji zastąpić podstawowe słownictwo nowym dźwiękiem.

Na przykład możesz powiedzieć aplikacji, aby dopasowała „Polowanie” do krótkiego ćwierkania zamiast długiego wycia. Ten rodzaj korekty jest bardziej przydatny niż dodawanie wielu dźwięków, aby dopasować je do jednego znaczenia, tak jak działa rozpoznawanie mowy, co byłoby jak powiedzenie aplikacji, że długie wycie i krótkie ćwierkanie obie znaczy „Mother Call”.

Uczenie maszynowe w aplikacjach do rozpoznawania mowy zwykle zapobiega tego typu nadpisywaniu. To tak, jakbyś chciał nauczyć Siri, że kiedy mówisz „blog technologiczny”, naprawdę masz na myśli „gruszkę”. Ale bardziej elastyczna forma uczenia maszynowego, której używa MeowTalk, może lepiej obsłużyć tę korektę z łatwością.

Utworzenie nowej interpretacji dodaje znaczenie, które nie było wcześniej kodowane. Na przykład, jeśli kot ma konkretne wezwanie, gdy chce mieć swoją ulubioną zabawkę, możesz dodać opcję „Chcę moją myszkę”. Jest to podobne do dodawania słowa do słownika autokorekty.

Związane z: Jak zdefiniować własne słowa autokorekty w systemie Android

Z biegiem czasu możesz opracować wysoce spersonalizowany profil mowy dla swojego kota. W końcu może być nawet na tyle wyrafinowane, że będzie przydatne dla opiekunów zwierząt lub do rozwiązywania problemów behawioralnych. Co więcej, pomaga właścicielom kotów bardziej uważać na swoje zwierzęta.

Werdykt: czy aplikacje do tłumaczenia Cat działają?

Ostatecznie „tłumaczenie kota” nadal w dużej mierze polega na tym, że użytkownik uczy aplikację, jak mówi kot. Prawdopodobnie zawsze tak będzie ze względu na wyjątkowość komunikacji każdego kota.

Ale fakt, że uczenie maszynowe zaszło tak daleko, że programiści mogą nawet częściowo odnieść w tym sukces, jest niesamowity. Uczenie maszynowe i sztuczna inteligencja rozwijają się z zawrotną prędkością i nie możemy się doczekać, aby zobaczyć, dokąd pójdą dalej.

E-mail
Powiązane tematy
  • Technologia wyjaśniona
  • Nauka języka
  • Nauczanie maszynowe
O autorze
Natalie Stewart (16 opublikowanych artykułów)

Natalie Stewart jest autorką dla MakeUseOf. Po raz pierwszy zainteresowała się technologią na studiach i rozwinęła pasję do pisania mediów na uniwersytecie. Natalie koncentruje się na technologii, która jest dostępna i łatwa w użyciu. Uwielbia aplikacje i urządzenia, które ułatwiają życie zwykłym ludziom.

Więcej od Natalie Stewart

Zapisz się do naszego newslettera

Dołącz do naszego biuletynu, aby otrzymywać wskazówki techniczne, recenzje, bezpłatne e-booki i ekskluzywne oferty!

Jeszcze jeden krok…!

Potwierdź swój adres e-mail w wiadomości e-mail, którą właśnie wysłaliśmy.

.