Naukowcy z Carnegie Mellon University opracowali system do interakcji z inteligentnymi głośnikami i innymi urządzeniami wspomaganymi głosem bez użycia słów budzących.
System, który opiera się na uczeniu maszynowym, mógłby stanowić podstawę bezpiecznej alternatywy dla stałych asystentów domowych.
Jak działa nowy system?
Nowe ustalenia zostały opublikowane w artykuł badawczy [PDF] przez czteroosobowy zespół badawczy, który dostarczył również film wyjaśniający, jak może funkcjonować nowy model.
Badania koncentrują się na Kierunek głosu, technika, która określa zarówno pozycję, jak i kąt, z którego pochodzi mowa. Różni się to od dzisiejszych inteligentnych urządzeń, które mają tendencję do skupiania się tylko na miejscu pochodzenia dźwięku.
Obecne podejście opiera się również na konkretnym słowie pobudki i właśnie dlatego zmiana słowa budzenia Alexy na coś innego daje tylko jedną lub dwie dodatkowe opcje.
Zastanawiamy się, jak zmienić słowo aktywacji na dowolnym urządzeniu Amazon Alexa.
Kiedy osoba mówi, jej głos tworzy echo w całym pomieszczeniu, które dociera do inteligentnego głośnika w różnym czasie. Analizując synchronizację, głośność i widmo częstotliwości dźwięku, które wytwarza każde odbite echo, staje się to nowe system może przewidzieć, czy użytkownik mówi w kierunku inteligentnego obiektu, czy też odwraca się od niego.
Oprócz artykułu badawczego zespół dostarczył również plik Link do GitHub do zbioru danych używanego do uczenia sieci neuronowej. 11520 unikalnych fraz w zbiorze danych wystarczyło, aby wyszkolić inteligentnego głośnika do przewidywania kąta, pod jakim zwrócony jest użytkownik, z dokładnością do 90 stopni.
Obliczenia wymagane do określenia kierunku są na tyle lekkie, że można je wykonać lokalnie na urządzeniu bez łączenia się ze zdalnym serwerem. Zespół badawczy stojący za nowymi odkryciami ma nadzieję, że takie podejście pozwoli na bardziej płynne interakcje z inteligentnymi urządzeniami i zapewni użytkownikom większą prywatność niż alternatywy oparte na chmurze.
Nie ma harmonogramu, kiedy ta technologia może pojawić się do użytku publicznego, ale istnieją podstawy, aby ostatecznie znieść potrzebę słów przebudzenia. Kiedy nie musisz już nazywać inteligentnego głośnika po imieniu, czy naprawdę go potrzebuje? Może Alexa zna odpowiedź.
Koniec z personifikowanymi asystentami domowymi?
Chociaż badanie to otwiera nowe ekscytujące możliwości interakcji z urządzeniami inteligentnymi, nie jest prawdopodobne, aby całkowicie zastąpiły słowa wybudzające. W końcu jedną z głównych zalet inteligentnych głośników jest to, że możesz wchodzić z nimi w interakcje za pomocą samego głosu podczas wykonywania innych zadań.
Być może obiecuje przyszłość, w której wiele inteligentnych urządzeń będzie mogło być używanych w tej samej przestrzeni. Zamiast budzić każde inteligentne urządzenie w zasięgu słuchu, możesz poprosić jedno urządzenie, aby cicho podało Ci prognozę pogody.
To jeszcze wczesne dni, ale taka technologia może sprawić, że płynne interakcje między człowiekiem a komputerem w science fiction staną się rzeczywistością w niezbyt odległej przyszłości.
Algorytmy uczenia maszynowego zostały zaprojektowane, aby ułatwić życie i ulepszyć systemy, ale mogą się nie udać, co może mieć złe konsekwencje.
- Inteligentny dom
- Wiadomości techniczne
- Komendy głosowe
- Alexa
- Inteligentny głośnik
- Nauczanie maszynowe
Ian Buckley jest niezależnym dziennikarzem, muzykiem, performerem i producentem wideo mieszkającym w Berlinie w Niemczech. Kiedy nie pisze ani nie występuje na scenie, majstruje przy elektronice lub kodowaniu dla majsterkowiczów w nadziei, że zostanie szalonym naukowcem.
Zapisz się do naszego newslettera
Dołącz do naszego biuletynu, aby otrzymywać wskazówki techniczne, recenzje, bezpłatne e-booki i ekskluzywne oferty!
Jeszcze jeden krok…!
Potwierdź swój adres e-mail w wiadomości, którą właśnie wysłaliśmy.