Reklama

Wszystkie trzy główne platformy telefoniczne mają teraz własny głos. Apple ma Siri, Microsoft ma Cortanę, a Google ma nieco mniej bezczelny Google Now 6 Funkcje Google Now, które zmienią sposób wyszukiwania Być może już korzystasz z Google Now na swoim urządzeniu z Androidem, ale czy masz z niego wszystko, co możesz? Wiedza o tych małych funkcjach może mieć duże znaczenie. Czytaj więcej .

Systemy te umożliwiają obsługę podstawowych zadań za pomocą sterowania głosowego. Każda z nich jest rodzajem wirtualnej sekretarki, która może odpowiadać na proste pytania, otwierać aplikacje, robić notatki i przekazywać wiadomości. Są przydatne, ale są także frustrująco ograniczone. Nie mogą zrobić niczego, do czego nie zostali wyraźnie zaprogramowani, a wiele zadań po prostu przekracza ich możliwości.

Jednak opracowywanych jest wiele technologii, które znacznie poprawią te systemy - i będą dostępne komercyjnie za kilka lat. Oto pięć najważniejszych sposobów, w jakie Twój telefon może stać się znacznie mądrzejszy.

Zobaczysz to, co widzisz

Rozpoznawanie mowy poczyniło ogromne postępy w ciągu ostatnich pięciu lat dzięki rozwojowi potężnych sieci neuronowych. Nowoczesne smartfony potrafią rozpoznawać mowę z zaskakującą dokładnością (minęło sporo czasu od Google Now źle mnie zrozumiał), a nawet potrafi na ich podstawie identyfikować piosenki i programy telewizyjne audio.

To świetnie - ale to dopiero początek. Ludzie nie wchodzą w interakcje ze światem przede wszystkim za pomocą dźwięku. Używamy wizji do praktycznie wszystkiego - i wkrótce nasze maszyny też. Zaczynamy od debiutu pierwszych wyświetlaczy do noszenia na słuchawkach, takich jak Google Glass i HoloLens Microsoftu Microsoft prezentuje nowe wersje demonstracyjne HoloLens na konferencji BuildZbliżający się zestaw słuchawkowy HoloLens firmy Microsoft to pierwsze wysokiej klasy urządzenie rozszerzonej rzeczywistości, które zostało pokazane publiczności. Czy wciąż jest to fantazyjne gadżet czy technologia, która jest bliska realizacji? Czytaj więcej , który może przesyłać strumieniowo informacje ze swoich kamer do smartfona, zapewniając bogatą i zawsze dostępną informację wizualną. Wielu obserwatorów, w tym ja, oczekuje, że staną się one powszechne w ciągu najbliższych pięciu lat.

Co więc może zrobić Twój telefon z tymi wszystkimi danymi?

Dużo. Google już to wykazał z tabletem Tango Google chce umieścić kamerę 3D na smartfonie - oto dlaczegoProjekt Google Tango wprowadza czujniki 3d na urządzenia mobilne. Oto, co wiemy do tej pory. Czytaj więcej kamera głębokościowa może określić położenie przestrzenne obiektów fizycznych z niezwykle wysoką dokładnością. Podobnie dokonano niesamowitych postępów w dziedzinie widzenia maszynowego - takich jak sieć neuronowa Microsoftu, która może zidentyfikować poszczególne rasy psóworaz sieć neuronowa Google, która może dokładnie opisać zawartość zdjęć. Razem te technologie otwierają cały świat aplikacji:

Co to za śruba? Algorytm widzenia maszynowego wie i może zamówić zamiennik na Amazon w ciągu pięciu sekund. Jak nazywała się kobieta, którą spotkałeś wczoraj w barze? Być może zgubiłeś jej kartę, ale twoje okulary złapały jej twarz i możesz ją znaleźć na Facebooku. Masz dziwnego kreta. Czy powinieneś zobaczyć się z lekarzem? Twój telefon może rzucić okiem i powiadomić Cię. Robisz zakupy spożywcze: czego potrzebujesz? Twoje okulary pamiętają ostatni raz, kiedy patrzyłeś w lodówkę, i wiedzą, czego brakuje. Mogą nawet dać ci wskazówki od przejścia, aby znaleźć poszczególne przedmioty.

Wpływ tej technologii na prywatność jest przerażający, ale tego rodzaju rzeczy również wydają się niezwykle przydatne.

Będzie wiedział, co lubisz

Smak może być trudny do ustalenia. Jest to bardzo osobiste i może być bardzo arbitralne. Spotify i Netflix radzą sobie z tworzeniem rekomendacji w oparciu o wzorce użytkowania (technika, która całkowicie ignoruje treść) - ale istnieją rzeczywiste ograniczenia tego podejścia.

Przyszłość tkwi w algorytmach, które potrafią zrozumieć sztukę na głębokim poziomie - złożone sieci neuronowe, które mogą nauczyć się wybierać złożone subtelności muzyki i filmów. To daje znacznie bogatsze zrozumienie tego, co ludzie robią i nie lubią w mediach - konkretne zrozumienie ich smaku.

Pierwsze wczesne wskazówki na ten temat zaczynają się pojawiać. Jak w SpotifyOdkryj tygodnik”, Która korzysta z tego rodzaju narzędzi do analizy treści, aby polecać utwory - w tym utwory, których normalnie nie słyszysz, ponieważ są zbyt niejasne, aby dobrze oceniać na podstawie wzorców użytkowania. Te techniki staną się jeszcze bardziej wydajne w przyszłości, a smartfon jest świetną platformą do wykorzystania tych informacji.

Szukasz czegoś wspólnego z przyjaciółmi? Co zrobić, jeśli aplikacje na telefonie mogą współpracować, gromadzić informacje o swoich upodobaniach i wybierać filmy lub koncerty, które według nich wszystkim się spodobają? Co z witrynami randkowymi, które oceniają Cię na podstawie głębokich cech Twoich upodobań? Co z aplikacjami, które mogą polecać Ci książki, ponieważ je przeczytały?

Możliwości są nieograniczone, a ktoś zarobi na tym dużo pieniędzy.

Będzie gadatliwy

Człowiek: gdzie teraz jesteś?
Maszyna: jestem w szczerym polu.
Człowiek: jaki jest cel umierania?
Maszyna: mieć życie.
Człowiek: jaki jest cel bycia inteligentnym?
Maszyna: aby dowiedzieć się, co to jest.
Człowiek: jaki jest cel emocji?
Maszyna: nie wiem.

To rozmowa z siecią neuronową opracowany przez Google, który uczy się z dużych baz tekstowych bez nadzoru człowieka. Ta wersja została wyszkolona na wielu starych skryptach filmowych i nauczyła się przewidywać następne zdanie w każdej napotkanej rozmowie. Jak się okazuje, jeśli trenujesz sztuczną inteligencję w zakresie skryptów filmowych, wszystkie jego konwersacje są super dramatyczny.

Jeśli nie jesteś pod wrażeniem, to zrozumiałe. Chatboty istnieją od dawna Jak zrobić bot do czatu dla swojej witryny lub firmyTrudności w nawiązywaniu kontaktu z tyloma ludźmi na całym świecie to strefy czasowe. Możesz chcieć być dostępny do interakcji z czytelnictwem lub do prowadzenia interesów z potencjalnymi klientami, ale w niektórych ... Czytaj więcej .

Ale przyjrzyj się bliżej. System Google jest wyjątkowy na dwa kluczowe sposoby.

Po pierwsze, jest bardzo prosta z punktu widzenia architektury: jest to pojedyncza ogromna sieć neuronowa i sama musiała nauczyć się dynamiki ludzkiego języka. Zwykłe chatboty działają przy użyciu tysięcy ręcznie kodowanych reguł reagowania na różne sytuacje. Kiedy recytują odpowiedź, dzieje się tak dlatego, że została ręcznie zakodowana lub zapamiętana na podstawie konkretnego przykładu. Sieć Google jest inna. Nauczył się swojego zachowania w sposób organiczny, starając się zrozumieć głęboką strukturę ludzkiego pisania.

Po drugie, rejestruje zaskakująco subtelną dynamikę, której nie robią inne boty czatu. Może odpowiedzieć na pytania zdrowego rozsądku na temat świata, mimo że nie jest do tego wyraźnie zaprogramowany.

Człowiek: kto jest skywalker?
Maszyna: on jest bohaterem .
Człowiek: kim jest Bill Clinton?
Maszyna: on jest miliarderem.
Człowiek: czy niebo jest niebieskie czy czarne?
Maszyna: niebieski .
Człowiek: czy kot ma ogon?
Maszyna: tak .
Człowiek: czy kot ma skrzydło?
Maszyna: Nie
Człowiek: czy kot może latać?
Maszyna: nie
Człowiek: ile nóg ma kot?
Maszyna: cztery, tak myślę.

Inna wersja bota czatu, wyszkolona w dziennikach pomocy technicznej, może zaskakująco dobrze wprowadzać prawdziwe wsparcie techniczne. Występują potknięcia (wydaje się, że trudno jest zapamiętać, którego systemu operacyjnego używasz) - ale z pewnością otrzymałem gorsze wsparcie techniczne od rzeczywistych ludzi.

Wszystko to dobrze wskazuje, że zaczynamy dochodzić do punktu, w którym sztuczna inteligencja może być naprawdę konwersacyjna. Sieć powyżej może prowadzić znośną rozmowę, nawet jeśli jej cele szkoleniowe wymagają jedynie przestrzegania powierzchownej struktury dialogu „w przód i w tył”.

Biorąc pod uwagę lepsze dane treningowe i funkcję nagrody, która kładzie nacisk na wymianę informacji, możliwości są nieograniczone. Wyobraź sobie wersję Siri, która może angażować cię w prawdziwą rozmowę, udzielać odpowiedzi i porad w odpowiedzi na pytania oraz wykonywać zadania bez potrzeby specjalnego programowania. To nie jest daleko.

Będzie dobrze przeczytany

Inna technologia, nad którą Google pracuje, dotyczy czytania ze zrozumieniem. To jest nazwane "Wektory myślowe, ”A koncepcja jest zaskakująco prosta. Możesz wyodrębnić „wektory myślowe” z aktywności sieci neuronowej, która zawiera informacje, takie jak zdanie lub artykuł. Otrzymujesz nieprzejrzystą informację, która dla nikogo nie znaczy nic oprócz sieci, która ją wygenerowała. Ta informacja w pewnym sensie przechowuje „znaczenie” tekstu, niezależnie od tego, jak zostało pierwotnie sformułowane.

Ma to kilka przydatnych właściwości. Na początek wektory te przypominają się nawzajem dla zdań o podobnym znaczeniu. Jeśli trawisz dwa zdania w ten sposób, możesz ustalić, czy oznaczają to samo, czy nie. Możesz także nimi manipulować. Wykorzystując dwie sieci neuronowe do generowania „wektorów myślowych” z tekstu w różnych językach, a następnie szkoląc trzecią sieć do nauki mapowania między nimi możesz stworzyć niezwykle wydajną metodę tłumaczenia maszynowego, która przechwytuje znaczenie tekstu, a nie tylko słowa w nim zawarte to.

Innym potencjalnym zastosowaniem tego jest wykorzystanie tej technologii do zebrania dużych ilości informacji i przetworzenia ich w zwartą reprezentację, a następnie wygenerowania podsumowania na podstawie wyników. Może to być niezwykle wydajne w aplikacjach mobilnych.

Wyobraź sobie, że możesz poprosić swój telefon o przeczytanie wszystkiego, co jest dostępne w Google na dany temat. Następnie wróć do Ciebie i zwięźle przedstaw swoje odkrycia w języku naturalnym i odpowiedz na pytania dotyczące wyników. To stanie się rzeczywistością naprawdę, bardzo szybko i będzie niezwykle przydatne.

Telefon przyszłości

Telefony w przyszłości będą prawdopodobnie wyglądać zupełnie inaczej niż telefony. Mogą być zakrzywione. Mogą być modułowe. Możesz z nimi wchodzić w interakcje za pomocą okularów rzeczywistości rozszerzonej. Jednak najważniejszą różnicą będzie inteligencja. Opisane tutaj funkcje zmienią nasze urządzenia w potężnych nauczycieli i pomocników.

Jest obecnie gorący wyścig zbrojeń Microsoft vs Google - Kto prowadzi wyścig sztucznej inteligencji?Badacze sztucznej inteligencji robią namacalne postępy, a ludzie znów zaczynają poważnie mówić o sztucznej inteligencji. Dwóch tytanów prowadzących wyścig sztucznej inteligencji to Google i Microsoft. Czytaj więcej w technologii głębokiego uczenia się. Efektem ubocznym jest to, że techniki te rozwijają się niezwykle szybko i będą dostępne na rynku wcześniej, niż mogłoby się wydawać.

Czy ekscytują Cię inteligentniejsze smartfony? Martwisz się o wpływ na prywatność? Daj nam znać w komentarzach!

Kredyty obrazkowe:Ludzki mózg przez Mopic przez Shutterstock

Andre, pisarz i dziennikarz z południowego zachodu, gwarantuje funkcjonalność do 50 stopni Celsjusza i jest wodoodporny do głębokości dwunastu stóp.