Reklama

Ostatnio pracowałem nad historią z udziałem osoby, która wykonała telefon, która została nagrana. Ta osoba później odmówiła przyznania, że ​​w ogóle kiedykolwiek dzwoniła.

Z nagranym głosem z rozmowy telefonicznej i klipem osoby zaprzeczającej oskarżeniu, zabrałem się do pracy, próbując znaleźć sposób na udowodnienie, że głosy były takie same.

Przyznaję, że mam trochę obsesji na punkcie technologii głosowych. Właśnie dlatego czekałem głos Google Jak korzystać z Google Voice do blogowania przez telefon Czytaj więcej aby stać się bardziej zaawansowanym dzięki technologii rozpoznawania głosu, dlatego uwielbiam aplikacje do sterowania głosem na PC jak Tazti Włącz funkcję zamiany mowy na tekst i głosu, konfigurując rozpoznawanie mowy w systemie WindowsRozpoznawanie mowy pozostaje silniejsze niż Cortana. Umożliwia sterowanie mową na tekst i sterowanie głosem. W tym artykule dowiesz się, co potrafi rozpoznawanie mowy, jak go skonfigurować, wyszkolić i używać. Czytaj więcej . Jednak jeśli chodzi o cyfrowe porównywanie głosów, byłem zagubiony. Prawdopodobnie widziałeś te filmy szpiegowskie, w których komputer może automatycznie rozpoznać głos znanego przestępcy na podstawie samego wydruku głosowego.

instagram viewer

Szczerze mówiąc, kiedy odkryłem Sonogram Visible Speech, zdałem sobie sprawę, że technologia głosowa spektrogramu faktycznie jest obecnie realny sposób na solidną identyfikację osoby za pomocą samego głosu.

Zrozumienie spektrogramu

Jeśli wiesz o izotopach chemicznych, to wiesz, że dzięki izotopom chemicy mogą zidentyfikować skład chemiczny związki, izolując podstawowe pierwiastki i wykorzystując rozkład do identyfikacji poszczególnych składników dowolnych mieszanina. W podobny sposób spektrogram audio rozkłada dźwięk na podstawowe częstotliwości. Interesującą rzeczą w ludzkim głosie jest to, że nikt nie mówi w jednej częstotliwości. Twoje usta, kanały nosowe i struktura skrzynki głosowej determinują mieszankę częstotliwości, które składają się na twój nieco wyjątkowy głos.

Sonogram Visible Speech to darmowa aplikacja do spektrogramów, która pobiera pliki wideo lub audio i psuje się w dół ścieżki audio do całego spektrum - wszystkich jego częstotliwości w całym przedziale czasowym tor. Wypełniony spektrogram wygląda jak na poniższym obrazku.

programy spektrogramu dźwięku

Jak widać, dolna ścieżka wygląda jak podstawowa fala dźwiękowa, którą można zobaczyć w programie takim jak Śmiałość 3 wskazówki Audacity, aby ulepszyć Twoje nagrane wywiadyCzysty dźwięk jest niezbędny w przypadku każdego podcastu lub nagrania, które chcesz opublikować. Zwiększ jakość dźwięku dzięki Audacity w trzech łatwych krokach. Czytaj więcej , jednak środkowy panel wyświetla każdy segment pliku dźwiękowego w całym układzie częstotliwości. Niesamowitą rzeczą w tym oprogramowaniu jest to, że istnieje wiele innych przebiegów, których można użyć do zbadania pliku dźwiękowego. Są to szczególnie dla zaawansowanych użytkowników.

programy spektrogramu dźwięku

Możesz skonfigurować sposób wyświetlania każdej z tych fal, przechodząc do menu „Opcje” i wybierając „Ogólne” Dostosowanie." Tutaj możesz zdefiniować, w jaki sposób wykresy logarytmiczne obliczają wynik i ogólną konfigurację wyświetlania wszystkich dostępnych wykresy.

cyfrowy spektrogram dźwięku

Jeśli dźwięk jest dość cichy lub analizowany głos jest szeptem, możesz rozważyć użycie logarytmicznego wyświetlania częstotliwości. Włącz ją z menu „Opcje” i wybierz „Częstotliwość logarytmiczna”. To nieco „powiększy” znaczące obszary częstotliwości w spektrogramie.

cyfrowy spektrogram dźwięku

To może naprawdę pomóc zidentyfikować wyraźne wzorce częstotliwości, które identyfikują kogoś na podstawie jego głosu. Jeśli jesteś całkowicie zagubiony i nie wiesz, od czego zacząć, kliknięcie „Pomoc” i przejście do „Pomocy online” otworzy bardzo dobrze napisaną instrukcję pomocy online Sonogram. To świetne miejsce na początek, jeśli dopiero zaczynasz korzystać ze spektrogramu analizy audio.

cyfrowy spektrogram dźwięku

Eksperyment ze spektrogramami za pomocą Ghost Hunting

Piękno tego oprogramowania polega na tym, że nadaje się ono do wielu różnych zastosowań. Jednym z artefaktów, który często pojawia się podczas polowania na duchy, jest to mój osobisty interes „Zjawisko głosu elektronicznego” - w którym głos zjawy lub ducha rzekomo pojawia się w dźwięku nagrania. Te nagrania są rozrzucone po całej sieci, więc postanowiłem usunąć kilka ze stron łowców duchów i przeprowadzić analizę spektrogramu.

Sonogram Visible Voice - potężne oprogramowanie do spektrogramu głosu sono6

Spektrogram pokazuje, że częstotliwości głosu są generalnie niskie, ale aby uzyskać lepszy obraz głosów w nagraniu, należy otworzyć dodatkowe kształty fal. Widok autokorelacji oblicza „skok” w czasie, w którym umieścisz mysz.

Sonogram Visible Voice - potężne oprogramowanie do spektrogramu głosu sono7

„Duch” ma średnią częstotliwość tonu około 129,0 Hz. Przewijanie do końca nagrania, gdzie słyszysz głos badacza, obliczoną wysokość częstotliwość wynosi około 208,0 hz (co ma sens, ponieważ jest to głos żeński i brzmi dźwięk ducha męski.)

Sonogram Visible Voice - potężne oprogramowanie do spektrogramu głosu sono8

Otwarcie wyświetlacza szybkiego Fouriera ujawnia jeszcze więcej szczegółów na temat głosów. Ta tabela szybko rozkłada podstawowe częstotliwości i wyświetla je w postaci kolorowego kodu.

Sonogram Visible Voice - potężne oprogramowanie do spektrogramu głosu sono9

W tym przypadku rozkład częstotliwości jest rozłożony na części, z pewnymi wysokimi, ale także dużą liczbą niskich częstotliwości w miksie. Jednak badacz w pokoju wyraźnie mówi głosem skupionym częstotliwościowo bardziej w kierunku górnego końca zakresu, jak pokazano tutaj.

Sonogram Visible Voice - potężne oprogramowanie do spektrogramu głosu sono10

Ta szybka analiza wykazała, że ​​dwa głosy są całkiem różne, ale jest to tylko podstawowy przykład możliwości tego potężnego oprogramowania. Zasadniczo każda sytuacja, w której może pomóc rozkład częstotliwości fali dźwiękowej - jest to oprogramowanie dla Ciebie. Jest łatwy do nauczenia, szybki w konfiguracji i konfiguracji oraz działa równie dobrze lub lepiej niż jakikolwiek inny płatny program na rynku.

Czy masz jakieś projekty, które mogłyby wykorzystać spektrogram? Czy próbowałeś kiedyś Sonogram Visible Speech? Podziel się swoim spostrzeżeniem w sekcji komentarzy poniżej.

Ryan ma tytuł licencjata z inżynierii elektrycznej. Pracował 13 lat w inżynierii automatyki, 5 lat w IT, a teraz jest inżynierem aplikacji. Były redaktor naczelny MakeUseOf, przemawiał na krajowych konferencjach dotyczących wizualizacji danych i był prezentowany w krajowej telewizji i radiu.