Oddzielenie różnych części utworu bez rzeczywistego trzpienia jest trudne, ale istnieje narzędzie o nazwie LALAL.AI jest w stanie obsłużyć ten proces. Dzieli utwory między wokale i instrumenty przy minimalnym wysiłku i nie wymaga umiejętności inżynierii dźwięku.
I chociaż LALAL.AI był już całkiem solidny, ostatnio zrobił ogromny krok naprzód dzięki wprowadzeniu nowej architektury sieci neuronowej o nazwie Cassiopeia. Wymaga Rocknet, sieci neuronowej poprzedniej generacji usługi i sprawia, że jest ona lepsza pod każdym względem.
Co wnosi Cassiopeia LALAL.AI do stołu?
Mówiąc bardzo prosto: Cassiopeia zapewnia lepsze wyniki rozdzielania przy znacznie mniejszej liczbie artefaktów dźwiękowych. Głównym celem LALAL.AI jest wyciąganie i oddzielanie wokali i instrumentów od utworu, więc posiadanie funkcji, która może poprawić te możliwości, jest niesamowite.
Dzięki nowej sieci neuronowej LALAL.AI zajmie trochę więcej czasu na wygenerowanie podzielonych ścieżek, ale to mały kompromis za znaczną poprawą jakości.
Więc co się zmieniło? Zasadniczo Rocknet, który jest nadal używany w LALAL.AI, bierze pod uwagę tylko składową amplitudy, ignorując składową fazową. Nowsza sieć neuronowa Cassiopeia uwzględnia składową fazową sygnału wejściowego i generuje fazę dla sygnału wyjściowego. W wyniku tego procesu podzielone ścieżki będą zawierały mniej artefaktów dźwiękowych.
Mówiąc prościej, nowy algorytm analizuje utwór głębiej, aby uzyskać lepszy podział.
Aby udowodnić, że jego usługa działa efektywniej, LALAL.AI przetestował ją pod kątem Spleeter, OpenUnmix i Extended Unmix. Porównał również wyniki z własną siecią neuronową Rocknet. Pełne wyniki testu można zobaczyć na Blog LALAL.AI, ale w zasadzie Cassiopeia wyprzedziła wszystkie inne w większości kategorii w różnych losowo wybranych gatunkach, takich jak jazz, soft rock, pop i tak dalej.
Co ciekawe, Rocknet nadal lepiej radzi sobie w kanale wokalnym. Cassiopeia ma nieco większą infiltrację z partii instrumentalnych do wokali. LALAL.AI zwrócił jednak uwagę, że liczby nie zawsze opowiadają całą historię, a czasami jakość dźwięku może być w rzeczywistości inna niż to, co pokazują testy.
Oto, co firma powiedziała w tej sprawie:
Chociaż Cassiopeia pozostaje w tyle za Rocknetem pod względem formalnych metryk dla wokali, zarówno część instrumentalna, jak i zwłaszcza rdzeń wokalny oddzielone Cassiopeia brzmi znacznie bardziej naturalnie i miękko niż Rocknet, bez metalicznie brzmiących artefaktów, które są tak charakterystyczne dla innych rozwiązania.
Przetestowałem wyniki na sobie i stwierdziłem, że sieć neuronowa Cassiopeia spowodowała czystsze podziały dźwięku. Utwór wokalny nie miał prawie żadnej dostrzegalnej infiltracji ze strony instrumentów, co jest dokładnie tym, czego oczekujesz od narzędzia takiego jak LALAL.AI
To powiedziawszy, wyniki Rocknet były nadal całkiem dobre i absolutnie nadawały się do odizolowania ścieżki wokalnej od partii instrumentalnych.
Jak wypróbować nową funkcję Cassiopeia LALAL.AI?
Jeśli chcesz dać szansę nowej sieci neuronowej, możesz udać się do LALAL.AI i upewnij się, że Użyj nowego algorytmu pole jest zaznaczone u dołu ekranu podczas przesyłania utworu.
Możesz także wybrać poziom agresji używany przez algorytm do rozdzielania ścieżek. Normalny jest dobry dla większości torów, ale możesz eksperymentować z łagodnymi i agresywnymi, aby zobaczyć, co tworzy dla ciebie lepszą trasę.
Zamiast spędzać godziny na tworzeniu pni, LALAL.AI używa sztucznej inteligencji, aby zrobić to w kilka sekund.
Czytaj dalej
- Lansowany
- Produkcja muzyczna
Dave LeClair pisze wiadomości o Google / Androidzie, zarządza mediami społecznościowymi i pojawia się w filmach.
Zapisz się do naszego newslettera
Dołącz do naszego biuletynu, aby otrzymywać wskazówki techniczne, recenzje, bezpłatne e-booki i ekskluzywne oferty!
Jeszcze jeden krok…!
Potwierdź swój adres e-mail w wiadomości e-mail, którą właśnie wysłaliśmy.