Wyprzedź szaleństwo zamiany tekstu na muzykę, eksperymentując z narzędziem muzycznym AI Meta.
Meta wydała kod dla MusicGen, kolejnego generatora muzyki AI, który może zamieniać opisy tekstowe w melodie. Demo można znaleźć w Internecie, a do wypróbowania wystarczy przeglądarka. Wyniki nie są złe, ale co więcej, pokazują, jak daleko posunęły się modele muzyczne AI.
Oto, co musisz wiedzieć o MusicGen i jak generować muzykę.
Co to jest MusicGen?
W czerwcu 2023 r. Meta wypuściła swój model generowania muzyki AI o nazwie MusicGen. Nie jest to pierwsza firma, która podejmuje złożony problem syntezy surowej muzyki z prostego opisu tekstowego; póki co możesz tworzyć muzykę za pomocą Jukebox OpenAI Lub generować fragmenty utworów za pomocą MusicLM.
Jest to jednak pierwsza firma, która udostępniła kod źródłowy, umożliwiając lokalne uruchamianie oprogramowania na komputerze komputera, jeśli masz kartę graficzną z co najmniej 16 GB pamięci — chociaż udało nam się sprawić, by działała z zaledwie 11 GB.
Nie martw się, jeśli nie masz sprzętu, ponieważ możesz bezpłatnie wypróbować aplikację internetową MusicGen za pomocą przeglądarki. Z wersji demonstracyjnej online można się spodziewać, że wygenerowanie fragmentu audio o długości około 12 sekund zajmie nieco ponad minutę.
Jak brzmi MusicGen?
Według Meta, MusicGen może tworzyć wysokiej jakości próbki muzyczne, chociaż odkryliśmy, że zaangażowani naukowcy zdefiniowali wysokiej jakości jak 32kHz. Znajduje się to gdzieś pomiędzy wymaganiami syntezy mowy (16kHz) a standardem dla muzyki cyfrowej (44,1 kHz).
W rzeczywistości dźwięk nie spełnia minimalnych standardów jakości, do których możesz być przyzwyczajony w radiu lub na platformach streamingowych. Jednak w porównaniu z innymi generatorami muzyki AI i biorąc pod uwagę stan technologii w momencie pisania, jakość dźwięku jest dość dobra przy niskim poziomie szumów w pliku.
Jak blisko jest muzyka z podpowiedziami? Możesz szybko to zrozumieć, słuchając przykładów, które wygenerowaliśmy poniżej. Ogólnie rzecz biorąc, udaje mu się trzymać popularnych gatunków muzycznych, zachowując jednocześnie bardziej spójną strukturę muzyczną w porównaniu do swoich poprzedników.
Jak generować muzykę za pomocą MusicGen
MusicGen jest łatwy w użyciu i nie wymaga rejestracji. Interfejs jest również prosty, co ułatwia wypróbowanie dla zabawy.
Oto jak generować muzykę za pomocą MusicGen:
- Otworzyć Aplikacja internetowa MusicGen.
- W polu tekstowym zatytułowanym Opisz swoją muzykę, wprowadź monit. Możesz spróbować czegoś tak prostego, jak „irlandzka melodia ludowa” lub uszczegółowić, uwzględniając instrument, tempo, gatunek lub emocje.
- wciśnij Generować przycisk, aby rozpocząć proces. Po minucie lub dwóch odtwarzacz audio pojawi się w module Generated Music po prawej stronie.
- Najedź kursorem na moduł, aby wyświetlić elementy sterujące odtwarzacza i odsłuchać plik, lub naciśnij ikonę pobierania w prawym górnym rogu, aby zapisać plik na komputerze. Pamiętaj, że można go pobrać tylko jako plik .mp4.
- Jeśli chcesz spróbować uwarunkować wyniki przy użyciu istniejącej melodii, możesz przesłać nagranie w module obok pola tekstowego. Alternatywnie możesz wybrać mikrofon aby nagrać melodię za pomocą mikrofonu.
Warunkowanie na melodii użyje zarówno opisu tekstowego, jak i melodii, którą podasz jako odniesienie. Jest to przydatne narzędzie do kształtowania wyników uzyskiwanych z MusicGen.
Jakie są ograniczenia dotyczące korzystania z MusicGen Audio?
Kod MusicGen jest swobodnie rozpowszechniany na licencji MIT z kilkoma ograniczeniami. Jeśli chodzi o dźwięk generowany za pomocą modelu, nie jest jasne, czy istnieją jakieś wytyczne prawne. Zamiast tego możesz chcieć słuchać Ostrzeżenie Meta dotyczące korzystania z MusicGen:
„Model nie powinien być używany do celowego tworzenia lub rozpowszechniania utworów muzycznych, które tworzą wrogie lub alienujące środowisko dla ludzi. Obejmuje to generowanie muzyki, którą ludzie mogliby uznać za niepokojącą, przygnębiającą lub obraźliwą; lub treści, które propagują historyczne lub aktualne stereotypy”.
Meta dalej wyjaśnia, że MusicGen jest przeznaczony dla badaczy, którzy chcą zbadać generowanie muzyki AI, a nie dla „dalsze zastosowania”, które, jak zakładamy, oznaczają działania takie jak przesyłanie i dystrybucja muzyki AI w strumieniu platformy.
The etyczne wady i zalety odzwierciedlają generowanie sztuki AI. Uzyskanie zgody na wykorzystanie danych do trenowania modeli sztucznej inteligencji, a także problem wynagradzania / uznawania artystów w stosownych przypadkach to powody, dla których Meta gra bezpiecznie.
Krótko mówiąc, jest mało prawdopodobne, aby eksploracja modelu dla zabawy wyrządziła szkody, ale może to być bardziej drażliwy problem, jeśli chodzi o wykorzystanie dźwięku do muzyki komercyjnej. Wiele osób zastanawia się, co przyszłość muzyki pop z AI wygląda jak.
Dodając kolejny model generowania muzyki do tego, co tam jest, Meta wydała MusicGen, model AI o otwartym kodzie źródłowym, zdolny do generowania surowej muzyki z prostego opisu tekstowego. Jeśli chcesz wypróbować technologię, możesz wypróbować wersję demonstracyjną za pomocą samej przeglądarki internetowej.