Czytelnicy tacy jak ty pomagają wspierać MUO. Kiedy dokonujesz zakupu za pomocą linków na naszej stronie, możemy otrzymać prowizję partnerską. Czytaj więcej.

GauGAN2 to narzędzie do tworzenia fotorealistycznych krajobrazów generowanych przez sztuczną inteligencję. Opracowany przez firmę NVIDIA i dostępny w formie internetowej wersji demonstracyjnej program GauGAN2 umożliwia dowolne dostosowywanie obrazu za pomocą połączenia szkicowania i wprowadzania tekstu w celu kierowania systemem sztucznej inteligencji.

Po pewnym czasie możesz udoskonalić obraz, dodając lub usuwając szczegóły, aż będzie odpowiedni. Obrazy, które może wytworzyć, często wyglądają realistycznie, ale jedno niewłaściwe pociągnięcie i obrazy mogą zacząć wyglądać jak dzieła sztuki fantasy, a nie rzeczywiste krajobrazy.

Oto, co musisz wiedzieć o GauGAN2 firmy NVIDIA.

Czym jest GauGAN2 firmy NVIDIA?

GauGAN2 to generator grafiki AI z unikalnym oknem edycji. Opracowany przez dział badawczy firmy NVIDIA, tej samej firmy, która produkuje procesory graficzne, jest dostępny dla każdego za pośrednictwem internetowej wersji demonstracyjnej.

Jest w pewnym sensie podobny do za pomocą Dall-E 2, generator tekstu na obraz AI, w którym możesz wpisać frazy, takie jak „zachodzące słońce nad pustynią”, a system AI utworzy obraz na podstawie tego opisu. Jednak to nie wszystko, co możesz zrobić z GauGAN2; istnieje kilka sposobów dalszej edycji obrazu.

Jedną z opcji jest użycie mapy segmentacji, aby zobaczyć zarys obiektów na obrazie. Korzystając z tych informacji, możesz zmienić kształt rzeczy, takich jak pasmo górskie, przerysowując jego granice lub całkowicie usuwając elementy.

Możesz także użyć narzędzia Ołówek, aby na przykład narysować okrąg, który może być renderowany jako słońce. To samo dotyczy narysowania kilku szczytów w tle, które mogą stać się pasmem górskim, zwłaszcza jeśli połączysz to z wprowadzeniem tekstu opisującego scenę.

Po wypróbowaniu GauGAN2 firmy NVIDIA możesz chcieć się czegoś nauczyć jak korzystać z aplikacji NVIDIA Canvas, który jest zbudowany na tej samej technologii. Jest to bezpłatna aplikacja skierowana do artystów i twórców, jednak działa tylko przy użyciu jednego z procesorów graficznych NVIDIA RTX.

Jak działa GauGAN2?

Za kulisami GauGAN2 został zbudowany przy użyciu generatywnych sieci przeciwstawnych (GAN). W rzeczywistości jego nazwa jest grą francuskiego artysty postimpresjonistycznego Paula Gauguina i GANs.

Powodem, dla którego może generować obrazy, które przekonująco wyglądają jak prawdziwe krajobrazy, jest to, że w okresie szkolenia nakarmiono go 10 milionami wysokiej jakości obrazów krajobrazów. Moc obliczeniowa wymagana do wytrenowania modelu pochodziła z superkomputera NVIDIA Selene, jednego z najpotężniejszych superkomputerów na świecie.

Sieci GAN znajdują zastosowanie w wielu aplikacjach, w tym w wielu Generatory tekstu na grafikę AI. Kluczową różnicą w stosunku do GauGAN2 jest możliwość zmiany obrazu generowanego przez sztuczną inteligencję w dedykowanym edytorze przy użyciu narzędzi takich jak pióro, wypełnienie i pędzel do wprowadzania zmian.

Interfejs jest minimalny, ale niezbyt przyjazny dla użytkownika, a jego wygląd retro może przypominać o początkach Microsoft Paint, w przeciwieństwie do najnowocześniejszego oprogramowania. Jeśli na pierwszy rzut oka sterowanie nie wydaje się oczywiste, możesz uruchomić krótki samouczek lub obejrzeć film instruktażowy; wystarczy kliknąć przyciski w prawym górnym rogu strony.

Jaką sztukę może wyprodukować GauGAN2?

Celem GauGAN2 jest tworzenie fotorealistycznych obrazów krajobrazów, takich jak góry, jeziora i plaże.

Istnieje biblioteka etykiet, z których można wybierać podczas szkicowania, które pomagają w dalszym oznaczaniu danych wejściowych szkicu, dzięki czemu generator AI może renderować odpowiedni obraz. Należą do nich m.in. mgła, wzgórze, kamień, śnieg i woda.

Jednak nie jest trudno, aby coś poszło nie tak i równie prawdopodobne jest tworzenie absurdalnych i surrealistycznych obrazów. Po prostu weź ołówek i narysuj kilka dziwnych kształtów, a GauGAN wypluje coś, co bardziej przypomina eksperymentalne dzieło sztuki niż cokolwiek rozpoznawalnego.

Wprowadzanie nonsensownych fraz w polu tekstowym może również powodować dziwne wyniki. Czasami nie trzeba nawet posuwać się tak daleko; po prostu prośba o górski krajobraz dała coś, co wygląda jak dziwna kombinacja śniegu i futra.

W obu przypadkach niektórzy artyści mogą uznać takie narzędzie za przydatne. Może być wykorzystany do przyspieszenia procesu tworzenia storyboardów lub jako szybki sposób na stworzenie grafiki koncepcyjnej do gry lub filmu.

Chociaż to demo jest dalekie od bycia dopracowanym produktem gotowym do użycia, ma pewien interesujący potencjał.

GauGAN2: hybrydowy generator grafiki AI

GauGAN2 dołącza do kolekcji generatorów obrazów AI, które zamieniają tekst w obrazy. Jednak w przeciwieństwie do innych aplikacji, możesz edytować obraz etapami, używając szkiców i tekstu jako danych wejściowych, dostosowując obraz AI do własnych upodobań.

Jeśli jest właściwie używany, GauGAN2 może tworzyć dość przekonujące fotorealistyczne obrazy natury, co może być przydatne dla artystów, którzy muszą wypełnić storyboard lub szybko stworzyć grafikę koncepcyjną. Jednak zbyt łatwo rzeczy stają się dziwaczne, a kilka zbłąkanych pociągnięć piórem może prowadzić do interesujących rezultatów.