Czytelnicy tacy jak ty pomagają wspierać MUO. Kiedy dokonujesz zakupu za pomocą linków na naszej stronie, możemy otrzymać prowizję partnerską.
W ostatniej dekadzie posiadanie aparatu o rozdzielczości 5 megapikseli pomagało uchwycić najlepsze możliwe zdjęcie. Jednak ten sam obraz wyglądałby gorszej jakości, ponieważ dziś można uzyskać znacznie wyraźniejsze zdjęcia o większej rozdzielczości.
GFPGAN to bezpłatne oprogramowanie typu open source, które może zwiększyć rozdzielczość tych obrazów i poprawić ich wygląd, a także naprawia niektóre uszkodzenia. Oto jak skalować i przywracać zdjęcia za pomocą GFPGAN.
Co to jest GFPGAN?
GFPGAN (Generative Facial Prior Generative Adversarial Network) to aplikacja typu open source dostępna do bezpłatnego użytku na GitHub. Możesz pobrać kod lub użyć jednej z wersji online, aby przeskalować swój obraz.
Aplikacja wykorzystuje wstępnie wytrenowany model GAN. Model GAN wykorzystuje zestaw danych do identyfikacji wzorców i wypełnienia luk w obrazie za pomocą algorytmy uczenia maszynowego i sieci neuronowe.
Innymi słowy, aplikacja ma inteligentny algorytm przetwarzania, który bezproblemowo zastępuje uszkodzoną lub rozmytą część zdjęcia podobnie wyglądającymi fragmentami innych zdjęć.
Jak poprawić rozdzielczość obrazu za pomocą GFPGAN
Kroki skalowania i przywracania obrazów za pomocą sztucznej inteligencji GFPGAN są dość proste. Wszystko, co musisz zrobić, to przesłać swój obraz na stronę internetową i poczekać, aż program zakończy transformację. Oto jak to zrobić.
- Otwórz stronę GFPGAN na GitHub.
- Otwórz jedną z dostępnych wersji demonstracyjnych online. Na przykład, Replika.
- Przewiń w dół i kliknij pole pod img sekcja, aby przesłać swój obraz. Alternatywnie możesz przeciągnąć i upuścić swoje zdjęcie lub zrobić je za pomocą kamery internetowej.
- Po przesłaniu obrazu dostosuj plik wersja I skala ustawienia. Wersja jest domyślnie ustawiona na najnowszą. Możesz zwiększyć współczynnik skalowania, aby uzyskać lepsze wyniki.
- Kliknij Składać i poczekaj, aż program wygeneruje wyniki. Możesz zobaczyć wyraźną różnicę w obrazie w zależności od współczynnika skalowania i chropowatości.
- Teraz możesz udostępnić lub pobrać swój obraz z dostępnych opcji.
To wszystko. Pomyślnie przeskalowałeś i przywróciłeś swój obraz za pomocą algorytmu GFPGAN. Możesz dostosować wersje i współczynnik skalowania, aby uzyskać różne wyniki.
Ograniczenia AI GFPGAN
Chociaż narzędzia do przywracania obrazu działają jak cud, istnieje kilka ograniczeń, których nawet sztuczna inteligencja nie może rozwiązać.
Na przykład algorytm skalowania obrazu zgaduje podczas dodawania dodatkowych pikseli. Nie tworzy niczego, ale uczy się na podstawie wstępnie wytrenowanego modelu i wykorzystuje istniejące dane do dokładnego zgadywania. Dlatego istnieje szansa, że osoba może wyglądać zupełnie inaczej niż oryginał.
Algorytm jest jednak tak płynny, że utrata tożsamości zdarza się rzadko. Warto jednak wspomnieć, że nierealistyczne jest oczekiwanie, że sztuczna inteligencja wygeneruje dokładny obraz danej osoby. W najlepszych przypadkach można spodziewać się wysokiej dokładności; w niektórych może to być zupełnie inna osoba.
Ponadto GFPGAN jest precyzyjnie stworzony do odbudowy twarzy. Dlatego jeśli chcesz zregenerować krajobraz lub obiekt, wyniki mogą nie być imponujące. W niektórych przypadkach obiekt może wyglądać na nadmiernie zredagowany lub wygładzony. To sprawia, że obraz wygląda nienaturalnie. Najlepiej byłoby użyć oprogramowania do edycji zdjęć, takiego jak Photoshop, aby ręcznie poprawić przeskalowany obraz, aby wyglądał naturalnie.
Obecnie GFPGAN nie osiągnął jeszcze maksymalnego potencjału. Dlatego przeskalowane obrazy nie będą tak ostre. A zdjęcia wyglądają na zbyt gładkie. Możesz wyostrz obraz za pomocą Photoshopa aby osiągnąć lepsze wyniki.
Wreszcie narzędzie ma ograniczoną moc obliczeniową. Dlatego ulepszanie dużego pliku może być kłopotliwe. Ale stary obraz o niskiej rozdzielczości nie będzie miał dużego rozmiaru pliku.
Różnice w wersjach GFPGAN
Algorytm GFPGAN ma różne wersje, których możesz użyć. Najnowszy jest oczywiście lepszy, ale w niektórych przypadkach nie zawsze jest konstruktywny. Na przykład wersja 1 umożliwia pokolorowanie zdjęcia, ale programiści usunęli tę funkcję w późniejszych aktualizacjach.
Oto zalety i ograniczenia każdej wersji, abyś mógł podjąć świadomą decyzję o przeskalowaniu obrazu. Niektóre wersje nie są dostępne online, więc musisz je pobrać ze strony GitHub i używać na swoim komputerze.
Wersja 1
Pierwsza wersja GFPGAN robi wrażenie. Generuje dane wyjściowe bardzo podobne do obrazu wejściowego. Ponadto ma funkcję kolorowania, która automatycznie koloruje czarno-biały obraz. Jednak może mieć trudności z regeneracją uszkodzonych obrazów.
Wersja 1.2
Druga wersja, czyli wersja 1.2, to ulepszony algorytm. Sprawi, że Twoje obrazy będą miały bardzo wysoką rozdzielczość. Jedynym mankamentem tej wersji jest jej najlepsza jakość. Przeskalowany obraz wygląda zbyt błyszcząco i nienaturalnie ze względu na funkcję makijażu upiększającego.
Wygląda na to, że narzędzie wdraża technologię HDR w celu uzyskania bardziej wyrazistych obrazów. Jednak ta funkcja najlepiej sprawdza się w przypadku krajobrazów i może jednocześnie sprawić, że obraz twarzy będzie wyglądał jak obraz. Możesz więc użyć tej wersji do zdjęć z krajobrazami. Jeśli chcesz ręcznie dodać efekt do swoich zdjęć, zapoznaj się z naszym szczegółowym przewodnikiem na temat jak zrobić fałszywy obraz HDR za pomocą Photoshopa.
Wersja 1.3
Wersja 1.3 jest lepsza niż poprzednie dwie wersje. Zmniejsza efekt nadmiernego połysku z wersji 1.2 i sprawia, że obrazy wyglądają bardziej naturalnie. Jednak zdjęcia nadal nie są ostre, aw niektórych przypadkach można stracić tożsamość osoby. Mimo to zapewnia najlepsze wyniki w porównaniu z poprzednimi wersjami.
Wersja 1.4
Wersja 1.4 jest nieco zaktualizowana w stosunku do wersji 1.3, aby uzyskać lepsze wyniki. Może pracować z obrazami o bardzo niskiej jakości, zapewniając najlepsze rezultaty. Ponadto ta wersja może również naturalnie usuwać uszkodzenia ze zdjęcia.
Bezproblemowe skalowanie i przywracanie obrazów niskiej jakości
GFPGAN to darmowa sztuczna inteligencja, która konwertuje obrazy niskiej jakości na obrazy o wysokiej rozdzielczości. Narzędzie jest wciąż w fazie rozwoju, więc w przyszłości możliwe jest zobaczenie lepszych wersji. Chociaż aktualizuje się regularnie, starsze wersje można znaleźć na stronie GitHub.
Niektóre wersje sprawdzają się lepiej w przypadku określonych zadań, a czasami wszystkie wyniki wyglądają identycznie. Najlepiej wypróbować wszystkie dostępne poprawki, takie jak Wersja i Współczynnik skalowania, aby uzyskać najlepsze wyniki.