Zmierzmy się z największymi graczami zajmującymi się sztuczną inteligencją i zobaczmy, który z nich zwycięży. DALL-E, Midjourney czy stabilna dyfuzja?

Sztuczna inteligencja przeszła długą drogę w dziedzinie generowania obrazu. Aplikacje generatywne, takie jak DALL-E, Midjourney i Stable Diffusion, wywarły ogromny wpływ na sposób, w jaki wchodzimy w interakcję z treściami cyfrowymi.

W tym artykule porównamy każdą aplikację, aby zobaczyć, która ogólnie lepiej generuje obrazy na podstawie monitów tekstowych. Zacznijmy!

DALL-E 2

DALL-E 2 ma prosty interfejs, który jest łatwy do zrozumienia i łatwo jest zacząć generować obrazy bez konieczności rejestrowania się na platformie innej firmy. Wystarczy wejść na stronę internetową i wpisać swój tekst w formularzu Generować pole, aby utworzyć obraz. DALL-E 2 utworzy następnie cztery wersje monitu, które możesz edytować lub pobrać.

Wyróżniająca się funkcja

Jedną z wyróżniających się funkcji DALL-E 2 jest możliwość tworzenia, edytowania i łączenia wielu obrazów razem. Po wybraniu żądanego obrazu i kliknięciu

Edytować, będziesz mieć możliwość korzystania z Dodaj ramkę generacji funkcję dodawania kolejnych generacji obrazu do istniejącej.

Po umieszczeniu ramki wprowadź nowy monit, a DALL-E 2 wygeneruje nowy zestaw obrazów z opcją połączenia dowolnego z nich z oryginalnym obrazem.

Następnie możesz użyć dowolnej funkcji edycji, aby udoskonalić obraz. Na przykład możesz użyć Usuwać narzędzie do usuwania istniejących pikseli, a następnie wprowadź nowy tekst w polu Generuj, aby go wypełnić. Możesz to zrobić wiele razy, aby uzyskać pożądane rezultaty.

Pamiętaj jednak, że za każdym razem, gdy klikniesz Generuj, zużywasz kredyty. A kiedy Twój przydział zostanie wykorzystany, będziesz musiał kupić więcej kredytów, aby kontynuować.

Zalety

  • Łatwy w użyciu
  • Duża elastyczność twórcza
  • Nie jest wymagana platforma innej firmy

Cons

  • Uproszczone obrazy
  • Nie wysoki stopień dokładności
  • Można tworzyć tylko kwadratowe obrazy

Zakrywamy podstawy DALL-E 2 jeśli nigdy wcześniej go nie używałeś.

W połowie podróży

W połowie podróży jest zapewne generator tekstu na obraz AI do pokonania. Dzięki potężnemu zestawowi funkcji jest w stanie tworzyć wysoce artystyczne i wiarygodne obrazy, których inni konkurenci AI jeszcze konsekwentnie nie osiągnęli. Ale w przeciwieństwie do DALL-E 2, musisz utworzyć konto Discord, zanim zaczniesz z niego korzystać.

Nawet z dodatkowymi warstwami złożoności i pomimo tego, że musisz wpisywać polecenia takie jak /imagine aby wygenerować swoje obrazy, wkrótce ułaskawisz Midjourney ze względu na piękną sztukę, którą możesz stworzyć za pomocą kilku słów.

Podobnie jak w przypadku DALL-E 2, tworzone są cztery wersje i można wybrać jedną lub więcej z nich, aby pobrać lub utworzyć wariacje. Ale istnieje większa elastyczność dzięki proporcjom obrazu; możesz zrobić dowolne proporcje, dołączając każdy obraz --ar a następnie stosunek, w naszym przykładzie, 3:2.

Jakość wyników to niewątpliwa magia Midjourney.

Wyróżniająca się funkcja

Jedną z bardziej ekscytujących i potężnych funkcji Midjourney jest możliwość przesyłania własnych obrazów, a następnie tworzenia dla nich monitów, których można użyć do stworzenia zupełnie nowych obrazów. Wpisując /describe, pojawi się prośba o przesłanie jednego ze swoich obrazów.

Po przesłaniu Midjourney zaoferuje cztery monity z własną interpretacją tego, co widzi.

Następnie możesz użyć tych monitów, aby utworzyć zupełnie inny zestaw obrazów.

Dzięki tak dużej kreatywnej elastyczności, Midjourney oferuje niemal nieograniczone możliwości.

Zalety

  • Obrazy wysokiej jakości
  • Użytkownicy mogą programować niestandardowe współczynniki
  • Duża elastyczność w kontrolowaniu parametrów obrazu

Cons

  • Bardziej skomplikowany w użyciu
  • Wymaga od użytkowników zarejestrowania się w Discord
  • Czas generowania obrazu wydłuża się dramatycznie po wyczerpaniu szybkich godzin

Możesz twórz wspaniałe tła do portretów za pomocą Midjourney aby Twoje zdjęcia się wyróżniały.

Stabilna dyfuzja

Stable Diffusion reprezentuje Dziki Zachód generatywnych aplikacji AI. Przy wielu dostępnych aplikacjach internetowych i opcjach instalacji nie jest łatwo porównać Stable Diffusion z DALL-E 2 i Midjourney. Wynika to głównie z rozbieżności między wersjami internetowymi a modelami instalacji pod względem opcji i jakości wydruku. Innymi słowy, wersje zainstalowanej wersji Stable Diffusion zazwyczaj zapewniają znacznie lepsze wyniki i swobodę twórczą.

Zajrzymy na oficjalną stronę Stable Diffusion, DreamStudio od Stability AIi pokazać, jak zacząć korzystać z aplikacji, aby dać podstawowe pojęcie o jej możliwościach.

Układ Stable Diffusion w DreamStudio jest bardziej zagracony niż DALL-E 2 i Midjourney, ale nadal jest łatwy w użyciu. Użytkownicy wersji próbnej otrzymują 200 darmowych kredytów na tworzenie monitów, które są wprowadzane w Podpowiedź skrzynka. Ale oprócz tego istnieje również Negatywny monit pole, w którym możesz uprzedzić Stabilną dyfuzję, aby pominąć rzeczy.

W menu po lewej stronie znajduje się kilka innych ważnych funkcji, które będą miały wpływ na ogólny obraz i wykorzystanie kredytów. jest Styl pole opcji, Załaduj obrazek, I Ustawienia (dla proporcji i liczby obrazów do wygenerowania). w Zaawansowany zakładka, jest Natychmiastowa siła, Kroki generacji, Nasionko, I Model.

Po najechaniu kursorem na każdą z tych opcji zobaczysz krótki opis każdej funkcji. Ale aby naprawdę zrozumieć, co każdy z nich robi w praktyce, musisz je po prostu wypróbować. Ale uważaj na swoje kredyty, ponieważ nie jest to system „jeden kredyt za jeden obraz”.

Wyróżniająca się funkcja

The Negatywny monit jest prawdopodobnie wyróżniającą się cechą stabilnej dystrybucji DreamStudio. Jest to również rzekomo wspaniałe narzędzie w innych wersjach Stable Diffusion, które pomaga w ogólnej jakości obrazu. W tych wersjach wpisywanie negatywnych stwierdzeń pomaga algorytmom generować dokładniejsze obrazy o wyższej jakości.

Kiedy negatywne monity działają, działają dobrze. Ale w wielu przypadkach wydasz kredyty, próbując udoskonalić pożądany wygląd.

Zalety

  • Wiele opcji dla wersji internetowych i zainstalowanych
  • Większa swoboda twórcza (w niektórych wersjach można tworzyć obrazy bez cenzury)
  • Wiele elementów sterujących do dostosowywania parametrów obrazu

Cons

  • Przepala kredyty w płatnych wersjach
  • Stroma krzywa uczenia się
  • Jakość obrazu jest bardzo chybiona, w zależności od posiadanej wersji

Jeśli potrzebujesz pomocy przy tworzeniu monitów, pokażemy Ci jak używać ChatGPT do tworzenia obrazów AI.

Która aplikacja jest lepsza?

Która aplikacja jest najlepsza, DALL-E 2, Midjourney czy Stable Diffusion? To trudne pytanie, ponieważ użytkownicy mają różne oczekiwania i istnieją różne wersje tych aplikacji, co sprawia, że ​​bezpośrednie porównania są nierealne. Jednak każdy z naszych przykładów możemy ocenić według tych kategorii.

Ranking jakości obrazu

Midjourney wytworzył obrazy najlepszej jakości w naszych przykładach. Były bardziej realistyczne i piękniej renderowane niż DALL-E 2 i Stable Diffusion.

Łatwość użycia

Po wyjęciu z pudełka DALL-E 2 był najłatwiejszy w użyciu. Nie wymagało użycia aplikacji innej firmy, a menu było proste i usprawnione.

Funkcje i możliwości

Midjourney wyprzedza swoich konkurentów, ponieważ ma więcej funkcji i możliwości, które zapewniają bardziej spójne tworzenie wysokiej jakości obrazów.

Prędkość

DALL-E 2 generuje obrazy najszybciej (około 12 sekund), wyprzedzając stabilną dyfuzję o około sekundę, a Midjourney (w trybie szybkim) o większy margines.

Elastyczność i dostosowanie

Stable Diffusion jest klasą samą w sobie pod względem elastyczności i dostosowania. Istnieje coraz więcej wersji, które pozwalają użytkownikom nie tylko tworzyć obrazy, które są zwykle cenzurowane, ale są wersje, które wytwarzają nawet wysokiej jakości obrazy, które są bezpośrednio wzorowane na Midjourney obrazy.

Midjourney i DALL-E 2 zajmują pierwsze miejsce pod względem liczby wygranych kategorii, ale ogólny zwycięzca musiałby przejść do Midjourney, na podstawie samej jakości obrazu.

Wraz ze wzrostem konkurencji użytkownicy treści AI są lepiej obsługiwani

Wszystko, co możemy zaoferować, to migawki najlepszych graczy spośród DALL-E 2, Midjourney i Stable Diffusion w dowolnym momencie. Dziedzina technologii sztucznej inteligencji stale się rozwija, a na rynek codziennie dołączają liczni konkurenci. Jest to bardzo korzystne dla użytkowników generatywnych aplikacji sztucznej inteligencji, ponieważ sprzyja innowacjom i prowadzi do obniżenia kosztów dostępu do tych niesamowitych kreatywnych narzędzi dla nas wszystkich.