Midjourney – KI-Bildgenerierung für Einsteiger

Lesedauer 6 Minuten
Zuletzt aktualisiert am 15. März 2023

Midjourney ist der Shooting-Star in der Welt der Bildgenerierung durch künstliche Intelligenz! Mit nur wenigen Worten zaubert das Tool atemberaubend schöne Bilder, die nicht nur beeindruckend, sondern auch unglaublich einfach zu handhaben sind. Sein künstlerischer Stil und seine unkomplizierte Bedienung machen es zur ersten Wahl für jeden, der in kürzester Zeit qualitativ hochwertige Bilder erstellen möchte.

Aber wie funktioniert Midjourney eigentlich? Und gibt es irgendwelche Einschränkungen oder Vorteile, die Nutzer:innen kennen sollten?

Inhaltsverzeichnis

Was ist Midjourney überhaupt?

Midjourney hat den großen Durchbruch geschafft, als im vergangenen Jahr ein Künstler mit einem von der Anwendung generierten Bild einen Wettbewerb gewann. Es ist eine generative KI-Anwendung, die aus Textbeschreibungen heraus wunderschöne Bilder erschaffen kann. Entwickelt wurde das Programm vom namensgebenden unabhängigen Forschungslabor  Midjourney, dessen Gründer David Holz auch schon Mitgründer von Leap Motions und Forscher bei der NASA war.

Bei Midjourney interagieren die Nutzer über einen Discord-Server mit der KI. Über einen Bot erstellt das Programm Bilder aus euren Beschreibungen und kann dabei auf viele verschiedene Stile eingehen. Midjourney ist seit Juli 2022 in einer offenen Beta-Phase verfügbar und bietet verschiedene Abonnement-Modelle an. 

Mit diesem Modell ist Midjourney eine der bekanntesten Anwendung generativer KI im Grafik-Bereich. Diese nutzen Algorithmen des maschinellen Lernens, um Systeme dazu zu befähigen, Grafiken aus vorhandenen Texten, Bildern oder Mustern zu erstellen. Das Ergebnis kann von Bildern über Videos bis hin zu 3D-Modellen reichen. Ziel ist es, menschliche Fertigkeiten zu erreichen oder sogar zu übertreffen und kreative und professionelle Inhalte zu produzieren. Mit Midjourney und anderen generativen KIs sind wir auf dem besten Weg dahin!

regelmäßig neue Bilder gibt’s auf dem Insta-Feed von KI-Journey

So funktioniert Midjourney

Zugang und Kosten

Um Midjourney nutzen zu können, benötigt man lediglich einen Discord-Account und muss sich über midjourney.com anmelden. Sowohl die Nutzung über die Discord-App als auch im Browser funktioniert schnell und zuverlässig. Es gibt etwa 25 kostenlose Aufträge für den Bot, bevor Nutzer:innen sich für ein Abo-Modell entscheiden müssen. Die Abonnementpreise reichen von 8 $ (ca. 11 € mit Steuer) bis 66,50 € (mit Steuer) und es gibt Rabatte für jährliche Zahlungen.

Es ist nicht erforderlich, Midjourney auf einem Gerät zu installieren oder über eine besonders schnelle Internetverbindung zu verfügen. Allerdings ist einigermaßen fließendes Englisch oder ein gutes Übersetzungstool wichtig, da alle Foren und Erklärungen auf Englisch verfasst sind. Obwohl die Bildbeschreibungen auch auf Deutsch funktionieren, sind die Ergebnisse schlechter.

Bilder generieren

Nachdem der Server erreicht ist, können die Anwender:innen einem der zahlreichen Kanäle beitreten. In der kostenlosen Testversion stehen dabei die #Newbie-Channel zur Verfügung. Von hier aus können es dann losgehen.

Midjourney - KI-Bildgenerierung. Verwendung des Imagine-Befehls
Chat-Befehl /imagine eingeben. Quelle: midjourney.com
  1. Im Eingabefeld des Chats wird der Befehl /imagine eingeben und mit der Eingabe- oder Leer-Taste bestätigt
  2. In das dargestellte dunkle Feld wir dann eine Bildbeschreibung eingegeben
  3. Der Befehl wird mit der Eingabe-Taste abgeschickt
KI Journey. 4er Raster zum Promt "Street Art graffiti" in Midjourney
4er Raster aus dem Prompt: Street Art Graffiti

Anschließend wird ein Raster aus vier quadratischen Bildern angezeigt, das vier verschiedene Bildbeschreibungen vorschlägt, die von der KI erstellt wurden. Midjourney benötigt ungefähr eine Minute, um das Raster zu generieren, abhängig von der aktuellen Serverauslastung.

 Re-Roll, Variations und Upscale

Mit dem Raster stehen dann vier Möglichkeiten zur Verfügung

  1. Re-Roll (grün): Generiert 4 neue Vorschläge aus der gleichen Bildbeschreibung
  2. Variations (blau): Generiert Varianten des gewählten Vorschlages
  3. Upscale (orange): Rendert den gewählten Vorschlag in besserer Auflösung

Das Upscale können die Nutzer:innen dann bewerten, abspeichern oder nochmal Varianten davon anfertigen lassen. Spülen und wiederholen. Das war es im Grunde.

Bild-zu-Bild

Neben reinen Texteingaben können die Anwender:innen auch Bilder in den Prompt eingeben. Dazu müssen sie die Bilder in Discord hochladen und können dann die Bild-URL an den Anfang des Prompts stellen. Für das Hochladen sollten die Bilder entweder auf einem privaten Kanal oder im Direktchat mit dem Discord-Bot gesendet werdne. Denn Alles, was in den Midjourney-Channels gepostet wird, ist öffentlich und kann von allen eingesehen werden.

Die Bilder am Anfang des Prompt beeinflussen sowohl Motiv, als auch Stil der Ergebnisse. Die User können sie ohne jegliche Ergänzung eingeben oder noch eine Bildbeschreibung hinten dran setzen. Mit dem Befehl /blend Verschmelzen zwei Bilder zu einem.

Einstellungen

Ein Menü für Einstellungsmöglichkeiten gibt es in Midjourney nicht. Über Parameter können verschiedene Befehle an die Bildbeschreibung gehangen werden.
  • --no schließt Begriffe aus der Bildbeschreibung aus. So sagt ihr der KI, was ihr nicht wollt.
  • --ar 3:2 oder --ar 2:1 gibt das Seitenverhältnis des Bildes an
  • --q 2 erzeugt Bilder in besserer Qualität
  • --niji nutzt einen Algorithmus, der speziell für Anime und Manga trainiert wurde.
Eine komplette Liste der aktuell verfügbaren Parameter findet ihr in der Dokumentation von Midjourney.

Vorteile gegenüber ähnlichen Tools

Midjourney kann wie der größte Konkurrent Stable Diffusion eine breite Palette an grafischen Stilen generieren. Das Programm kann Ölgemälde, Illustrationen, Pixelart, Fotos, Stickerdesign, Website-Templates, Game-Assets und Charakterdesign erstellen. Midjourney wird kontinuierlich weiterentwickelt und zum Zeitpunkt dieses Artikels war Version 4c erst wenige Wochen alt, während die Veröffentlichung von Version 5 für die nächsten Tage geplant war.

Midjourney größte Vorteile im Überblick:
  • Midjourney ist benutzerfreundlich und einfach zu bedienen
  • es benötigt nur wenige Wörter, um atemberaubende Bilder zu genieren (Stand Version 4c)
  • die generierten Bilder sind überzeugend und stilistisch ansprechend
  • Midjourney ist mobil und kann auch auf dem Handy genutzt werden
  • keine Installation erforderlich
  • technisches Fachwissen ist nicht nötig
  • Midjourney erfordert nur einen Discord-Account und einen Textbefehl

Nachteile von Midjourney

Obwohl Midjourney für viele Kreative eine wunderbare Möglichkeit bietet, um beeindruckende Ergebnisse zu erzielen, hat es leider auch seine Nachteile – insbesondere für größere Unternehmen und Marken.

Unklare Regelungen zu DSGVO und Privatsphäre:
Die erzeugten Bilder sind grundsätzlich öffentlich und können von allen Community-Mitgliedern weiterverwendet werden. Es gibt zwar einen „Privat“-Modus, aber auch dieser kann nicht zu 100% garantiert werden. Die Nutzungsbedingungen von Midjourney wurden bereits von KI Journey thematisiert. Auch wieweit schneller Support für Unternehmen verfügbar ist, ist unklar.

Nutzungskosten:
OpenAI hat StableDiffusion der Community kostenfrei und zur freien Weiterentwicklung zur Verfügung gestellt.

Die mangelnde Kontrolle über die Ergebnisse stellt die größte Herausforderung dar. Obwohl Einstellungen wie Seitenverhältnisse, Qualität und Stil beeinflusst werden können, ist eine gezielte Steuerung der Ergebnisse nicht möglich. Wenn beispielsweise ein bestimmter Teil eines Bildes entfernt werden soll, kann dies nur durch wiederholtes Generieren von Varianten des Bildes erreicht werden, bis das gewünschte Ergebnis erreicht ist. 

Im Vergleich dazu bietet Stable Diffusion z. B. folgende Möglichkeiten:
  • einzelne Bereich des Bildes gezielt neu genieren oder verbessern
  • Wahl zwischen verschiedenen Generierungsmodellen, die auf verschiedene Stile oder Motive spezialisiert sind
  • Wechsel zwischen diesen Modellen im Entstehungsprozess
  • beinahe bliebe Bildgrößen (Vielfache von 512px), sofern es die eigene Hardware zulässt
  • Wahl des Algorithmus, der die Bilder vergrößert
  • Plugins für Photoshop
  • ständige Entwicklung neuer Tools und Erweiterungen durch die Community

Fazit: Beeindruckende Anwendung für Einsteiger

Ich sag’s wie es ist: ich schätze Midjourney sehr und werde es auch in Zukunft für meine KI Journey nutzen. Allerdings muss ich auch sagen, dass Midjourney nicht unbedingt ein Alleskönner in der KI-Welt ist. Seine Stärken liegen vor allem in der Ästhetik und der intuitiven Bedienbarkeit. Wer viel unterwegs arbeitet oder einfach eine schnelle Lösung braucht, die problemlos auf dem Tablet oder Handy genutzt werden kann, trifft mit Midjourney eine ausgezeichnete Wahl.

Alternativen

Unternehmen, Marken und Kreative, die nach einer Anwendung suchen, die nahtlos in ihren bestehenden Kreativprozess integriert werden und mit anderen Programmen verbunden werden kann, sollten sich Stable Diffusion ansehen. Die Plattform bietet nicht nur umfangreiche Anpassungsmöglichkeiten und Erweiterungen, sondern auch einen hohen Grad an Datensicherheit.

Für Benutzer, die sich detailliertere Einstellungen wünschen, ohne sich mit lokalen Installationen, Python oder Hardwareanforderungen auseinandersetzen zu müssen, bietet sich Leonardo.ai an. Diese noch kostenlose Webanwendung verbindet Stable Diffusion mit einigen seiner Funktionen und bietet einem benutzerfreundlichen Webinterface. Obwohl die Anwendung öffentlich zugänglich ist, bietet sie bereits in der kostenlosen Version einen Privatmodus.

Da sich das Angebot an Tools und Methoden ständig verändert, ist es schwierig, klare Empfehlungen zu geben. Da hilft nur: ständig weitersuchen.

Weitere Ratgeber
Wie Generative KI Bildgestaltung neu definiert

Wie Generative KI Bildgestaltung neu definiert

Generative Künstliche Intelligenz (KI) hat die Art und Weise revolutioniert, wie Bilder erstellt werden. Mit Hilfe von Algorithmen und Deep...
Weiterlesen
Illustrationen mit KI erstellen und vergrößern

Illustrationen mit KI erstellen und vergrößern

Künstliche Intelligenz (KI) hat in der Bildgenerierung und -vergrößerung erstaunliche Fortschritte gemacht. Sowohl Midjourney als auch Stable Diffusion können ohne...
Weiterlesen
Upscaling mit ChaiNNer – kostenfreie Gigapixel-Alternative

Upscaling mit ChaiNNer – kostenfreie Gigapixel-Alternative

KI-generierte Bilder können mit ChaiNNer hochskaliert werden, um die Qualität des Bildes zu verbessern. Im Gegensatz zu Gigapixel von TopazLabs...
Weiterlesen
Midjourney v5 – täuschend echt

Midjourney v5 – täuschend echt

Midjourney hat mit der neuen Version "Midjourney v5" eine neue Generation ihres Algorithmus veröffentlicht, der laut Angaben des Unternehmens eine...
Weiterlesen

Jana arbeitet seit 2006 im Bereich Content Management und wurde von Midjourney so richtig für KI-Tool angefixed. Als Hobby-Illustratorin, die sowohl mit digitalen als auch mit traditionellen Medien arbeitet, sieht sie die Deeplearning-Algorithmen als wunderschöne neue Spielzeugkiste.

ChatGPT ist ein ChatBot von OpenAI.
ChatGPT wird als Co-Autor genannt, wenn die KI den Text spürbar mitgestaltet hat, jedoch inhaltlich keinen oder wenig Einfluss hatte.

Scroll to Top
Cookie Consent mit Real Cookie Banner