Midjourney hat mit der neuen Version „Midjourney v5“ eine neue Generation ihres Algorithmus veröffentlicht, der laut Angaben des Unternehmens eine deutlich größere stilistische Bandbreite, schnellere Reaktionen und höhere Bildqualität bietet. Neue Features sind unter anderem bessere Details, eine Unterstützung für Seitenverhältnisse größer als 2:1 sowie die Gewichtung von Bildern und Texten.
Ab dem 15.03. ist die neueste Version des Midjourney-Texteditors verfügbar, welche Anwender:innen über den Parameter „--v 5
“ testen können. Die vorherige Version v4c bleibt jedoch standardmäßig eingestellt. KI Journey hat die wichtigsten Neuerungen der neuen Version getestet.
Inhaltsverzeichnis
Das kann Midjourney v5
Im Vergleich zu den Vorgängerversionen (v3 und v4) soll v5 sehr vielseitig sein und sehr gut auf freie Formulierungen reagieren können. V5 ist laut Midjourney das zweite Modell, das auf ihrem KI-Supercluster trainiert wurde und verwendet deutlich andere neuronale Architekturen und neue ästhetische Techniken. Stark verbessert hat sich das Verständnis für natürlich Sprache. Allerdings wird v5 so möglicherweise etwas schwieriger zu bedienen und kurze Prompts funktionieren möglicherweise nicht so gut. Es wird empfohlen, längere und explizitere Texte zu schreiben.
In den Patchnotes gibt Midjourney folgende neuen Features an:
- deutlich größere stilistische Bandbreite
- schnellere Reaktion auf Eingabeaufforderungen
- deutlich höhere Bildqualität (2x höhere Auflösung)
- Detailliertere Bilder. Die Wahrscheinlichkeit, dass Details korrekt sind, ist größer. Weniger unerwünschter Text.
- Unterstützt
--ar
Seitenverhältnisse größer als 2:1 (Testphase) - Unterstützt das Argument
--tile
für nahtlose Kacheln (Testphase) - Unterstützt
--iw
für die Gewichtung von Image-Prompts gegenüber Text-Prompts
So stilsicher ist der Algorithmus
Midjourney hat bereits eine beeindruckende Bandbreite an Stilen, die es schwierig machen, diese spezielle Fähigkeit zu testen. Dennoch zeigt auch V5 eine gute Leistung bei der Umsetzung von Angaben wie „Illustration“, „flat shaded“ oder „character sheet“, wie es bereits in früheren Versionen des Algorithmus der Fall war. Allerdings wurden bei der Verwendung des illustrativen Stils einige Bilder generiert, auf denen mehr oder weniger Hände und Finger waren, als man erwarten würde.
verschiedene Stile generiert mit Midjourney v5
Qualität und Details
Bereits im initialen 4er Raster wird die Auflösung der Bilder mit 1024×1024 Pixel generiert. Das dauert zwar ein bisschen länger, aber es sieht schon viel besser aus und enthält auch mehr Informationen. Im Moment gibt es jedoch noch keinen Upscaling-Algorithmus, der größere Auflösungen ermöglicht. Aber im Vergleich zu früheren Modellen wäre eine Erhöhung auf 2064 Pixel durchaus denkbar.
Die Unterschiede machen sich besonders bei fotorealistischen Bildern bemerkbar. Endlich sehen Hundenasen wie echte Hundenasen aus, die Fellstrukturen sind deutlich verbessert und die meisten Menschen haben normale Hände. In diesem Bereich hat das Modell definitiv einen Schritt nach vorne gemacht und das Ergebnis kann sich sehen lassen.
Fotorealistische Bilder mit hohem Detailgrad
Unendliche Seitenverhältnisse
Das frühere Modell hatte eine Begrenzung auf Seitenverhältnisse von maximal 2:1, aber jetzt können Nutzer:innen so richtig Gas geben. Zwar gehen bei den extremen Verhältnissen hin und wieder einige Details verloren, aber die Ergebnisse können trotzdem beeindruckend sein.
KI Journey hat die Verhältnisse 16:9, 9:21 und 23:10 getestet. Die Grafiken im Format 9:12 hatten auffällig oft schwarze Balken am oberen und unteren Rand. Auch bei 23:10 waren diese öfter einmal zu sehen. Am saubersten war das herkömmliche Format 16:9.
Daneben ist bei dieser Testreihe aufgefallen, dass das gleiche Text-Prompt unterschiedlich stark stilisiert ist. Zum Teil sind es eindeutige Concept-Visuals, dann wieder sehr fotorealistisch.
Muster erstellen mit Midjourney v5
In Midjourney V5 ist die beliebte Funktion --tile
wieder verfügbar. Mit diesem Parameter können Bilder erstellt werden, die sich nahtlos wiederholen lassen und somit perfekt für die Erstellung von Musterstoffen, Tapeten und Texturen geeignet sind. Dabei generiert Midjourney nur eine einzige Kachel. Um sicherzustellen, dass alles gut zusammenpasst, benötigen Nutzer:innen zusätzliche Tools wie den Seamless Texture Checker. Das funktionierte gewohnt gut.
Kacheln aus Midjourney v5 und die zusammengesetzten Muster
Gewichtung von Text und Bild im neuen Midjourney
Die Gewichtung verschiedener Teile der Eingabe ist ein wichtiges Werkzeug bei Midjourney, da sie den Unterschied zwischen einem „Hotdog“ und einem „hot dog“ ausmachen kann. Dieser Einfluss ist besonders gut bei einfachen Text-Prompts zu beobachten:
- „plant-llama“ versucht erwartungsgemäß beide Motive zu verschmelzen
- „plant:: llama“ trennt die Motive mit dem Separator ::. Beide sind gleich wichtig
- „plant::2 llama“ bewertet die Pflanzen doppelt so hoch, wie das Lama
- bei „plant:: llama::2“ ist nun das Lama besonders wichtig
Der Text-Prompt „plant“ und „llama“ in verschiedenen Gewichtungen
--iw
gibt an, wie wichtig das Bild in der Eingabe ist. Dabei dürfen die Werte zwischen 0,25 und 2 liegen. Gewichtungen zwischen zwei Bildern sind derzeit nicht möglich. Das Bild der Topfpflanze kombiniert mit dem Text-Prompt „llama“.
Wie Generative KI Bildgestaltung neu definiert
Illustrationen mit KI erstellen und vergrößern
Upscaling mit ChaiNNer – kostenfreie Gigapixel-Alternative
Midjourney – KI-Bildgenerierung für Einsteiger
Jana arbeitet seit 2006 im Bereich Content Management und wurde von Midjourney so richtig für KI-Tool angefixed. Als Hobby-Illustratorin, die sowohl mit digitalen als auch mit traditionellen Medien arbeitet, sieht sie die Deeplearning-Algorithmen als wunderschöne neue Spielzeugkiste.
- Janahttps://www.ki-journey.de/author/admin/
- Janahttps://www.ki-journey.de/author/admin/
- Janahttps://www.ki-journey.de/author/admin/
- Janahttps://www.ki-journey.de/author/admin/