Ein aktueller Trend im KI-Bereich sind neben den Chatbots wohl gerade die text-to-image-Konverter. Man gibt also nur eine englische Beschreibung eines Bildes ein, das man haben möchte, und die KI erstellt das Wunschbild automatisch. Soweit ich es verstehe, sind diese Bilder dann quasi rechtefrei, da es keinen menschlichen Künstler gibt. Oder ist dem nicht so und die Bildrechte liegen dann beim KI-Anbieter?

Diese Woche hatte ich mal etwas Zeit und habe es ausprobiert, und zwar u.A. mit diesem Programm hier:

https://huggingface.co/spaces/stabilityai/stable-diffusion

Das mag bei Landschaften und Objekten funktionieren, aber bei realistischen Charakteren tritt doch sehr deutlich der „uncanny valley“-Effekt auf. Gerade im Bezug auf Anatomie, Proportionen und Perspektiven scheint es noch hakeln. Ich hatte mich daher auf den Bereich comic-artiger Zeichnungen verlagert.

Natürlich habe ich ihm auch mal Charakterbeschreibungen aus den Selene-Romanen gegeben, um zu sehen, was der Software dazu einfällt. Im Prinzip könnte man diese Bilder für eine illustrierte Edition der Bücher benutzen. Auch hier sind die Resultate aber meist eher seltsam. Vor allem scheint es mir so, als könnte man das selbe Bild dann nicht mehr wiederholen oder modifizieren. Man bekommt bei jedem Versuch ein neues Resultat, kann aber z.B. nicht festlegen „Nimm das selbe Bild noch mal und korrigiere den Glitch“ oder „Nimm das selbe Bild noch mal und ändere die Mimik“ etc. Oder geht das bei anderen Anbietern?

Ich hatte es zuerst mit Rick versucht, den ich mir immer als blonden Jungen mit kurzen Haaren vorstelle, der aber trotzdem eine etwas „geekige“ Ausstrahlung haben sollte. Damit kam die KI nicht recht klar, und hat mir fast immer den selben generischen Blondling präsentiert. Hier trotzdem mal ein Ergebnis im akzeptablen Bereich, aber doch recht austauschbar (den „amputierten“ rechten Arm übersehen wir auch mal):

Im Bezug auf Seli wurde es noch schwieriger, denn eine Kombination von „geeky“ und „mysterious“ erschien der Software wohl paradox. Es waren auch viele Resultate mit deutlichen glitches dabei. Hier dennoch mal zwei Resultate:

Das fällt eindeutig eher in das gruselige Spektrum, aber auf eine abstrakte Art und Weise hat es einige Facetten des Charakters sogar getroffen.

Das hier ist deutlich besser und ich könnte es mir sogar auf einem minimalistischen Buchcover vorstellen (Buchtitel dann links). Auch hier sind aber verschiedene Fehler zu erkennen, speziell die zu unterschiedlichen Augen. Generell fehlt es diesen Bildern gefühlt aber einfach an Ausstrahlung.

Falls jemand der Blogleser mal zuviel Zeit und Laune hat (und eventuell eine fähigere Software kennt) würde ich mich über Bilder von Charakteren, Orten, Szenarien und Objekten aus den Selene-Büchern aber freuen. Gerne per Email, vielleicht überrascht es mich ja.

Für das offizielle Cover von Band 4 werde ich mich trotzdem wieder an Coverdesignerin Nadine wenden, sofern sie nach Fertigstellung des Buches in 20 Jahren noch aktiv ist. Jupp. Es geht leider kaum was voran und nach einem Jahr habe ich nur 11 magere DIN-A4-Seiten. Was ich neulich noch ergänzt habe, sind zwei einleitende Zitate, die eventuell Anregungen zum Verlauf der Geschichte geben können. Hier erneut alle fertigen Seiten:

http://www.bruchbach.de/band4.pdf

Was ich mir noch überlegt habe: die Kapiteltitel könnten alle auf Bücher aus dem eher esoterischen Spektrum verweisen. Kapitel 1 heißt ja „Passport to Magonia“ und für Kapitel 2 hatte ich mir den Titel „Chariots of the Gods“ überlegt. Außerdem sollte sich Kapitel 2 doch mit der großen kosmischen Frage befassen, die subtil vielleicht schon am Ende von Band 3 angeklungen ist: wozu braucht Gott ein Raumschiff.

Ich habe also durchaus so einige Ideen, aber bisher kommt kein „flow“ zustande. Vermutlich kam der stetige Inspirations- und Informationsstrom, den ich bei den ersten drei Bänden hatte, doch aus höherdimensionalen Sphären.

Werbung

Ein Gedanke zu “Neumodische KI-Bilder

  1. Danke für den Link. Hatte bereits ein paar KI-Generatoren ausprobiert, deren Ergebnisse mich aber nicht ganz übezeugt haben. Hugging Face trifft’s aber schon ganz gut.

    Like

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit deinem WordPress.com-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s