Wie KI Regenbogen kackt

Halt! Du! Nicht wegklicken! Ich weiß, die Überschrift ist bedenklich, doch ich verspreche dir, es steckt einiges dahinter, und ich werde es dir erläutern. Also, zuerst mal sieh dir das Titelbild an. Gefällt dir meine Kunstwerk? Ich habe als Anregung den Vitruvianischen Mann von Leonardo da Vinci genommen, und ihn zeitgemäß als Roboter gestaltet. Nicht nur, dass ich habe auch einen Regenbogen reingeklackst.

Ich finde dieses Werk cool. Und geschaffen hat es nicht mein menschlicher Geist in einem warmen Körper, sondern tausende von Prozessoren in einer kalten Maschine. Die von OpenAI entwickelte künstliche Intelligenz namens DALL-E erlaubt mit ein paar Stichworten die Schaffung eines Kunstwerkes. Hier verwendete ich einfach die Wortkombination “vitruvian man robot in style of leonardo da vinci” und schon erhielt ich vier Ergebnisse.

Ein neuerlicher Versuch mit der Hinzufügung des Wortes “rainbow” brachte diese Ergebnisse:

Und mit ein bisschen Bearbeitung mit dem DALL-E Werkzeug kam ich zu diesem Titelbild:

Die Möglichkeiten sind faszinierend und fast grenzenlos. Auch Nicht-Künstler können damit rasch halbwegs interessante und einzigartige Illustrationen schaffen. So wie hier mit den Stichworten “mad race dog driving Teslas in style of Pieter Bruegel“. Den Tesla erkennt man zwar nicht, aber wer wird denn so kleinlich sein?

Wir erreichen einen Punkt, wo sich künstliche Intelligenz von einem Werkzeug, das im Hintergrund von Anwendungen läuft und uns Einkaufsvorschläge macht oder Werbung serviert zu einer, die aktiv im Vordergrund sichtbar und verwendet werden kann.

Generative KI, wie sie DALL-E verwendet, schöpft aus einer Datenbank von Gemälden und erlaubt mittels einfacher Texteingabe die Schaffung neuer Kunst im Stile und in Inspiration von vorhandener Kunst.

Generative KI beschränkt sich dabei nicht nur auf Gemälde. Auch Videos und Audio können damit generiert werden. Meta, die Mutterfirma von Facebook, stellte gerade erst Make-A-Video vor, mit dem aus Text oder einfachen Fotos mehrere Sekunden lange Videos erstellt werden.

Und gerade erst machte ein fiktives Interview zwischen dem Podcaster Joe Rogan und dem vor einem Jahrzehnt verstorbenen Apple-Gründer Steve Jobs die Runde. Gefüttert mit hunderten Stunden an Audioclips der beiden konnte die KI eine eigene Version eines nie stattgefundenen Podcasts generieren.

All diese Beispiele für mich zurück zum Titel dieser Beitrags, denn wir sehen hier potenziell eine kreative Explosion. Jeder kann mit nur ein paar Worten Kunst schaffen, egal ob man weiß, wie man einen Pinsel schwingt, eine Kamera hält, oder eher zwei linke Hände hat. Und das hat der CEO von Stability AI, Emad Mostaque, anlässlich des Abschlusses der ersten Investmentrunde in sein Unternehmen durch Google und anderen Firmen in der Größe von gewaltigen 101 Millionen Dollar, folgendermaßen zusammengefasst:

Ein Großteil der Welt ist kreativ verstopft, und wir werden dafür sorgen, dass sie Regenbögen kacken können.

Emad Mostaque, CEO of Stability AI

Für KI scheint es momentan keine Grenzen zu geben. Fast jeden Tag hören wir von neuen Anwendungsgebieten, in denen verschiedenste Formen der KI zum Einsatz kommen. Sie erstellt fotorealistische Porträts von nicht-existierenden Menschen, schreibt Artikel für Zeitungen, oder fährt Autos und der realen Welt. Und da bin ich nun schon zum wiederholten Male in einem fahrerlosen Robotaxi in San Francisco unterwegs gewesen oder habe auf einem Tesla Model 3 die FSD Beta verwendet.

Wie hier in diesem Video, wo uns auch etwas Ungewöhnliches vor das Auto gelaufen ist: zwei auf nächtlicher Jagd befindliche Kojoten. Wenigstens haben sie uns nicht vors Auto gekackt.

Kommentar verfassen