bvklogo_white
Worte zu Bildern machen


Worte: Filmteam bei Dreharbeiten eines Krimis mit großer Kamera auf Dolly in der Nacht auf der Strasse und hellen LED Scheinwerfern
Foto: © Stable Diffusion / HA Lusznat

Während die Bildbeschreibung schon seit vielen Jahrzehnten zum beliebten Rapportier, der gymnasialen Bildung gehört und visuelle Darstellung in Wörter fasst, ist der umgekehrte Weg bisher nur wenigen talentierten Malern vorbehalten geblieben. Sie konnten nach verbalen Vorgaben Bilder kreieren. Jetzt gibt es KI gestützte Computer Programme, die aus Wörtern Bilder machen können. Sie basieren auf einen großen Datensatz aus Bildern und deren Beschreibung und suchen nicht aus einer Sammlung Bilder aus, die am besten zur Beschreibung passen, sondern generieren diese neu, indem sie vereinfacht besprochen aus einer nebulösen Vorstellung kommend Bilder auf Grund ihres Erfahrungsschatzes konkretisieren.

Man kann Bilder mit künstlichem Rauschen überlagern, ein Verfahren, was verwendet wird, um digitale Bilder mit einer Textur zu versehen und ihnen die technische Schärfe und Konkretheit zu nehmen. Solche Verfahren werden in hunderten von Ebenen auf Bilder angewandt und am Ende kehrt man den Prozess um und ent-rauscht das Ergebnis Schicht für Schicht um zu neuen konkreten Ergebnissen zu kommen. Dieser Prozess kann auch bei gleicher verbaler Eingabe jedes Mal anders verlaufen und zu völlig anderen Ergebnissen führen. Aber jedes Ergebnis beinhaltet den genauen nachvollziehbaren Pfad seiner Entstehung.


Prof. Björn Ommer, LMU beim 3. KI Symposium in der HFF München
Foto: © HA Lusznat

Sehr viel Aufmerksamkeit erhielt LMU Professor für Machine Vision & Learning, Dr. Björn Ommer, für das Programm „Stable Diffusion“, das für alle Nutzer frei zugänglich ist und zur Demokratisierung der Bild Generierung schon erheblich beigetragen hat. Er sprach über seine Erfahrung beim 3. Münchner KI-Symposium von FKTG und HFF in den Räumen der Hochschule in München. Initiiert wurde die Veranstaltung von der KI Abteilung der Hochschule unter Leitung von Prof. Dr. Sylvia Rothe.


HFF Prof. Dr. Sylvia Rothe
Foto: © HA Lusznat

KI ist schon jetzt im Arbeitsbereich der Kameraleute angekommen, sei es als Gesichts- und Objekterkennungsprogramm in automatisierten Kameras oder als Verwaltungs- und Entscheidungshilfe in der Nachbearbeitung. Mit der Bildgenerierung ist jetzt das nächste Level erreicht und vielleicht ist es eine gute Idee für DoPs, Sprachkurse zu belegen, damit sie ihre Bildvorstellungen genauer formulieren können, um den Text-zu-Bild Systemen entsprechende Ergebnisse zu entlocken, denn das Ganze funktioniert nicht nur mit Standbildern, sonder schon in ersten Versuchen auch mit Bewegtbild.


Berufsverband Kinematographie
Foto: © Stable Diffusion

Schon vor vielen Jahren hat ein älterer Kollege einen Zusammenhang zwischen der Berühmtheit eines Kameramannes und der Anzahl seiner Bilder im Internet ausmachen können, wobei die Wirkungsweise doppelseitig sein kann. Man ist berühmt und deshalb gibt es viele Bilder, oder man ist berühmt, weil es viele Bilder gibt. Letztere Erkenntnis gibt all denen recht, die hemmungslos Bilder ihrer selbst in die Welt posten. Stable Diffusion könnte jetzt ein Messprogramm sein, wie berühmt eine Person wirklich ist. Gibt man den Namen ein, dann wird auf Basis von Millionen Bildern destilliert. Ist im Ergebnis halbwegs die gesuchte Person erkennbar, dann ist schon ein wirklicher Grad von Berühmtheit erreicht.


Michael Ballhaus Kameramann
Foto: © Stable Diffusion


Hans Albrecht Lusznat Kameramann
Foto: © Stable Diffusion

Alle Bildunterschriften entsprechen der Worteingabe in Stable Diffusion

Kategorie

Weitere Blogeinträge