Team brainstormt über die Bilderauswahl
© iStock
Ein BMW iX steht vor dem Vodafone-Tower in Düsseldorf.

Ob ein Algorithmus kreativ werden kann? Diese Bildautomatik basiert auf KI

Vielle­icht klingt es nach Spiel­erei, denn wozu braucht es Kreativ­ität bei ein­er kün­stlichen Intel­li­genz (KI)? Tat­säch­lich kön­nte ein kreativ­er Algo­rith­mus aber beim Gener­ieren opti­maler Bilder unter­stützen. So eine Bil­dau­tomatik, die auf KI basiert, haben Wis­senschaftler nun entwick­elt.

Eine auf KI basierende Bil­dau­tomatik kön­nte zukün­ftig vielle­icht in der Wer­bung Anwen­dung find­en. Doch wie sehen ihre Ergeb­nisse genau aus und haben KIs wirk­lich kün­st­lerische Fähigkeit­en, wie sie bis­lang nur von Men­schen bekan­nt sind? Das find­est Du jet­zt her­aus.

Bilder auf Zuruf: Diese KI generiert Bilder anhand der Beschreibung

Am Pro­jekt Retrieve GAN arbeit­en Forsch­er von Google, der Uni­ver­sität Kali­fornien (Merced) und der Yon­sei Uni­ver­si­ty zusam­men, um eine KI zu entwick­eln, die Bilder und Bild­wel­ten ein­fach auf Grund­lage ein­er Beschrei­bung malen kann.

Du wün­schst Dir zum Beispiel ein Bild von zwei Booten im Wass­er, rechts im Bild eine Brücke, im Hin­ter­grund Wolkenkratzer und passend dazu einen bewölk­ten Him­mel? Solche Motive kann die KI von Retrieve GAN bere­its gut umset­zen. Allerd­ings ste­ht kein Robot­er­arm vor ein­er Staffelei und pin­selt fleißig drauf los. Stattdessen läuft die auf KI basierende Bil­dau­tomatik jedes Mal in drei Schrit­ten ab:

  1. Ver­ste­hen der Beschrei­bung
    Nur wenn Retrieve GAN tat­säch­lich weiß, was das neue Bild enthal­ten soll, kann die KI auch mit der Arbeit begin­nen. Aktuell bekommt das Sys­tem dazu einen soge­nan­nten Szenen­graphen, der alle rel­e­van­ten Infos enthält.
  2. Find­en passender Bestandteile
    Als näch­stes sucht die KI nach den passenden Bestandteilen für das Werk. Die Boote nimmt sie aus dem einen Bild, das Wass­er aus einem anderen, dazu find­et sie noch eine passende Brücke, Wolkenkratzer und einen bewölk­ten Him­mel. Schon ist alles beisam­men.
  3. Gener­ierung des Bildes
    Im let­zten Schritt, wenn alle Bil­dauss­chnitte bere­itliegen, set­zt Retrieve GAN alles pass­ge­nau zusam­men. Das Bild ist fer­tig und kann begutachtet wer­den.

Weitere künstliche Intelligenz lernt menschliche Kunst

Bere­its im Jahr 2018 hat eine andere KI den Weg in die Kreativwirtschaft gefun­den, näm­lich als Karika­tur­ist. Die Kun­st des karika­tur­is­tis­chen Zeich­nens beste­ht bekan­ntlich darin, das per­fek­te Gle­ichgewicht aus Abstrak­tion und Real­is­mus zu find­en. Schließlich soll eine Karikatur – so verz­er­rt sie auch sein mag – einen hohen Wieder­erken­nungswert zu ein­er realen Per­son ermöglichen. Dazu verän­dern Kün­stler meist die Pro­por­tio­nen der geze­ich­neten Per­son, acht­en dabei vor allem auf Details und bewahren gle­ichzeit­ig einen ganz indi­vidu­ellen Zeichen­stil.

So gese­hen erfordert eine gelun­gene Karikatur also beson­ders viel men­schlichen Ein­fluss. Entwick­lern von Microsoft und der City Uni­ver­si­ty of Hong Kong ist es gelun­gen, diese beson­dere Aus­druck­skun­st mit ein­er kün­stlichen Intel­li­genz nachzustellen.

Dabei han­delt es sich auch heute noch um eine bemerkenswerte Leis­tung, da für Karika­turen keine klaren Regeln definiert wer­den kön­nen. Daher kom­binierten die Forsch­er riesige Daten­men­gen, die aus tausenden Karika­turen ver­schieden­ster Kün­stler stammten, mit Hil­fe von maschinellem Ler­nen.

GAN: Zwei KIs sind besser als eine

Bei der Durch­führung wandten die Forsch­er bei­der Pro­jek­te soge­nan­nte Gen­er­a­tive Adver­sar­i­al Net­works (GAN) an, was so viel wie erzeu­gende, geg­ner­ische Net­zw­erke bedeutet. Diese stellen in der Infor­matik eine gängige Meth­ode dar, um maschinelles Ler­nen zu ermöglichen. Dabei müssen die KIs zweier Net­zw­erke miteinan­der arbeit­en.

Und so funktioniert’s: Das erste Net­zw­erk erar­beit­et ver­schiedene Lösun­gen, die sich im gewün­scht­en Ergeb­nis­bere­ich befind­en. Während­dessen gle­icht das zweite Net­zw­erk diese Ergeb­nisse mit den gewün­scht­en Resul­tat­en anhand von Vor­la­gen ab und nimmt so lange Kor­rek­turen vor, bis die gewün­scht­en Ergeb­nisse umge­set­zt sind.

KI-Teamarbeit führt zum gewünschten Ergebnis

Dieses Prinzip wurde auch auf das Karikatur-Zeich­nen über­tra­gen: Während die KI des einen Net­zw­erks Porträts bekan­nter Men­schen nur durch die Verän­derun­gen ihrer Pro­por­tio­nen abwan­delte, übertrug die KI des zweit­en Net­zw­erks typ­is­che Zeichen­stile der vorgegebe­nen Karika­turen auf die kün­stlich erstellte Abbil­dung des ersten Net­zw­erks.

Zusam­menge­set­zt ergaben die ange­fer­tigten Ergeb­nisse eine voll­w­er­tige Karikatur, wie sie auch ein men­schlich­er Kün­stler ange­fer­tigt haben kön­nte.

Der Knack­punkt dabei war allerd­ings, dass die bei­den KIs alleine nicht zu diesem Resul­tat gekom­men wären, da jedes Ergeb­nis für sich allein viel zu abstrakt aus­fiel, um den karikierten Per­so­n­en zuge­ord­net wer­den zu kön­nen.

Wie sehen die Ergebnisse der auf KI basierenden Bildautomatiken aus?

Ob Karikatur oder neu gemaltes Bild auf Zuruf: Wenn sich KIs nicht nur kün­stlich, son­dern auch kün­st­lerisch betäti­gen, dann sind die Ergeb­nisse natür­lich das Span­nend­ste.

Um die Karika­turen der KI der Entwick­ler von Microsoft und der City Uni­ver­si­ty of Hong Kong bestaunen zu kön­nen, brauchst Du bloß einen Blick in ihre Forschungsar­beit zu wer­fen. Dort kannst Du näm­lich gle­ich zu Anfang schon sehen, wie die Karika­turen ent­standen sind – vom ursprünglichen Foto bis zur fer­ti­gen KI-gener­ierten Karikatur.

Noch mehr zusam­menge­set­zte Bilder, die Retrieve GAN bish­er gener­iert hat, find­est Du in der Veröf­fentlichung der Forsch­er. Du kannst anhand von zahlre­ichen Beispie­len nachvol­lziehen, wie die auf KI basierende Bil­dau­tomatik arbeit­et und zu ihren Ergeb­nis­sen kommt. Die sind zwar aktuell noch nicht für den pro­fes­sionellen Ein­satz tauglich, aber ein wichtiges Zwis­chen­ziel haben die Wis­senschaftler damit schon erre­icht. Denn die KI kann den Zusam­men­hang zwis­chen den einzel­nen Bildbe­standteilen erken­nen und sucht deshalb wesentlich clev­er­er nach passenden Auss­chnit­ten.

Die Forschung auf diesem Gebi­et soll selb­stver­ständlich weit­erge­hen, sodass auf KI basierende Bil­dau­tomatiken in Zukun­ft noch viel intel­li­gen­ter arbeit­en und pro­fes­sionelle Ergeb­nisse liefern dürften.

Kün­stliche Intel­li­gen­zen als kreative Kün­stler – kommt die Mas­chine an den Men­schen ran? Wie lautet Deine Mei­n­ung zu diesem The­ma? Lass es uns in den Kom­mentaren wis­sen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Das könnte Dich auch interessieren