Innovation & Technologie
Microsofts neuer Bot zeichnet auf Bestellung
Wie intelligent ist die Künstliche Intelligenz wirklich? Und wie schlau kann sie werden? Die erste Frage stellt sich die ganze Welt und die zweite wird sogar ständig neu beantwortet. Die jüngste Antwort stammt von Microsoft. Ein Programm, das zeichnen kann und dabei Deine Anweisungen versteht und umsetzt.
Zeichnen ist entweder ganz leicht oder ganz schwer. Es kommt im Prinzip immer darauf an, welchen Anspruch man an das Ergebnis hat. Zumindest, wenn man ein Mensch ist. Für Computer gilt bisher: Zeichnen ist unglaublich kompliziert und es entstehen trotz der vielen verfügbaren Bilder im Internet dabei fast zwangsläufig Fehler. Microsoft hat sich diesem Problem angenommen und einen Bot entwickelt, der das Zeichnen für Dich übernimmt.
Was kann der neue Bot?
Die Zeichensoftware von Microsoft verarbeitet Beschreibungen in Textform und generiert dann Bilder des Beschriebenen. Die Bilder werden dabei nicht etwa aus bestehenden Bildern zusammengesetzt, sondern von Grund auf neu errechnet. Die Daten bezieht der Bot aus einem Fundus an Bildern mit zugehörigen Beschreibungen. Den einzelnen Wörtern der Beschreibung werden bestimmte Bildbereiche zugeordnet. Das Programm erkennt Gemeinsamkeiten der Bereiche verschiedener Bilder, die mit demselben Wort verknüpft sind und versteht so, was mit dem Wort gemeint ist. So sitzen beispielsweise gezeichnete Vögel meist auf Ästen, weil die Mehrzahl der eingespeisten Bilder von Vögeln diese auf Ästen sitzend darstellen.
Was ist das Neue an dem Microsoft-Programm?
Auch andere namhafte Wettbewerber wie Google, Facebook und Nvidia haben sich bereits mit ähnlichen Versuchen beschäftigt, wobei Google die Werke seiner KI sogar ausgestellt hat. Der Unterschied ist, dass der Microsoft-Bot wesentlich besser darin ist, Bilder nach komplexeren Beschreibungen zu zeichnen. Wenn die Anweisung beispielsweise nicht nur lautet, einen „Vogel” zu zeichnen, sondern einen „gelben Vogel mit blauen Flügeln und rotem Schnabel”, kämen die meisten bisherigen Bots an ihre Grenzen. Das Ergebnis wäre dann ein Vogel, der auf irgendeine Art die Farben Gelb, Blau und Rot miteinander vereint und sowohl Flügel als auch einen Schnabel hat. Microsofts Neuentwicklung hingegen ordnet die Farben in den meisten Fällen korrekt zu.
Wie funktioniert es?
Der Bot besteht aus zwei Funktionseinheiten. Die Erste erstellt aus der Textbeschreibung ein Bild. Die Zweite greift ebenfalls auf Textbeschreibungen zu und bewertet das Bild auf seine Authentizität hin. Im Grunde versucht der erste Programmteil, den zweiten Part auszutricksen, indem er ihm ein selbst erstelltes Bild als „echt” verkauft, während Programmteil zwei versucht, sich nicht austricksen zu lassen. Erst wenn Programmteil zwei sein Okay gibt, wird das Ergebnis ausgegeben.
Neue Ideen, alte Fehler
Interessant ist, dass das Programm mitunter „eigene” Kreativität erkennen lässt. Details, die nicht erwähnt wurden, werden von allein ergänzt. Hier liegt der eigentliche Fortschritt in Sachen Künstliche Intelligenz.
Fehlerfrei ist der Bot allerdings noch lange nicht. Immer wieder sind kleine Fehler in den Bildern zu finden, wie etwa falsch gefärbte Details. Auch mit dem Erstellen von Nonsense-Bildern hat das Programm noch so seine Probleme. Als es aufgefordert wurde, einen über einem See schwebenden roten Doppeldeckerbus zu zeichnen, kam ein sehr verwaschenes Bild heraus. Die Darstellung war zwar als über dem See schwebender Bus interpretierbar, aber genauso gut hätte das Bild ein Boot mit zwei Decks zeigen können. Dieses Beispiel zeigt, dass der Bot wahrscheinlich in seiner Datenbank keine Verbindung zwischen den Worten „See” und „Bus“ gefunden hat. Microsofts Produkt ist also weniger als ein fertiges Angebot zu verstehen, sondern mehr als ein weiterer Schritt in der Entwicklung künstlicher Intelligenz.
Große Entwicklung oder viel Lärm um nichts? Schreib uns Deine Meinung in die Kommentare.