Google-Roboter hebt einen Schwamm auf
© Google and Everyday Robots
Auf dem symbolischen Bild zum Thema „Was ist Mixed Reality“ steht ein Mann mit Mixed-Reality-Brille in einem leeren Raum und interagiert mit einem digital eingeblendeten Schreibtisch samt Monitor, Stuhl und Kaffeetasse. Die Szene zeigt beispielhaft, wie virtuelle Objekte nahtlos in die reale Umgebung projiziert werden und veranschaulicht das Potenzial von Mixed Reality im Arbeitsalltag.
Das Wort "Wi-Fi" und das Symbol für WLAN sind auf einem Handy abgebildet, das jemand hochhält.

Neuer Google-Roboter mit Machine Learning versteht Dich ohne Befehle

Ein langer Tag liegt hin­ter Dir und Du sagst: „Ein küh­les Getränk wäre klasse.“ Oft­mals ver­ste­hen nicht ein­mal Deine Mit­men­schen den Wink mit dem Zaunpfahl. Auch virtuelle Assis­ten­ztech­nolo­gien mit Sprach­s­teuerung deck­en Deine physis­chen Bedürfnisse nicht. Eine Inno­va­tion soll genau diese Lücke füllen: Der Google-Robot­er mit dem „Path­ways Lan­guage Mod­ell“, kurz PaLM-Say­Can. Auf Basis von Machine Learn­ing kann er Deine sprach­lichen Aus­sagen zu einem logis­chen Ganzen zusam­men­fü­gen und daraufhin handeln.

Robot­er­sys­teme haben in den ver­gan­genen Jahren mith­il­fe von kün­stlich­er Intel­li­genz (KI) und Machine Learn­ing eine gewaltige Entwick­lung durch­laufen. Wenn es darum geht, Zusam­men­hänge zu erken­nen und eigen­ständig Lösun­gen für Deine Prob­leme zu find­en, hakt es aber oft­mals noch. Robot­er haben damit zu kämpfen, Deine indi­rek­ten Auf­forderun­gen zu ver­ste­hen und darüber „nachzu­denken“, welch­es Ziel Du wohl mit Dein­er Aus­sage ver­fol­gst. Im Rah­men des Pro­jek­tes PaLM-Say­Can soll ein neuer Google-Robot­er mit KI-Sprach­mod­ell Abhil­fe schaf­fen – und Machine Learn­ing auf ein ganz neues Lev­el heben.

Bitte akzeptieren Sie die Nutzung von Drittanbieter-Einbindungen mit einem Klick auf den folgenden Button:

So komplex ist Dein Handeln

Stell Dir vor, Du möcht­est durch eine Tür gehen. Rechnest Du dabei mit ein­er Kol­li­sion? Ver­mut­lich nicht. Aber warum ist das so? Ganz ein­fach: Durch Deine Lebenser­fahrung und Dein angeeignetes Kon­tex­twissen weißt Du, dass Du zuerst den Tür­griff nach unten drück­en musst, um sie zu öff­nen. Ein­fach für Dich, kom­plex für den Robot­er: Denn er hat das Ver­ständ­nis nicht von Natur aus, son­dern greift auf das Weltwissen im Inter­net zurück. Dafür benötigt der Robot­er Machine Learn­ing, um von Datenbestän­den passende Muster abzuleiten.

Von genial bis schräg: Die 8 kurios­es­ten Roboter-Kreationen

Präzisere Auswertung Deiner Bedürfnisse dank Natural Language Understanding

Von Input und Ver­ar­beitung bis hin zur Reak­tion: Nat­ur­al Lan­guage Under­stand­ing beschreibt den Prozess, den der Google-Robot­er während Dein­er sprach­lichen Kom­mu­nika­tion mit ihm durch­läuft. Das Sprach­mod­ell PaLM ver­sucht mit genau dieser Tech­nolo­gie, die Inhalte Dein­er Aus­sagen zu inter­pretieren und weitest­ge­hend zu ver­ste­hen. Mith­il­fe von Machine Learn­ing studiert der Robot­er dann automa­tisch Muster und Zusam­men­hänge aus vorhan­de­nen Dat­en, ohne expliz­it pro­gram­miert zu wer­den. Die Kom­bi­na­tion bei­der Tech­nolo­gien führt zu ein­er steti­gen Verbesserung der Maschine.

Google-Roboter hebt Snack-Tüte auf

Glaub­st Du, dass der Robot­er Dir bei alltäglichen Din­gen helfen kann? — Bild: Google and Every­day Robots

Der Google Robot­er hat die Beson­der­heit, Auf­gaben analysieren und pri­or­isieren zu kön­nen. Das Mod­ell ver­ar­beit­et die sprach­lichen Infor­ma­tio­nen und gener­iert mögliche Schritte sowie Hand­lungsmöglichkeit­en. Wie wahrschein­lich ist es, dass Dein Wun­sch nach einem Snack befriedigt wird, wenn Dir der Robot­er eine Banane bringt? Wenn die Banane vom Sprach­mod­ell am höch­sten eingestuft wird, bekommst Du einen gesun­den Snack statt ein­er Tüte Chips.

Eine natür­liche Kom­mu­nika­tion ste­ht bei der Kom­mu­nika­tion mit Googles PaLM im Vorder­grund. Mit einem lock­eren Spruch kannst Du Dich also über­raschen lassen, welch­es Getränk oder welch­er Snack Dich heute erwartet.

Google-Roboter mit Machine Learning und KI-Sprachmodell: Das steckt dahinter

Das KI-Sprach­mod­ell PaLM wurde erst­mals im April 2022 vorgestellt. Dank fortschrit­tlich­er Auf­fas­sung von Ursache und Wirkung sprach­lich­er Inter­ak­tio­nen wurde das Mod­ell zu einem wesentlichen Bestandteil von Googles KI-Strate­gie. Durch stetige Verbesserung des Google-Robot­ers soll er bald auch kom­plexere Hand­lungsab­fol­gen mit einem hohen Anteil an Logik­leis­tun­gen durch­führen können.

Trotz großer Fortschritte ste­ht das Sprach­mod­ell noch am Anfang. Es wird weit­ere Forschung­sprozesse durch­laufen, um den KI-basierten Google-Robot­er im Umgang mit dem Men­schen ver­trauter zu machen und ihm präzis­ere Hand­lungsabläufe anzu­trainieren. Ziel ist es, einen All­rounder zu erschaf­fen. Der Ein­satz im Haushalt als all­t­agstauglich­er Robot­er wäre schon mal ein Anfang. Bish­er wer­den auf der offiziellen Web­seite von PaLM-Say­Can jedoch nur Demo-Szenar­ien des Google-Robot­ers veröf­fentlicht. Es bleibt also span­nend, wie sich sein Kön­nen im weit­eren Prozess entwickelt.

Nutzt Du bere­its intel­li­gente Tech­nolo­gien, die über die Sprachas­sis­tenz hin­aus­ge­hen? Schreibe es uns gerne in die Kommentare!

Das könnte Dich auch interessieren