Die Sprache des Kontexts
Im Gegensatz zur menschlichen Kommunikation, die eine Vielzahl von Nuancen und Feinheiten beinhaltet, verstehen die heutigen Roboter nur das Wörtliche. Während sie durch Wiederholung lernen können, geht es bei Maschinen in der Sprache um direkte Befehle, und sie sind ziemlich unfähig, wenn es um komplexe Anfragen geht. Selbst die scheinbar geringfügigen Unterschiede zwischen „hebe den roten Apfel auf“ und „hebe ihn auf“ können für einen Roboter zu viel sein, als dass er sie entschlüsseln könnte.
Das wollen Forscher vom MIT’s Computer Science and Artificial Intelligence Laboratory (CSAIL) ändern. Sie denken, dass sie den Robotern helfen können, diese komplexen Anforderungen zu verarbeiten, indem sie Maschinensystemen beibringen, den Kontext zu verstehen.
In einem Vortrag, den sie letzte Woche auf der International Joint Conference on Artificial Intelligence (IJCAI) in Australien vorstellten, präsentierte das MIT-Team ComText – kurz für „commands in context“ – ein Alexa-ähnliches System, das einem Roboter dabei hilft, Befehle zu verstehen, die kontextabhängiges Wissen über Objekte in seiner Umgebung beinhalten.
Im Wesentlichen ermöglicht ComText einem Roboter, seine unmittelbare Umgebung zu visualisieren und zu verstehen, indem er aus dieser Umgebung eine sogenannte „episodische Erinnerung“ entwickelt, die mehr „persönliche“ als semantische Erinnerungen sind, die im Allgemeinen nur Fakten sind und Informationen über Größe, Form, Position und Position eines Objekts enthalten können, selbst wenn es jemandem gehört.
Als sie ComText auf einem zweiarmigen humanoiden Roboter namens Baxter testeten, stellten die Forscher fest, dass der Bot 90 Prozent der komplexen Befehle korrekt ausführen konnte.
Der Hauptbeitrag ist diese Idee, dass Roboter verschiedene Arten von Speicher haben sollten, genau wie Menschen „, erklärte der leitende Forscher Andrei Barbu in einer Pressemitteilung. „Wir haben die erste mathematische Formulierung, die sich mit diesem Thema befasst, und wir erforschen, wie diese beiden Arten von Gedächtnis miteinander spielen und arbeiten.“
Bessere Kommunikation, bessere Roboter
Natürlich hat ComText noch viel Raum für Verbesserungen, aber letztendlich könnte ComText dazu genutzt werden, die Kommunikationslücke zwischen Mensch und Maschine zu verringern.
„Dort, wo Menschen die Welt als eine Sammlung von Objekten und Menschen und abstrakten Konzepten verstehen, betrachten sie Maschinen als Pixel, Punktwolken und 3D-Karten, die aus Sensoren generiert werden „, so Rohan Paul, einer der Hauptautoren der Studie.
Letztendlich könnte ein System wie ComText es uns ermöglichen, Roboter zu lehren, schnell auf die Absicht einer Handlung zu schließen oder mehrstufige Anweisungen zu befolgen.
Angesichts der Tatsache, dass so viele verschiedene Industriezweige die Vorteile autonomer Technologien und künstlich intelligenter (KI) Systeme nutzen werden, könnten die Auswirkungen davon weit verbreitet sein. Alles, von selbstfahrenden Autos bis hin zu den KI‘ s, die im Gesundheitswesen eingesetzt werden, könnte von einer verbesserten Interaktionsfähigkeit mit der Welt und den Menschen um sie herum profitieren.