Der nächste Schritt in Sachen KI? Objektidentifikation
Die Vorstellung von künstlicher Intelligenz beflügelt bereits seit langer Zeit die Fantasie der Menschen. Nicht nur Science-Fiction-Autoren sondern auch Wissenschaftler der Informatik und angrenzender Felder beschäftigen sich damit und versuchen, die Vorstellung real zu machen.
Hürden für Künstliche Intelligenzen
Eine Schwierigkeit dabei ist, dass es schwerfällt, den Begriff „Intelligenz“ umfassend zu definieren. Wer schon einmal versucht hat, seinen IQ herauszufinden, stößt darauf, dass es verschiedene Arten von Intelligenz gibt: mathematische, sprachliche, emotionale, kreative usw. Eine künstliche Intelligenz müsste also ebenfalls in der Lage sein, diese verschiedenen Arten zu beherrschen, allerdings stößt sie dabei aktuell noch an ihre Grenzen. Bisher ist künstliche Intelligenz nämlich sehr stark auf das begrenzt was sie „kennt“. Eine wichtige Aufgabe der Wissenschaftler ist es also, ihr „beizubringen“ sich neues Wissen anzueignen oder „kreativ“ mit vorhandenem umzugehen.
Woran Systeme künstlicher Intelligenz bisher scheiteten, war Objektidentifikation. Kannte ein solches System zum Beispiel das Bild einer Tasse, konnte es dieses Objekt nur aus genau dem Blickwinkel erkennen, den das Foto zeigte. Stand die Tasse zum Beispiel auf dem Kopf, war etwas geneigt oder hatte eine andere Farbe bzw. Form, erkannte die Künstliche Intelligenz sie nicht mehr als Tasse.
Wissenschaftlern des Massachusetts Institute of Technology (MIT) ist nun ein großer Schritt zur Verbesserung dieser Fähigkeiten gelungen: Mit einem Computer-Vision-System namens „DON“, für „Dense Object Nets“, lernt eine Künstliche Intelligenz Objekte selbstständig zu erkennen. Dafür legen die Forscher das betreffende Objekt auf eine Platte und das System schaut es sich mithilfe eines beweglichen Roboterarms aus allen möglichen Blickwinkeln an. Ähnlich dazu, wenn wir etwas in die Hand nehmen und es von allen Seiten betrachten. Wenn ein Gegenstand auf diese Weise erfasst wurde, kann das System ihn auch dann erkennen, wenn es ihn in einer bisher unbekannten Perspektive, Form oder Farbe sieht. Außerdem kann es, basierend auf seinem Wissen über das Objekt, abstrahieren: Hat das System zum Beispiel 6 verschiedene Tassen unterschiedlicher Größe, Form und Farbe gescannt, lernt es zu abstrahieren welche Eigenschaften eine Tasse ausmachen und kann sie in all ihren Varianten erkennen.
Außerdem ist die Künstliche Intelligenz in der Lage, bestimmte Teile des Objekts zu identifizieren. Markieren Forscher auf einem Bild den Henkel der Tasse, findet der Roboterarm die Stelle, an der sich der Henkel befindet und greift diesen. Dabei ist vollkommen egal, aus welcher Perspektive der Arm die Tasse sieht.
Anwendung in der Praxis
Das klingt alles schön und gut, aber wo ist der praktische Nutzen dabei? Künstliche Intelligenz findet zunehmend bei Fabrikrobotern Einsatz. Laufen gefertigte Teile auf einem Laufband an ihnen vorbei, sind die in der Regel auf alle möglichen Arten durcheinandergeworfen und verdreht. Da ist es ungünstig, wenn der Roboter nicht erkennt, womit er es zu tun hat oder wie er das Objekt greifen soll. Außerdem bietet die neue Technologie großen Nutzen für den Bereich Augmented Reality. So können Apps oder Brillen, die damit funktionieren, Objekte künftig im Raum erkennen. Möchte sich jemand per Augmented Reality eine neue Küche zusammenbauen, erkennt zum Beispiel die AR-App eines Möbelhauses künftig, bei welchen Gegenständen es sich um Herd, Waschbecken und Co. handelt und kann die neuen Möbel an den gleichen Stellen platzieren.
Schreiben Sie einen Kommentar