Helix: Eine neue KI für Roboter von Figure

Nicht zum ersten Mal beeindruckt Figure.AI, ein Roboter-Startup aus Sunnyvale, mit seinem zweibeinigen und zweihändigen Robotern. Schon ein erstes Video, wo der Roboter Figure 01 mit einem Menschen spricht und Aufgaben für ihn erledigt, zeigte, wohin die Reise geht. War dieser Roboter damals noch mit einem Sprachmodell von OpenAI integriert, demonstriert das Startup nun ein eigenes visions-basiertes Sprach- und Actionmodell namens Helix.

Das folgende, von Figure-CEO Brett Adcock veröffentlichte Video, zeigt gleich zwei Figure Roboter, denen ein paar Objekte vorgelegt werden, die sie noch nie gesehen haben, und die sie entsprechend einsortieren müssen. Zur Auswahl stehen ein Kühlschrank, eine Schublade, ein Tablett und eine Schüssel. Dabei reichen die beiden Roboter einander auch die unterschiedlichen Objekte wie Kekspackungen, Ketchup-Flasche oder einen Apfel.

Besonders auffällig ist auch, wie die beiden Roboter miteinander durch Kopfnicken und einander ansehen scheinbar miteinander fast schon menschlich kommunizieren. Dieses Verhalten kommt nicht von ungefähr. In der Vorstellung der Vision-Language-Action-Modells (VLA-Modell) Helix wird das als eingebaute Designfunktion erwähnt. Hier einige Details:

  • Steuerung des gesamten Oberkörpers: Helix ist die erste VLA, die eine kontinuierliche Steuerung des gesamten humanoiden Oberkörpers mit hoher Geschwindigkeit ermöglicht, einschließlich der Handgelenke, des Oberkörpers, des Kopfes und einzelner Finger.
  • Zusammenarbeit mit mehreren Robotern: Helix ist der erste VLA, der gleichzeitig auf zwei Robotern arbeitet und es ihnen ermöglicht, eine gemeinsame, weitreichende Manipulationsaufgabe mit Objekten zu lösen, die sie noch nie zuvor gesehen haben.
  • Alles aufheben: Mit Helix ausgerüstete Figurenroboter können jetzt praktisch jeden kleinen Haushaltsgegenstand aufheben, darunter Tausende von Gegenständen, denen sie noch nie zuvor begegnet sind, indem sie einfach Aufforderungen in natürlicher Sprache folgen.
  • Ein neuronales Netz: Im Gegensatz zu früheren Ansätzen verwendet Helix einen einzigen Satz neuronaler Netzwerkgewichte, um alle Verhaltensweisen zu erlernen – das Aufnehmen und Ablegen von Gegenständen, die Verwendung von Schubladen und Kühlschränken und die roboterübergreifende Interaktion – ohne aufgabenspezifische Feinabstimmung.
  • Kommerziell nutzbar: Helix ist die erste VLA, die vollständig auf eingebetteten, stromsparenden GPUs läuft und damit sofort für den kommerziellen Einsatz bereit ist.

Wie ein Mensch versteht Helix Sprache, durchschaut Probleme und kann jeden Gegenstand greifen – und das alles ohne Training oder Code. In Tests konnte Helix fast jeden Haushaltsgegenstand greifen.

4 Gedanken zu “Helix: Eine neue KI für Roboter von Figure

Kommentar verfassen