Kung-Fu-Roboter! Beeindruckend, aber eigentlich nur Blendwerk

Das Neue Jahr hat gerade begonnen – für uns schon früher, für China erst gestern – und 2025 sieht bereits uralt aus. Zumindest was die Fortschritte bei humanoiden Robotern betrifft. Für die chinesische Neujahrsshow wurden nicht zum ersten Mal wieder Roboter in die Tanz- und Kung-Fu-Choreographie integriert.

Zu sehen waren eine Handvoll G1-Roboter des in Hangzhou beheimateten Roboterherstellers Unitree, die äußerst beliebt bei Forschern sind und in vielen beeindruckenden Videos ihre Bewegungsfähigkeiten zeigen. Hier ist der etwa vierminütige Auftritt der G1-Roboter beim Lunar New Year Festival:

Wirklich beeindruckend sind die flüssigen Bewegungen der Roboter, die Balancefähigkeiten, selbst wenn die menschlichen Tänzer sie unabsichtlich aus dem Gleichgewicht bringen. Auch andere Hersteller wollen da nicht zurückstehen, wie beispielsweise Agibot aus Shanghai.

Der Fortschritt innerhalb eines Jahres, von 2025 auf 2026, ist dabei nicht zu übersehen. Wirkten die Unitree G1-Roboter auf dem cinesischen Neujahrsfestival 2025 noch eher zackig und ungelenk, war die 2026-Vorstellung definitiv ein großer Schritt in den Bewegungsfähigkeiten vorwärts.

Das sehen wir auch beim Gehen und Laufen. Die Gegenüberstellung wie der Tesla Optimus und der Figure.AI Roboter, wie auch die Teilnehmer beim DARPA Robotics Challenge 2012, über die Jahre zeigen, demonstriert wie weit die Industrie gekommen ist.

Ich erspare uns jetzt noch mehr Videos, denn wir glauben es gerne, dass hier große Fortschritte stattfinden. Doch sind es die richtigen? Geht es uns vor allem um laufende, tanzende und Kung-Fu kämpfende Roboter, wegen denen Investoren Milliarden Euro in die Entwicklung von Humanoiden stecken? Natürlich nicht.

Figure.AI CEO Brett Adcock forderte die Roboterhersteller dazu in einem – übrigens recht sehenswerten – Podcast auf, nicht nur „Loops“ zu zeigen. Ein Roboter, der einen Salto macht, ein paar Kung-Fu-Sprünge und Ähnliches zeigt, arbeitet nur vorprogrammierte Routinen ab. So toll das aussieht, und so sehr es die Stabilität und Balance von Roboter vorwärts bringt, so weit schießt es am eigentlich Ziel vorbei – außer, man will Roboter nur für solche Auftritte entwickeln.

Das eigentliche Entwicklungsziel sollten humanoide Roboter sein, die Menschen gefährliche, monotone und gesundheitsgefährdende Arbeiten abnehmen können. Coole Tanzroutinen und Shaolin-Figuren auf der Bühne zählen wohl nicht dazu.

Doch da ist es recht dünn, was die Videos dazu betrifft. Nicht, dass es keine gäbe, doch wirft ein schneller Blick mehr Fragen auf, als er beantwortet. Zuerst kommt die Frage, ob es sich hier um einen fernbedienten oder autonom agierenden Roboter handelt. Mit „fernbedient“ ist dabei gemeint, ob der Roboter von einem Menschen mittels einer Fernsteuerung bedient wird und die Aufgaben ausführt.

Nicht dass das per se schlecht ist. Mittels Fernbedienung werden humanoide Roboter heute trainiert und auch Trainingsvideo für die Maschinenlernsysteme erzeugt. So hat NEURA Robotics aus Deutschland ein eigenes Gym, also Trainingszentrum, für seine Roboter eingerichtet.

Auch Fourier Intelligence aus Shanghai bot einen Blick hinter die Kulissen, wie der GR-3-Roboter trainiert wird. Vor einzelnen Robotern sitzen menschliche Trainer, die die Bewegungen ausführen, um eine Aufgabe zu erledigen.

Für manche Aufgaben wird es auch in Zukunft Sinn machen, menschliche Teleoperatoren hinzuziehen, wie beispielsweise bei Rettungsmissionen, oder Forschungsmissionen in unzugänglichen Teilen der Erde, sei es unter Wasser, in Höhlen, oder im Orbit.

Doch das hat Brett Adcock damit nicht gemeint. Er fordert die anderen Hersteller auf, nicht nur einfach eine Routine („Loop“) oder einen fernbedienten Roboter zu zeigen, sondern ein Video, das einen autonomen Roboter eine komplexe Aufgabe – und aktuell scheint jede Haushaltsaufgabe für humanoide Roboter komplex zu sein – von Anfang bis zum Ende machen lässt und in einer ungeschnittenen Fassung veröffentlicht wird.

Nicht gemeint ist dabei folgendes Video, das den NEURA Robotics 4NE-1 zeigt. Man beachte, dass die interessanten Stellen nicht sichtbar sind, wie das Schneiden der Gurken und Schlichten der Gurkenscheiben auf einen Teller.

Ein Video von Figure.AI, das die Fähigkeiten des VLA Modell Helix 02 demonstriert, kann als Messlatte für alle anderen Videodemonstrationen von Humanoiden dienen. Im Video sehen wir ungeschnitten in drei Minuten, wie der Figure 03 einen Geschirrspüler öffnet, die Teller und Becher herausnimmt, sie stapelt und in Regale und Laden hineinstellt, danach Teller und Becher aus der Spüle nimmt, damit den leeren Geschirrspüler füllt und eine Spültablette einlegt, ihn einschaltet und schließt.

Keine Fernsteuerung, ungeschnitten, mit Bewegung des ganzen Roboters durch die Küche, und komplexen Aufgaben vom Öffnen, Ausräumen, Stapeln, Einschlichten, Regaltüren und Schubladen öffnen und schließen, Einräumen, Einlegen, Einschalten bis hin zum Schließen.

So beeindruckend die Kung-Fu- und Tanzroutinen sind, sie sind nichts anderes als eine Augenauswischerei. Sie beeindrucken die Laien, sie lassen Investoren die Brieftasche locker sitzen, aber sie werden Unternehmer enttäuschen, die sich von den Humanoiden echte Arbeitsleistung erwarten.

Diese Videos beweisen vor allem eines: die Roboterhardware ist – stark vereinfacht ausgedrückt – gemeistert. Völlig offen sind die VLA- und Betriebssysteme, die die Roboterhardware steuern werden. Die wahren Fähigkeiten bei humanoiden Robotern werden darin liegen, wie sie autonom Aufgaben ausführen können. Die herausforderungen liegen dabei bei den Fortschritten der von den Roboterherstellern verwendeten VLA-Modelle, das Objekte erkennen, die Roboterhände sie manipulieren, und eine Aufgabe zufriedenstellend erledigen kann.

Wie auch immer: Happy Lunar New Year!

2 Gedanken zu “Kung-Fu-Roboter! Beeindruckend, aber eigentlich nur Blendwerk

  1. Lieber Mario,
    Danke für Deinen wie immer richtig guten Beitrag.
    Nicht immer der rein fachliche Bericht verhilft zum Durchbruch, da er sachlich ist und das reine Fachpublikum anspricht aber den deutlich größeren Rest nicht. Der wird aber gebraucht.
    Es gilt die Brücke zu bauen zwischen der fachlichen Welt und anderen Welt.
    Heute müssen wir aufgrund der ZEIT von beiden Seiten die Brücke bauen. Hierzu sind solche Videos wichtig. Bitte verstehe mich richtig: eine fundierte Technologie ist die Basis, ohne diese geht nichts.
    Heute können wir uns aufgrund der enormen Geschwindigkeit in der technologischen Entwicklung es nicht erlauben, die Brücke nur von einer Seite zu bauen. Kommunikation ist hier ebenso essenziell wie der richtige Einsatz von Simulation und KI.
    Beste Grüße
    Egon

Kommentar verfassen