Megőrzik az irányítást és az egyensúlyt, de nem térnek el programozásuktól. A Galbot által fejlesztett technológia az, amit a robotikusok látás-nyelv-cselekvés modellnek (VLA) neveznek. Ennek célja, hogy a gépek képesek legyenek az ismeretlen és változó környezetekben működni, hasonlóan az emberekhez. Jelenleg a Galbot robotjai még nem tudják megbízhatóan elvégezni az emberek számára egyszerű feladatokat, például az edények mosogatását. Azonban Wang alapító a kínai médiának azt mondta, hogy célja, hogy három éven belül 10 000 robot végezzen alapvető kiskereskedelmi és gyári munkát. (Néhány AI úttörő, mint Yann LeCun, nagyon szkeptikus, hogy a jelenlegi mélytanulási megközelítés elérheti a Galbothoz hasonló cégek által remélt eredményeket.)
Chen látogatásának célja az volt, hogy megvizsgálja, hogyan lehetne a Galbot robotjait egy elektromos járműgyárban – a világ egyik legbonyolultabb gyártási környezetében – használni. Ennek eléréséhez a robotokat rengeteg gyári forgatókönyv alapján kell betanítani, de erre nincs kész adatbázis. Ahhoz, hogy a Galbotnak egyáltalán esélye legyen robotokat telepíteni egy ilyen környezetben, egy olyan szakemberre van szükségük, aki évtizedek bonyolult gyártási tapasztalatával rendelkezik. Ennek a személynek kell meghatároznia a humanoid robot számára a megfelelő feladatokat, meg kell adnia a tanuláshoz szükséges adatokat, sőt, ki kell egyenlítenie azt, amit a robot még nem tud megtenni. Ez az a szakértelem, amit Chen kínál.
Egy liftel felmentünk egy torony tetejére, és beléptünk egy tárgyalóterembe, amely a Pekingi Egyetem buja zöld campusára nézett. Hamarosan megérkezett egy idősebb Galbot mérnök, és elkezdte Chennek ismertetni a cég legújabb fejleményeit. Elmagyarázta, hogy a Galbot robotokat nemrég telepítették 10 pekingi gyógyszertárban, ahol 24 órán át osztanak ki gyógyszereket. Nvidia chipek hajtják őket, minden robot költsége körülbelül 700 000 jüan (76 000 font). Egy ponton a mérnök megállt egy diánál, amely részletesen bemutatta a Galbot humanoidjai mögött álló technológiát.
A mérnök megjegyezte, hogy a mélytanulás felemelkedése előtt a Chenhez hasonló ipari robotikusok manuálisan képezték a gépeket. A programozók explicit utasításokat írtak minden egyes mozdulathoz. Amikor valami elromlott, debugolták a kódot, és új sorokat adtak hozzá az új helyzetek kezelésére. A mélytanulás ígérete, hogy ezt a kézzel írt kódot a rugalmasabb VLA modell váltja fel. Az ilyen modellek létrehozásának egyik fő szűk keresztmetszete – és egy kulcsfontosságú oka annak, hogy a robotok "ChatGPT-pillanata" még nem érkezett el – a képzési adatok hiánya.
A kutatók két fő módon gyűjtik ezeket az adatokat. Az első egy manuális folyamat, az úgynevezett távműködtetés, amikor az emberek egy robotot vezetnek át egy pontos feladaton, néha százezres nagyságrendben. Minden feladat rögzít egy adatcsomagot – beleértve a vizuális információkat, a kéz pozícióját, a nyomatékot és a mélységet –, amelyet "cselekvési szekvenciának" neveznek, és amelyet később a VLA betanítására használnak. Ez a módszer munkaigényes, ezért a Galbot inkább a második megközelítést részesíti előnyben: virtuális környezetek építését. "Olyan, mint az Avatar," mondta a mérnök, a kasszasikert említve. "Nem kell fizikailag a csatatérre lépnem; csak a kabinban fekszem, és mindent szimulálhatok."
A mérnök valós videókat mutatott nekünk a Galbot robotokról, amelyeket boltsegédként, idősek gondozására szolgáló társakként és szállító robotkutyaként teszteltek, miközben élő forgalomban közlekedtek. Azt állította, hogy a szállító robotok "két-három éven belül" készen állhatnak, ha elegendő erőforrást fordítanak a projektre – bár ezt a döntést még nem hozták meg. Miután Chen megismerte ezeket a lehetőségeket, alig tudta visszafojtani izgatottságát. Javaslatot tett arra, hogy képezzék a Galbot humanoidjait egy csavar meghúzására. Míg az emberi munkások ösztönösen végzik ezt, egy robot számára lebontva számos mikrodöntésre derül fény: a lyuk megtalálása, a csavar igazítása, a megfelelő nyomás és nyomaték alkalmazása, és annak tudása, mikor kell megállni. A mérnök elmondta Chennek, hogy a Galbot robotok már képesek megfogni és kezelni olyan szerszámokat, mint egy csavarhúzó, de még nem biztos benne, hogy megbirkóznak a pontos igazítással, a csavarral, vagy annak tudásával, milyen erővel kell forgatni. "Határozzuk meg a felelősségeket," nyugtatta meg Chen. "Amit te megbízhatóan kezelhetsz, és amit én átveszek."
Megegyeztek egy célban: ahhoz, hogy a Galbot humanoid életképes legyen a gyárban, nyolc másodpercen belül kellene meghúznia egy csavart. A mérnök hátradőlt, kissé túlterhelten. "Nektek olyan széles mérnöki szakértelem áll rendelkezésre."
"Különböző gének," válaszolta Chen simán. "Együtt megoldhatjuk az ipar problémáit."
A megbeszélés után egy háztömbnyit északra sétáltam egy közeli bevásárlóközpontba, ahol a Galbot egyik kiskereskedelmi robotját állította fel egy promóciós kioszk mögött. A fehér, manöken-szerű G1 modell volt kiállítva, egy emberi munkás pedig készenlétben állt, ha valami elromlana. Rendeltem egy Pocari Sweat-et, egy japán energiaitalt, egy táblagépről. A G1 a polc felé fordult, mechanikai karjai szárnyakként meredtek ki, mielőtt az egyik fogó megragadta az italomat. Kissé túl magasról tette az üveget a pultra, így az ital néhány centimétert oldalra pattant, bár nem esett le.
Együtt töltött időnk során Chen hangsúlyozta, hogy ez a technológia gyorsabban fejlődik, mint ahogy el tudnám képzelni. De a G1-vel való tapasztalatom – ami lényegében egy fényűző, félig kompetens árusítóautomata – szkeptikussá tett. Két hónappal később, februárban a lakásomból néztem a holdújévi gálát. A Galbot robotja egy előre felvett részben jelent meg, és másképp nézett ki. A fogók eltűntek, tíz ízületi ujj váltotta fel őket. A karok már nem voltak terjedelmesek, hanem fürge és emberi volt. Amikor a robot egy vízüvegért nyúlt a polcon, sokkal gyorsabban és magabiztosabban mozgott, mint korábban. Nem tudom, mennyit szerkesztettek vagy rendeztek ebből. De ízelt kaptam arról, amit Chen érzett.
Ha láttál már kínai robotot táncolni vagy kungfuzni, valószínűleg a Unitree készítette. Tavaly a cég több mint 5500 humanoid robotot szállított, többet, mint bármely más cég a világon. Nemrég egy viral videó mutatta a kínai popcsillag, Wang Leehom chengdui koncertjét, ahol Unitree robotok voltak a háttértáncosok. Elon Musk egy szóval osztotta meg: "Lenyűgöző." Ezek a viral előadások jó marketinget jelentenek Kínának, de a Unitree fő ügyfelei laborok és egyetemek, köztük az Oxford, a Carnegie Mellon, az UC San Diego és a Boston Dynamics, amelyek megvásárolják a robotokat, és szoftvereket fejlesztenek, hogy okosabbá tegyék őket. Egy szóvivő elmondta nekem, hogy a Unitree azt szeretné, hogy robotjaik végül gyárakba és otthonokba jussanak, hogy "átvegyék az emberek számára a veszélyes, ismétlődő és unalmas munkát."
Egy késő esti órában Ningbóban ültem egy taxiban, amikor üzenetet kaptam egy Unitree szóvivőtől. Másnap reggel találkozót beszéltünk meg a hangcsou-i székhelyükön, de a cég hirtelen egy "fontos eseményt" ütemezett, amely lezárta az iroda közelében lévő összes utat. Nincs sok dolog Kínában, amely megállíthatja a forgalmat és megzavarhatja az ütemterveket. Megnéztem a telefonomon, hogy hol van Xi Jinping elnök: két nappal korábban egy sporteseményen vett részt Kantonban, de nem volt világos, hová tart tovább. A szóvivő megkérdezte, ma este el tudnék-e jönni. Ránéztem az időre – már 19:32 volt. "Itt leszünk," biztositott. Siettem a vasútállomásra.
A globális hírnevével ellentétben a Unitree székhelye meglepően szerény. A cég két kopott épületet foglal el Hangcsou technológiai negyedében, egy régi telepen belül, amelyet autókereskedők és kis családi üzletek szegélyeznek. Amikor este 9 óra körül érkeztem, a legtöbb Unitree alkalmazott éppen hazament. Három médiaképviselő üdvözölt, és kísért el egy kiállító területre, ahol egy sor robot várt. Egy lila bokszsisak bóbiskolt, miközben olyan intenzitással adott kombinációkat, hogy ösztönösen hátráltam. Közelben egy másik robot charlestont táncolt. Ezután egy négylábú robotkutya forgott és mutatott trükköket. A bemutató során a bemutatók folyamatosan erősen rúgták a robotokat, de a gépek minden ütést elnyeltek anélkül, hogy felborultak volna.
A Boston Dynamics egyik fejlesztője, egy amerikai versenytárs, elmondta nekem, hogy a Unitree hardvere nagyon fejlett és figyelemre méltóan megfizethető. Robotjaik 1600 dollár körül kezdődnek, míg a hasonló amerikai modellek tízezrekébe kerülnek. A Boston Dynamics fejlesztője a Unitree előnyét szerkezeti feltételeknek tulajdonította. Kínának két kiterjedt metropoliszi központja van – a Sanghaj közelében található Jangce torkolata és a sencseni Perlafolyó torkolata –, amelyek sűrű hardverbeszállítói hálózatoknak adnak otthont. A robotkészítők néha átmehetnek a szomszédba egy pótalkatrészért. Egy robot prototípus módosítása Sencsenben kevesebb, mint egy napot vehet igénybe, de a Szilícium-völgyben heteket, ahol az alkatrészeknek több államon vagy óceánon át kell utazniuk. Ez az építési könnyedség is segít megmagyarázni, hogy miért van 330 különböző típusú humanoid robot Kínában. Ez a kreatív rombolást a folyamat rutin részévé teszi. "Kereskedelmi forgalomba hozunk egy generációs robotot," mondta Harry Xu, robotikai vállalkozó és a Tsinghua Egyetem kutatója. Sok ebből a generációból elkerülhetetlenül megbukik. "Aztán megépítjük a következő generációt."
Az amerikai és a kínai humanoid robotikai iparágakat egy spektrumként is lehet tekinteni. Az egyik végén ott van az általános célú humanoid – a sci-fi víziója egy olyan gépről, amely mindent meg tud csinálni, amit egy ember. A másik végén egy olyan robot áll, amelyet arra képeztek, hogy egy dolgot rendkívül jól csináljon, feláldozva a sokoldalúságot a kereskedelmi megbízhatóságért. Különböző okokból – a kereskedelmi forgalomba hozás nyomása, kormányzati szerződések, az intenzív verseny, amely a differenciálódást és a profitot jutalmazza a tiszta kutatás helyett – a kínai cégek inkább a szerényebb, specializáltabb vég felé húzódnak. A nagy amerikai techcégek, amelyeket mélyebb kockázati tőke véd, és kevésbé sürgető kereskedelmi sürgősség, gyakran az általános célú robotok szent gráljára törekszenek. Egy valószínű jövő az, hogy az USA vezeti az általános humanoidok fejlesztését, míg Kína megfizethető, megbízható robotokkal látja el a világot, amelyek mindegyike kitűnik egy adott feladatban. Az USA talán végül előáll egy olyan robottal, amely lekaszállhatja a pázsitodat, kiviszheti a kutyádat, és bébiszitterkedhet a gyerekeiddel. De amíg vársz, akár három kínai robotot is vehetsz, amelyek mindegyike egy feladatot lát el, a töredékéért az árnak.
Látogatásom utáni reggel taxival mentem vissza a Unitree irodáiba, hogy megnézzem, mi történik. A kerület körüli háztömböt lezárták. Kiszálltam, és egy háztömbnyit sétáltam a Unitree főkapuj