Udržují kontrolu a rovnováhu, ale neodchylují se od svého naprogramování. Technologie, kterou Galbot vyvíjí, je to, co robotici nazývají model vidění-jazyk-akce (VLA). Jeho cílem je umožnit strojům fungovat v neznámém a proměnlivém prostředí, podobně jako lidé. V současné době roboti Galbotu nedokážou spolehlivě plnit úkoly, které jsou pro lidi jednoduché, například mýt nádobí. Zakladatel Wang však čínským médiím řekl, že jeho cílem je mít do tří let 10 000 robotů, kteří budou zvládat základní maloobchodní a tovární práce. (Někteří průkopníci umělé inteligence, jako je Yann LeCun, jsou velmi skeptičtí, že současný přístup hlubokého učení může dosáhnout výsledků, na které společnosti jako Galbot doufají.)
Chenova návštěva měla za cíl prozkoumat, jak by se roboti Galbotu mohli využívat v továrně na elektrická vozidla – jednom z nejkomplexnějších výrobních prostředí na světě. K dosažení tohoto cíle je nutné roboty trénovat na obrovském množství továrních scénářů, ale pro to neexistuje žádná hotová databáze. Aby měl Galbot jakoukoli šanci nasadit roboty v takovém prostředí, potřebují specialistu s desítkami let zkušeností v komplexní výrobě. Tato osoba musí definovat správné úkoly pro humanoidního robota, specifikovat data, která se potřebuje naučit, a dokonce kompenzovat to, co robot zatím nedokáže. To je odbornost, kterou Chen nabízí.
Výtahem jsme vyjeli na vrchol věže a vstoupili do zasedací místnosti s výhledem na bujný zelený kampus Pekingské univerzity. Brzy dorazil starší inženýr Galbotu a začal Chena informovat o nejnovějším pokroku společnosti. Vysvětlil, že roboti Galbotu byli nedávno nasazeni v 10 pekingských lékárnách, kde 24 hodin denně vydávali léky. Každý robot, poháněný čipy Nvidia, stojí asi 700 000 jüanů (76 000 liber). V jednu chvíli se inženýr na snímku zastavil u podrobností o technologii stojící za humanoidy Galbotu.
Inženýr poznamenal, že před vzestupem hlubokého učení robotici jako Chen trénovali stroje ručně. Programátoři psali explicitní instrukce pro každý pohyb. Když se něco pokazilo, ladili kód a přidávali nové řádky pro zvládnutí nových situací. Hluboké učení slibuje nahradit tento ručně psaný kód flexibilnějším modelem VLA. Hlavním úzkým místem při vytváření takových modelů – a klíčovým důvodem, proč „moment ChatGPT“ pro roboty ještě nepřišel – je nedostatek tréninkových dat.
Výzkumníci shromažďují tato data dvěma hlavními způsoby. Prvním je manuální proces zvaný teleoperace, při kterém lidé vedou robota přesný úkol, někdy i stotisíckrát. Každý úkol zaznamenává datový balíček – včetně vizuálních informací, polohy rukou, točivého momentu a hloubky – známý jako „akční sekvence“, která se později používá k tréninku VLA. Tato metoda je pracně náročná, proto Galbot dává přednost druhému přístupu: vytváření virtuálních prostředí. „Je to jako **Avatar**,“ řekl inženýr s odkazem na kasovní trhák. „Nemusím fyzicky vstoupit na bojiště; jen si lehnu do své kapsle a můžu simulovat všechno.“
Inženýr nám ukázal reálná videa robotů Galbotu testovaných jako prodavači, společníci pro péči o seniory a doručovací robotičtí psi pohybující se v živém provozu. Tvrdil, že doručovací roboti by mohli být připraveni „za dva až tři roky“, pokud by projektu byla věnována dostatečná pozornost – i když toto rozhodnutí ještě neudělali. Po seznámení se všemi těmito možnostmi Chen sotva potlačoval své nadšení. Navrhl plán, jak naučit humanoidy Galbotu zašroubovat šroub. Zatímco lidský pracovník to dělá instinktivně, rozložení tohoto úkonu pro robota odhaluje četná mikro-rozhodnutí: najít otvor, zarovnat šroub, aplikovat správný tlak a točivý moment a vědět, kdy přestat. Inženýr Chenovi řekl, že roboti Galbotu již dokážou uchopit a manipulovat s nástroji jako šroubovák, ale ještě si nebyl jistý, zda zvládnou přesné zarovnání šroubu nebo vědět, jak silně ho otočit. „Pojďme si definovat odpovědnosti,“ uklidnil ho Chen. „Co ty zvládneš spolehlivě a co převezmu já.“
Dohodli se na cíli: aby byl humanoid Galbotu v továrně životaschopný, musel by zašroubovat šroub za méně než osm sekund. Inženýr se opřel, lehce ohromen. „Vy máte tak širokou škálu inženýrských znalostí.“
„Různé geny,“ plynule odpověděl Chen. „Můžeme společně řešit problémy průmyslu.“
Po schůzce jsem šel blok na sever do nedalekého nákupního centra, kde Galbot umístil jednoho ze svých maloobchodních robotů za propagačním stánkem. Byl vystaven bílý model G1 podobný figuríně, přičemž poblíž stál lidský pracovník pro případ potíží. Z tabletu jsem si objednal Pocari Sweat, japonský energetický nápoj. G1 se otočil směrem k polici, jeho mechanické paže trčely jako křídla, než jedna klešť uchopila můj nápoj. Položil láhev na pult z příliš velké výšky, takže se nápoj odrazil o několik centimetrů stranou, i když nespadl.
Během našeho společného času Chen zdůrazňoval, že tato technologie postupuje rychleji, než si dokážu představit. Moje zkušenost s G1 – v podstatě glorifikovaným, poloschopným automatem – mě však zanechala skeptickou. O dva měsíce později, v únoru, jsem sledoval novoroční galavečer ze svého bytu. Robot Galbotu se objevil v předem nahraném segmentu a vypadal jinak. Kleště zmizely, nahradilo je deset kloubových prstů. Paže již nebyly objemné, ale pružné a lidské. Když robot sáhl po lahvi s vodou na polici, pohyboval se mnohem rychleji a sebejistěji než dříve. Nevím, kolik z toho bylo upraveno nebo zinscenováno. Ale okusil jsem, co Chen cítil.
Pokud jste viděli čínského robota tančit nebo cvičit kung-fu, je pravděpodobné, že ho vyrobila společnost Unitree. Loni společnost dodala přes 5 500 humanoidních robotů, více než kterákoli jiná společnost na světě. Nedávno virální video ukázalo koncert čínské popové hvězdy Wang Leehoma v Čcheng-tu, kde roboti Unitree sloužili jako doprovodní tanečníci. Elon Musk to sdílel s jedním slovem: „Působivé.“ Tyto virální výkony jsou pro Čínu dobrou reklamou, ale hlavními zákazníky Unitree jsou laboratoře a univerzity, včetně Oxfordu, Carnegie Mellon, UC San Diego a Boston Dynamics, které roboty kupují a vyvíjejí software, aby byly inteligentnější. Mluvčí mi řekl, že Unitree chce, aby jejich roboti nakonec vstoupili do továren a domácností, aby „převzali za lidi nebezpečnou, opakující se a únavnou práci“.
Jednou pozdě večer jsem byl v taxíku v Ning-pu, když mi přišla zpráva od mluvčí Unitree. Plánovali jsme se setkat druhý den ráno v jejich sídle v Chang-čou, ale společnost náhle naplánovala „důležitou událost“, která uzavře všechny silnice v okolí kanceláře. V Číně není mnoho věcí, které by zastavily provoz a narušily plány. Zkontroloval jsem telefon, abych zjistil, kde je prezident Si Ťin-pching: před dvěma dny se zúčastnil sportovní akce v Kantonu, ale nebylo jasné, kam míří dál. Mluvčí se zeptala, jestli můžu přijet dnes večer. Podíval jsem se na čas – bylo už 19:32. „Budeme tady,“ ujistila mě. Spěchal jsem na nádraží.
Navzdory svému globálnímu postavení je sídlo Unitree překvapivě skromné. Společnost zabírá dvě omšelé budovy v technologické čtvrti Chang-čou, uvnitř starého areálu lemovaného prodejci automobilů a malými rodinnými obchody. Když jsem dorazil kolem 21. hodiny, většina zaměstnanců Unitree právě končila práci. Přivítali mě tři mediální zástupci, kteří mě doprovodili do výstavní oblasti, kde čekala řada robotů. Jeden robot s fialovou boxerskou helmou se pohupoval, když prováděl kombinace tak intenzivně, že jsem instinktivně ustoupil. Nedaleko další robot tančil charleston. Poté čtyřnohý robotický pes předváděl salta a triky. Během celé demonstrace prezentující roboty stále tvrdě kopali, ale stroje pohltily každý úder bez převrácení.
Jeden vývojář z Boston Dynamics, amerického konkurenta, mi řekl, že hardware Unitree je vysoce pokročilý a pozoruhodně cenově dostupný. Jejich roboti začínají na zhruba 1 600 dolarech, zatímco srovnatelné americké modely stojí desítky tisíc. Vývojář z Boston Dynamics připsal výhodu Unitree strukturálním podmínkám. Čína má dvě rozsáhlá metropolitní centra – deltu řeky Jang-c’-ťiang poblíž Šanghaje a deltu Perlové řeky v Šen-čenu – která hostí hustou síť dodavatelů hardwaru. Výrobci robotů si někdy mohou zajít vedle pro náhradní díl. Úprava prototypu robota může v Šen-čenu trvat méně než den, ale v Silicon Valley týdny, kde mohou díly cestovat přes několik států nebo oceány. Tato snadnost výstavby také pomáhá vysvětlit, proč je v Číně 330 různých typů humanoidních robotů. Mění kreativní destrukci v rutinní součást procesu. „Uvádíme na trh jednu generaci robotů,“ řekl Harry Xu, robotický podnikatel a výzkumník z univerzity Čching-chua. Mnoho z této generace nevyhnutelně selže. „Pak postavíme další generaci.“
Dalším způsobem, jak nahlížet na humanoidní robotický průmysl v USA a Číně, je spektrum. Na jednom konci stojí univerzální humanoid – sci-fi vize stroje, který dokáže vše, co člověk. Na druhém konci je robot vycvičený k tomu, aby dělal jednu věc extrémně dobře, obětující univerzálnost pro komerční spolehlivost. Z různých důvodů – tlaku na komercializaci, vládních zakázek, intenzivní konkurence, která odměňuje diferenciaci a zisk před čistým výzkumem – mají čínské společnosti tendenci být taženy k skromnějšímu, specializovanějšímu konci. Hlavní americké technologické firmy, chráněné hlubším venture kapitálem a menší bezprostřední komerční naléhavostí, často míří ke svatému grálu univerzálních robotů. Pravděpodobná budoucnost je taková, že USA povedou vývoj generalizovaných humanoidů, zatímco Čína bude svět zásobovat cenově dostupnými, spolehlivými roboty, z nichž každý vyniká v konkrétním úkolu. USA mohou nakonec vyrobit jediného robota, který vám poseká trávník, vyvenčí psa a pohlídá děti. Ale zatímco čekáte, můžete si klidně koupit tři čínské roboty, z nichž každý zvládne jeden úkol, za zlomek ceny.
Ráno po mé návštěvě jsem se taxíkem vrátil do kanceláří Unitree, abych viděl, co se děje. Blok kolem areálu byl uzavřen. Vystoupil jsem a došel asi blok k hlavní bráně Unitree, kde stáli tři muži v oblecích a hlídali, skenujíce každého kolemjdoucího. Za třemi černými dodávkami veřejné bezpečnosti jsem nic neviděl. Zkontroloval jsem telefon a uviděl, že Si Ťin-pching je 750 mil daleko v Pekingu, kde hostí návštěvu španělského krále Felipeho VI. Překročil jsem ulici a zastavil další taxík. Když jsem nastoupil, řidič byl zvědavý, jestli jsem před továrnou něco viděl. Právě vysadil zaměstnance Unitree a rychle spekuloval: „Uvnitř musí být armádní skupina.“
Jeho odhad byl rozumný. Před dvěma lety čínská státní televize odvysílala záběry z vojenských cvičení ukazující robotické psy Unitree vybavené kulomety. Američtí zákonodárci navrhli odříznout Unitree od amerických technologií, jako jsou polovodiče. Unitree trvá na tom, že neprodává armádě ani nepodporuje vojenské úpravy třetích stran, ale jedna americká analytická firma tvrdí, že Unitree prodává čínským univerzitám, které mají smlouvy s armádou. Tato pozornost ovlivnila čínský robotický průmysl. Mluvčí přední robotické společnosti mi řekl, že je úřady varovali, aby nemluvili se západními médii. Když jsem se zeptal mluvčích Unitree na jejich zákazníky a zda prodávají více robotů v zahraničí nebo v Číně, společnost jednoduše odpověděla: „Děláme obojí.“ Později, když jsem se dotazoval dál, Unitree vysvětlilo, že bezpečnostní přítomnost, kterou jsem viděl, nesouvisela s armádou – byla to vládní delegace, která přišla poznat jejich roboty.
Ve stejném týdnu, kdy jsem navštívil Galbot s Chenem Liangem, jsem odcestoval na okraj Pekingu do toho, co městská vláda nazývá „největším výcvikovým centrem robotů v Číně“. Centrum provozuje společnost Leju Robotics, jejíž roboti se neučí ze simulací, ale z reálných příkladů poskytovaných lidskými sběra