Kina genomgår en omvälvande robotikrevolution.

Kina genomgår en omvälvande robotikrevolution.

De behåller kontroll och balans, men de avviker inte från sin programmering. Den teknik som Galbot utvecklar är vad robotikexperter kallar en vision-language-action-modell (VLA). Den syftar till att låta maskiner fungera i okända och föränderliga miljöer, ungefär som människor. För närvarande kan Galbots robotar inte pålitligt utföra uppgifter som är enkla för människor, som att diska. Men grundaren Wang har sagt till kinesisk media att han inom tre år vill ha 10 000 robotar som hanterar grundläggande detaljhandels- och fabriksarbete. (Vissa AI-pionjärer, som Yann LeCun, är mycket skeptiska till att dagens deep learning-tillvägagångssätt kan uppnå de resultat som företag som Galbot hoppas på.)

Chens besök syftade till att utforska hur Galbots robotar kunde användas i en elbilsfabrik – en av världens mest komplexa tillverkningsmiljöer. För att uppnå detta krävs att robotarna tränas på ett stort antal fabriksscenarier, men det finns ingen färdig databas för detta. För att Galbot ska ha någon chans att använda robotar i en sådan miljö behöver de en specialist med decennier av erfarenhet av komplex tillverkning. Denna person måste definiera rätt uppgifter för den humanoida roboten, specificera vilka data den behöver lära sig och till och med kompensera för vad roboten ännu inte kan göra. Det är den expertis som Chen erbjuder.

Vi åkte hiss till toppen av ett torn och gick in i ett mötesrum med utsikt över Pekinguniversitets gröna campus. Snart anlände en senior Galbot-ingenjör och började informera Chen om företagets senaste framsteg. Han förklarade att Galbot-robotar nyligen hade satts in på 10 apotek i Peking, där de delade ut mediciner dygnet runt. Drivna av Nvidia-chip kostar varje robot cirka 700 000 yuan (76 000 pund). Vid ett tillfälle pausade ingenjören på en bild som detaljerade tekniken bakom Galbots humanoider.

Innan deep learning blev populärt, noterade ingenjören, tränade industrirobotikexperter som Chen maskiner manuellt. Programmerare skrev explicita instruktioner för varje rörelse. När något gick fel felsökte de koden och lade till nya rader för att hantera nya situationer. Deep learning lovar att ersätta denna handskrivna kod med den mer flexibla VLA-modellen. En stor flaskhals i att skapa sådana modeller – och en viktig anledning till att "ChatGPT-ögonblicket" för robotar inte har kommit – är bristen på träningsdata.

Forskare samlar in dessa data på två huvudsakliga sätt. Det första är en manuell process som kallas teleoperation, där människor guidar en robot genom en specifik uppgift, ibland hundratusentals gånger. Varje uppgift registrerar ett datapaket – inklusive visuell information, handposition, vridmoment och djup – känt som en "handlingssekvens", som senare används för att träna VLA:n. Denna metod är arbetsintensiv, vilket är varför Galbot föredrar det andra tillvägagångssättet: att bygga virtuella miljöer. "Det är som Avatar", sa ingenjören och hänvisade till blockbusterfilmen. "Jag behöver inte fysiskt kliva ut på slagfältet; jag ligger bara i min kapsel och kan simulera allt."

Ingenjören visade oss verklighetsbaserade videor där Galbot-robotar testades som butikspersonal, äldreomsorgskompisar och leveransrobothundar som navigerar i levande gatutrafik. Han hävdade att leveransrobotarna kunde vara klara om "två till tre år" om tillräckliga resurser ägnades åt projektet – även om de ännu inte hade fattat det beslutet. Efter att ha lärt sig om alla dessa möjligheter kunde Chen knappt dölja sin entusiasm. Han föreslog en plan för att träna Galbots humanoider att skruva. Medan mänskliga arbetare gör detta instinktivt, avslöjar en uppdelning för en robot många mikrobeslut: hitta hålet, rikta in skruven, applicera rätt tryck och vridmoment och veta när man ska sluta. Ingenjören sa till Chen att Galbot-robotar redan kunde greppa och manipulera verktyg som en skruvmejsel, men han var inte säker på att de kunde hantera den exakta inriktningen. Skruven, eller att veta hur hårt man ska vrida den. "Låt oss definiera ansvarsområden", lugnade Chen honom. "Vad du kan hantera pålitligt, och vad jag tar över."

De kom överens om ett mål: för att den humanoide Galbot-roboten ska vara livskraftig i fabriken måste den kunna fästa en skruv på under åtta sekunder. Ingenjören lutade sig tillbaka, lite överväldigad. "Ni har ett så brett spektrum av ingenjörskompetens."

"Olika gener", svarade Chen smidigt. "Vi kan lösa branschens problem tillsammans."

Efter mötet gick jag ett kvarter norrut till ett närliggande köpcentrum, där Galbot hade satt upp en av sina detaljhandelsrobotar bakom en informationskiosk. Den vita, skyltdocksliknande G1-modellen var utställd, med en mänsklig arbetare på plats ifall något gick fel. Jag beställde en Pocari Sweat, en japansk energidryck, från en surfplatta. G1:an svängde mot hyllan, dess mekaniska armar stack ut som vingar, innan en klon tog tag i min dryck. Den placerade flaskan på disken från lite för högt, så drycken studsade några centimeter åt sidan, även om den inte välte.

Under hela vår tid tillsammans hade Chen betonat att denna teknik utvecklades snabbare än jag kunde föreställa mig. Men min upplevelse med G1:n – i grunden en glorifierad, halvkompetent varuautomat – fick mig att tvivla. Två månader senare, i februari, tittade jag på nyårsgalan från min lägenhet. Galbots robot dök upp i ett förinspelat inslag, och den såg annorlunda ut. Klorna var borta, ersatta av tio ledade fingrar. Armarna var inte längre klumpiga utan smidiga och mänskliga. När roboten sträckte sig efter en vattenflaska på hyllan rörde den sig mycket snabbare och säkrare än tidigare. Hur mycket av detta som var redigerat eller iscensatt vet jag inte. Men jag fick en smak av vad Chen kände.

Om du har sett en kinesisk robot dansa eller göra kung fu är chansen stor att den är tillverkad av Unitree. Förra året levererade företaget över 5 500 humanoider, fler än något annat företag i världen. Nyligen visade en viral video kinesiska popstjärnan Wang Leehoms konsert i Chengdu, där Unitree-robotar fungerade som bakgrundsdansare. Elon Musk delade videon med ett ord: "Imponerande." Dessa virala uppträdanden är bra marknadsföring för Kina, men Unitrees huvudsakliga kunder är laboratorier och universitet, inklusive Oxford, Carnegie Mellon, UC San Diego och Boston Dynamics, som köper robotarna och utvecklar mjukvara för att göra dem mer intelligenta. En talesperson sa till mig att Unitree vill att deras robotar så småningom ska komma in i fabriker och hem för att "ta över farligt, repetitivt och tråkigt arbete åt människor."

Sent en kväll satt jag i en taxi i Ningbo när jag fick ett meddelande från en Unitree-talesperson. Vi hade planerat att träffas på deras huvudkontor i Hangzhou nästa morgon, men företaget hade plötsligt schemalagt ett "viktigt evenemang" som skulle stänga alla vägar nära kontoret. Det finns inte många saker i Kina som kan stoppa trafiken och störa scheman. Jag kollade telefonen för att se var president Xi Jinping befann sig: två dagar tidigare hade han deltagit i ett sportevenemang i Guangzhou, men det var oklart vart han var på väg härnäst. Talespersonen frågade om jag kunde komma ikväll. Jag tittade på klockan – den var redan 19:32. "Vi är här", försäkrade hon. Jag skyndade till tågstationen.

Trots sin globala status är Unitrees huvudkontor överraskande anspråkslöst. Företaget upptar två medfarna byggnader i Hangzhous tekniska distrikt, inuti en gammal anläggning omgiven av bilhandlare och små familjeaffärer. När jag anlände runt 21:00 var de flesta Unitree-anställda precis på väg hem från jobbet. Jag hälsades av tre mediarrepresentanter som eskorterade mig till ett utställningsområde där en rad robotar väntade. En robot med en lila boxningshjälm gungade medan den slog kombinationer med sådan intensitet att jag instinktivt backade. I närheten dansade en annan robot charleston. Sedan cyklade en fyrbent robothund genom voltar och trick. Under hela demonstrationen sparkade presenterna hårt på robotarna, men maskinerna absorberade varje slag utan att välta.

En utvecklare på Boston Dynamics, en amerikansk konkurrent, sa till mig att Unitrees hårdvara är mycket avancerad och anmärkningsvärt prisvärd. Deras robotar börjar på cirka 1 600 dollar, medan jämförbara amerikanska modeller kostar tiotusentals. Boston Dynamics-utvecklaren tillskrev Unitrees fördel strukturella förhållanden. Kina har två stora metropolregioner – Yangtzeflodens delta nära Shanghai och Pärlflodens delta i Shenzhen – som har tät nätverk av hårdvaruleverantörer. Robotillverkare kan ibland gå till grannen för ett reservdel. Att justera en robotprototyp kan ta mindre än en dag i Shenzhen, men veckor i Silicon Valley, där delar kan behöva transporteras över flera delstater eller hav. Denna bygglätthet hjälper också till att förklara varför det finns 330 olika typer av humanoider i Kina. Det förvandlar kreativ förstörelse till en rutinmässig del av processen. "Vi kommersialiserar en generation av robotar", sa Harry Xu, robotentreprenör och forskare vid Tsinghuauniversitetet. Många från den generationen misslyckas oundvikligen. "Sedan bygger vi nästa generation."

Ett annat sätt att se på de humanoiderobotindustrierna i USA och Kina är som ett spektrum. I ena änden finns den mångsidiga humanoiden – sci-fi-visionen av en maskin som kan göra allt en människa kan. I den andra änden finns en robot tränad att göra en sak extremt bra, som offrar mångsidighet för kommersiell tillförlitlighet. Av olika anledningar – press att kommersialisera, statliga kontrakt, intensiv konkurrens som belönar differentiering och vinst över ren forskning – tenderar kinesiska företag att dras mot det mer anspråkslösa, specialiserade hållet. Stora amerikanska teknikföretag, skyddade av djupare riskkapital och mindre omedelbar kommersiell brådska, siktar ofta på den heliga graalen av mångsidiga robotar. En trolig framtid är att USA leder utvecklingen av generaliserade humanoider, medan Kina förser världen med prisvärda, pålitliga robotar, var och en utmärkt på en specifik uppgift. USA kan så småningom producera en enda robot som kan klippa din gräsmatta, gå ut med din hund och passa dina barn. Men medan du väntar kan du lika gärna köpa tre kinesiska robotar som var och en hanterar en uppgift, till en bråkdel av priset.

Morgonen efter mitt besök tog jag en taxi tillbaka till Unitrees kontor för att se vad som hände. Kvarteret runt omkretsen hade avspärrats. Jag klev ur och gick ungefär ett kvarter till Unitrees entré, där tre kostymklädda män stod på vakt och skannade varje förbipasserande. Bortom tre svarta polisbussar kunde jag inte se någonting. Jag kollade telefonen och såg att Xi Jinping var 1 200 km bort i Peking och värd för ett besök av Spaniens kung Felipe VI. Jag korsade gatan och vinkade till mig en annan taxi. När jag satt i bilen var chauffören nyfiken på om jag hade sett något utanför fabriken. Han hade precis släppt av en Unitree-anställd och spekulerade snabbt: "Det måste finnas en armégrupp därinne."

Hans gissning var rimlig. För två år sedan sände kinesisk statstelevision bilder från militärövningar som visade Unitree-robothundar utrustade med maskingevär. Amerikanska lagstiftare har föreslagit att stänga av Unitree från amerikansk teknik som halvledare. Unitree hävdar att de inte säljer till militären eller stöder militära modifieringar av tredje part, men ett amerikanskt analysföretag hävdar att Unitree säljer till kinesiska universitet som har kontrakt med militären. Denna granskning har påverkat Kinas robotindustri. En talesperson på ett ledande robotföretag sa till mig att de hade varnats av myndigheterna att inte prata med västerländsk media. När jag frågade Unitrees talespersoner om företagets... När jag frågade om deras kunder och om de sålde fler robotar utomlands eller i Kina svarade företaget helt enkelt: "Vi gör båda och." Senare, när jag följde upp, förklarade Unitree att säkerhetspersonalen jag hade sett inte var militärrelaterad – det var en regeringsdelegation som besökte för att lära sig om deras robotar.

Under samma vecka som jag besökte Galbot med Chen Liang reste jag till utkanten av Peking till vad stadsstyret kallar Kinas "största robotträningscenter". Centret drivs av Leju Robotics, ett företag vars robotar lär sig inte från simuleringar utan från verkliga exempel som tillhandahålls av mänskliga datainsamlare, eller teleoperatörer. Lejus flaggskeppshumanoid, Kuavo, används redan i vissa elbilsfabriker över hela Kina för grundläggande uppgifter som att plocka kartonger.

I lobbyn visade en stor väggskärm en karta över Kina med fem glödande röda prickar som markerade varje stad där Leju har ett träningscenter. Bredvid varje prick stod antalet handlingssekvenser som samlats in på platsen. Den största platsen var här i Peking, där cirka 100 teleoperatörer var uppställda i prydliga rader i ett avgränsat hörn av ett lager. Varje arbetsstation hade två personer tilldelade en robot, som utförde olika uppgifter som att torka ett bord, organisera bestick eller flytta ett glas vatten. Uppe på övervåningen tränade teleoperatörer robotar på industriuppgifter som att sortera och packa lådor. Leju och dess dotterbolag säljer en del av dessa data till