De opprettholder kontroll og balanse, men de avviker ikke fra programmeringen sin. Teknologien Galbot utvikler er det robotutviklere kaller en vision-language-action-modell (VLA). Denne har som mål å la maskiner operere i ukjente og skiftende omgivelser, omtrent som mennesker. For øyeblikket kan Galbots roboter ikke utføre oppgaver som er enkle for mennesker, som å vaske opp, pålitelig. Imidlertid har gründer Wang fortalt kinesiske medier at han har som mål å ha 10 000 roboter som håndterer grunnleggende detaljhandel- og fabrikkarbeid innen tre år. (Noen AI-pionerer, som Yann LeCun, er svært skeptiske til at dagens dyp læring-tilnærming kan oppnå resultatene selskaper som Galbot håper på.)
Chens besøk var for å utforske hvordan Galbots roboter kunne brukes i en elektrisk bilfabrikk – et av verdens mest komplekse produksjonsmiljøer. Å oppnå dette krever å trene robotene på et stort antall fabrikkscenarier, men det finnes ingen ferdig database for dette. For at Galbot skal ha noen sjanse til å deployere roboter i et slikt miljø, trenger de en spesialist med tiår med kompleks produksjonserfaring. Denne personen må definere de riktige oppgavene for den humanoide roboten, spesifisere dataene den trenger å lære, og til og med kompensere for det roboten ennå ikke kan gjøre. Det er ekspertisen Chen tilbyr.
Vi tok heisen til toppen av et tårn og gikk inn i et møterom med utsikt over Peking Universitets frodige grønne campus. En senior Galbot-ingeniør kom snart og begynte å orientere Chen om selskapets siste fremskritt. Han forklarte at Galbot-roboter nylig var deployert i 10 apotek i Beijing, og delte ut medisiner 24 timer i døgnet. Drevet av Nvidia-brikker, koster hver robot omtrent 700 000 yuan (£76 000). På et tidspunkt stoppet ingeniøren på et lysbilde som detaljerte teknologien bak Galbots humanoider.
Før dyp lærings oppgang, bemerket ingeniøren, trente industrielle robotutviklere som Chen maskiner manuelt. Programmerere skrev eksplisitte instruksjoner for hver bevegelse. Når noe gikk galt, feilsøkte de koden og la til nye linjer for å håndtere nye situasjoner. Dyp læring lover å erstatte denne håndskrevne koden med den mer fleksible VLA-modellen. En stor flaskehals i å skape slike modeller – og en nøkkelgrunn til at "ChatGPT-øyeblikket" for roboter ikke har kommet – er knappheten på treningsdata.
Forskere samler disse dataene på to hovedmåter. Den første er en manuell prosess kalt teleoperasjon, der mennesker guider en robot gjennom en presis oppgave, noen ganger hundre tusenvis av ganger. Hver oppgave registrerer en datapakke – inkludert visuell informasjon, håndposisjonering, dreiemoment og dybde – kjent som en "handlingssekvens", som senere brukes til å trene VLA-en. Denne metoden er arbeidskrevende, noe som er grunnen til at Galbot foretrekker den andre tilnærmingen: å bygge virtuelle miljøer. "Det er som **Avatar**," sa ingeniøren og henviste til suksessfilmen. "Jeg trenger ikke fysisk å gå ut på slagmarken; jeg bare ligger i min kapsel og kan simulere alt."
Ingeniøren viste oss virkelige videoer av Galbot-roboter som ble testet som butikkmedarbeidere, eldreomsorgsfølgesvenner og leveringsrobothunder som navigerer i levende gatetrafikk. Han hevdet at leveringsrobotene kunne være klare om "to til tre år" hvis tilstrekkelige ressurser ble dedikert til prosjektet – selv om de ikke hadde tatt den avgjørelsen ennå. Etter å ha lært om alle disse mulighetene, kunne Chen nesten ikke holde tilbake spenningen. Han foreslo en plan for å trene Galbots humanoider til å skru en skrue. Mens menneskelige arbeidere gjør dette instinktivt, avslører å bryte det ned for en robot utallige mikrobeslutninger: finne hullet, justere skruen, påføre riktig trykk og dreiemoment, og vite når man skal stoppe. Ingeniøren fortalte Chen at Galbot-roboter allerede kunne gripe og manipulere verktøy som en skrutrekker, men han var ikke sikker på at de kunne håndtere den presise justeringen. Skruen, eller å vite hvor hardt man skal vri den. "La oss definere ansvar," forsikret Chen ham. "Det du kan håndtere pålitelig, og det jeg tar over."
De ble enige om et mål: for at den humanoide Galbot-roboten skulle være levedyktig i fabrikken, måtte den feste en skrue på under åtte sekunder. Ingeniøren lente seg tilbake, litt overveldet. "Dere har et så bredt spekter av ingeniørkompetanse."
"Forskjellige gener," svarte Chen glatt. "Vi kan løse bransjens problemer sammen."
Etter møtet gikk jeg en kvartal nordover til et nærliggende kjøpesenter, der Galbot hadde satt opp en av sine detaljhandelsroboter bak en promotasjonskiosk. Den hvite, utstillingsdukke-lignende G1-modellen var på utstilling, med en menneskelig arbeider til stede i tilfelle noe gikk galt. Jeg bestilte en Pocari Sweat, en japansk energidrikk, fra en nettbrett. G1-en svingte mot hyllen, dens mekaniske armer stakk ut som vinger, før en klo grep drikken min. Den plasserte flasken på disken fra litt for høyt, så drikken hoppet noen centimeter til siden, selv om den ikke falt.
Gjennom tiden vi tilbrakte sammen, hadde Chen understreket at denne teknologien utviklet seg raskere enn jeg kunne forestille meg. Men min opplevelse med G1-en – i hovedsak en glorifisert, halvkompetent salgsautomat – gjorde meg skeptisk. To måneder senere, i februar, så jeg på nyttårsshowet fra leiligheten min. Galbots robot dukket opp i et forhåndsinnspilt segment, og den så annerledes ut. Klørne var borte, erstattet av ti leddede fingre. Armene var ikke lenger klumpete, men smidige og menneskelignende. Da roboten strakte seg etter en vannflaske på hyllen, beveget den seg mye raskere og mer selvsikkert enn før. Hvor mye av dette som var redigert eller iscenesatt, vet jeg ikke. Men jeg fikk en smak av det Chen følte.
Hvis du har sett en kinesisk robot danse eller gjøre kung fu, er sjansene store for at den ble laget av Unitree. I fjor leverte selskapet over 5 500 humanoide roboter, mer enn noe annet selskap i verden. Nylig viste en viral video den kinesiske popstjernen Wang Leehoms konsert i Chengdu, der Unitree-roboter fungerte som bakgrunnsdansere. Elon Musk repostet den med ett ord: "Imponerende." Disse virale opptredenene er god markedsføring for Kina, men Unitrees hovedkunder er laboratorier og universiteter, inkludert Oxford, Carnegie Mellon, UC San Diego og Boston Dynamics, som kjøper robotene og utvikler programvare for å gjøre dem mer intelligente. En talsperson fortalte meg at Unitree ønsker at robotene deres til slutt skal komme inn i fabrikker og hjem for å "ta farlig, repetitivt og kjedelig arbeid for mennesker."
Sent en kveld satt jeg i en drosje i Ningbo da jeg fikk en melding fra en Unitree-talsperson. Vi hadde planlagt å møtes på hovedkvarteret deres i Hangzhou neste morgen, men selskapet hadde brått planlagt en "viktig begivenhet" som ville stenge alle veier nær kontoret. Det er ikke mange ting i Kina som kan stoppe trafikken og forstyrre planer. Jeg sjekket telefonen for å se hvor president Xi Jinping var: to dager tidligere hadde han deltatt på en sportsbegivenhet i Guangzhou, men det var ikke klart hvor han skulle videre. Talspersonen spurte om jeg kunne komme i kveld. Jeg så på klokken – den var allerede 19:32. "Vi vil være her," forsikret hun meg. Jeg skyndte meg til togstasjonen.
Til tross for sin globale status, er Unitrees hovedkvarter overraskende beskjeden. Selskapet holder til i to medtatte bygninger i Hangzhous teknologidistrikt, inne i et gammelt komplett omgitt av bilforhandlere og små familiebutikker. Da jeg ankom rundt klokken 21, var de fleste Unitree-ansatte akkurat ferdig med arbeidsdagen. Jeg ble mottatt av tre mediarrepresentanter som eskorterte meg til et utstillingsområde der en rekke roboter ventet. En robot med en lilla boksehjelm duppet mens den slo kombinasjoner med en slik intensitet at jeg instinktivt tok et skritt tilbake. I nærheten danset en annen robot charleston. Deretter syklet en firbeint robothund gjennom flips og triks. Gjennom hele demonstrasjonen sparket presentatørene hardt til robotene, men maskinene absorberte hvert slag uten å velte.
En utvikler hos Boston Dynamics, en amerikansk konkurrent, fortalte meg at Unitrees maskinvare er svært avansert og bemerkelsesverdig rimelig. Robotene deres starter på rundt 1 600 dollar, mens sammenlignbare amerikanske modeller koster titusener. Boston Dynamics-utvikleren tilskrev Unitrees fordel til strukturelle forhold. Kina har to enorme metropolsentre – Yangtze-deltaet nær Shanghai og Perleflodens delta i Shenzhen – som huser tette nettverk av maskinvareleverandører. Robotprodusenter kan noen ganger gå til naboen for et reservedel. Å justere en robotprototype kan ta mindre enn en dag i Shenzhen, men uker i Silicon Valley, hvor deler kanskje må reise over flere stater eller hav. Denne enkelheten i bygging hjelper også til med å forklare hvorfor det finnes 330 forskjellige typer humanoide roboter i Kina. Det gjør kreativ ødeleggelse til en rutinemessig del av prosessen. "Vi kommersialiserer én generasjon av roboter," sa Harry Xu, en robotikkentreprenør og forsker ved Tsinghua University. Mange fra den generasjonen mislykkes uunngåelig. "Så bygger vi neste generasjon."
En annen måte å se på de humanoide robotikkindustriene i USA og Kina er som et spektrum. I den ene enden sitter den allsidige humanoide – sci-fi-visjonen om en maskin som kan gjøre alt et menneske kan. I den andre enden er en robot trent til å gjøre én ting ekstremt godt, som ofrer allsidighet for kommersiell pålitelighet. Av ulike grunner – press for kommersialisering, statlige kontrakter, intens konkurranse som belønner differensiering og profitt fremfor ren forskning – har kinesiske selskaper en tendens til å bli dratt mot den mer beskjedne, spesialiserte enden. Store amerikanske teknologiselskaper, beskyttet av dypere venturekapital og mindre umiddelbar kommersiell hastverk, sikter ofte mot den hellige gral av allsidige roboter. En plausibel fremtid er en der USA leder utviklingen av generaliserte humanoider, mens Kina forsyner verden med rimelige, pålitelige roboter, hver utmerket seg i en spesifikk oppgave. USA kan til slutt produsere en enkelt robot som kan klippe plenen din, gå med hunden din og passe barna dine. Men mens du venter, kan du like gjerne kjøpe tre kinesiske roboter som hver håndterer én oppgave, til en brøkdel av prisen.
Morgenen etter besøket tok jeg en drosje tilbake til Unitrees kontorer for å se hva som skjedde. Kvartalet rundt omkretsen var avsperret. Jeg gikk ut og gikk omtrent en kvartal til Unitrees hovedport, der tre menn i dress sto vakt og skannet hver forbipasserende. Bak tre svarte politibiler kunne jeg ikke se noe. Jeg sjekket telefonen og så at Xi Jinping var 1200 km unna i Beijing, og var vert for et besøk fra Spanias kong Felipe VI. Jeg krysset gaten og vinket til en annen drosje. Inne i drosjen var sjåføren nysgjerrig på om jeg hadde sett noe utenfor fabrikken. Han hadde nettopp levert av en Unitree-ansatt og spekulerte raskt: "Det må være en militærgruppe der inne."
Gjetningen hans var rimelig. For to år siden viste kinesisk statlig TV opptak av militærøvelser som viste Unitree-robothunder utstyrt med maskingevær. Amerikanske lovgivere har foreslått å kutte Unitree fra amerikansk teknologi som halvledere. Unitree hevder at de ikke selger til militæret eller støtter militære modifikasjoner fra tredjeparter, men et amerikansk analysefirma hevder at Unitree selger til kinesiske universiteter som har kontrakt med militæret. Denne granskingen har påvirket Kinas robotikkindustri. En talsperson ved et topp robotikkselskap fortalte meg at de hadde blitt advart av myndighetene om ikke å snakke med vestlige medier. Da jeg spurte Unitrees talspersoner om selskapets... Da jeg spurte om kundene deres og om de solgte flere roboter i utlandet eller i Kina, svarte selskapet bare: "Vi gjør begge deler." Senere, da jeg fulgte opp, forklarte Unitree at sikkerhetstilstedeværelsen jeg hadde sett ikke var militærrelatert – det var en regjeringsdelegasjon på besøk for å lære om robotene deres.
I løpet av samme uke jeg besøkte Galbot med Chen Liang, reiste jeg til utkanten av Beijing til det byregjeringen kaller Kinas "største robot treningssenter". Senteret drives av Leju Robotics, et selskap hvis roboter lærer ikke fra simuleringer, men fra virkelige eksempler gitt av menneskelige datainnsamlere, eller teleoperatører. Lejus flaggskip humanoide robot, Kuavo, brukes allerede i noen elektriske bilfabrikker over hele Kina for grunnleggende oppgaver som å pakke opp pappesker.
I lobbyen viste en stor veggmonitor et kart over Kina med fem glødende røde prikker som markerte hver by der Leju har et treningssenter. Ved siden av hver prikk var antall handlingssekvenser samlet på det stedet. Det største stedet var her i Beijing, der omtrent 100 teleoperatører var ordnet i pene rekker i et avsperret hjørne av et lager. Hver arbeidsstasjon hadde to personer tildelt en robot, som utførte forskjellige oppgaver som å tørke et bord, organisere bestikk eller flytte et glass vann. Oppe traente teleoperatører roboter på industrielle oppgaver som sortering og pakking av esker. Leju og dets tilk