He pitävät hallinnan ja tasapainon, mutta eivät poikkea ohjelmoinnistaan. Galbotin kehittämä teknologia on se, mitä robottitutkijat kutsuvat näkö-kieli-toiminta-malliksi (VLA). Sen tavoitteena on mahdollistaa koneiden toiminta tuntemattomissa ja muuttuvissa ympäristöissä, aivan kuten ihmisillä. Tällä hetkellä Galbotin robotit eivät pysty luotettavasti suorittamaan ihmisille yksinkertaisia tehtäviä, kuten tiskaamaan. Kuitenkin perustaja Wang on kertonut kiinalaisille medioille, että hänen tavoitteenaan on saada 10 000 robottia hoitamaan perusvähittäiskauppa- ja tehdastyötä kolmen vuoden sisällä. (Jotkut tekoälyn uranuurtajat, kuten Yann LeCun, ovat erittäin skeptisiä siitä, että nykyinen syväoppimisen lähestymistapa voi saavuttaa sellaiset tulokset, joita yritykset kuten Galbot toivovat.)
Chenin vierailun tarkoituksena oli tutkia, kuinka Galbotin robotteja voitaisiin käyttää sähköautotehtaassa – yhdessä maailman monimutkaisimmista valmistusympäristöistä. Tämän saavuttaminen edellyttää robottien kouluttamista valtavalla määrällä tehdasskenaarioita, mutta valmista tietokantaa tätä varten ei ole. Jotta Galbotilla olisi mitään mahdollisuuksia ottaa robotteja käyttöön tällaisessa ympäristössä, he tarvitsevat asiantuntijan, jolla on vuosikymmenten kokemus monimutkaisesta valmistuksesta. Tämän henkilön on määriteltävä oikeat tehtävät humanoidirobotille, määritettävä tiedot, joita sen on opittava, ja jopa kompensoitava sitä, mitä robotti ei vielä osaa. Se on se asiantuntijuus, jota Chen tarjoaa.
Kävimme hissillä tornin huipulle ja astuimme kokoushuoneeseen, josta avautui näkymä Pekingin yliopiston vehreälle kampus-alueelle. Pian saapui vanhempi Galbot-insinööri ja alkoi pitää Chenille tietopuheen yrityksen uusimmasta edistymisestä. Hän selitti, että Galbot-robotteja oli äskettäin otettu käyttöön 10 Pekingin apteekissa, ja ne jakavat lääkkeitä 24 tuntia vuorokaudessa. Nvidian siruilla toimivan robotin hinta on noin 700 000 juania (76 000 puntaa). Yhteen vaiheeseen insinööri pysähtyi dioihin, jotka yksityiskohtasivat Galbotin humanoidirobottien taustalla olevaa teknologiaa.
Ennen syväoppimisen nousua, insinööri huomautti, että teollisuusrobotiikan asiantuntijat kuten Chen kouluttivat koneita manuaalisesti. Ohjelmoijat kirjoittivat eksplisiittisiä ohjeita jokaiselle liikkeelle. Kun jotain meni pieleen, he debuggasivat koodia ja lisäsivät uusia rivejä käsittelemään uusia tilanteita. Syväoppimisen on tarkoitus korvata tämä käsin kirjoitettu koodi joustavammalla VLA-mallilla. Suuri pullonkaula tällaisten mallien luomisessa – ja keskeinen syy sille, miksi robottien "ChatGPT-hetki" ei ole vielä saapunut – on koulutusdatan niukkuus.
Tutkijat keräävät tätä dataa kahdella pääasiallisella tavalla. Ensimmäinen on manuaalinen prosessi nimeltä teleoperaatio, jossa ihmiset ohjaavat robottia tarkassa tehtävässä, joskus satoja tuhansia kertoja. Jokainen tehtävä tallentaa datapaketin – mukaan lukien visuaalinen tieto, käden asento, vääntömomentti ja syvyys – joka tunnetaan "toimintosarjana" ja jota myöhemmin käytetään VLA:n kouluttamiseen. Tämä menetelmä on työvoimavaltaista, minkä vuoksi Galbot suosii toista lähestymistapaa: virtuaaliympäristöjen rakentamista. "Se on kuin Avatar", insinööri sanoi viitaten menestyselokuvaan. "Minun ei tarvitse fyysisesti astua taistelukentälle; vain makaan kapselissani ja voin simuloida kaiken."
Insinööri näytti meille videopätkiä todellisesta maailmasta, joissa Galbot-robotteja testattiin myymäläapulaisina, vanhustenhoitoseuraajina ja toimitusrobottikoirina, jotka liikkuvat vilkkaassa katuliikenteessä. Hän väitti, että toimitusrobotit voisivat olla valmiita "kahdessa-kolmen vuoden" sisällä, jos projektiin kohdistettaisiin riittävästi resursseja – vaikka he eivät olleetkaan vielä tehneet sitä päätöstä. Saatuaan tietää kaikista näistä mahdollisuuksista Chen tuskin piti innostustaan kurissa. Hän ehdotti suunnitelmaa Galbotin humanoidirobottien kouluttamiseksi ruuvaamaan ruuvia. Vaikka ihmistyöntekijät tekevät tämän vaistomaisesti, sen pilkkominen robotille paljastaa lukuisia mikropäätöksiä: reiän löytäminen, ruuvin kohdistaminen, oikean paineen ja vääntömomentin soveltaminen sekä tiedon siitä, milloin lopettaa. Insinööri kertoi Chenille, että Galbot-robotit osasivat jo tarttua työkaluihin kuten ruuvimeisseliin ja käsitellä niitä, mutta hän ei ollut vielä varma, pystyisivätkö ne käsittelemään tarkkaa kohdistamista – ruuvia tai tietämään, kuinka kovaa sitä pitää kiertää. "Määritellään vastuut", Chen rauhoitteli häntä. "Mitä voit luotettavasti hoitaa, ja mitä minä otan haltuuni."
He sopivat tavoitteesta: jotta Galbotin humanoidi olisi toimiva tehtaassa, sen täytyisi kiristää ruuvi alle kahdeksassa sekunnissa. Insinööri nojautui taaksepäin, hieman ylityöllistettynä. "Teillä on niin laaja-alainen insinööritaidon kirjo."
"Eri geenejä", Chen vastasi sujuvasti. "Voimme ratkaista teollisuuden ongelmat yhdessä."
Kokouksen jälkeen kävelin korttelin pohjoiseen läheiseen kauppakeskukseen, jonne Galbot oli asettanut yhden vähittäiskaupparoboteistaan mainoskojun taakse. Valkoista, mannekiinin kaltaista G1-mallia esiteltiin, ja ihmistyöntekijä seisoi lähistöllä varmuuden vuoksi. Tilasin tabletilla Pocari Sweat -japanilaista energiajuomaa. G1 kääntyi hyllyä kohti, sen mekaaniset käsivarret työntyivät esiin kuin siivet, kunnes yksi pinssi tarttui juomaani. Se asetti pullon tiskille hieman liian korkealta, joten juoma pomppasi muutaman senttimetrin sivulle, vaikka ei kaatunutkaan.
Koko yhteisen ajanamme Chen oli korostanut, että tämä teknologia kehittyy nopeammin kuin voin kuvitella. Mutta kokemukseni G1:n kanssa – joka oli pohjimmiltaan ylistetty, osaava automaatti – jätti minut skeptiseksi. Kaksi kuukautta myöhemmin helmikuussa katsoin kiinalaista uudenvuoden galaa asunnostani. Galbotin robotti esiintyi esinauhoitetussa osiossa, ja se näytti erilaiselta. Pinssit olivat poissa, korvattuina kymmenellä nivelisormella. Käsivarret eivät olleet enää kömpelöt vaan ketterät ja ihmismäiset. Kun robotti tarttui hyllyllä olevaan vesipulloon, se liikkui paljon nopeammin ja varmemmin kuin aiemmin. Kuinka paljon tästä oli editoitu tai lavastettu, en tiedä. Mutta sain maistaa sitä, mitä Chen tunsi.
Jos olet nähnyt kiinalaisen robotin tanssimassa tai tekemässä kungfuta, on todennäköistä, että sen on valmistanut Unitree. Viime vuonna yritys toimitti yli 5 500 humanoidirobottia, enemmän kuin mikään muu yritys maailmassa. Äskettäin virallinen video näytti kiinalaisen poptähden Wang Leehomin konsertin Chengdussa, jossa Unitree-robotit toimivat tanssijoiden taustalla. Elon Musk jakoi sen uudelleen yhdellä sanalla: "Vaikuttavaa." Nämä virtaavat esitykset ovat hyvää markkinointia Kiinalle, mutta Unitreen pääasiakkaat ovat laboratoriot ja yliopistot, mukaan lukien Oxford, Carnegie Mellon, UC San Diego ja Boston Dynamics, jotka ostavat robotteja ja kehittävät ohjelmistoja tehdäkseen niistä älykkäämpiä. Yhteyshenkilö kertoi minulle, että Unitree haluaa robottiensa lopulta päästä tehtaisiin ja koteihin "ottamaan vastuulleen vaarallista, toistuvaa ja ikävää työtä ihmisiltä".
Eräänä myöhäisenä iltana olin taksissa Ningbossa, kun sain viestin Unitreen yhteyshenkilöltä. Olimme suunnitelleet tapaavamme heidän päämajassaan Hangzhoussa seuraavana aamuna, mutta yritys oli äkillisesti ajanut "tärkeän tapahtuman", joka sulkisi kaikki tiet toimiston lähellä. Kiinassa ei ole montaa asiaa, joka pysäyttäisi liikenteen ja häiritsisi aikatauluja. Tarkistin puhelintani nähdäkseni, missä presidentti Xi Jinping oli: kaksi päivää aiemmin hän oli osallistunut urheilutapahtumaan Guangzhoussa, mutta ei ollut selvää, minne hän oli matkalla seuraavaksi. Yhteyshenkilö kysyi, voisinko tulla tänä iltana. Katsoin kelloa – se oli jo 19.32. "Olemme täällä", hän vakuutti. Kiirehdin rautatieasemalle.
Huolimatta maailmanlaajuisesta asemastaan, Unitreen päämaja on yllättävän vaatimaton. Yritys käyttää kahta kulunutta rakennusta Hangzhoun teknologiakaupunginosassa, vanhassa kompleksissa, jonka laidalla on autokauppiaita ja pieniä perheliikkeitä. Saavuttuani noin klo 21 useimmat Unitreen työntekijät olivat juuri pääsemässä töistä. Minua tervehtivät kolme mediasuhteiden edustajaa, jotka saattivat minut näyttelyalueelle, jossa odotti joukko robotteja. Yksi robotti heilutti puristuslakitettä yhdistelmiä heittäessään niin voimakkaasti, että astuin vaistomaisesti taaksepäin. Lähellä toinen robotti tanssi charlestonia. Seuraavaksi nelijalkainen robottikoira pyöri kierähdyksiä ja temppuja. Koko esittelyn ajan esittelijät potkivat robotteja kovaa, mutta koneet imivät jokaisen iskun kaatumatta.
Yksi Boston Dynamicsin kehittäjä, amerikkalainen kilpailija, kertoi minulle, että Unitreen laitteisto on erittäin kehittynyttä ja huomattavan edullista. Heidän robottinsa alkavat noin 1 600 dollarista, kun taas vastaavat amerikkalaiset mallit maksavat kymmeniä tuhansia. Boston Dynamicsin kehittäjä selitti Unitreen edun rakenteellisilla olosuhteilla. Kiinassa on kaksi laajaa metropolialuetta – Jangtse-joen suistoalue Shanghain lähellä ja Helmijoen suistoalue Shenzhenissä – joissa on tiheä laitteistotoimittajien verkosto. Robottivalmistajat voivat joskus kävellä naapuriin varaosien perässä. Robottiprototyypin säätäminen voi kestää Shenzhenissä alle päivän, mutta viikkoja Silicon Valleyssa, jossa osat saattavat joutua matkustamaan useiden osavaltioiden tai valtamerten halki. Tämä rakentamisen helppous auttaa myös selittämään, miksi Kiinassa on 330 erityyppistä humanoidirobottia. Se muuttaa luovan tuhoamisen rutiiniksi osaksi prosessia. "Kaupallistamme yhden sukupolven robotteja", sanoi Harry Xu, robottialan yrittäjä ja Tsinghuan yliopiston tutkija. Monet tuolta sukupolvelta epäonnistuvat väistämättä. "Sitten rakennamme seuraavan sukupolven."
Toinen tapa tarkastella humanoidirobottiteollisuutta Yhdysvalloissa ja Kiinassa on jatkumo. Toisessa päässä on yleiskäyttöinen humanoidi – scifi-visio koneesta, joka voi tehdä mitä tahansa, mitä ihminenkin. Toisessa päässä on robotti, joka on koulutettu tekemään yhden asian erittäin hyvin, uhraten monipuolisuuden kaupallisen luotettavuuden hyväksi. Useista syistä – kaupallistamispaine, valtion sopimukset, kova kilpailu, joka palkitsee erilaistumisen ja voiton puhtaamman tutkimuksen sijaan – kiinalaiset yritykset taipuvat kohti vaatimattomampaa, erikoistunutta päätä. Suuret amerikkalaiset teknologiayritykset, joita suojaa syvempi riskipääoma ja vähemmän välitön kaupallinen kiire, usein tähtäävät yleiskäyttöisten robottien pyhään Graaliin. Todennäköinen tulevaisuus on sellainen, jossa Yhdysvallat johtaa yleisten humanoidien kehitystä, kun taas Kiina toimittaa maailmalle edullisia, luotettavia robotteja, joista jokainen erikoistuu tiettyyn tehtävään. Yhdysvallat saattaa lopulta tuottaa yhden robotin, joka voi leikata nurmikosi, ulkoiluttaa koirasi ja lastenvahtisi lapsiasi. Mutta odotellessasi voit yhtä hyvin ostaa kolme kiinalaista robottia, joista jokainen hoitaa yhden tehtävän, murto-osalla hinnasta.
Käyntini jälkeisenä aamuna otin taksin takaisin Unitreen toimistoille nähdäkseni, mitä tapahtui. Lähialueen kortteli oli eristetty. Astuin ulos ja kävelin noin korttelin Unitreen pääportille, jossa kolme pukuista miestä vartioi, tarkkaillen jokaista ohikulkijaa. Kolmen mustan yleisen turvallisuuspakun takana en nähnyt mitään. Tarkistin puhelintani ja näin, että Xi Jinping oli 1 200 kilometrin päässä Pekingissä, isännöimässä Espanjan kuningas Felipe VI