La Cina sta attraversando una rivoluzione robotica trasformativa.

La Cina sta attraversando una rivoluzione robotica trasformativa.

Mantengono il controllo e l'equilibrio, ma non deviano dalla loro programmazione. La tecnologia che Galbot sta sviluppando è ciò che i robotici chiamano un modello visione-linguaggio-azione (VLA). Mira a permettere alle macchine di operare in ambienti non familiari e in cambiamento, proprio come gli umani. Attualmente, i robot di Galbot non riescono a svolgere in modo affidabile compiti semplici per gli umani, come lavare i piatti. Tuttavia, il fondatore Wang ha dichiarato ai media cinesi di puntare ad avere 10.000 robot che gestiscano lavori di base nel retail e in fabbrica entro tre anni. (Alcuni pionieri dell'IA, come Yann LeCun, sono molto scettici sul fatto che l'attuale approccio di deep learning possa raggiungere i risultati che aziende come Galbot sperano di ottenere.)

La visita di Chen aveva lo scopo di esplorare come i robot di Galbot potessero essere utilizzati all'interno di una fabbrica di veicoli elettrici, uno degli ambienti di produzione più complessi al mondo. Raggiungere questo obiettivo richiede di addestrare i robot su un vasto numero di scenari di fabbrica, ma non esiste un database pronto per questo. Affinché Galbot abbia una qualsiasi possibilità di schierare robot in un tale ambiente, hanno bisogno di uno specialista con decenni di esperienza nella produzione complessa. Questa persona deve definire i compiti giusti per il robot umanoide, specificare i dati di cui ha bisogno per apprendere e persino compensare ciò che il robot non è ancora in grado di fare. Questa è l'esperienza che Chen offre.

Abbiamo preso un ascensore fino alla cima di una torre e siamo entrati in una sala riunioni che si affaccia sul lussureggiante campus verde dell'Università di Pechino. Presto è arrivato un ingegnere senior di Galbot e ha iniziato a informare Chen sui progressi più recenti dell'azienda. Ha spiegato che i robot Galbot erano stati recentemente schierati in 10 farmacie di Pechino, dispensando farmaci 24 ore su 24. Alimentati da chip Nvidia, ogni robot costa circa 700.000 yuan (76.000 sterline). A un certo punto, l'ingegnere si è soffermato su una diapositiva che dettagliava la tecnologia alla base degli umanoidi di Galbot.

Prima dell'ascesa del deep learning, ha notato l'ingegnere, i robotici industriali come Chen addestravano le macchine manualmente. I programmatori scrivevano istruzioni esplicite per ogni movimento. Quando qualcosa andava storto, eseguivano il debug del codice e aggiungevano nuove righe per gestire nuove situazioni. Il deep learning promette di sostituire questo codice scritto a mano con il più flessibile modello VLA. Un grosso collo di bottiglia nella creazione di tali modelli – e una ragione chiave per cui il "momento ChatGPT" per i robot non è ancora arrivato – è la scarsità di dati di addestramento.

I ricercatori raccolgono questi dati principalmente in due modi. Il primo è un processo manuale chiamato teleoperazione, in cui gli umani guidano un robot attraverso un compito preciso, a volte centinaia di migliaia di volte. Ogni compito registra un pacchetto di dati – inclusi informazioni visive, posizionamento della mano, coppia e profondità – noto come "sequenza d'azione", che viene poi utilizzata per addestrare il VLA. Questo metodo è ad alta intensità di lavoro, motivo per cui Galbot preferisce il secondo approccio: costruire ambienti virtuali. "È come Avatar", ha detto l'ingegnere, riferendosi al film campione d'incassi. "Non devo fisicamente mettere piede sul campo di battaglia; mi sdraio semplicemente nella mia capsula e posso simulare tutto."

L'ingegnere ci ha mostrato video reali di robot Galbot testati come commessi di negozio, compagni per l'assistenza agli anziani e robot-cane per le consegne che navigano nel traffico stradale reale. Ha affermato che i robot per le consegne potrebbero essere pronti in "due o tre anni" se al progetto fossero dedicate risorse sufficienti – anche se non avevano ancora preso quella decisione. Dopo aver appreso di tutte queste possibilità, Chen riusciva a malapena a contenere la sua eccitazione. Ha proposto un piano per addestrare gli umanoidi di Galbot a guidare una vite. Mentre i lavoratori umani lo fanno istintivamente, scomporlo per un robot rivela numerose micro-decisioni: trovare il foro, allineare la vite, applicare la giusta pressione e coppia, e sapere quando fermarsi. L'ingegnere ha detto a Chen che i robot Galbot potevano già afferrare e manipolare strumenti come un cacciavite, ma non era ancora sicuro che potessero gestire l'allineamento preciso della vite, o sapere quanto forte girarla. "Definiamo le responsabilità", lo ha rassicurato Chen. "Ciò che puoi gestire in modo affidabile, e ciò che mi prenderò io."

Hanno concordato un obiettivo: affinché l'umanoide Galbot fosse fattibile in fabbrica, avrebbe dovuto serrare una vite in meno di otto secondi. L'ingegnere si è appoggiato allo schienale, leggermente sopraffatto. "Voi ragazzi avete una gamma così ampia di competenze ingegneristiche."

"Geni diversi", ha risposto Chen con disinvoltura. "Possiamo risolvere insieme i problemi del settore."

Dopo la riunione, ho camminato un isolato a nord fino a un centro commerciale vicino, dove Galbot aveva installato uno dei suoi robot per il retail dietro un chiosco promozionale. Il modello G1, bianco e simile a un manichino, era in esposizione, con un lavoratore umano di guardia in caso qualcosa andasse storto. Ho ordinato una Pocari Sweat, una bevanda energetica giapponese, da un tablet. Il G1 si è girato verso lo scaffale, le sue braccia meccaniche che sporgevano come ali, prima che una pinza afferrasse la mia bevanda. Ha posizionato la bottiglia sul bancone da un'altezza leggermente eccessiva, facendo rimbalzare la bevanda di qualche centimetro di lato, anche se non è caduta.

Durante tutto il tempo trascorso insieme, Chen aveva sottolineato che questa tecnologia stava avanzando più velocemente di quanto potessi immaginare. Ma la mia esperienza con il G1 – essenzialmente un distributore automatico glorificato e semi-competente – mi ha lasciato scettico. Due mesi dopo, a febbraio, ho guardato il galà del Capodanno Lunare dal mio appartamento. Il robot di Galbot è apparso in un segmento preregistrato, e sembrava diverso. Le pinze erano sparite, sostituite da dieci dita articolate. Le braccia non erano più ingombranti ma agili e simili a quelle umane. Quando il robot ha raggiunto una bottiglia d'acqua sullo scaffale, si è mosso molto più velocemente e con più sicurezza di prima. Quanto di questo fosse stato modificato o messo in scena, non lo so. Ma ho avuto un assaggio di ciò che Chen stava provando.

Se avete visto un robot cinese ballare o fare kung fu, è probabile che fosse prodotto da Unitree. L'anno scorso, l'azienda ha spedito oltre 5.500 robot umanoidi, più di qualsiasi altra azienda al mondo. Recentemente, un video virale mostrava il concerto del pop star cinese Wang Leehom a Chengdu, dove i robot Unitree facevano da ballerini di supporto. Elon Musk lo ha ripostato con una parola: "Impressionante". Queste esibizioni virali sono una buona pubblicità per la Cina, ma i principali clienti di Unitree sono laboratori e università, inclusi Oxford, Carnegie Mellon, UC San Diego e Boston Dynamics, che acquistano i robot e sviluppano software per renderli più intelligenti. Un portavoce mi ha detto che Unitree vuole che i suoi robot entrino eventualmente nelle fabbriche e nelle case per "svolgere lavori pericolosi, ripetitivi e noiosi per le persone".

Una sera tardi, ero in un taxi a Ningbo quando ho ricevuto un messaggio da un portavoce di Unitree. Avevamo pianificato di incontrarci nella loro sede di Hangzhou la mattina seguente, ma l'azienda aveva improvvisamente programmato un "evento importante" che avrebbe chiuso tutte le strade vicino all'ufficio. Non ci sono molte cose in Cina che possono fermare il traffico e sconvolgere gli orari. Ho controllato il telefono per vedere dove fosse il presidente Xi Jinping: due giorni prima, aveva partecipato a un evento sportivo a Guangzhou, ma non era chiaro dove si stesse dirigendo dopo. Il portavoce mi ha chiesto se potevo venire quella sera. Ho guardato l'ora – erano già le 19:32. "Saremo qui", mi ha assicurata. Sono corsa alla stazione ferroviaria.

Nonostante la sua statura globale, la sede di Unitree è sorprendentemente modesta. L'azienda occupa due edifici logorati nel distretto tecnologico di Hangzhou, all'interno di un vecchio complesso affiancato da concessionarie d'auto e piccoli negozi a gestione familiare. Quando sono arrivata verso le 21:00, la maggior parte dei dipendenti di Unitree stava appena finendo il lavoro. Sono stata accolta da tre addetti stampa che mi hanno scortata in un'area espositiva dove una serie di robot aspettava. Un robot con un casco da boxe viola ondeggiava mentre lanciava combinazioni con tale intensità che ho istintivamente fatto un passo indietro. Nelle vicinanze, un altro robot ballava il Charleston. Poi, un cane robotico a quattro zampe eseguiva una serie di capriole e acrobazie. Durante tutta la dimostrazione, i presentatori continuavano a dare calci forti ai robot, ma le macchine assorbivano ogni colpo senza ribaltarsi.

Uno sviluppatore di Boston Dynamics, un concorrente americano, mi ha detto che l'hardware di Unitree è altamente avanzato e notevolmente conveniente. I loro robot partono da circa 1.600 dollari, mentre modelli americani comparabili costano decine di migliaia. Lo sviluppatore di Boston Dynamics ha attribuito il vantaggio di Unitree a condizioni strutturali. La Cina ha due vasti hub metropolitani – il Delta del Fiume Yangtze vicino a Shanghai e il Delta del Fiume delle Perle a Shenzhen – che ospitano dense reti di fornitori di hardware. I produttori di robot a volte possono andare nella porta accanto per un pezzo di ricambio. Modificare un prototipo di robot può richiedere meno di un giorno a Shenzhen, ma settimane nella Silicon Valley, dove i componenti potrebbero dover viaggiare attraverso più stati o oceani. Questa facilità di costruzione aiuta anche a spiegare perché ci sono 330 diversi tipi di robot umanoidi in Cina. Trasforma la distruzione creativa in una parte routinaria del processo. "Commercializziamo una generazione di robot", ha detto Harry Xu, imprenditore robotico e ricercatore alla Tsinghua University. Molti di quella generazione inevitabilmente falliscono. "Poi costruiamo la generazione successiva."

Un altro modo per vedere le industrie della robotica umanoide negli Stati Uniti e in Cina è come uno spettro. A un'estremità c'è l'umanoide generico – la visione fantascientifica di una macchina che può fare tutto ciò che fa un umano. All'altra estremità c'è un robot addestrato a fare una cosa estremamente bene, sacrificando la versatilità per l'affidabilità commerciale. Per varie ragioni – pressione a commercializzare, contratti governativi, competizione intensa che premia la differenziazione e il profitto rispetto alla pura ricerca – le aziende cinesi tendono a essere attratte verso l'estremità più modesta e specializzata. Le principali aziende tecnologiche americane, protette da capitali di rischio più profondi e da un'urgenza commerciale meno immediata, spesso mirano al Sacro Graal dei robot generici. Un futuro plausibile è quello in cui gli Stati Uniti guidano lo sviluppo di umanoidi generalizzati, mentre la Cina fornisce al mondo robot convenienti e affidabili, ciascuno eccellente in un compito specifico. Gli Stati Uniti potrebbero eventualmente produrre un singolo robot che può tagliare il tuo prato, portare a spasso il tuo cane e fare da babysitter ai tuoi figli. Ma mentre aspetti, potresti anche comprare tre robot cinesi che gestiscono ciascuno un compito, a una frazione del prezzo.

La mattina dopo la mia visita, ho preso un taxi per tornare agli uffici di Unitree per vedere cosa stesse succedendo. L'isolato intorno al perimetro era stato transennato. Sono scesa e ho camminato per circa un isolato fino al cancello principale di Unitree, dove tre uomini in abito stavano di guardia, scrutando ogni passante. Oltre tre furgoni neri della sicurezza pubblica, non riuscivo a vedere nulla. Ho controllato il telefono e ho visto che Xi Jinping era a 750 miglia di distanza a Pechino, ospitando una visita del re Felipe VI di Spagna. Ho attraversato la strada e ho chiamato un altro taxi. Una volta dentro, l'autista era curioso se avessi visto qualcosa fuori dalla fabbrica. Aveva appena lasciato un dipendente di Unitree e si è affrettato a speculare: "Devono esserci delle unità militari dentro."

La sua ipotesi era ragionevole. Due anni fa, la televisione di stato cinese ha trasmesso filmati di esercitazioni militari che mostravano cani robot Unitree equipaggiati con mitragliatrici. I legislatori americani hanno suggerito di tagliare Unitree dalle tecnologie statunitensi come i semiconduttori. Unitree sostiene di non vendere ai militari né di approvare modifiche militari da parte di terzi, ma un'azienda di analisi con sede negli Stati Uniti afferma che Unitree vende a università cinesi che hanno contratti con i militari. Questo scrutinio ha colpito l'industria robotica cinese. Un portavoce di una delle principali aziende robotiche mi ha detto che le autorità li avevano avvertiti di non parlare con i media occidentali. Quando ho chiesto ai portavoce di Unitree chi fossero i clienti dell'azienda e se vendessero più robot all'estero o in Cina, l'azienda ha semplicemente risposto: "Facciamo entrambe le cose." Più tardi, quando ho chiesto chiarimenti, Unitree ha spiegato che la presenza di sicurezza che avevo visto non era legata ai militari – era una delegazione governativa in visita per conoscere i loro robot.

Nella stessa settimana in cui ho visitato Galbot con Chen Liang, mi sono recata alla periferia di Pechino in quello che il governo municipale chiama il "più grande centro di addestramento robotico della Cina". Il centro è gestito da Leju Robotics, un'azienda i cui robot apprendono non da simulazioni ma da esempi reali forniti da raccoglitori di dati umani, o teleoperatori. Il robot umanoide di punta di Leju, Kuavo, è già utilizzato in alcune fabbriche di veicoli elettrici in tutta la Cina per compiti di base come sbloccare scatole di cartone.

Nell'atrio, un grande monitor a parete mostrava una mappa della Cina con cinque punti rossi luminosi che segnavano ogni città in cui Leju ha un centro di addestramento. Accanto a ogni punto c'era il numero di sequenze d'azione raccolte in quel sito. Il sito più grande era qui a Pechino, dove circa 100 teleoperatori erano disposti in file ordinate in un angolo separato di un magazzino. Ogni postazione di lavoro aveva due persone assegnate a un robot, che eseguivano compiti diversi come pulire un tavolo, organizzare le posate o spostare un bicchiere d'acqua. Al piano superiore, i teleoperatori addestravano i robot su compiti industriali come ordinare e imballare scatole. Leju e le sue affiliate vendono alcuni di questi dati a terzi e ne hanno anche rilasciato pubblicamente una parte – 100 ore – per i ricercatori internazionali da utilizzare per affinare i modelli visione-linguaggio-azione.

Dal lato della stanza, ho osservato un lavoratore che indossava un visore simile a quello VR guid