Zachowują kontrolę i równowagę, ale nie odbiegają od swojego programowania. Technologia, którą rozwija Galbot, to to, co robotycy nazywają modelem wzrokowo-językowo-działaniowym (VLA). Ma on umożliwić maszynom działanie w nieznanych i zmieniających się środowiskach, podobnie jak ludziom. Obecnie roboty Galbota nie potrafią niezawodnie wykonywać zadań prostych dla ludzi, takich jak zmywanie naczyń. Jednak założyciel Wang powiedział chińskim mediom, że w ciągu trzech lat chce, aby 10 000 robotów wykonywało podstawowe prace w handlu detalicznym i fabrykach. (Niektórzy pionierzy AI, jak Yann LeCun, są bardzo sceptyczni, czy obecne podejście głębokiego uczenia może osiągnąć rezultaty, na jakie liczą firmy takie jak Galbot).
Wizyta Chena miała na celu zbadanie, jak roboty Galbota mogłyby być wykorzystane wewnątrz fabryki pojazdów elektrycznych – jednego z najbardziej złożonych środowisk produkcyjnych na świecie. Osiągnięcie tego wymaga przeszkolenia robotów na ogromnej liczbie scenariuszy fabrycznych, ale nie ma gotowej bazy danych do tego celu. Aby Galbot miał jakąkolwiek szansę na wdrożenie robotów w takim środowisku, potrzebuje specjalisty z dziesięcioleciami doświadczenia w złożonej produkcji. Ta osoba musi zdefiniować odpowiednie zadania dla humanoidalnego robota, określić dane, których potrzebuje on do nauki, a nawet kompensować to, czego robot jeszcze nie potrafi. To właśnie jest ekspertyza, którą oferuje Chen.
Wjechaliśmy windą na szczyt wieży i weszliśmy do sali konferencyjnej z widokiem na bujny zielony kampus Uniwersytetu Pekińskiego. Wkrótce przybył starszy inżynier Galbota i zaczął informować Chena o najnowszych postępach firmy. Wyjaśnił, że roboty Galbota zostały niedawno wdrożone w 10 pekińskich aptekach, wydając leki 24 godziny na dobę. Napędzane chipami Nvidii, każdy robot kosztuje około 700 000 juanów (76 000 funtów). W pewnym momencie inżynier zatrzymał się na slajdzie szczegółowo opisującym technologię stojącą za humanoidami Galbota.
Inżynier zauważył, że przed wzrostem znaczenia głębokiego uczenia, robotycy przemysłowi tacy jak Chen szkolili maszyny ręcznie. Programiści pisali wyraźne instrukcje dla każdego ruchu. Gdy coś poszło nie tak, debugowali kod i dodawali nowe linie, aby radzić sobie z nowymi sytuacjami. Głębokie uczenie obiecuje zastąpić ten ręcznie pisany kod bardziej elastycznym modelem VLA. Głównym wąskim gardłem w tworzeniu takich modeli – i kluczowym powodem, dla którego "moment ChatGPT" dla robotów jeszcze nie nadszedł – jest niedobór danych treningowych.
Badacze zbierają te dane na dwa główne sposoby. Pierwszy to ręczny proces zwany teleoperacją, w którym ludzie prowadzą robota przez precyzyjne zadanie, czasem setki tysięcy razy. Każde zadanie rejestruje pakiet danych – w tym informacje wizualne, pozycjonowanie dłoni, moment obrotowy i głębię – znany jako "sekwencja działań", który jest później używany do trenowania VLA. Ta metoda jest pracochłonna, dlatego Galbot preferuje drugie podejście: budowanie środowisk wirtualnych. "To jak **Avatar**" – powiedział inżynier, odnosząc się do kasowego filmu. "Nie muszę fizycznie wchodzić na pole bitwy; po prostu leżę w mojej kapsule i mogę symulować wszystko".
Inżynier pokazał nam rzeczywiste filmy z testami robotów Galbota jako sprzedawców sklepowych, towarzyszy opieki dla osób starszych i psów-robotów dostawczych poruszających się w prawdziwym ruchu ulicznym. Twierdził, że roboty dostawcze mogłyby być gotowe za "dwa do trzech lat", gdyby poświęcono wystarczające zasoby na ten projekt – choć jeszcze takiej decyzji nie podjęli. Po poznaniu wszystkich tych możliwości Chen ledwo mógł powstrzymać swoją ekscytację. Zaproponował plan przeszkolenia humanoidów Galbota do wkręcania śruby. Podczas gdy ludzcy pracownicy robią to instynktownie, rozbicie tego na części dla robota ujawnia liczne mikro-decyzje: znalezienie otworu, wyrównanie śruby, zastosowanie odpowiedniego nacisku i momentu obrotowego oraz wiedza, kiedy przestać. Inżynier powiedział Chenowi, że roboty Galbota potrafią już chwytać i manipulować narzędziami takimi jak śrubokręt, ale nie był jeszcze pewien, czy poradzą sobie z precyzyjnym wyrównaniem śruby lub wiedzą, jak mocno ją obrócić. "Zdefiniujmy odpowiedzialności" – uspokoił go Chen. "To, co ty możesz niezawodnie obsłużyć, i to, co ja przejmę".
Uzgodnili cel: aby humanoid Galbota był opłacalny w fabryce, musiałby przykręcić śrubę w czasie poniżej ośmiu sekund. Inżynier odchylił się, lekko przytłoczony. "Macie tak szeroki zakres wiedzy inżynierskiej".
"Różne geny" – płynnie odpowiedział Chen. "Możemy razem rozwiązywać problemy branży".
Po spotkaniu przeszedłem blok na północ do pobliskiego centrum handlowego, gdzie Galbot ustawił jednego ze swoich robotów handlowych za stoiskiem promocyjnym. Na pokazie był biały, manekinopodobny model G1, a w pobliżu stał ludzki pracownik na wypadek problemów. Zamówiłem z tabletu Pocari Sweat, japoński napój energetyczny. G1 obrócił się w stronę półki, jego mechaniczne ramiona wystawały jak skrzydła, zanim jedno szczypce chwyciło mój napój. Postawił butelkę na ladzie z nieco za dużej wysokości, więc napój odbił się kilka centymetrów w bok, choć nie przewrócił się.
Podczas całego naszego spotkania Chen podkreślał, że ta technologia rozwija się szybciej, niż mogłem sobie wyobrazić. Ale moje doświadczenie z G1 – będącym w zasadzie glorifikowanym, półkompetentnym automatem sprzedającym – pozostawiło mnie sceptycznym. Dwa miesiące później, w lutym, oglądałem galę z okazji Chińskiego Nowego Roku ze swojego mieszkania. Robot Galbota pojawił się w nagranym wcześniej segmencie i wyglądał inaczej. Szczypce zniknęły, zastąpione przez dziesięć artykułowanych palców. Ramiona nie były już nieporęczne, lecz smukłe i podobne do ludzkich. Gdy robot sięgał po butelkę wody na półce, poruszał się znacznie szybciej i pewniej niż wcześniej. Nie wiem, ile z tego było zmontowane lub zaaranżowane. Ale poczułem to, co czuł Chen.
Jeśli widziałeś chińskiego robota tańczącego lub uprawiającego kung-fu, istnieje szansa, że został wykonany przez Unitree. W zeszłym roku firma wysłała ponad 5500 robotów humanoidalnych, więcej niż jakakolwiek inna firma na świecie. Niedawno wiralowy film pokazał koncert chińskiej gwiazdy pop Wang Leehom w Chengdu, gdzie roboty Unitree służyły jako tancerze wspierający. Elon Musk udostępnił go ponownie z jednym słowem: "Imponujące". Te wiralowe występy to dobry marketing dla Chin, ale głównymi klientami Unitree są laboratoria i uniwersytety, w tym Oxford, Carnegie Mellon, UC San Diego i Boston Dynamics, które kupują roboty i rozwijają oprogramowanie, aby uczynić je bardziej inteligentnymi. Rzecznik powiedział mi, że Unitree chce, aby ich roboty ostatecznie trafiły do fabryk i domów, aby "przejmować dla ludzi niebezpieczną, powtarzalną i żmudną pracę".
Pewnego późnego wieczoru byłem w taksówce w Ningbo, gdy otrzymałem wiadomość od rzecznika Unitree. Planowaliśmy spotkać się w ich siedzibie w Hangzhou następnego ranka, ale firma nagle zaplanowała "ważne wydarzenie", które zamknie wszystkie drogi w pobliżu biura. W Chinach nie ma wielu rzeczy, które mogą zatrzymać ruch i zakłócić plany. Sprawdziłem telefon, aby zobaczyć, gdzie jest prezydent Xi Jinping: dwa dni wcześniej uczestniczył w wydarzeniu sportowym w Guangzhou, ale nie było jasne, dokąd zmierza dalej. Rzecznik zapytał, czy mogę przyjechać dziś wieczorem. Spojrzałem na czas – była już 19:32. "Będziemy tutaj" – zapewniła mnie. Pospieszyłem na dworzec kolejowy.
Pomimo swojej światowej pozycji, siedziba Unitree jest zaskakująco skromna. Firma zajmuje dwa zniszczone budynki w dzielnicy technologicznej Hangzhou, wewnątrz starego kompleksu otoczonego dealerami samochodów i małymi rodzinnymi sklepami. Gdy przybyłem około 21:00, większość pracowników Unitree właśnie kończyła pracę. Przywitali mnie trzej przedstawiciele mediów, którzy zaprowadzili mnie do strefy wystawowej, gdzie czekał szereg robotów. Jeden robot w purpurowym kasku bokserskim kiwał się, zadając kombinacje ciosów z taką intensywnością, że instynktownie się cofnąłem. W pobliżu inny robot tańczył charlestona. Następnie czworonożny robot-pies wykonywał przewroty i sztuczki. Podczas całej demonstracji prezentujący ciągle mocno kopali roboty, ale maszyny absorbowały każdy cios bez przewracania się.
Jeden deweloper z Boston Dynamics, amerykańskiego konkurenta, powiedział mi, że sprzęt Unitree jest wysoce zaawansowany i niezwykle przystępny cenowo. Ich roboty zaczynają się od około 1600 dolarów, podczas gdy porównywalne amerykańskie modele kosztują dziesiątki tysięcy. Deweloper z Boston Dynamics przypisał przewagę Unitree warunkom strukturalnym. Chiny mają dwie rozległe metropolitalne ośrodki – deltę Rzeki Jangcy w pobliżu Szanghaju i deltę Rzeki Perłowej w Shenzhen – które hostują gęste sieci dostawców sprzętu. Producenci robotów czasem mogą pójść do sąsiada po zamienną część. Modyfikacja prototypu robota może zająć mniej niż dzień w Shenzhen, ale tygodnie w Dolinie Krzemowej, gdzie części mogą musieć podróżować przez wiele stanów lub oceanów. Ta łatwość budowania również pomaga wyjaśnić, dlaczego w Chinach istnieje 330 różnych typów robotów humanoidalnych. Zamienia to twórczą destrukcję w rutynową część procesu. "Komercyjnie wdrażamy jedną generację robotów" – powiedział Harry Xu, przedsiębiorca robotyczny i badacz z Uniwersytetu Tsinghua. Wielu z tej generacji nieuchronnie upada. "Potem budujemy następną generację".
Innym sposobem spojrzenia na branżę robotyki humanoidalnej w USA i Chinach jest widzenie jej jako spektrum. Na jednym końcu znajduje się humanoid ogólnego przeznaczenia – wizja sci-fi maszyny, która może zrobić wszystko, co człowiek. Na drugim końcu jest robot wyszkolony do robienia jednej rzeczy wyjątkowo dobrze, poświęcając wszechstronność dla komercyjnej niezawodności. Z różnych powodów – presji na komercjalizację, kontraktów rządowych, intensywnej konkurencji, która nagradza różnicowanie i zysk ponad czyste badania – chińskie firmy mają tendencję do ciągnięcia w stronę skromniejszego, wyspecjalizowanego końca. Główne amerykańskie firmy technologiczne, chronione głębszym kapitałem wysokiego ryzyka i mniejszą bezpośrednią presją komercyjną, często celują w świętego Graala robotów ogólnego przeznaczenia. Prawdopodobną przyszłością jest taka, w której USA prowadzą rozwój uogólnionych humanoidów, podczas gdy Chiny zaopatrują świat w przystępne cenowo, niezawodne roboty, każdy doskonały w konkretnym zadaniu. USA mogą ostatecznie wyprodukować jednego robota, który może kosić twój trawnik, wyprowadzać psa i opiekować się dziećmi. Ale podczas gdy czekasz, możesz równie dobrze kupić trzy chińskie roboty, z których każdy wykonuje jedno zadanie, za ułamek ceny.
Rankiem po mojej wizycie wziąłem taksówkę z powrotem do biur Unitree, aby zobaczyć, co się dzieje. Blok wokół obwodu został odgrodzony. Wysiadłem i przeszedłem około bloku do bramy głównej Unitree, gdzie trzech umundurowanych mężczyzn stało na straży, skanując każdego przechodnia. Poza trzema czarnymi furgonetkami służb publicznych nie widziałem niczego. Sprawdziłem telefon i zobaczyłem, że Xi Jinping jest 750 mil dalej w Pekinie, goszcząc wizytę króla Hiszpanii Filipa VI. Przeszedłem przez ulicę i zatrzymałem kolejną taksówkę. Gdy już wsiadłem, kierowca był ciekaw, czy widziałem coś na zewnątrz fabryki. Właśnie wysadził pracownika Unitree i szybko spekulował: "Musi być wewnątrz grupa wojskowa".
Jego przypuszczenie było rozsądne. Dwa lata temu chińska telewizja państwowa wyemitowała nagrania z ćwiczeń wojskowych pokazujących psy-roboty Unitree wyposażone w karabiny maszynowe. Amerykańscy ustawodawcy sugerowali odcięcie Unitree od amerykańskich technologii, takich jak półprzewodniki. Unitree utrzymuje, że nie sprzedaje wojsku ani nie popiera modyfikacji wojskowych przez strony trzecie, ale jedna amerykańska firma analityczna twierdzi, że Unitree sprzedaje chińskim uniwersytetom, które współpracują z wojskiem. Ta kontrola wpłynęła na chiński przemysł robotyczny. Rzecznik wiodącej firmy robotycznej powiedział mi, że władze ostrzegły ich, aby nie rozmawiać z zachodnimi mediami. Kiedy zapytałem rzeczników Unitree o klientów firmy i czy sprzedają więcej robotów za granicą czy w Chinach, firma po prostu odpowiedziała: "Robimy obie rzeczy". Później, gdy dopytywałem, Unitree wyjaśniło, że obecność służb, którą widziałem, nie była związana z wojskiem – była to delegacja rządowa odwiedzająca, aby dowiedzieć się o ich robotach.
W tym samym tygodniu, w którym odwiedziłem Galbota z Chenem Liangiem, pojechałem na obrzeża Pekinu do tego, co władze miasta nazywają "największym centrum szkoleniowym robotów w Chinach". Centrum jest prowadzone przez Leju Robotics, firmę, której roboty uczą się nie z symulacji, ale z rzeczywistych przykładów dost