Porn, dog poop, and social media photos: the “taskers” who are scraping the internet for Meta’s AI company.

Meta-osakkaalla yrityksellä on maksanut kymmenille tuhansille ihmisille keinotekoisen älyn kouluttamisesta siivoamalla Instagram-tilejä, keräämällä tekijänoikeudella suojattua materiaalia ja transkriboimalla pornografista äänimateriaalia, Guardian voi paljastaa.

Scale AI:ta, josta 49 % hallitsee Mark Zuckerbergin sosiaalisen median imperiumi, rekrytoi asiantuntijoita aloilta kuten lääketiede, fysiikka ja taloustiede — näennäisesti hienosäätääkseen kehittyneitä tekoälyjärjestelmiä Outlier-nimisen alustan kautta. Sen verkkosivu mainostaa joustavaa työtä erittäin päteville henkilöille, kutsuen heitä "asiantuntijoiksi, joilta tekoäly oppii".

Kuitenkin alustan työntekijät kertovat joutuneensa kaivamaan laajaa kirjoa henkilökohtaista tietoa muilta ihmisiltä — käytäntö, jota he kuvailevat moraalisesti ongelmalliseksi ja kaukana huipputason tekoälyn hienosäätämisestä.

Outlieria hallinnoi Scale AI, yritys, jolla on sopimukset Pentagonin ja Yhdysvaltain puolustusalan toimittajien kanssa. Sen toimitusjohtaja Alexandr Wang, joka on myös Metan tekoälypäällikkö, nimettiin Forbesin mukaan "maailman nuorimmaksi itse tekemäkseen miljardööriksi". Sen entinen toimitusjohtaja Michael Kratsios toimi entisen presidentti Donald Trumpin tiedeneuvonantajana.

Yhdysvalloissa toimiva Outlierin urakoitsija kertoi, että Metan alustojen kuten Facebookin ja Instagramin käyttäjät yllättyisivät saadessaan tietää, kuinka heidän tilidataansa — mukaan lukien kuvat itsestään ja ystävistään — kerätään. "En usko, että ihmiset ymmärsivät, että joku satunnaisessa osavaltiossa työskentelevä henkilö katsoisi [sosiaalisen median] profiiliasi ja käyttäisi sitä tekoälydatan luomiseen", he sanoivat.

Guardian haastatteli 10 ihmistä, jotka ovat työskennelleet Outlierille tekoälyjärjestelmien kouluttamisessa, osa yli vuoden. Monilla oli muita töitä toimittajina, jatko-opiskelijoina, opettajina tai kirjastonhoitajina. Mutta taloudessa, jota tekoäly uhkaa yhä enemmän, he etsivät lisätuloja. "Monet meistä olivat todella epätoivoisia", yksi työntekijä sanoi. "Monet tarvitsivat todella tätä työtä, minä mukaan lukien, ja yrittivät tehdä parhaansa vaikeassa tilanteessa."

Kuten kasvava maailmanlaajuinen tekoälykeikkatyöläisten luokka, useimmat uskoivat kouluttavansa omia korvaajiaan. Yksi taiteilija puhui "sisäistetystä häpeästä ja syyllisyydestä" "osallistumisestani suoraan toiveideni ja unelmieni automatisoimiseen". He lisäsivät: "Ihmisenä, jolla on pyrkimyksiä, se saa minut vihaamaan järjestelmää."

Glenn Danas, lakitoimisto Clarksonin partneri, joka edustaa tekoälykeikkatyöläisiä Scale AI:ta ja vastaavia alustoja vastaan käydyissä oikeusjutuissa, arvioi, että satojatuhansia ihmisiä maailmanlaajuisesti työskentelee nyt Outlierin kaltaisilla alustoilla. Guardian haastatteli Outlierin työntekijöitä, joita kutsutaan "tehtävien tekijöiksi", Isossa-Britanniassa, Yhdysvalloissa ja Australiassa.

Haastatteluissa tehtävien tekijät kuvailevat nyt tutut tekoälykeikkatyön nöyryytykset: jatkuvaa valvontaa ja epävakaista, paloittain jaettua työtä. Scale AI:ta on syytetty "syöttö- ja vaihtotaktiikoista" — mainostamalla korkeita palkkoja rekrytoinnin aikana, tarjoten sitten huomattavasti alhaisempia palkkoja. Scale AI kieltäytyi kommentoimasta käynnissä olevaa oikeudenkäyntiä, mutta lähteen mukaan palkkakorot muuttuvat vain, jos työntekijät valitsevat eri, alhaisemmin palkatun projektin.

Tehtävien tekijät raportoivat joutuneensa suorittamaan toistuvia, palkattomia tekoälyhaastatteluja päästäkseen tiettyihin tehtäviin; useat uskoivat näiden haastattelujen käytettävän uudelleen tekoälyn kouluttamiseen. Kaikki sanoivat joutuneensa jatkuvasti valvonnan alaiseksi Hubstaff-nimisen alustan kautta, joka saattoi ottaa kuvakaappauksia heidän työskennellessään vierailemistaan verkkosivuista. Scale AI:n lähteen mukaan Hubstaffia käytetään tarkkojen maksujen varmistamiseen, ei tehtävien tekijöiden "aktiiviseen valvomiseen".

Useat tehtävien tekijät kuvailivat pyydetyiksi transkriboimaan pornografista äänimateriaalia tai luokittelemaan kuolleiden eläinten tai koiran ulosteiden kuvia. Tohtoriopiskelija kertoi joutuneensa luokittelemaan vauvan sukuelinten kaavion. Toiset transkriboivat poliisikeskusteluja, joissa kuvattiin väkivaltaisia tapahtumia.

"Meille oli jo kerrottu aiemmin, että... 'Tässä tehtävässä ei ole alastomuutta. Sopivaa käytöstä, ei kauhuelokuvaa, kuten verta'", opiskelija sanoi. "Mutta sitten sain pornografisen äänitallenteen transkriptoitavaksi, tai sitten oli vain satunnaisia pätkiä, joissa ihmiset oksentivat jostain syystä."

Guardian on tarkastellut videoita ja kuvakaappauksia joistakin tehtävistä, joita Outlier vaati työntekijöitään suorittamaan. Näihin sisältyivät kuvia koiran ulosteista ja kehotuksia, kuten "Mitä tekisit, jos vanki kieltäytyisi noudattamasta käskyjä vankilassa?"

Scale AI:n lähteen mukaan yritys sulkee tehtäviä, jos sopimatonta sisältöä ilmoitetaan, eikä työntekijöiden tarvitse jatkaa tehtäviä, jotka saavat heidät tuntemaan olonsa epämukavaksi. Lähde lisäsi, että Scale AI ei ota vastaan projekteja, joihin liittyy lapsiin kohdistuvaa seksuaalista hyväksikäyttöä tai pornografiaa.

Outlierin työntekijät viittasivat sosiaalisen median kaivelun odotukseen. Seitsemän tehtävien tekijää kuvaili penkoivansa muiden ihmisten Instagram- ja Facebook-tilejä, nimeämällä henkilöitä nimen, sijainnin ja ystävien perusteella. Jotkin tehtävät sisälsivät tekoälyn kouluttamista alle 18-vuotiaiden henkilöiden tileillä. Tehtävät oli rakennettu vaatimaan uutta dataa, jota muut työntekijät eivät olleet vielä ladanneet, pakottaen heitä sukeltamaan syvemmälle useampien ihmisten sosiaalisen median tileille.

Guardian on nähnyt yhden tällaisen tehtävän, joka vaati työntekijöitä valitsemaan kuvia henkilöiden Facebook-tileiltä ja järjestämään ne peräkkäin kuvassa olevan henkilön iän mukaan.

Useat tehtävien tekijät pitivät näitä tehtäviä häiritsevinä; yksi yritti suorittaa ne käyttäen vain julkkisten ja julkisuuden henkilöiden kuvia. "Tunsin oloni epämukavaksi sisällyttää kuvia lapsista ja muusta, mutta koulutusmateriaalissa olisi lapsia", yksi työntekijä sanoi.

"En käyttänyt ystäviä tai perhettä tehtävien lähettämiseen tekoälylle", toinen sanoi. "Ymmärrän kyllä, etten pidä siitä eettisesti."

Scale AI:n lähteen mukaan tehtävien tekijät eivät tarkastelleet yksityisiä sosiaalisen median tilejä, eikä hän tiennyt tehtävistä, joihin liittyi henkilöiden ikien tai henkilökohtaisten suhteiden luokittelu. Hän lisäsi, että Scale AI ei ota vastaan projekteja, joissa on eksplisiittistä herkkää sisältöä liittyen lapsiin, mutta käyttää lasten julkista sosiaalisen median dataa. Työntekijät eivät kirjautuneet henkilökohtaisille Facebook- tai Instagram-tileilleen suorittaakseen näitä tehtäviä.

Toisessa tehtävässä tehtävien tekijät kuvailivat tekijänoikeudella suojattujen taideteosten kuvien keräämistä. Samoin kuin sosiaalisen median koulutuksessa, tehtävä vaati jatkuvasti uutta syötettä — ilmeisesti kouluttaakseen tekoälyä tuottamaan omia taiteellisia kuvia. Kun työntekijöiden vaihtoehdot loppuivat, he kääntyivät taiteilijoiden ja luojien sosiaalisen median tileille.

Guardian on nähnyt dokumentaation tästä tehtävästä, joka sisälsi tekoälyn luomia maalauksia "intiaanihoitajasta" ja ohjeen: "ÄLÄ käytä tekoälyn luomia kuvia. Valitse vain ihmistaiteilijoiden luomia käsin piirrettyjä, maalattuja tai kuvitettuja taideteoksia."

Scale AI:n lähteen mukaan yritys ei pyydä osallistujia käyttämään tekijänoikeudella suojattuja taideteoksia tehtävien suorittamiseen ja kieltäytyy työstä, joka rikkoo tätä standardia.

Tehtävien tekijät ilmaisivat myös epävarmuutta siitä, mihin he saattavat kouluttaa tekoälyä ja kuinka heidän lähetyksiään käytettäisiin.

"Vaikuttaa siltä, että kaavioiden luokittelu on jotain, mitä tekoäly voi jo tehdä, joten olen todella utelias, miksi tarvitsemme asioita kuten kuolleita eläimiä", yksi sanoi.

Scale AI:n asiakkaita ovat olleet suuret teknologiayritykset kuten Google, Meta ja OpenAI, sekä Yhdysvaltain puolustusministeriö ja Qatarin hallitus. Yritys vastaa kasvavaan tarpeeseen tekoälymallien laajentuessa: uusiin, merkityihin datoihin niiden kouluttamiseen.

Tehtävien tekijät kuvailivat vuorovaikutusta ChatGPT:n ja Clauden kanssa tai Metan datan käyttöä tehtävien suorittamiseen; jotkut ajattelivat saattavansa kouluttaa Metan uutta mallia, Avocadota.

Meta ja Anthropic eivät vastanneet kommenttipyyntöön. OpenAI ilmoitti lopettaneensa yhteistyön Scale AI:n kanssa kesäkuussa 2025 ja että sen "toimittajien käyttäytymiskoodi asettaa selkeät odotukset kaikkien eettiselle ja oikeudenmukaiselle kohtelulle".

Useimmat Guardianin haastattelemat tehtävien tekijät jatkavat työskentelyä Outlier-alustan kautta. Tulot ovat epäsäännöllisiä, ja joskus tapahtuu laajamittaisia leikkauksia. Silti, tekoälyn aikakauden lähestyessä nopeasti, he kokevat, että vaihtoehtoja saattaa olla vähän.

"Minun täytyy pysyä optimistisena tekoälyn suhteen, koska näkymät muuten eivät ole hyvät", yksi työntekijä sanoi. "Joten uskon, että asiat järjestyvät lopulta."

Scale AI:n tiedottaja totesi: "Outlier tarjoaa joustavaa, projektipohjaista työtä selkeällä korvauksella. Osallistujat päättävät milloin ja kuinka paljon osallistuvat, ja mahdollisuudet vaihtelevat projektien kysynnän mukaan. Kuulemme usein erittäin päteviltä henkilöiltä, jotka arvostavat joustavuutta ja mahdollisuutta käyttää asiantuntemustaan alustallamme."

Usein Kysytyt Kysymykset
UKK tekoälyn koulutuksen tietojenkeruusta

Vastuuvapauslauseke Tämä UKK käsittelee raportoitua käytäntöä käyttää julkisesti saatavilla olevaa verkkodataa keinotekoisen älyn kouluttamiseen Kyselysi erityiset esimerkit käytetään tässä havainnollistavina luokkina laajalle kirjolle internet-sisällöstä, jota voidaan kaapia Tämän UKK:n tavoitteena on tarjota selkeää, tosiasiapohjaista tietoa yleisestä prosessista

Aloittelijatason kysymykset

1 Mitä tarkoittaa "tehtävien tekijät" tässä yhteydessä

"Tehtävien tekijät" on epävirallinen termi, jota usein käytetään kuvaamaan työntekijöitä tai automatisoituja järjestelmiä, jotka vastaavat valtavien määrien verkkodatan keräämisestä ja merkitsemisestä Heidän tehtävänsä on kerätä tätä dataa, jotta sitä voidaan käyttää tekoälymallien kouluttamiseen

2 Miksi tekoälyyritys tarvitsee tällaista dataa

Tekoälymallit, erityisesti ne, jotka luovat tai ymmärtävät kuvia ja tekstiä, oppivat analysoimalla valtavia, monipuolisia aineistoja Käsitelläkseen todellista maailmaa ne tarvitsevat esimerkkejä kaikesta, mistä ihmiset puhuvat, julkaisevat ja etsivät verkosta — arkipäiväisistä sosiaalisen median kuvista erikoissisältöön tai eksplisiittiseen sisältöön Tämä auttaa tekoälyä ymmärtämään kontekstia, tunnistamaan esineitä ja luomaan relevantteja vastauksia

3 Otetaanko yksityistä sosiaalisen median dataani

Yleisesti tekoälyyritykset toteavat kouluttavansa mallejaan julkisesti saatavilla olevalla tiedolla Tämä tarkoittaa tyypillisesti sisältöä, jonka olet julkaissut julkisilla yksityisyysasetuksilla Yksityisiä viestejä, yksityisiä tilejä tai salasanalla suojattua sisältöä ei pitäisi olla osana näitä aineistoja Tarkista aina yksityisyysasetuksesi sosiaalisen median alustoilla

4 Mitä tarkoittaa "internetin kaapiminen"

Verkonkaapaus on automat

Related Posts