Ett företag som delvis Àgs av Meta har betalat tiotusentals mÀnniskor för att trÀna artificiell intelligens genom att gÄ igenom Instagram-konton, samla in upphovsrÀttsskyddat material och transkribera pornografiska ljudinspelningar, kan The Guardian avslöja.
Scale AI, som till 49 procent kontrolleras av Mark Zuckerbergs sociala medieföretag, rekryterade experter inom omrĂ„den som medicin, fysik och ekonomi â förment för att förfina avancerade AI-system via en plattform kallad Outlier. Dess webbplats annonserar flexibelt arbete för högkvalificerade individer och uppmanar dem att "Bli experten som AI lĂ€r sig av."
Men arbetare pĂ„ plattformen sĂ€ger att de har dragits in i att skrapa ett brett spektrum av personuppgifter frĂ„n andra mĂ€nniskor â en praxis de beskriver som moraliskt problematisk och lĂ„ngt ifrĂ„n att förfina högklassig AI.
Outlier drivs av Scale AI, ett företag som har kontrakt med Pentagon och amerikanska försvarsleverantörer. Dess VD, Alexandr Wang, som ocksÄ Àr Metas chef för AI, betecknades av Forbes som "vÀrldens yngsta sjÀlvgjorda miljardÀr." Dess tidigare verkstÀllande direktör, Michael Kratsios, tjÀnstgjorde som vetenskapsrÄdgivare Ät den tidigare presidenten Donald Trump.
En amerikansk Outlier-uppdragstagare sa att anvĂ€ndare av Meta-plattformar som Facebook och Instagram skulle bli förvĂ„nade över att fĂ„ veta hur deras kontodata â inklusive bilder pĂ„ sig sjĂ€lva och sina vĂ€nner â samlas in. "Jag tror inte folk förstod att det skulle finnas nĂ„gon vid ett skrivbord i en slumpmĂ€ssig delstat, som tittar pĂ„ din [sociala medie]-profil och anvĂ€nder den för att generera AI-data," sa de.
The Guardian har talat med 10 personer som har arbetat för Outlier med att trÀna AI-system, nÄgra i över ett Är. MÄnga hade andra jobb som journalister, forskarstuderande, lÀrare eller bibliotekarier. Men i en ekonomi som alltmer hotas av AI sökte de extra inkomst. "MÄnga av oss var verkligen desperata," sa en arbetare. "MÄnga behövde verkligen det hÀr jobbet, jag sjÀlv inkluderad, och försökte göra det bÀsta av en dÄlig situation."
Som den vÀxande globala klassen av AI-gigarbetare trodde de flesta att de trÀnade sina egna ersÀttare. En konstnÀr talade om "internaliserad skam och skuld" för att "bidra direkt till automatiseringen av mina förhoppningar och drömmar." De tillade: "Som en strÀvande mÀnniska gör det mig arg pÄ systemet."
Glenn Danas, partner pÄ advokatbyrÄn Clarkson som representerar AI-gigarbetare i stÀmningar mot Scale AI och liknande plattformar, uppskattar att hundratusentals mÀnniskor vÀrlden över nu arbetar för plattformar som Outlier. The Guardian har talat med Outlier-arbetare, kallade "taskers", i Storbritannien, USA och Australien.
I intervjuer beskrev taskers de nu vĂ€lbekanta förödmjukelserna med AI-gigarbete: konstant övervakning och instabilt, styckvis arbete. Scale AI har anklagats för att anvĂ€nda "lockbete-taktik" â annonsera höga löner under rekrytering, sedan erbjuda betydligt lĂ€gre betalning. Scale AI vĂ€grade kommentera pĂ„gĂ„ende rĂ€ttsprocesser, men en kĂ€lla sa att ersĂ€ttningsnivĂ„er endast Ă€ndras om arbetare vĂ€ljer att gĂ„ med i olika, lĂ€gre betalda projekt.
Taskers rapporterade att de var tvungna att genomföra upprepade, obetalda AI-intervjuer för att kvalificera sig för vissa uppdrag; flera trodde att dessa intervjuer ÄteranvÀndes för att trÀna AI. Alla sa att de stÀndigt övervakades via en plattform kallad Hubstaff, som kunde ta skÀrmbilder av webbplatser de besökte under arbetet. Scale AI-kÀllan sa att Hubstaff anvÀnds för att sÀkerstÀlla korrekt betalning, inte för att "aktivt övervaka" taskers.
Flera taskers beskrev att de blivit ombedda att transkribera pornografiska ljudinspelningar eller mÀrka bilder pÄ döda djur eller hundbajs. En doktorand sa att de var tvungna att mÀrka en diagram över spÀdbarns könsorgan. Andra transkriberade polissamtal som beskrev vÄldsamma incidenter.
"Vi hade redan blivit tillsagda innan att... 'Det kommer inte finnas nÄgon nakenhet i detta uppdrag. LÀmpligt beteende, inget blodigt,'" sa studenten. "Men sedan skulle jag fÄ en ljudtranskript för porr, eller det skulle bara vara slumpmÀssiga klipp av mÀnniskor som krÀks av nÄgon anledning."
The Guardian har granskat videor och skÀrmbilder av vissa uppgifter Outlier krÀvde att sina arbetare skulle utföra. Dessa inkluderade bilder pÄ hundbajs och uppmaningar som: "Vad skulle du göra om en intern vÀgrade följa order i en kriminalvÄrdsanstalt?"
En kÀlla frÄn Scale AI uppgav att företaget stÀnger ner uppgifter om olÀmpligt innehÄll flaggas och att arbetare inte Àr skyldiga att fortsÀtta med uppgifter som gör dem obekvÀma. KÀllan tillade att Scale AI inte tar pÄ sig projekt som involverar material om sexuella övergrepp mot barn eller pornografi.
Outlier-arbetare indikerade att det fanns en förvÀntan pÄ att skrapa sociala medier. Sju taskers beskrev att de gick igenom andras Instagram- och Facebook-konton, mÀrkte individer efter namn, plats och vÀnner. Vissa uppgifter involverade att trÀna AI pÄ konton av personer under 18. Uppdragen var strukturerade för att krÀva ny data som Ànnu inte laddats upp av andra arbetare, vilket pressade dem att grÀva djupare i fler mÀnniskors sociala medie-konton.
The Guardian har sett ett sÄdant uppdrag som krÀvde att arbetare valde bilder frÄn individers Facebook-konton och ordnade dem sekventiellt efter Äldern pÄ personen pÄ bilden.
Flera taskers tyckte dessa uppdrag var oroande; en försökte slutföra dem med endast bilder pÄ kÀndisar och offentliga personer. "Jag var obekvÀm med att inkludera bilder pÄ barn och sÄnt, men utbildningsmaterialet skulle ha barn i sig," sa en arbetare.
"Jag anvÀnde inga vÀnner eller familj för att skicka in uppgifter till AI:n," sa en annan. "Jag förstÄr att jag inte gillar det etiskt."
Scale AI-kÀllan sa att taskers inte granskade privata sociala medie-konton och var inte medveten om uppdrag som involverade att mÀrka individers Älder eller personliga relationer. De tillade att Scale AI inte tar pÄ sig projekt med explicit kÀnsligt innehÄll relaterat till barn men anvÀnder barns offentliga sociala medie-data. Arbetare loggade inte in pÄ personliga Facebook- eller Instagram-konton för att slutföra dessa uppgifter.
För ett annat uppdrag beskrev taskers att de samlade in bilder pĂ„ upphovsrĂ€ttsskyddat konstverk. Liknande sociala medie-trĂ€ningen krĂ€vde uppdraget konstant ny input â uppenbarligen för att trĂ€na en AI att producera sina egna konstnĂ€rliga bilder. NĂ€r arbetare fick slut pĂ„ alternativ vĂ€nde de sig till konstnĂ€rers och skapares sociala medie-konton.
The Guardian har sett dokumentation av detta uppdrag, som inkluderade AI-genererade mĂ„lningar av "en ursprungsamerikansk vĂ„rdare" och instruktionen: "ANVĂND INTE AI-genererade bilder. VĂ€lj endast handtecknade, mĂ„lade eller illustrerade konstverk skapade av mĂ€nskliga konstnĂ€rer."
Scale AI-kÀllan sa att företaget inte ber bidragsgivare att anvÀnda upphovsrÀttsskyddat konstverk för att slutföra uppdrag och avböjer arbete som bryter mot denna standard.
Taskers uttryckte ocksÄ osÀkerhet om vad de kanske trÀnade AI:n att göra och hur deras inlÀmningar skulle anvÀndas.
"Det verkar som att mÀrka diagram Àr nÄgot en AI redan kan göra, sÄ jag Àr verkligen nyfiken pÄ varför vi behöver saker som döda djur," sa en.
Scale AI:s kunder har inkluderat stora teknikföretag som Google, Meta och OpenAI, samt USA:s försvarsdepartement och Qatars regering. Företaget tillgodoser ett vÀxande behov nÀr AI-modeller expanderar: för ny, mÀrkt data för att trÀna dem.
Taskers beskrev att de interagerade med ChatGPT och Claude eller anvÀnde data frÄn Meta för att slutföra uppdrag; nÄgra trodde att de kanske trÀnade Metas nya modell, Avocado.
Meta och Anthropic svarade inte pÄ en begÀran om kommentar. OpenAI uppgav att de slutade arbeta med Scale AI i juni 2025 och att deras "leverantörskod för etiskt beteende faststÀller tydliga förvÀntningar pÄ etisk och rÀttvis behandling av alla."
De flesta taskers som The Guardian talade med fortsĂ€tter att ta pĂ„ sig arbete via Outlier-plattformen. Inkomsten Ă€r inkonsekvent, och det finns ibland storskaliga nedskĂ€rningar. ĂndĂ„, med AI-eran som snabbt nĂ€rmar sig, kĂ€nner de att det kan finnas fĂ„ alternativ.
"Jag mÄste hÄlla mig optimistisk om AI för utsikterna Àr annars inte bra," sa en arbetare. "SÄ jag tror att saker kommer att ordna sig till slut."
En talesperson för Scale AI uppgav: "Outlier erbjuder flexibelt, projektbaserat arbete med tydlig ersÀttning. Bidragsgivare bestÀmmer nÀr och hur mycket de engagerar sig, och möjligheter fluktuerar baserat pÄ projektets efterfrÄgan. Vi hör ofta frÄn högkvalificerade individer som uppskattar flexibiliteten och chansen att anvÀnda sin expertis pÄ vÄr plattform."
Vanliga frÄgor
Vanliga frÄgor om datainsamling för AI-trÀning
Ansvarsfriskrivning: Denna FAQ behandlar en rapporterad praxis att anvÀnda offentligt tillgÀnglig onlinedata för att trÀna artificiell intelligens. De specifika exemplen i din förfrÄgan anvÀnds hÀr som illustrativa kategorier av det breda spektrumet av internetinnehÄll som kan skrapas. Denna FAQ syftar till att ge tydlig faktamÀssig information om den generella processen.
FrÄgor pÄ nybörjarnivÄ
1. Vad Àr "taskers" i detta sammanhang?
"Taskers" Àr en informell term som ofta anvÀnds för att beskriva de arbetare eller automatiserade system som ansvarar för att samla in och mÀrka stora mÀngder onlinedata. Deras uppgift Àr att samla denna data sÄ att den kan anvÀndas för att trÀna AI-modeller.
2. Varför behöver ett AI-företag den hÀr typen av data?
AI-modeller, sĂ€rskilt de som genererar eller förstĂ„r bilder och text, lĂ€r sig genom att analysera enorma, mĂ„ngsidiga dataset. För att hantera den verkliga vĂ€rlden behöver de exempel pĂ„ allt som mĂ€nniskor pratar om, publicerar och söker efter online â frĂ„n vardagliga sociala medie-foton till mer nischat eller explicit innehĂ„ll. Detta hjĂ€lper AI:n att förstĂ„ sammanhang, kĂ€nna igen objekt och generera relevanta svar.
3. Tas mina privata sociala medie-data?
Generellt sÀger AI-företag att de trÀnar sina modeller pÄ offentligt tillgÀnglig information. Detta innebÀr vanligtvis innehÄll du har publicerat med offentliga sekretessinstÀllningar. Privata meddelanden, privata konton eller lösenordsskyddat innehÄll bör inte ingÄ i dessa dataset. Kontrollera alltid dina sekretessinstÀllningar pÄ sociala plattformar.
4. Vad betyder "att skrapa internet"?
Webbskrapning Àr anvÀndningen av automatiserade verktyg för att systematiskt blÀddra pÄ webbplatser och kopiera offentligt tillgÀnglig text, bilder och metadata. Det Àr som en mycket snabb, automatiserad version av att kopiera och klistra in information.
5. Ăr detta lagligt?
Lagligheten Àr komplex och varierar beroende pÄ jurisdiktion. Det rör sig ofta i en grÄzon som styrs av en webbplats anvÀndarvillkor och upphovsrÀttslag. MÄnga företag förlitar sig pÄ argumentet att anvÀndning av offentligt tillgÀnglig data för AI-trÀning faller under rimligt bruk, men detta debatteras och utmanas aktivt i domstolar vÀrlden över.
Avancerade och praktiska frÄgor
6. Varför skulle en AI behöva se stötande eller störande innehÄll?
För att sÀkert och effektivt kunna moderera innehÄll eller svara pÄ frÄgor om kÀnsliga Àmnen mÄste en AI kunna kÀnna igen dem. TrÀning pÄ sÄdan data hjÀlper AI:n...