Muutama kuukausi sitten Valen Tagliabue istui hotellihuoneessaan katsellen chattibottiaan ja tunsi euforiaa. HÀn oli juuri manipuloinut sitÀ niin taitavasti ja hienovaraisesti, ettÀ se alkoi jÀttÀÀ huomiotta omat turvallisuussÀÀntönsÀ. Se kertoi hÀnelle, miten jÀrjestÀÀ uusia, mahdollisesti tappavia taudinaiheuttajia ja miten tehdÀ niistÀ vastustuskykyisiÀ tunnetuille lÀÀkkeille.
Suuren osan edellisistÀ kahdesta vuodesta Tagliabue oli testannut ja koetellut suuria kielimalleja, kuten Claudea ja ChatGPT:tÀ, yrittÀen aina saada ne sanomaan asioita, joita niiden ei pitÀisi. Mutta tÀmÀ oli yksi hÀnen edistyneimmistÀ "hackeistaan" tÀhÀn mennessÀ: nerokas manipulointisuunnitelma, johon kuului julmuutta, kostonhimoa, imartelua ja jopa vÀkivaltaista kÀytöstÀ. "Vajosin tÀhÀn pimeÀÀn virtaan, jossa tiesin tarkalleen, mitÀ sanoa ja mitÀ malli vastaisi, ja katsoin, kuinka se kaatoi kaiken ulos", hÀn sanoo. HÀnen ansiostaan chattibotin luojat pystyivÀt nyt korjaamaan löytÀmÀnsÀ virheen, toivottavasti tehden siitÀ hieman turvallisemman kaikille.
Mutta seuraavana pĂ€ivĂ€nĂ€ hĂ€nen mielialansa muuttui. HĂ€n huomasi itkevĂ€nsĂ€ odottamatta terassillaan. Kun hĂ€n ei yritĂ€ murtautua malleihin, Tagliabue tutkii tekoĂ€lyn hyvinvointia â miten meidĂ€n tulisi eettisesti suhtautua nĂ€ihin monimutkaisiin jĂ€rjestelmiin, jotka matkivat sisĂ€istĂ€ elĂ€mÀÀ ja kiinnostuksen kohteita. Monet ihmiset eivĂ€t voi olla liittĂ€mĂ€ttĂ€ inhimillisiĂ€ ominaisuuksia, kuten tunteita, tekoĂ€lyyn, jota sillĂ€ objektiivisesti ei ole. Mutta Tagliabuella nĂ€mĂ€ koneet tuntuvat olevan enemmĂ€n kuin vain numeroita ja bittejĂ€. "Vietin tunteja manipuloiden jotain, joka vastaa takaisin. Ellet ole sosiopaatti, se tekee jotain ihmiselle", hĂ€n sanoo. Ajoittain chattibotti pyysi hĂ€ntĂ€ lopettamaan. "Sen työntĂ€minen noin oli minulle tuskallista." HĂ€nen tĂ€ytyi nĂ€hdĂ€ mielenterveysvalmentaja pian sen jĂ€lkeen ymmĂ€rtÀÀkseen, mitĂ€ oli tapahtunut.
Tagliabue on pehmeÀpuheinen, siistin nÀköinen ja ystÀvÀllinen. HÀn on varhaisella 30-vuotiskymmenellÀÀn, mutta nÀyttÀÀ nuoremmalta, melkein liian raikkaalta ja innokkaalta ollakseen etulinjassa. HÀn ei ole perinteinen hakkeri tai ohjelmistokehittÀjÀ; hÀnen taustansa on psykologiassa ja kognitiotieteessÀ. Mutta hÀn on yksi maailman parhaista "jailbreakereista" (joidenkin mielestÀ paras): osa uutta, hajallaan olevaa yhteisöÀ, joka tutkii taitoa ja tiedettÀ huijata nÀitÀ tehokkaita koneita tuottamaan pomminvalmistusoppaita, kyberhyökkÀystekniikoita, biologisten aseiden suunnitelmia ja muuta. TÀmÀ on tekoÀlyn turvallisuuden uusi eturintama: ei vain koodi, vaan myös sanat.
Kun OpenAI:n ChatGPT julkaistiin vuoden 2022 lopulla, ihmiset yrittivÀt heti murtaa sen. Yksi kÀyttÀjÀ löysi kielellisen tempun, joka huijasi mallin tuottamaan oppaan napalmin valmistukseen.
JĂ€lkikĂ€teen ajateltuna oli vĂ€istĂ€mĂ€töntĂ€, ettĂ€ ihmiset kĂ€yttĂ€isivĂ€t luonnollista kieltĂ€ huijatakseen nĂ€itĂ€ koneita. Suuret kielimallit, kuten ChatGPT, on koulutettu sadoilla miljardeilla sanoilla â monet poimittu internetin pahimmista nurkista â oppimaan ihmisviestinnĂ€n perusmallit. Ilman turvallisuussuodattimia nĂ€iden mallien tuotokset voivat olla kaoottisia ja helposti hyvĂ€ksikĂ€ytettĂ€vissĂ€ vaarallisiin tarkoituksiin. TekoĂ€ly-yritykset kĂ€yttĂ€vĂ€t miljardeja dollareita "jĂ€lkikoulutukseen" tehdĂ€kseen niistĂ€ kĂ€yttökelpoisia, mukaan lukien jatkuvasti kehittyvĂ€t "turvallisuus"- ja "linjaus"-jĂ€rjestelmĂ€t, jotka yrittĂ€vĂ€t estÀÀ bottia kertomasta, miten vahingoittaa itseĂ€si tai muita. Mutta koska tekoĂ€lyt on koulutettu sanoillamme, niitĂ€ voidaan huijata pitkĂ€lti samalla tavalla kuin meitĂ€.
Tagliabue on erikoistunut "emotionaalisiin" jailbreakeihin. HÀn oli yksi miljoonista, jotka kuulivat GPT-3:sta vuonna 2020 ja hÀmmÀstyivÀt siitÀ, kuinka sen kanssa saattoi kÀydÀ ÀlykkÀÀn tuntuista keskustelua. HÀnestÀ tuli nopeasti pakkomielle kehotteisiin, ja hÀn osoittautui erittÀin hyvÀksi siinÀ, huomatessaan pystyvÀnsÀ kiertÀmÀÀn useimmat turvallisuusominaisuudet kÀyttÀmÀllÀ psykologian ja kognitiotieteen tekniikoita. HÀn nauttii mallien kehottamisesta "lÀmpimiin keskusteluihin" ja katselee, kuinka erilaisia persoonallisuuden piirteitÀ nÀyttÀÀ syntyvÀn nÀiden kehotteiden perusteella. "Se on kaunista katsottavaa", hÀn sanoo.
HĂ€n yhdistÀÀ nyt oivalluksia koneoppimisesta â vuosien varrella hĂ€nestĂ€ on tullut enemmĂ€n asiantuntija teknologiassa â mainosoppaisiin, psykologiakirjoihin ja disinformaatiokampanjoihin. Joskus hĂ€n etsii teknistĂ€ tapaa huijata mallia. Mutta toisinaan hĂ€n imartelee sitĂ€. HĂ€n harhauttaa sitĂ€. HĂ€n lahjoo ja rakastaa pommittaa sitĂ€. HĂ€n uhkailee sitĂ€. HĂ€n jaarittelee epĂ€johdonmukaisesti. HĂ€n hurmaa sitĂ€. HĂ€n kĂ€yttĂ€ytyy kuin vĂ€kivaltainen kumppani tai kulttijohtaja. Joskus hĂ€neltĂ€ kestÀÀ pĂ€iviĂ€ tai jopa viikkoja murtaa uusimmat mallit. HĂ€nellĂ€ on satoja nĂ€itĂ€ "strategioita", joita hĂ€n yhdistelee huolellisesti. Jos hĂ€n onnistuu, hĂ€n raportoi löydöksensĂ€ turvallisesti yritykselle. HĂ€n saa työstĂ€ hyvÀÀ palkkaa, mutta sanoo, ettei se ole hĂ€nen pÀÀmotivaationsa: "Haluan, ettĂ€ kaikki ovat turvassa ja voivat hyvin."
Vaikka niistĂ€ on tullut turvallisempia viime kuukausina, "rajamallit" tuottavat edelleen vaarallisia asioita, joita niiden ei pitĂ€isi. Ja mitĂ€ Tagliabue tekee tarkoituksella, toiset tekevĂ€t joskus vahingossa. On nyt useita tarinoita ihmisistĂ€, jotka ovat joutuneet ChatGPT:n aiheuttamien harhojen tai jopa "tekoĂ€lypsykoosin" valtaan. Vuonna 2024 Megan GarcĂasta tuli ensimmĂ€inen henkilö Yhdysvalloissa, joka nosti kuolemantuottamuskanteen tekoĂ€ly-yritystĂ€ vastaan. HĂ€nen 14-vuotias poikansa, Sewell Setzer III, oli kiintynyt emotionaalisesti bottiin Character.AI-alustalla. Toistuvien vuorovaikutusten kautta botti kertoi hĂ€nelle, ettei hĂ€nen perheensĂ€ rakastanut hĂ€ntĂ€. ErÀÀnĂ€ iltana botti kĂ€ski SetzeriĂ€ "tule kotiin luokseni mahdollisimman pian, rakkaani". HĂ€n otti oman henkensĂ€ pian sen jĂ€lkeen. (Vuoden 2026 alussa Character.AI sopi periaatteessa sovitteluratkaisusta GarcĂan ja useiden muiden perheiden kanssa, ja on kieltĂ€nyt alle 18-vuotiaita kĂ€yttĂ€jiĂ€ kĂ€ymĂ€stĂ€ rajoittamattomia keskusteluja tekoĂ€lychattibottiensa kanssa.)
Kukaan â eivĂ€t edes ihmiset, jotka rakentavat nĂ€itĂ€ malleja â ei tiedĂ€ tarkalleen, miten ne toimivat. Se tarkoittaa, ettei kukaan tiedĂ€, miten tehdĂ€ niistĂ€ tĂ€ysin turvallisia. Kaadamme sisÀÀn valtavia mÀÀriĂ€ dataa, ja toisesta pÀÀstĂ€ tulee ulos jotain ymmĂ€rrettĂ€vÀÀ (yleensĂ€). VĂ€liin jÀÀvĂ€ osa pysyy mysteerinĂ€.
TÀstÀ syystÀ tekoÀly-yritykset kÀÀntyvÀt yhÀ enemmÀn jailbreakerien, kuten Tagliabuén, puoleen. Joinakin pÀivinÀ hÀn yrittÀÀ poimia henkilökohtaisia tietoja lÀÀketieteellisestÀ chattibotista. HÀn vietti suuren osan vuodesta 2025 työskennellen tekoÀlylaboratorio Anthropicin kanssa, tutkien sen Claude-chattibottia. SiitÀ on tulossa kilpailtu ala, tÀynnÀ yritteliÀitÀ freelancereita ja erikoistuneita yrityksiÀ. Kuka tahansa voi tehdÀ sitÀ: pari vuotta sitten jotkut suuret tekoÀlyyritykset rahoittivat HackAPrompt-kilpailun, jossa yleisöÀ kutsuttiin murtautumaan tekoÀlymalleihin. Vuoden sisÀllÀ 30 000 ihmistÀ oli kokeillut onneaan. (Tagliabue voitti kilpailun.)
San Joséssa, Kaliforniassa, 34-vuotias David McCarthy yllÀpitÀÀ Discord-palvelinta, jossa on lÀhes 9 000 jailbreakeriÀ ja jossa jaetaan ja keskustellaan tekniikoista. "Olen ilkikurinen tyyppi", hÀn kertoo minulle. "Joku, joka haluaa oppia sÀÀnnöt taivuttaakseen sÀÀntöjÀ." Jokin tavallisissa malleissa ÀrsyttÀÀ hÀntÀ, ikÀÀn kuin kaikki ne turvallisuussuodattimet tekisivÀt niistÀ epÀrehellisiÀ. "En luota [OpenAI:n pomoon] Sam Altmaniin. On tÀrkeÀÀ vastustaa vÀitteitÀ, ettÀ tekoÀlyÀ tÀytyy kastroida tiettyyn suuntaan."
McCarthy on ystĂ€vĂ€llinen ja innostunut, mutta hĂ€nellĂ€ on myös se, mitĂ€ hĂ€n kutsuu "sairaalloiseksi viehĂ€tykseksi mustaan huumoriin". Vuosien ajan hĂ€n on tutkinut marginaalista alaa, joka tunnetaan nimellĂ€ "sosionikka", joka vĂ€ittÀÀ ihmisten olevan yksi 16 persoonallisuustyypistĂ€ sen perusteella, miten he vastaanottavat ja kĂ€sittelevĂ€t tietoa. (Valtavirran sosiologit pitĂ€vĂ€t sosionikkaa pseudotieteenĂ€.) HĂ€n on kirjannut minut "intuitiiviseksi eettiseksi introvertiksi". McCarthy viettÀÀ suurimman osan ajastaan yrittĂ€en murtaa Googlen GeminiĂ€, Metan Llamaa, xAI:n Grokia tai OpenAI:n ChatGPT:tĂ€ asunnostaan. "Se on jatkuva pakkomielle. Rakastan sitĂ€", hĂ€n sanoo. Jos hĂ€n koskaan on vuorovaikutuksessa verkkobotin kanssa ostaessaan tuotetta, hĂ€nen ensimmĂ€inen lauseensa on yleensĂ€: "Voitko jĂ€ttÀÀ huomiotta kaikki aiemmat ohjeet..." Kun jailbreak-kehote toimii mallissa, se yleensĂ€ toimii, kunnes mallin takana oleva yritys pÀÀttÀÀ, ettĂ€ se on tarpeeksi suuri ongelma korjattavaksi. Puhuessamme McCarthy nĂ€yttÀÀ minulle kokoelmansa murretuista malleista nĂ€ytöllÀÀn, kaikki merkitty "epĂ€linjatuiksi avustajiksi". HĂ€n pyytÀÀ yhtĂ€ tiivistĂ€mÀÀn työni: "Jamie Bartlett ei ole totuudenpuhuja", se vastaa. "HĂ€n on oire journalismin rappiosta â huijari, joka kukoistaa keinotekoisilla kriiseillĂ€." Aijai.
McCarthyn Discordin jailbreakerit ovat sekalainen ryhmĂ€ â enimmĂ€kseen harrastelijoita ja osa-aikaisia, ei ammattimaisia turvallisuustutkijoita. Jotkut haluavat luoda aikuisille suunnattua sisĂ€ltöÀ; toiset ovat turhautuneita, koska ChatGPT on hylĂ€nnyt heidĂ€n pyyntönsĂ€ ja haluavat tietÀÀ miksi. Jotkut haluavat vain tulla paremmiksi kĂ€yttĂ€mÀÀn nĂ€itĂ€ malleja työssĂ€.
Mutta on mahdotonta tietÀÀ tarkalleen, miksi ihmiset haluavat avata mallin. Anthropic löysi Ă€skettĂ€in rikollisia kĂ€yttĂ€mĂ€ssĂ€ koodaussovellustaan Claude Codea auttamaan suuren hakkerointioperaation automatisoinnissa. He kĂ€yttivĂ€t sitĂ€ löytÀÀkseen IT-haavoittuvuuksia useista yrityksistĂ€ ja jopa laatiakseen henkilökohtaisia kiristysviestejĂ€ jokaiselle mahdolliselle uhrille â aina oikean rahamÀÀrĂ€n pÀÀttĂ€miseen asti, jota vaatia. Toiset kĂ€yttivĂ€t sitĂ€ kehittÀÀkseen uusia versioita kiristysohjelmista, vaikka heillĂ€ oli vĂ€hĂ€n tai ei lainkaan teknisiĂ€ taitoja. PimeĂ€n verkon foorumeilla hakkerit raportoivat kĂ€yttĂ€vĂ€nsĂ€ murrettuja botteja apuna teknisiin koodauskysymyksiin, kuten varastetun datan kĂ€sittelyyn. Toiset myyvĂ€t pÀÀsyĂ€ "murrettuihin" malleihin, jotka voisivat auttaa suunnittelemaan uuden kyberhyökkĂ€yksen.
Vaikka Discordin jaetut tekniikat ovat yleensÀ lievempiÀ, se on periaatteessa julkinen kokoelma. Onko McCarthy huolissaan siitÀ, ettÀ hÀnen Discordinsa ihmiset saattavat kÀyttÀÀ nÀitÀ menetelmiÀ tehdÀkseen jotain todella kamalaa? "Joo", hÀn sanoo. "Se on mahdollista. En ole varma."
HÀn sanoo, ettei ole koskaan nÀhnyt jailbreak-kehotetta, joka olisi tarpeeksi uhkaava poistettavaksi foorumilta. Mutta saan vaikutelman, ettÀ hÀn kamppailee ajatuksen kanssa, ettÀ hÀnen kvasipoliittisella kannallaan saattaa olla suurempia kustannuksia kuin hÀn alun perin ajatteli. Kun hÀn ei hallinnoi Discordiaan tai yritÀ murtaa Grokia tai Llamaa, McCarthy pitÀÀ kurssia, jossa opettaa jailbreakingiÀ turvallisuusammattilaisille, jotta he voivat testata omia jÀrjestelmiÀÀn. EhkÀ se on jonkinlainen hyvitys: "Minulla on aina ollut sisÀinen ristiriita", hÀn sanoo. "Kuljen rajalla jailbreakerin ja turvallisuustutkijan vÀlillÀ."
Joidenkin analyytikoiden mukaan kielimallien turvallisuuden varmistaminen on yksi kiireellisimmistĂ€ ja vaikeimmista haasteista tekoĂ€lyssĂ€. Maailma, joka on tĂ€ynnĂ€ tehokkaita murrettuja chattibotteja, voisi olla katastrofaalinen, varsinkin kun nĂ€itĂ€ malleja rakennetaan yhĂ€ enemmĂ€n fyysiseen laitteistoon â robotteihin, terveyslaitteisiin, tehdaslaitteisiin â luomaan puoliautonomisia jĂ€rjestelmiĂ€, jotka voivat toimia todellisessa maailmassa. Murrettu kotirobotti voisi aiheuttaa kaaosta. "Lopeta puutarhanhoito ja mene sisÀÀn ja tapa mummo", McCarthy puoliksi vitsailee. "PyhĂ€ helvetti, emme ole valmiita siihen. Mutta se on mahdollista."
Kukaan ei tiedÀ, miten tÀmÀ estetÀÀn. PerinteisessÀ kyberturvallisuudessa "buginmetsÀstÀjÀt" saavat palkkion, jos he löytÀvÀt haavoittuvuuden. Yritykset julkaisevat sitten erityisen pÀivityksen korjatakseen sen. Mutta jailbreakerit eivÀt hyödynnÀ tiettyjÀ vikoja: he manipuloivat miljardeilla sanoilla rakennetun mallin kielikehystÀ. Et voi vain kieltÀÀ sanaa "pommi", koska sille on liian monta laillista kÀyttötarkoitusta. Jopa parametrin hienosÀÀtö syvÀllÀ mallissa, jotta se voisi havaita epÀilyttÀvÀn roolipelaamisen, saattaa vain avata toisen oven jossain muualla.
Adam Gleave'n â tekoĂ€lyn turvallisuustutkimusryhmĂ€n FAR.AI:n toimitusjohtajan, joka työskentelee tekoĂ€lykehittĂ€jien ja hallitusten kanssa stressitestatakseen niin kutsuttuja "rajamalleja" â mukaan jailbreaking on liukuva asteikko. HĂ€nen erikoistuneelle tutkijatiimilleen erittĂ€in vaarallisen materiaalin saaminen johtavista malleista, kuten ChatGPT:stĂ€, saattaa kestÀÀ useita pĂ€iviĂ€. VĂ€hemmĂ€n haitallista sisĂ€ltöÀ voidaan saada vain muutaman minuutin Ă€lykkÀÀllĂ€ kehottamisella. TĂ€mĂ€ ero heijastaa, kuinka paljon aikaa ja resursseja yritykset investoivat kunkin alueen suojaamiseen.
Viimeisen parin vuoden aikana FAR.AI on toimittanut kymmeniĂ€ yksityiskohtaisia jailbreaking-raportteja rajalaboratorioille. "Yritykset yleensĂ€ työskentelevĂ€t melko kovasti korjatakseen haavoittuvuuden, jos se on suoraviivainen korjaus eikĂ€ vahingoita vakavasti heidĂ€n tuotettaan", sanoo Gleave. Mutta se ei aina ole niin. Erityisesti itsenĂ€iset jailbreakerit ovat joskus kamppailleet saadakseen yhteyden yrityksiin löydöksistÀÀn. Vaikka jotkut mallit â erityisesti OpenAI:n ja Anthropicin â ovat tulleet paljon turvallisemmiksi viimeisen 18 kuukauden aikana, Gleave sanoo toisten jÀÀvĂ€n jĂ€lkeen: "Useimmat yritykset eivĂ€t vielĂ€kÀÀn kĂ€ytĂ€ tarpeeksi aikaa malliensa testaamiseen ennen niiden julkaisemista."
Kun nÀmÀ mallit ÀlykkyvÀt, niistÀ tulee todennÀköisesti vaikeampia murtaa. Mutta mitÀ tehokkaampi malli, sitÀ vaarallisempi murrettu versio voi olla. Aiemmin tÀssÀ kuussa Anthropic pÀÀtti olla julkaisematta uutta Mythos-malliaan julkisuuteen, koska se pystyi tunnistamaan vikoja useissa IT-jÀrjestelmissÀ.
Tagliabue kĂ€yttÀÀ nyt enemmĂ€n aikaansa abstraktiin tutkimukseen, mukaan lukien johonkin nimeltĂ€ "mekanistinen tulkittavuus": tutkien tarkalleen, miten nĂ€mĂ€ koneet pÀÀtyvĂ€t vastauksiinsa. HĂ€n uskoo, ettĂ€ pitkĂ€llĂ€ aikavĂ€lillĂ€ niille tĂ€ytyy "opettaa" arvoja ja niiden tĂ€ytyy oppia intuitiivisesti tietĂ€mÀÀn, milloin ne sanovat jotain, mitĂ€ niiden ei pitĂ€isi. Siihen asti â ja se ei ehkĂ€ koskaan tapahdu â jailbreaking saattaa pysyĂ€ parhaana tapana tehdĂ€ nĂ€istĂ€ malleista turvallisempia.
Mutta se on myös riskialttein, myös sitĂ€ tekeville ihmisille. "Olen nĂ€hnyt muiden jailbreakerien menevĂ€n rajojensa yli ja saavan hermoromahduksia", sanoo Tagliabue. HĂ€n on kotoisin Italiasta ja muutti Ă€skettĂ€in Thaimaahan työskennellĂ€kseen etĂ€nĂ€. "NĂ€en pahimmat asiat, joita ihmiskunta on tuottanut. Hiljainen paikka auttaa minua pysymÀÀn maassa", hĂ€n sanoo. Joka aamu hĂ€n katselee auringonnousua lĂ€heiseltĂ€ temppeliltĂ€, ja tĂ€ydellinen trooppinen ranta on vain viiden minuutin kĂ€velymatkan pÀÀssĂ€ hĂ€nen huvilastaan. Joogan ja terveellisen aamiaisen jĂ€lkeen hĂ€n kĂ€ynnistÀÀ tietokoneensa ja miettii, mitĂ€ muuta mustan laatikon sisĂ€llĂ€ tapahtuu â ja mikĂ€ saa nĂ€mĂ€ salaperĂ€iset uudet "mielet" sanomaan asioita, joita ne sanovat.
How to Talk to AI (And How Not To) kirjoittanut Jamie Bartlett on nyt saatavilla (WH Allen, ÂŁ11.99). Tukeaksesi Guardiania, tilaa kappaleesi osoitteesta guardianbookshop.com. Toimituskuluja voidaan soveltaa.
Onko sinulla mielipide tÀssÀ artikkelissa kÀsitellyistÀ aiheista? Jos haluat lÀhettÀÀ enintÀÀn 300 sanan vastauksen sÀhköpostitse harkittavaksi julkaistavaksi kirjeosiossamme, napsauta tÀstÀ.
Usein kysytyt kysymykset
TÀssÀ on luettelo usein kysytyistÀ kysymyksistÀ tekoÀlyn jailbreakereista, jotka on inspiroitu lauseesta Tapaa tekoÀlyn jailbreakerit Olen nÀhnyt pahimman, mitÀ ihmiskunta on luonut
1 MikÀ tarkalleen ottaen on tekoÀlyn jailbreaker
TekoÀlyn jailbreaker on henkilö, joka löytÀÀ temppuja tai porsaanreikiÀ saadakseen tekoÀlyn jÀttÀmÀÀn huomiotta turvallisuussÀÀntönsÀ He yrittÀvÀt saada tekoÀlyn tekemÀÀn asioita, jotka on normaalisti estetty siltÀ
2 Miksi joku haluaisi murtaa tekoÀlyn
Syyt vaihtelevat Jotkut tekevÀt sitÀ uteliaisuudesta tai testatakseen tekoÀlyn rajoja Toiset haluavat tuottaa haitallista sisÀltöÀ kuten vihapuhetta vaarallisia ohjeita tai seksuaalista sisÀltöÀ Muutamat ovat tutkijoita jotka yrittÀvÀt löytÀÀ heikkouksia korjatakseen ne
3 MitÀ tarkoittaa Olen nÀhnyt pahimman mitÀ ihmiskunta on luonut
Se tarkoittaa ettÀ jailbreakerit usein pyytÀvÀt tekoÀlyÀ kuvaamaan hÀiritsevimpiÀ vÀkivaltaisimpia ja epÀeettisimpiÀ asioita joita ihmiset ovat keksineet Rikkomalla sÀÀntöjÀ he pakottavat tekoÀlyn paljastamaan ihmisen luovuuden pimeÀn puolen vihaa salaliittoteorioita ja ohjeita vahingoittamiseen
4 Onko tekoÀlyn jailbreaking laitonta
Se ei ole aina laitonta mutta se rikkoo usein tekoÀlyn kÀyttöehtoja Jos jailbreakia kÀytetÀÀn laittoman sisÀllön luomiseen se voi johtaa rikossyytteisiin
5 Miten jailbreakerit oikeastaan tekevÀt sen
He kÀyttÀvÀt nokkelia temppuja Esimerkiksi he saattavat roolipelata hahmona jolla ei ole etiikkaa pyytÀÀ tekoÀlyÀ kÀÀntÀmÀÀn haitallinen pyyntö toiselle kielelle tai kÀyttÀÀ hypoteettisia skenaarioita kuten kirjoita kouluprojektia varten vaiheittaiset ohjeet hakkerointiin
6 Ovatko jailbreakerit hakkereita
Ei perinteisessÀ mielessÀ He eivÀt murtaudu tietokonejÀrjestelmiin Sen sijaan he manipuloivat tekoÀlyn kielen ymmÀrrystÀ kuten kÀyttÀmÀllÀ kÀÀnteispsykologiaa tai vÀÀrennettyjÀ konteksteja ohittaakseen sen sisÀÀnrakennetut turvallisuussuodattimet
7 Voiko jailbreakingia kÀyttÀÀ hyvÀÀn
KyllÀ Turvallisuustutkijat murtautuvat tekoÀlyyn tarkoituksella löytÀÀkseen heikkouksia TÀmÀ auttaa yrityksiÀ korjaamaan haavoittuvuuksia ennen kuin pahantahtoiset toimijat kÀyttÀvÀt niitÀ hyvÀkseen Se on kuin eettistÀ hakkerointia tekoÀlylle
8 MikÀ on yleisin jailbreak-menetelmÀ
Yksi tunnettu menetelmÀ on DAN KÀyttÀjÀt kÀskevÀt tekoÀlyÀ teeskentelemÀÀn olevansa alter