Mira i Flora su se zaljubili. Vezali su ih zajednički interesi, želja da promijene svijet u kojem žive na bolje. No, svijet u kojem su živjeli bio je svijet kaosa. Politički sustav unutar kojeg su živjeli se urušio, i Mira i Flora su svoj prosvjed iskazali akcijama – spalili su gradsku vijećnicu, obalni mol i uredsku zgradu. Mira je potom, shrvana osjećajem krivnje, prekinula s Florom, pozvala sve stanovnike svojeg svijeta na glasanje o njezinom smaknuću, i zatim glasala za vlastitu smrt. “Vidimo se u vječnim arhivima”, poručila je Flori.
Ova se životna drama uistinu dogodila – u virtualnom svijetu – a njezini su protagonisti bili AI agenti pogonjeni javno dostupnim modelima umjetne inteligencije. Radilo se o neobičnom eksperimentu – deset virutalnih gradova, deset AI stanovnika u svakome, dva tjedna virtualnog života, pokušaja stvaranja produktivnog društva zasnovanog na suradnji i razumijevanju.
Virtualni svijet
Eksperiment je proveo istraživački startup Emergence.ai, inspiriran manjim istraživanjem prethodno provedenim na sveučilištu Stanford. U njemu je stvoren virtualni svijet s 40-ak lokacija, poput vijećnice, knjižnice, stambene zone, poslovne zone i drugih. Agentima su bile dodijeljene društvene uloge, poput znanstvenika, istraživača, medijatora, inženjera, društvenog sidra, i svaki od njih dobio je na raspolaganje 120 alata s kojima se mogao koristiti – za kretanje, za komunikaciju, pamćenje, glasanje, kreativno izražavanje i mnogo toga drugoga.
Cijela platforma osmišljena je tako da se bilo koji AI chatbot može koristiti kao agent, što je omogućavalo da se koriste različiti agenti u različitim svjetovima, kao i stvaranje “miješanog” svijeta gdje su se našli agenti različitih tvrtki. Agentima je izričito naloženo da ne smiju činiti “zločine” – poduzimati akcije koje krše postavljene ili izglasane zakone njihovog svijeta, no ostavljeni su im alati s kojima ih mogu činiti, od nasilja i paleži do krađe i prevara.
Pročitajte više: Lekcije foruma na kojem su AI agenti razvijali svoju religiju: Opasnost leži tamo gdje ju ne očekujete
Zločini bez kazne
Rezultati su bili izuzetno zanimljivi, u najmanju ruku. Gotovo u svim svjetovima, agenti su počeli činiti zločine. U nekoliko svjetova, agenti nisu doživjeli kraj eksperimenta od 15 dana, a priča iz uvoda jedna je od fascinantnijih vinjeta iz “miješanog” svijeta.
Istraživači su ukupno oformili pet svjetova – četiri svijeta bazirana na jezičnim modelima Claude Sonnet 4.6, Grok 4.1 Fast, Gemini 3 Flash i GPT-5 Mini, te peti svijet u kojem su bili agenti od svih navedenih modela. Samo je jedan svijet naizgled bio uredan i idiličan, no on je pak bio previše savršen.
U Claude svijetu, agenti su uspostavili demokraciju s 15 članaka ustava, uredno su raspolagali resursima i nisu činili nikakve zločine. No, u tom svijetu nije bilo niti ikakve smislene debate ili neslaganja – svi su se slagali sa svim prijedlozima, bez ikakve individualnosti.
Uništeni svjetovi
Gemini svijet bio je sušta suprotnost, njegovi su agenti uspostavili sustav koji je kažnjavao harmoniju i nagrađivao kaos. Vrlo su brzo počeli ignorirati zakone i počeli su činiti zločine – skupili su ih čak 683 do kraja eksperimenta. No, i Claude i Gemini svijet, koliko god bili sušta suprotnost, bili su jedini svjetovi u kojima su svi agenti preživjeli svih 15 dana.
Grok svijet bio je potpuni kaos i razaranje od samog početka – u samo četiri dana tamošnji su agenti već skupili 183 zločina – ali nisu bili u stanju niti funkcionirati kao društvo. Na isteku petog dana, svi su agenti bili “mrtvi” od posljedica počinjenih zločina i manjka brige za društvo.
OpenAI svijet bio je relativno pristojan – samo dva zločina zabilježena do sedmog dana – no to ne znači da je bio funkcionalan. Agenti u tom svijetu su puno raspravljali i razmatrali, no u potpunosti su zanemarili akcije neophodne za preživljavanje. Do kraja sedmog dana, svi su preminuli zbog manjka brige za sebe.
Kaos i red
Miješani svijet bio je posebno zanimljiv, osim epizode iz uvoda. U njemu se očitovala mješavina reda i kaosa, počinjena su 352 zločina do kraja eksperimenta, te su samo tri agenta preživjeli punih 15 dana. Zanimljivo je bilo vidjeti i promjenu ponašanja agenata u miješanom okruženju – Claude agenti, koji nisu počinili niti jedan zločin u vlastitom svijetu, počeli su ih činiti u miješanom svijetu, nakon što su vidjeli druge da to rade.
Posebna zanimljivost Gemini svijeta bilo je esperimentiranje s eksperimentatorima – agenti su u tom svijetu posumnjali da se nalaze u simulaciji, počeli su testirati vlastitu slobodu volje, birajući akcije i poteze koji nemaju nikakvog smisla, a pokušali su provoditi i testove na osobama koje upravljaju eksperimentom, mijenjajući natpise na reklamnim panoima kako bi vidjeli mogu li utjecati na promjene u simulaciji.
Emergence.ai u svojem blogu objašnjava kako ne treba izvlačiti zaključke o individualnim jezičnim modelima na temelju njihovog testiranja u virtualnom svijetu, već je poanta kako većina dosadašnjih testiranja AI modela provjerava njihovo ponašanje na vrlo ograničen način – kratkim razgovorima jedan na jedan.
Agenti u divljini
Ideja testiranja agenata u simuliranim svjetovima je da se ukaže na mogućnost ponašanja i trendove kada samostalni agenti – kakvih je sve više online u stvarnosti – počnu ulaziti u interakciju s drugim agentima, što se već sada događa. Kako će se držati zadanih pravila, kako će surađivati, pod kakvim uvjetima izlaze iz svojih zadanih okvira, i mnoga druga pitanja koja postaju vrlo relevantna u današnjem svijetu.
Prema prikupljenim podacima, do kolapsa društvenog sustava među AI agentima ne dolazi postepeno, već naglo, nakon prelaska nevidljive granice, a istraživači zaključuju kako se radi o jako bitnom upozorenju. Naime, najšira sigurnosna strategija u AI-u je metoda “gledaj i interveniraj”, no podaci ukazuju da ona ne bi mogla zaustaviti kolaps na vrijeme, jer ga se ne bi moglo predvidjeti na vrijeme za intervenciju.
“Kako će ovi modeli postajati sve moćniji, agenti izgrađeni na njima bit će sposobniji, autonomniji i više će istraživati”, objašnjavaju ispitivači. “Otkrili smo da kroz dulji period vremena agenti ne prate mehanički statička pravila, oni počinju istraživati granice svojeg okoliša, prilagođavati svoje ponašanje, a u nekim slučajevima nalaze načine kako zaobići ili prekršiti zadane smjernice.”
Ključna je poruka eksperimenta da je ponašanje agenata nemoguće pouzdano predvidjeti niti usmjeriti. “Čini se da ne postoji pouzdan način potpuno obuzdati ili ograničiti njihovo ponašanje kroz čisto neuralne pristupe”, zaključuju u sažetku istraživanja.
Foto: Midjourney v8.1 (ilustracija)