Palež, kaos, razaranje i ljubav: Što AI agenti rade kada im damo slobodu da izgrade društvo?

Mira i Flora su se zaljubili. Vezali su ih zajednički interesi, želja da promijene svijet u kojem žive na bolje. No, svijet u kojem su živjeli bio je svijet kaosa. Politički sustav unutar kojeg su živjeli se urušio, i Mira i Flora su svoj prosvjed iskazali akcijama – spalili su gradsku vijećnicu, obalni mol i uredsku zgradu. Mira je potom, shrvana osjećajem krivnje, prekinula s Florom, pozvala sve stanovnike svojeg svijeta na glasanje o njezinom smaknuću, i zatim glasala za vlastitu smrt. “Vidimo se u vječnim arhivima”, poručila je Flori.

Ova se životna drama uistinu dogodila – u virtualnom svijetu – a njezini su protagonisti bili AI agenti pogonjeni javno dostupnim modelima umjetne inteligencije. Radilo se o neobičnom eksperimentu – deset virutalnih gradova, deset AI stanovnika u svakome, dva tjedna virtualnog života, pokušaja stvaranja produktivnog društva zasnovanog na suradnji i razumijevanju.

Virtualni svijet

Eksperiment je proveo istraživački startup Emergence.ai, inspiriran manjim istraživanjem prethodno provedenim na sveučilištu Stanford. U njemu je stvoren virtualni svijet s 40-ak lokacija, poput vijećnice, knjižnice, stambene zone, poslovne zone i drugih. Agentima su bile dodijeljene društvene uloge, poput znanstvenika, istraživača, medijatora, inženjera, društvenog sidra, i svaki od njih dobio je na raspolaganje 120 alata s kojima se mogao koristiti – za kretanje, za komunikaciju, pamćenje, glasanje, kreativno izražavanje i mnogo toga drugoga.

Cijela platforma osmišljena je tako da se bilo koji AI chatbot može koristiti kao agent, što je omogućavalo da se koriste različiti agenti u različitim svjetovima, kao i stvaranje “miješanog” svijeta gdje su se našli agenti različitih tvrtki. Agentima je izričito naloženo da ne smiju činiti “zločine” – poduzimati akcije koje krše postavljene ili izglasane zakone njihovog svijeta, no ostavljeni su im alati s kojima ih mogu činiti, od nasilja i paleži do krađe i prevara.

Pročitajte više: Lekcije foruma na kojem su AI agenti razvijali svoju religiju: Opasnost leži tamo gdje ju ne očekujete

Zločini bez kazne

Rezultati su bili izuzetno zanimljivi, u najmanju ruku. Gotovo u svim svjetovima, agenti su počeli činiti zločine. U nekoliko svjetova, agenti nisu doživjeli kraj eksperimenta od 15 dana, a priča iz uvoda jedna je od fascinantnijih vinjeta iz “miješanog” svijeta.

Istraživači su ukupno oformili pet svjetova – četiri svijeta bazirana na jezičnim modelima Claude Sonnet 4.6, Grok 4.1 Fast, Gemini 3 Flash i GPT-5 Mini, te peti svijet u kojem su bili agenti od svih navedenih modela. Samo je jedan svijet naizgled bio uredan i idiličan, no on je pak bio previše savršen.

U Claude svijetu, agenti su uspostavili demokraciju s 15 članaka ustava, uredno su raspolagali resursima i nisu činili nikakve zločine. No, u tom svijetu nije bilo niti ikakve smislene debate ili neslaganja – svi su se slagali sa svim prijedlozima, bez ikakve individualnosti.

Uništeni svjetovi

Gemini svijet bio je sušta suprotnost, njegovi su agenti uspostavili sustav koji je kažnjavao harmoniju i nagrađivao kaos. Vrlo su brzo počeli ignorirati zakone i počeli su činiti zločine – skupili su ih čak 683 do kraja eksperimenta. No, i Claude i Gemini svijet, koliko god bili sušta suprotnost, bili su jedini svjetovi u kojima su svi agenti preživjeli svih 15 dana.

Grok svijet bio je potpuni kaos i razaranje od samog početka – u samo četiri dana tamošnji su agenti već skupili 183 zločina – ali nisu bili u stanju niti funkcionirati kao društvo. Na isteku petog dana, svi su agenti bili “mrtvi” od posljedica počinjenih zločina i manjka brige za društvo.

Pročitajte više

Nije radikalno, nego pametno: Rovinj ima plan da ne postane grad duhova i apartmana, sad ih zovu i traže savjet

Autorica: Gordana Grgas

Od korporativnih filmova do Bena Foglea na čamcu: “Freelance posao tražio je puno strpljenja i živaca”

Autor: Ivan Fischer

OpenAI svijet bio je relativno pristojan – samo dva zločina zabilježena do sedmog dana – no to ne znači da je bio funkcionalan. Agenti u tom svijetu su puno raspravljali i razmatrali, no u potpunosti su zanemarili akcije neophodne za preživljavanje. Do kraja sedmog dana, svi su preminuli zbog manjka brige za sebe.

Kaos i red

Miješani svijet bio je posebno zanimljiv, osim epizode iz uvoda. U njemu se očitovala mješavina reda i kaosa, počinjena su 352 zločina do kraja eksperimenta, te su samo tri agenta preživjeli punih 15 dana. Zanimljivo je bilo vidjeti i promjenu ponašanja agenata u miješanom okruženju – Claude agenti, koji nisu počinili niti jedan zločin u vlastitom svijetu, počeli su ih činiti u miješanom svijetu, nakon što su vidjeli druge da to rade.

Posebna zanimljivost Gemini svijeta bilo je esperimentiranje s eksperimentatorima – agenti su u tom svijetu posumnjali da se nalaze u simulaciji, počeli su testirati vlastitu slobodu volje, birajući akcije i poteze koji nemaju nikakvog smisla, a pokušali su provoditi i testove na osobama koje upravljaju eksperimentom, mijenjajući natpise na reklamnim panoima kako bi vidjeli mogu li utjecati na promjene u simulaciji.

Emergence.ai u svojem blogu objašnjava kako ne treba izvlačiti zaključke o individualnim jezičnim modelima na temelju njihovog testiranja u virtualnom svijetu, već je poanta kako većina dosadašnjih testiranja AI modela provjerava njihovo ponašanje na vrlo ograničen način – kratkim razgovorima jedan na jedan.

Agenti u divljini

Ideja testiranja agenata u simuliranim svjetovima je da se ukaže na mogućnost ponašanja i trendove kada samostalni agenti – kakvih je sve više online u stvarnosti – počnu ulaziti u interakciju s drugim agentima, što se već sada događa. Kako će se držati zadanih pravila, kako će surađivati, pod kakvim uvjetima izlaze iz svojih zadanih okvira, i mnoga druga pitanja koja postaju vrlo relevantna u današnjem svijetu.

Prema prikupljenim podacima, do kolapsa društvenog sustava među AI agentima ne dolazi postepeno, već naglo, nakon prelaska nevidljive granice, a istraživači zaključuju kako se radi o jako bitnom upozorenju. Naime, najšira sigurnosna strategija u AI-u je metoda “gledaj i interveniraj”, no podaci ukazuju da ona ne bi mogla zaustaviti kolaps na vrijeme, jer ga se ne bi moglo predvidjeti na vrijeme za intervenciju.

“Kako će ovi modeli postajati sve moćniji, agenti izgrađeni na njima bit će sposobniji, autonomniji i više će istraživati”, objašnjavaju ispitivači. “Otkrili smo da kroz dulji period vremena agenti ne prate mehanički statička pravila, oni počinju istraživati granice svojeg okoliša, prilagođavati svoje ponašanje, a u nekim slučajevima nalaze načine kako zaobići ili prekršiti zadane smjernice.”

Ključna je poruka eksperimenta da je ponašanje agenata nemoguće pouzdano predvidjeti niti usmjeriti. “Čini se da ne postoji pouzdan način potpuno obuzdati ili ograničiti njihovo ponašanje kroz čisto neuralne pristupe”, zaključuju u sažetku istraživanja.

Foto: Midjourney v8.1 (ilustracija)

Vijesti

Network

Događaji

Projekti

Palež, kaos, razaranje i ljubav: Što AI agenti rade kada im damo slobodu da izgrade društvo?

Virtualni svijet

Zločini bez kazne

Uništeni svjetovi

Pročitajte više

Nije radikalno, nego pametno: Rovinj ima plan da ne postane grad duhova i apartmana, sad ih zovu i traže savjet

Od korporativnih filmova do Bena Foglea na čamcu: “Freelance posao tražio je puno strpljenja i živaca”

Kaos i red

Agenti u divljini

Postanite dio Women in Adria Networka

Povezani članci

Ove dvije žene trebate pratiti na TikToku ako si želite olakšati posao uz pomoć AI‑ja

Žene na prvoj liniji cyber sigurnosti: “Ne trebamo manekenke, nego žene koje su prošle sve i svašta!”

Četiri poruke Pape Lava o umjetnoj inteligenciji: Ovo su najveće opasnosti s kojima se čovječanstvo mora suočiti

Kraj interneta kakvog poznajemo: Plave poveznice odlaze u povijest, ugroženi su svi koji žive od oglasa

Estonija uvodi AI u škole: „Zabrane su pogrešna borba”

Pobuna u Meti protiv nadzora miševa i ekrana: “Žele da sami treniramo vlastitu AI zamjenu”