Zaboravite ChatGPT – nova umjetna inteligencija se sama nadograđuje

Zaboravite ChatGPT – nova umjetna inteligencija se sama nadograđuje
AI - umjetna inteligencija, Izvor: Alexandra Koch, Pixabay

Većina modela umjetne inteligencije uči iz podataka koje im dajemo. Oni su obučeni, raspoređeni i većim dijelom ostaju relativno zamrznuti u vremenu dok ih netko ne odluči ponovno obučiti. Ali ova konkretna umjetna inteligencija ne funkcionira tako – ona obučava samu sebe!

Darwin-Gödelov stroj (DGM) ne samo da reagira na naredbe, već i doslovno prepisuje vlastiti kod, provodi eksperimente na sebi i razvija se. U svibnju 2025. istraživači su pokrenuli jedan od najradikalnijih AI sustava do sada – samopoboljšavajući stroj koji ne samo da postaje pametniji s upotrebom, već i mijenja vlastitu strukturu kako bi bolje funkcionirao.

Čak se i sam kopira, ima varijacije, briše ono što ne uspije i zadržava ono što radi. Nema ponovne obuke, pa čak ni ljudski inženjer nije potreban da se umiješa kako bi se prilagodio.

Još je značajnije to što već nadmašuje modele fiksnog koda na stvarnim zadacima i bitno se razlikuje od onoga što smo vidjeli u umjetnoj inteligenciji. Zato njegov uspjeh predstavlja izazov za desetljeća umjetne inteligencije i kako bi nas stroj koji sam sebe prepisuje jednog dana mogao u potpunosti nadmašiti.

Stroj koji sam sebe prepisuje

Do danas, svaki AI sustav ima ograničenje; može raditi samo ono što mu kažemo. Čak ni ChatGPT, unatoč svim svojim mogućnostima, ne može temeljno promijeniti svoj rad bez da netko u OpenAI-u modificira kod. Ali Darwin-Gödelov stroj mijenja taj model.

  • To je prva umjetna inteligencija u stvarnom svijetu dizajnirana da namjerno modificira vlastito programiranje.
  • Prolazi kroz namjerno testirane samonadgradnje i može čitati vlastite Python datoteke.
  • Može razmišljati o tome kako se poboljšava, prepisivati, pa čak i testirati kako bi postala bolja, a zatim ponoviti proces.

Ova ideja nije nova – teorijski Gödelovi strojevi predlažu se već dugi niz godina, a AI sustavi koji se mogu prepisati nakon što to dokažu koristili bi njihovim ciljevima.

Ovaj Darwin-Gödelov stroj, koji koristi formalni pristup dokazivanja, umjesto toga ovisi o nečemu daleko neposrednijem: pokušajima i pogreškama, kao i testovima usporedbe i mjerljivim igrama.

Više se radi o inženjerstvu i zamahu koji ciljaju sami sebe. Poboljšanja nečega što stvarno funkcionira ono su što ovaj stroj čini prvim takve vrste u životu.

Evolucija sa svrhom

Na uglu je populacija agenata za kodiranje, od kojih je svaki sposoban prepisati vlastiti izvorni kod, a oni ne rade izolirano. Postoji digitalni ekosustav koji predlaže promjene, pokreće testove usporedbe, pa se čak i natječe za opstanak na temelju performansi.

Evo kako to funkcionira:
  • Jedan agent isprobava malo samostalno uređivanje – možda preoblikuje način na koji čita datoteke koda ili izrađuje pametniji validator zakrpa.
  • Pokreće ažuriranu verziju na stvarnim programskim zadacima, koristeći utvrđene testove usporedbe poput SWE-bench ili Polyglot.
  • Ako promjena poboljša performanse, agent preživljava i arhivira se. Ako ne, odbacuje se.
  • Novi agenti zatim se granaju od najuspješnijih verzija — razvijajući se poput digitalnih potomaka.

I rezultati govore sami za sebe – performanse su udvostručene na nekim zadacima, i to ne zbog toga što smo mi shvatili bolji algoritam — to je zato što je stroj shvatio kako poboljšati vlastite performanse. To je rekurzivni proces koji poboljšava i potiče još brže poboljšanje.

Brojke ne lažu

Istraživači su testirali DGM na SWE benchmarku, što je mjerilo za automatizirani popravak koda. Počelo je s 20% stopom uspjeha. A onda je taj broj skočio na 50%. Nije imao dodatnu obuku, nije bilo vanjske pomoći, samo je izvukao rekurzivno poboljšanje.

Još je uvjerljivije to što dosljedno nadmašuje modele koji se ne modificiraju sami.

  • Svaka verzija postaje oštrija i učinkovitija.
  • U nekim slučajevima, postaje drugačija od posljednje verzije.
  • Ne radi se samo o učenju onoga što funkcionira, već o učenju kako bolje učiti sa svakim ciklusom kroz koji prolazi.

Ovo je vrsta umjetne inteligencije koja prilagođava alate, usavršava tijekove rada i fino podešava interne strategije – i to je proboj. Ne radi se samo o tome da ova umjetna inteligencija postaje bolja, već o tome da postaje bolja u tome.

Kvaliteta koja teži nečemu čega smo se dugo bojali ili čak nadali, umjetnoj inteligenciji, ranim znakovima nepokolebljivog poboljšanja.

Zašto je to velika stvar?

Darwin-Gödel je drugačiji. Preispituje svoje performanse i prepisuje kako se vlastiti mozak može poboljšati. Mijenja način na koji gradimo inteligenciju. Sada su ljudi pokrenuli novi skok u umjetnoj inteligenciji, od pisanja koda do prikupljanja podataka, pa čak i redizajniranja modela.

Međutim, DGM predlaže budućnost u kojoj umjetna inteligencija koristi nadogradnje kako bi testirala sebe i razvija se brže nego što možemo intervenirati. To je i uzbudljivo i uznemirujuće, jer što više autonomije ovi sustavi dobivaju, to imamo manje utjecaja i uvida u trenutno stanje.

Naravno, sada je Darwin-Gödelov stroj ograničen na referentne vrijednosti kodne baze koje su još uvijek u sandboxu i pod nadzorom. To je također painting away, vrsta umjetne inteligencije koja ne čeka dopuštenje, već se jednostavno poboljšava.

Danas to izgleda kao pametnije ispravljanje grešaka i brže rješavanje problema. Sutra? Možda će izgledati kao nešto što nismo dizajnirali – i što ne razumijemo u potpunosti.