AI sustav identificira lažne videozapise

U eri u kojoj manipulirani lažni videozapisi mogu širiti dezinformacije, maltretirati ljude i poticati na štetu, istraživači s UC Riversidea stvorili su snažan novi sustav za razotkrivanje tih lažnih videozapisa.
Amit Roy-Chowdhury, profesor elektrotehnike i računarstva, i doktorand Rohit Kundu, obojica s UCR-ovog Fakulteta inženjerstva Marlan i Rosemary Bourns, udružili su se s Googleovim znanstvenicima kako bi razvili model umjetne inteligencije koji detektira manipuliranje videozapisima – čak i kada manipulacije idu daleko dalje od zamjene lica i izmijenjenog govora. Rad je objavljen na arXiv preprint poslužitelju.
Roy-Chowdhury je također sudirektor Instituta za istraživanje i obrazovanje o umjetnoj inteligenciji (RAISE) UC Riversidea, novog interdisciplinarnog istraživačkog centra na UCR-u.
Jedan od prvih alata sposobnih identificirati sintetičke ili obrađene videozapise koji se ne oslanjaju na sadržaj lica
Njihov novi sustav, nazvan Univerzalna mreža za identificiranje manipuliranih i sintetičkih videozapisa (UNITE), otkriva krivotvorine ispitivanjem ne samo lica već i cijelih video kadrova, uključujući pozadine i obrasce kretanja. Ova analiza čini ga jednim od prvih alata sposobnih identificirati sintetičke ili obrađene videozapise koji se ne oslanjaju na sadržaj lica.
„Deepfakeovi su evoluirali“, rekao je Kundu. „Više se ne radi samo o zamjeni lica. Ljudi sada stvaraju potpuno lažne videozapise – od lica do pozadina – koristeći snažne generativne modele. Naš sustav je izgrađen da sve to uhvati i rakrinka.“
Razvoj UNITE-a dolazi u trenutku kada je generiranje teksta u videozapis i slike u videozapis postalo široko dostupno online
Ove AI platforme omogućuju gotovo svima da izrađuju vrlo uvjerljive videozapise, što predstavlja ozbiljan rizik za pojedince, institucije i samu demokraciju.
„Zastrašujuće je koliko su ovi alati postali dostupni“, rekao je Kundu. „Svatko s umjerenim vještinama može zaobići sigurnosne filtere i generirati realistične videozapise javnih osoba koje govore stvari koje nikada nisu rekle.“
Kundu je objasnio da su se raniji detektori deepfakea gotovo u potpunosti usredotočili na znakove lica.
„Ako u kadru nema lica, mnogi detektori jednostavno ne rade“, rekao je. „No dezinformacije mogu doći u mnogim oblicima. Promjena pozadine scene može jednako lako iskriviti istinu.“

Model dubokog učenja temeljen na transformatoru za analizu videoisječaka
Kako bi se riješio ovaj problem, UNITE koristi model dubokog učenja temeljen na transformatoru za analizu videoisječaka. Detektira suptilne prostorne i vremenske nedosljednosti – znakove koje su prethodni sustavi često propuštali. Model se oslanja na temeljni okvir umjetne inteligencije poznat kao SigLIP, koji izdvaja značajke koje nisu vezane za određenu osobu ili objekt.
Nova metoda obuke, nazvana „gubitak pažnje i raznolikosti“, potiče sustav da prati više vizualnih regija u svakom kadru, sprječavajući ga da se fokusira isključivo na lica.
Rezultat je univerzalni detektor sposoban za označavanje niza krivotvorina – od jednostavnih zamjena lica do složenih, potpuno sintetičkih videozapisa generiranih bez ikakvih stvarnih snimaka.
„To je jedan model koji obrađuje sve ove scenarije“, rekao je Kundu. „To ga čini univerzalnim.“
Istraživači su predstavili svoja otkrića na Konferenciji o računalnom vidu i prepoznavanju uzoraka (CVPR) 2025. u Nashvilleu, Tennessee. Rad pod nazivom “Prema univerzalnom sintetičkom video detektoru: od manipulacija licem ili pozadinom do sadržaja koji u potpunosti generira umjetna inteligencija”, pod vodstvom Kundua, opisuje arhitekturu i metodologiju obuke UNITE-a.
Suradnja s Googleom
Među koautorima su istraživači Googlea Hao Xiong, Vishal Mohanty i Athula Balachandra.
Suradnja s Googleom, gdje je Kundu bio na praksi, omogućila je pristup opsežnim skupovima podataka i računalnim resursima potrebnim za obuku modela na širokom rasponu sintetičkog sadržaja, uključujući videozapise generirane iz teksta ili statičnih slika – formate koji često ometaju postojeće detektore.
Iako je još uvijek u razvoju, UNITE bi uskoro mogao igrati vitalnu ulogu u obrani od dezinformacija putem videa. Potencijalni korisnici uključuju platforme društvenih medija, provjeravače činjenica i redakcije koje rade na sprječavanju viralnog širenja manipuliranih videozapisa.
“Ljudi zaslužuju znati je li ono što vide stvarno“, rekao je Kundu. “I kako umjetna inteligencija postaje sve bolja u krivotvorenju stvarnosti, moramo postati bolji u otkrivanju istine.“





