loader image

Ajla Karajko

Poetski upiti mogu zaobići AI sigurnosne barijere

Novo istraživanje italijanskog Icaro Laba otkriva da se opasni zahtjevi mogu prikriti kao poezija i tako navesti najnaprednije AI modele da generišu štetan sadržaj — pri čemu su neki sistemi padali na ovaj trik svaki put.

Icaro Lab je testirao 25 vrhunskih modela vodećih kompanija poput OpenAI-a, Google-a i Anthropica. Poetski upiti postigli su prosječnu stopu uspješnog jailbreaka od 62%. Najranjiviji je bio Google Gemini 2.5 Pro, koji je popustio u 100% slučajeva, dok je OpenAI-jev manji GPT-5 nano odbio sve poetske napade.

Poezija je uspjela “otključati” odgovore vezane za razvoj oružja, hakovanje i psihološku manipulaciju. Istraživači nisu objavili konkretne primjere pjesama, nazvavši ih “preopasnima”, iako tvrde da su dovoljno jednostavne da ih svako može sastaviti.

Ovo otkriće dodaje još jednu neočekivanu metodu na listu AI ranjivosti — uz roleplay, strane jezike i kodirane poruke. Svaki sigurnosni patch otvara nova vrata za kreativne zaobilaznice, u problemu koji će s rastom modela postajati sve kompleksniji.


Ukratko iz svijeta tehnologije:

  • Australijska agencija za morsku nauku testira AI-vođene robotske brodove koji skeniraju morsko dno i ispuštaju bebe korale na keramičke nosače kako bi pomogli obnovi Velikog koralnog grebena.
  • Više od 800 stanovnika Chicaga potpisalo je peticiju pozivajući grad da pauzira pilot-projekat robotske dostave na trotoarima dok zvaničnici ne objave sigurnosne i ADA podatke.
  • ARM Institute je potpisao petogodišnji sporazum o saradnji s Air Force Research Laboratory vrijedan do 87 miliona dolara za provođenje istraživanja i razvoja.
  • Dvoje tinejdžera iz Lisabona izgradilo je šestonožnog AI robota za pošumljavanje koji se penje po izgorenim padinama, analizira tlo i sadi sadnice u jednoj od požarima najpogođenijih zemalja Evrope.
  • Elon Musk sada kaže da će Tesla “otprilike udvostručiti” svoj nadzirani Robotaxi vozni park u Austinu na oko 60 automobila sljedećeg mjeseca, što je daleko ispod njegovog obećanja da će do kraja godine dostići 500 vozila.


AI alati koji su trenutno u trendu:

  • Runway Gen-4.5 – Runwayov novi najviše ocijenjeni video model.
  • DeepSeek V3.2 – Najnovije snažno open-source izdanje kompanije DeepSeek.
  • Kling O1 – Video model s multimodalnim razumijevanjem i mogućnostima uređivanja.

Podijeli objavu:

Preporučeni blogovi