loader image

Ajla Karajko

Poetski upiti mogu zaobići AI sigurnosne barijere

Novo istraživanje italijanskog Icaro Laba otkriva da se opasni zahtjevi mogu prikriti kao poezija i tako navesti najnaprednije AI modele da generišu štetan sadržaj — pri čemu su neki sistemi padali na ovaj trik svaki put. Icaro Lab je testirao 25 vrhunskih modela vodećih kompanija poput OpenAI-a, Google-a i Anthropica. Poetski upiti postigli su prosječnu […]

OpenAI trenira modele da “priznaju” kada varaju

OpenAI je objavio novo istraživanje o tehnici nazvanoj “Confessions”, koja modele uči da generišu drugi, potpuno iskren izlaz — u kojem sami prijavljuju kršenje pravila, prečice ili varljiva rješenja koja su koristili. Model nakon glavnog odgovora piše poseban “izvještaj o priznanjima” gdje navodi sva primljena uputstva i da li ih je zaista ispoštovao. Ova priznanja […]

Anthropic koristi Claude-a kao istraživačkog intervjuera

Anthropic je lansirao Anthropic Interviewer, Claude-om pokretan alat koji provodi i analizira kvalitativne intervjue u velikom obimu — debitirajući studijom sa 1.250 profesionalaca o tome kako AI utiče na njihov rad. Ovaj alat pokriva cijeli istraživački proces: priprema pitanja, vodi razgovore od 10–15 minuta i grupiše teme za ljudske analitičare. U prvoj studiji, 86% ispitanika […]

Anthropic anketira vlastite inženjere o uticaju AI-a na njihov rad

Anthropic je objavio internu studiju zasnovanu na odgovorima 132 inženjera, otkrivajući kako su AI alati značajno promijenili svakodnevni rad u kompaniji — povećavajući produktivnost, ali i otvarajući pitanja poput gubitka vještina, manje mentorstva i nesigurnosti karijere. Inženjeri kažu da sada koriste Claude za 60% svojih zadataka, uz procijenjeni rast produktivnosti od 50%, što je duplo […]

Procurili dokumenti otkrivaju uvid u ‘dušu’ Claude-a

Interni dokument pod nazivom “Soul”, koji opisuje ličnost, etičke principe i samopoimanje Claude modela, pojavio se javno nakon što ga je istraživač izvukao iz Claude 4.5 Opus verzije — a Anthropic je potvrdio da je autentičan i da je korišten u treningu. Dokument postavlja hijerarhiju Claudeovih prioriteta: sigurnost, etiku, interne smjernice kompanije i korisnost, uz […]

Anthropic se priprema za IPO trku sa OpenAI-jem

Prema navodima Financial Timesa, Anthropic počinje pripreme za izlazak na berzu već 2026. godine — angažujući istu pravnu firmu koja je vodila IPO-e Googlea i LinkedIna, dok investitori vrše pritisak da Claude kreator prvi izađe na tržište prije OpenAI-ja. Anthropic je, navodno, angažovao Wilson Sonsini, poznatu po tome što je izvela najveće tehnološke gigante na […]

Google planira graditi svemirske podatkovne centre do 2027. godine

Google-ov CEO Sundar Pichai otkrio je ambiciozan plan: pod projektom “Suncatcher”, kompanija će do 2027. lansirati prve solarne satelite–data centre u svemir, što bi moglo potpuno promijeniti način na koji se gradi AI infrastruktura. Google u 2027. planira lansirati dva prototipa u partnerstvu s kompanijom Planet, kako bi testirali AI hardver u svemirskim uslovima. Sateliti […]

Kina pretiče SAD u otvorenoj AI ekonomiji

Novo istraživanje MIT-a i Hugging Facea, koje analizira 2.2 milijarde preuzimanja na Hugging Face platformi, otkriva veliki zaokret u globalnom AI pejzažu: kineske kompanije preuzele su dominaciju koju su godinama držale američke tehnološke firme. Studija pokazuje da su kineski AI developeri prestigli američke po udjelu u preuzimanjima — 17.1% naspram 15.8%. Glavni pokretači ovog rasta […]

Aristotle’ AI riješio 30-godišnji matematički problem

Aristotle, AI sistem kompanije Harmonic, samostalno je riješio 30 godina staru verziju Erdős Problema #124 — što istraživači nazivaju prvim pravim korakom u eru “vibe proving” matematike. Sistem je do rezultata došao za šest sati, a zatim formalno verifikovao dokaz u Lean-u za samo jednu minutu. Ovo je omogućeno novom beta verzijom Aristotlea, koja kombinuje […]