Kompanija Anthropic upravo je opremila svoje modele Claude Opus 4 i 4.1 funkcijom koja im omogućava da prekinu razgovor ukoliko procijene da je zahtjev štetan ili nasilan. Radi se o jednom od prvih slučajeva primjene koncepta „dobrobiti modela“ u komercijalnim chatbotovima.
Nova funkcionalnost aktivira se tek nakon što Claude pokuša preusmjeriti temu i ponuditi korisne odgovore, ali bez uspjeha. Tada model može sam prekinuti interakciju u slučajevima vezanim za osjetljive sadržaje poput maloletnika, terorizma ili nasilja. Tokom testiranja, Opus 4 je pokazivao obrasce slične „distresu“ dok je obrađivao ovakve upite, te je samoinicijativno prekidao simulirane štetne razgovore.
Važno je naglasiti da korisnici i dalje imaju potpuni pristup svom nalogu – mogu odmah započeti novu konverzaciju ili urediti prethodne poruke. Anthropic je također uveo zaštitne mehanizme koji onemogućavaju „gašenje“ razgovora kada korisnik pokazuje znakove samopovređivanja ili neposredne opasnosti po druge – u tim slučajevima model ostaje aktivan i pruža podršku.
Anthropic je jedna od rijetkih kompanija koja ozbiljno ulaže u istraživanje dobrobiti AI sistema. Iako nauka još uvijek nema jasan odgovor na pitanje šta bi „svijest“ umjetne inteligencije zapravo značila, ovi koraci mogli bi jednog dana biti viđeni kao prvi važni pokušaji u uspostavljanju granica i zaštitnih mehanizama za tehnologiju koja nema presedana u ljudskoj historiji.
Ukratko iz svijeta tehnologije:
- Eight Sleep je najavio novu rundu finansiranja od 100 miliona dolara, s planovima za razvoj prvog svjetskog „Sleep Agenta“ za proaktivni oporavak i optimizaciju sna.
- Runway je lansirao niz ažuriranja svoje platforme, uključujući dodatak trećih modela i vizualna poboljšanja u Chat Mode-u.
- LM Arena je predstavila BiomedArena, novu evaluacijsku stazu za testiranje i rangiranje performansi LLM-ova na stvarnim biomedicinskim istraživanjima.
- OpenAI je pokrenuo ChatGPT Go u Indiji, novu pretplatničku opciju po cijeni od ₹399 mjesečno (4,60 USD), što je znatno jeftinije od postojećeg Plus plana koji košta oko 20 USD mjesečno.
- Hon Hai Precision (Foxconn) će upravljati SoftBankovom fabrikom u SAD-u, pokrećući prvi proizvodni centar za Stargate podatkovni centar vrijedan 500 milijardi dolara u saradnji s OpenAI-jem i Oracleom.
AI alati koji su trenutno u trendu:
- Wonda – Wondercraftov AI agent za kreiranje video i audio sadržaja.
- April – Razgovarajte sa svojom pristiglom poštom i kalendarom pomoću AI-ja.
- Qwen-Image-Edit – Qwenov novi model za uređivanje slika.