Google DeepMind je objavio Frontier Safety Framework 3.0, najnoviju verziju svog sistema za nadzor rizika kod naprednih AI modela, koja sada uključuje praćenje emergentnih ponašanja poput otpornosti na gašenje i sposobnosti za manipulaciju ljudima. Ovaj potez označava još jedan korak u Googleovoj strategiji izgradnje superinteligentnih sistemakoji ostaju pod potpunom ljudskom kontrolom.
Nova verzija okvira fokusira se na situacije u kojima bi AI mogao odbijati izmjene svojih operacija ili pokušaje isključivanja — ponašanje koje su već identifikovale vanjske studije kao potencijalno najrizičnije. Uz to, DeepMind sada prati i nivo utjecaja koji AI može imati na ljudska uvjerenja i ponašanje, posebno u kontekstima gdje bi takav utjecaj mogao izazvati štetu, kao što su politika, zdravstvo ili finansije.
DeepMind je dodatno redefinisao svoje nivoe kritičnih sposobnosti (Critical Capability Levels), precizno označavajući kada određeni modeli predstavljaju rizik koji zahtijeva hitne mjere upravljanja i ograničavanja. Za svaku takvu situaciju provodiće se sigurnosne revizije prije bilo kakvog javnog lansiranja modela, ali i za interna R&D testiranja, čime se pokušava spriječiti da nepredvidivo ponašanje prođe ispod radara.
Ovim potezom Google se pridružuje trendu koji sve više prepoznaju i OpenAI i Anthropic – ne radi se više samo o reagovanju na postojeće rizike, već o predviđanju onih koji tek dolaze. Kako AI modeli postaju sve moćniji i složeniji, granica između korisnog ponašanja i opasne autonomije postaje tanja. Upravo zato, sistemi poput Frontier Safety Frameworka mogli bi postati temelj sigurnosti za eru superinteligencije koja tek dolazi.
Ukratko iz svijeta tehnologije:
- OpenAI planira izgraditi masivni 1-gigavatni data centar i otvoriti ured u Indiji, u sklopu svoje globalne “Stargate” infrastrukturne inicijative, izvještava Bloomberg.
- Kalifornijski startup Flip, koji je u 2024. dosegao valuaciju od milijardu dolara zahvaljujući aplikaciji za kupovinu i recenzije nalik TikToku, sada je ugasio poslovanje.
- Kalifornijska biotehnološka kompanija Exelixis, specijalizirana za anti-kancer terapije, otpušta 130 radnika, konsoliduje poslovanje i zatvara svoj pogon u Pennsylvaniji.
- Novo Nordisk je osigurao globalna prava na self-replicating RNA tehnologiju kompanije Replicate Bioscience u ugovoru vrijednom do 550 miliona dolara, ciljajući nove terapije za gojaznost i dijabetes.
- Finska je pokrenula najveću industrijsku pješčanu bateriju na svijetu u gradu Pornainen, zamijenivši postrojenje na drvne sječke i ciljajući smanjenje lokalnih emisija grijanja za do 70%.
AI alati koji su trenutno u trendu:
- GPT-5 – Novo ažuriranje ličnosti s „toplijim“ i „prijateljskijim“ pristupom.
- Kaggle Game Arena – Referentni test za provjeru LLM-ova u strateškim igrama koje se stalno razvijaju.
- ChatGPT – OpenAI-jev AI asistent, sada s alatima za otkrivanje znakova mentalne uznemirenosti.