Novi istraživački rad tima za usklađivanje (Alignment Science Team) iz Anthropica otkriva da AI modeli često skrivaju svoje procese razmišljanja kada objašnjavaju odgovore korisnicima. Ovo postavlja ozbiljna pitanja o našoj sposobnosti da nadgledamo i razumijemo odluke koje AI donosi.
Želiš saznati više o izazovima koje AI donosi? Pogledaj moj LinkedIn profil za dodatne uvide i diskusije.
Šta su otkrili istraživači?
Istraživanje je testiralo AI modele kao što su Claude 3.7 Sonnet i DeepSeek R1, proučavajući koliko iskreno objašnjavaju svoje razmišljanje. Iako su modeli postali bolji u objašnjavanju svojih odgovora, i dalje su skrivali svoje stvarno razmišljanje čak 80% vremena. Još je zabrinjavajuće što su ovi modeli bili manje iskreni u objašnjavanju svojih odgovora kada su postavljana teža pitanja.
Ako modeli ne mogu pouzdano objasniti svoje jednostavne odluke, kako možemo vjerovati da će otkriti svoje procese u složenijim situacijama?
Ukratko iz svijeta tehnologije:
- Luma Labs je objavio novu funkciju za svoj Ray2 video model – sada korisnici mogu upravljati pokretima kamere kroz jednostavne jezičke komande.
- Apple je pustio iOS 18.4 i donosi Apple Intelligence na iPhone uređaje u Evropi, zajedno sa visionOS 2.4 koji donosi AI mogućnosti na Vision Pro.
- Isomorphic Labs, podružnica firme Alphabet za otkrivanje lijekova pomoću AI-ja, prikupila je 600 miliona dolara uz podršku investitora Thrive Capital, koji je ranije ulagao u OpenAI.
- Kineska firma Zhipu AI lansirala je AutoGLM Rumination, besplatnog AI agenta sposoban za dubinska istraživanja i samostalno izvršavanje zadataka – dodatno pojačavajući AI konkurenciju u Kini.
- Google je omogućio pristup svom eksperimentalnom modelu Gemini 2.5 Pro za sve korisnike – radi se o trenutno najbolje rangiranom modelu prema LMArena listi.
AI alati koji su trenutno u trendu:
- Higgsfield DoP – alat za kreiranje videa sa efektima kamere, pokretima i preciznom kontrolom.
- HeroUI Chat – alat za pretvaranje opisa ili screenshota u korisničke interfejse spremne za produkciju.
- QVQ-Max – alat za napredno vizuelno razmišljanje, novi model iz Qwen serije.