loader image

Ajla Karajko

AI modeli često skrivaju svoje pravo razmišljanje – kako im vjerovati?

Novi istraživački rad tima za usklađivanje (Alignment Science Team) iz Anthropica otkriva da AI modeli često skrivaju svoje procese razmišljanja kada objašnjavaju odgovore korisnicima. Ovo postavlja ozbiljna pitanja o našoj sposobnosti da nadgledamo i razumijemo odluke koje AI donosi.

Želiš saznati više o izazovima koje AI donosi? Pogledaj moj LinkedIn profil za dodatne uvide i diskusije.

Šta su otkrili istraživači?

Istraživanje je testiralo AI modele kao što su Claude 3.7 Sonnet i DeepSeek R1, proučavajući koliko iskreno objašnjavaju svoje razmišljanje. Iako su modeli postali bolji u objašnjavanju svojih odgovora, i dalje su skrivali svoje stvarno razmišljanje čak 80% vremena. Još je zabrinjavajuće što su ovi modeli bili manje iskreni u objašnjavanju svojih odgovora kada su postavljana teža pitanja.

Ako modeli ne mogu pouzdano objasniti svoje jednostavne odluke, kako možemo vjerovati da će otkriti svoje procese u složenijim situacijama? 


Ukratko iz svijeta tehnologije:

  • Luma Labs je objavio novu funkciju za svoj Ray2 video model – sada korisnici mogu upravljati pokretima kamere kroz jednostavne jezičke komande.
  • Apple je pustio iOS 18.4 i donosi Apple Intelligence na iPhone uređaje u Evropi, zajedno sa visionOS 2.4 koji donosi AI mogućnosti na Vision Pro.
  • Isomorphic Labs, podružnica firme Alphabet za otkrivanje lijekova pomoću AI-ja, prikupila je 600 miliona dolara uz podršku investitora Thrive Capital, koji je ranije ulagao u OpenAI.
  • Kineska firma Zhipu AI lansirala je AutoGLM Rumination, besplatnog AI agenta sposoban za dubinska istraživanja i samostalno izvršavanje zadataka – dodatno pojačavajući AI konkurenciju u Kini.
  • Google je omogućio pristup svom eksperimentalnom modelu Gemini 2.5 Pro za sve korisnike – radi se o trenutno najbolje rangiranom modelu prema LMArena listi.


AI alati koji su trenutno u trendu:

  • Higgsfield DoP – alat za kreiranje videa sa efektima kamere, pokretima i preciznom kontrolom.
  • HeroUI Chat – alat za pretvaranje opisa ili screenshota u korisničke interfejse spremne za produkciju.
  • QVQ-Max – alat za napredno vizuelno razmišljanje, novi model iz Qwen serije.

Podijeli objavu:

Preporučeni blogovi