Novi rezultati sa Univerziteta Emory pokazuju da je GPT-5 ostvario izvanredne performanse na medicinskim testovima, nadmašujući i prethodni GPT-4o, ali i same ljekare u zadacima koji zahtijevaju dijagnostičko i multimodalno rezonovanje.
Model je na testu MedQA postigao tačnost od 95,84%, što je skok od gotovo pet procentnih poena u odnosu na najbolji rezultat GPT-4o. Još impresivnije, na složenim multimodalnim zadacima, gdje se kombiniraju anamneza pacijenta i medicinske slike, GPT-5 je ostvario 70% uspješnosti – čak 30 poena više nego GPT-4o.
U poređenju sa zdravstvenim radnicima u fazi prije sticanja licence, GPT-5 je bio bolji za 24% u rezonovanju i 29% u razumijevanju tokom stručnih testova. Model je pokazao i sofisticirane dijagnostičke sposobnosti, poput tačne identifikacije rijetkih stanja – primjerice Boerhaaveovog sindroma – koristeći laboratorijske nalaze i CT skenove.
Ovi rezultati označavaju značajnu promjenu: dok je GPT-4o bio blizu ljudskog nivoa, GPT-5 već sada značajno nadmašuje ljekare. Stručnjaci ističu da se približavamo tački u kojoj bi se izostanak korištenja AI-ja u kliničkoj praksi mogao smatrati profesionalnim propustom. A s obzirom na to da se jaz u performansama i dalje povećava, jasno je da AI postaje nezaobilazan saveznik medicine budućnosti.
Ukratko iz svijeta tehnologije:
- Google je najavio novog Gemini-pokretanog zdravstvenog asistenta za Fitbit, koji će moći pružati personalizovane savjete o fitnessu, spavanju i zdravlju prilagođene podacima korisnika.
- Anthropic je proširio dostupnost svog agentnog alata za programiranje Claude Code na Enterprise i Team pakete, s novim administrativnim kontrolama za upravljanje troškovima, postavkama politika i još mnogo toga.
- MIT-ova inicijativa NANDA otkrila je da samo 5% enterprise AI implementacija donosi prihod, dok jaz u znanju i loše integracije koče širu primjenu tehnologije.
- Sebastien Bubeck iz OpenAI-ja izjavio je da GPT-5-pro može „dokazivati nove zanimljive matematičke teoreme“, koristeći model za rješavanje otvorenog složenog problema.
- Google-ov product lead Logan Kilpatrick objavio je bananu emotikon na X-u, nagovještavajući da je „nano-banana“ model za uređivanje fotografija koji se testira na LM Arena vjerovatno iz Google-a.
AI alati koji su trenutno u trendu:
- Eleven Music API – Integracija visokokvalitetne muzike u proizvode i radne procese.
- M3 Agent – ByteDance Seedov multimodalni agent s dugoročnom memorijom.
- Nemotron Nano 2 – Nvidia porodica malih i efikasnih modela za rezonovanje.