loader image

Ajla Karajko

GPT-5 nadmašio doktore na medicinskim ispitima

Novi rezultati sa Univerziteta Emory pokazuju da je GPT-5 ostvario izvanredne performanse na medicinskim testovima, nadmašujući i prethodni GPT-4o, ali i same ljekare u zadacima koji zahtijevaju dijagnostičko i multimodalno rezonovanje.

Model je na testu MedQA postigao tačnost od 95,84%, što je skok od gotovo pet procentnih poena u odnosu na najbolji rezultat GPT-4o. Još impresivnije, na složenim multimodalnim zadacima, gdje se kombiniraju anamneza pacijenta i medicinske slike, GPT-5 je ostvario 70% uspješnosti – čak 30 poena više nego GPT-4o.

U poređenju sa zdravstvenim radnicima u fazi prije sticanja licence, GPT-5 je bio bolji za 24% u rezonovanju i 29% u razumijevanju tokom stručnih testova. Model je pokazao i sofisticirane dijagnostičke sposobnosti, poput tačne identifikacije rijetkih stanja – primjerice Boerhaaveovog sindroma – koristeći laboratorijske nalaze i CT skenove.

Ovi rezultati označavaju značajnu promjenu: dok je GPT-4o bio blizu ljudskog nivoa, GPT-5 već sada značajno nadmašuje ljekare. Stručnjaci ističu da se približavamo tački u kojoj bi se izostanak korištenja AI-ja u kliničkoj praksi mogao smatrati profesionalnim propustom. A s obzirom na to da se jaz u performansama i dalje povećava, jasno je da AI postaje nezaobilazan saveznik medicine budućnosti.


Ukratko iz svijeta tehnologije:

  • Google je najavio novog Gemini-pokretanog zdravstvenog asistenta za Fitbit, koji će moći pružati personalizovane savjete o fitnessu, spavanju i zdravlju prilagođene podacima korisnika.
  • Anthropic je proširio dostupnost svog agentnog alata za programiranje Claude Code na Enterprise i Team pakete, s novim administrativnim kontrolama za upravljanje troškovima, postavkama politika i još mnogo toga.
  • MIT-ova inicijativa NANDA otkrila je da samo 5% enterprise AI implementacija donosi prihod, dok jaz u znanju i loše integracije koče širu primjenu tehnologije.
  • Sebastien Bubeck iz OpenAI-ja izjavio je da GPT-5-pro može „dokazivati nove zanimljive matematičke teoreme“, koristeći model za rješavanje otvorenog složenog problema.
  • Google-ov product lead Logan Kilpatrick objavio je bananu emotikon na X-u, nagovještavajući da je „nano-banana“ model za uređivanje fotografija koji se testira na LM Arena vjerovatno iz Google-a.


AI alati koji su trenutno u trendu:

  • Eleven Music API – Integracija visokokvalitetne muzike u proizvode i radne procese.
  • M3 Agent – ByteDance Seedov multimodalni agent s dugoročnom memorijom.
  • Nemotron Nano 2 – Nvidia porodica malih i efikasnih modela za rezonovanje.

Podijeli objavu:

Preporučeni blogovi