OpenAI je službeno izbacio svoj Realtime API iz beta faze, predstavljajući pritom i novi gpt-realtime model sposoban za govor-u-govor interakciju, uz set novih alata za developere poput podrške za unos slika i integracija sa Model Context Protocol (MCP) serverima.
Novi gpt-realtime donosi napredne mogućnosti poput prepoznavanja neverbalnih signala, kao i automatskog prebacivanja između jezika uz zadržavanje prirodnog toka razgovora. Na testovima audio rezonovanja, model je postigao tačnost od 82,8%, što je ogroman skok u odnosu na prethodnika koji je imao 65,6%.
Pored govorne nadogradnje, OpenAI je dodao i podršku za MCP, što omogućava glasovnim agentima da se povežu s eksternim izvorima podataka i alatima bez potrebe za komplikovanim prilagođenim integracijama. gpt-realtime sada može obrađivati i vizualne ulaze poput fotografija i screenshotova, dajući glasovnom agentu mogućnost da rezonuje o slikama paralelno s razgovorom.
Ovim potezom OpenAI potvrđuje da je mainstream usvajanje glasovnih agenata pitanje vremena. Uz nadogradnje koje donose prirodniju konverzaciju, vizuelno razumijevanje i fleksibilne integracije, gpt-realtime se pozicionira kao ključna platforma za kompanije i developere koji žele da glasovni asistenti postanu sastavni dio korisničke podrške ili personalizovanih aplikacija.
Ukratko iz svijeta tehnologije:
- Toyoake, Japan, predložio je neobavezujuću uredbu kojom se stanovnicima preporučuje da ograniče ličnu upotrebu pametnih telefona na dva sata dnevno i uvedu večernje termine zabrane korištenja za učenike.
- Google je pristao platiti 30 miliona dolara za nagodbu u kolektivnoj tužbi u kojoj se tvrdi da je nezakonito prikupljao lične podatke djece mlađe od 13 godina na YouTubeu bez pristanka roditelja.
- Sony je najavio da će cijene PlayStation 5 konzola u SAD-u porasti za 50 dolara po komadu, uglavnom zbog novih američkih tarifa na uvezenu elektroniku.
- Great Western Railway je saopćio da je njihov putnički voz na baterije prešao 200 milja, postavivši novi svjetski rekord za najdužu udaljenost pređenu jednim punjenjem.
- Naučnici su kreirali najdetaljniju genetsku mapu slabosti kod starijih osoba, otvarajući nove puteve za anti-aging terapije preciznim identifikovanjem gena povezanih sa zdravstvenim rizicima.
AI alati koji su trenutno u trendu:
- ChatGPT – OpenAI-jev AI asistent, sada s alatima za otkrivanje znakova mentalne uznemirenosti.
- Gemini Storybooks – Google-ova AI sada kreira narativne slikovnice sa pripovijedanjem.
- AgentHub – Realističan sandbox za simulaciju i evaluaciju AI agenata.