loader image

Ajla Karajko

OpenAI lansirao gpt-realtime za glasovne agente

OpenAI je službeno izbacio svoj Realtime API iz beta faze, predstavljajući pritom i novi gpt-realtime model sposoban za govor-u-govor interakciju, uz set novih alata za developere poput podrške za unos slika i integracija sa Model Context Protocol (MCP) serverima.

Novi gpt-realtime donosi napredne mogućnosti poput prepoznavanja neverbalnih signala, kao i automatskog prebacivanja između jezika uz zadržavanje prirodnog toka razgovora. Na testovima audio rezonovanja, model je postigao tačnost od 82,8%, što je ogroman skok u odnosu na prethodnika koji je imao 65,6%.

Pored govorne nadogradnje, OpenAI je dodao i podršku za MCP, što omogućava glasovnim agentima da se povežu s eksternim izvorima podataka i alatima bez potrebe za komplikovanim prilagođenim integracijama. gpt-realtime sada može obrađivati i vizualne ulaze poput fotografija i screenshotova, dajući glasovnom agentu mogućnost da rezonuje o slikama paralelno s razgovorom.

Ovim potezom OpenAI potvrđuje da je mainstream usvajanje glasovnih agenata pitanje vremena. Uz nadogradnje koje donose prirodniju konverzaciju, vizuelno razumijevanje i fleksibilne integracije, gpt-realtime se pozicionira kao ključna platforma za kompanije i developere koji žele da glasovni asistenti postanu sastavni dio korisničke podrške ili personalizovanih aplikacija.


Ukratko iz svijeta tehnologije:

  • Toyoake, Japan, predložio je neobavezujuću uredbu kojom se stanovnicima preporučuje da ograniče ličnu upotrebu pametnih telefona na dva sata dnevno i uvedu večernje termine zabrane korištenja za učenike.
  • Google je pristao platiti 30 miliona dolara za nagodbu u kolektivnoj tužbi u kojoj se tvrdi da je nezakonito prikupljao lične podatke djece mlađe od 13 godina na YouTubeu bez pristanka roditelja.
  • Sony je najavio da će cijene PlayStation 5 konzola u SAD-u porasti za 50 dolara po komadu, uglavnom zbog novih američkih tarifa na uvezenu elektroniku.
  • Great Western Railway je saopćio da je njihov putnički voz na baterije prešao 200 milja, postavivši novi svjetski rekord za najdužu udaljenost pređenu jednim punjenjem.
  • Naučnici su kreirali najdetaljniju genetsku mapu slabosti kod starijih osoba, otvarajući nove puteve za anti-aging terapije preciznim identifikovanjem gena povezanih sa zdravstvenim rizicima.


AI alati koji su trenutno u trendu:

  • ChatGPT – OpenAI-jev AI asistent, sada s alatima za otkrivanje znakova mentalne uznemirenosti.
  • Gemini Storybooks – Google-ova AI sada kreira narativne slikovnice sa pripovijedanjem.
  • AgentHub – Realističan sandbox za simulaciju i evaluaciju AI agenata.

Podijeli objavu:

Preporučeni blogovi