OpenAI je predstavio novi standard nazvan GDPval, koji procjenjuje koliko vještačka inteligencija može parirati profesionalcima u stvarnom radu. Test je obuhvatio 44 zanimanja — od finansija do zdravstva — i uključio vodeće modele poput GPT-5, Claude Opus 4.1, Gemini 2.5 i Grok 4, koje su stručnjaci ocjenjivali prema kvalitetu i tačnosti obavljenih zadataka.
Ukupno je analizirano 1.320 zadataka koje su pripremili profesionalci s prosječno 14 godina iskustva iz devet ekonomskih sektora. Prema rezultatima, Claude Opus 4.1 je ostvario najbolji ukupni skor s 47,6 % pobjeda, posebno briljirajući u vizuelnim i prezentacijskim zadacima, dok je GPT-5 prednjačio u tehničkoj preciznosti i analitičkom razmišljanju.
OpenAI je otkrio da je učinak modela utrostručen u samo 15 mjeseci, upoređujući napredak od GPT-4o do GPT-5, što ukazuje na izuzetno brz tempo razvoja i sve veću sposobnost AI sistema da obavljaju kompleksne radne zadatke.
Ono što GDPval jasno pokazuje jeste da, iako AI modeli još nisu u potpunosti spremni zamijeniti ljude, već dostižu profesionalni nivo u određenim oblastima. Ako se nastavi ovakav tempo napretka, sljedeći veliki skok mogao bi doći za samo nekoliko mjeseci — otvarajući novo poglavlje u načinu na koji radimo i sarađujemo s inteligentnim sistemima.
Ukratko iz svijeta tehnologije:
- Kalifornijski startup Telo, proizvođač kompaktnog električnog kamioneta MT1 vrijednog 41.000 dolara, prikupio je 20 miliona dolara u seriji A finansiranja, koju su zajednički predvodili suosnivač Tesle Marc Tarpenning i drugi investitori.
- NASA razmatra upotrebu nuklearnog udara kao krajnje mjere odbrane od asteroida 2024 YR4, koji sada ima oko 4% šanse da se sudari s Mjesecom 2032. godine.
- Valon zapošljava – Forward Deployed Engineer, plata 130.000–230.000 USD + udio u vlasništvu. Rad na lokaciji s korporativnim klijentima radi prevođenja njihovih potreba u kod. Lokacije: New York, San Francisco i Seattle. Prijave ovdje.*
- Spotify je najavio AI zaštitne mjere uključujući filter za spam, politiku protiv imitacije i obavezu otkrivanja AI sadržaja, otkrivajući da je već uklonjeno preko 75 miliona AI spam pjesama.
- Meta je pokrenula Vibes, novi AI video feed unutar aplikacije Meta AI, koji korisnicima omogućava otkrivanje, kreiranje i remiksovanje kratkih AI videa s vizuelnim efektima, muzikom i stilovima.
AI alati koji su trenutno u trendu:
- Kaggle Game Arena – Referentni test za provjeru LLM-ova u strateškim igrama koje se stalno razvijaju.
- ChatGPT – OpenAI-jev AI asistent, sada s alatima za otkrivanje znakova mentalne uznemirenosti.
- Gemini Storybooks – Google-ova AI sada kreira narativne slikovnice sa pripovijedanjem.