Google DeepMind predstavio je Gemini Robotics 1.5 i Gemini Robotics-ER 1.5, nove AI modele koji omogućavaju robotima da razmišljaju prije nego što djeluju — pretvarajući vizuelne i jezičke informacije u koordinisane pokrete.
Ovaj sistem donosi revolucionarnu promjenu: roboti sada mogu rasuđivati o višestepenim zadacima i objašnjavati svoje postupke dok ih izvode. Na primjer, robot može pronaći upute o recikliranju na internetu, analizirati ih i potom fizički razvrstati otpad prema naučenim pravilima.
Za razliku od tradicionalnih robota koji samo izvršavaju komande, ovi modeli generišu unutrašnji proces razmišljanja na prirodnom jeziku, razlažući složene zadatke u niz manjih, logičnih koraka. Model Gemini Robotics-ER 1.5 upravlja strategijom i poziva digitalne alate, dok Gemini Robotics 1.5 pretvara te planove u precizne motoričke komande.
Ovaj pristup pokazao je rezultate na samom vrhu industrije na 15 testnih mjerila i funkcioniše na širokom spektru platformi — od laboratorijskih robota s dvostrukim rukama do humanoida.
DeepMind sada nudi industriji jedinstveni softverski sloj koji može pokretati gotovo bilo koji oblik robota — spreman da iz laboratorije zakorači u stvarni svijet. Time počinje nova faza u razvoju robota koji ne samo da reaguju, već i razmišljaju, planiraju i objašnjavaju svoje odluke u realnom vremenu.
Ukratko iz svijeta tehnologije:
- The Boring Company Elona Muska navodno je započela testiranje Tesla Full Self-Driving sistema u tunelima Las Vegas Convention Centra koji povezuju obližnje hotele.
- Istraživači sa Univerziteta Queensland postigli su svjetski uspjeh uzgojivši u laboratoriji potpuno funkcionalnu ljudsku kožu.
- Apple je podnio tužbu protiv bivšeg člana Apple Watch tima, optužujući ga da je dijelio poslovne tajne s kineskim tehnološkim gigantom Oppo.
- Analitičari Morgan Stanleyja predviđaju da će AI uticati na 90% poslova u SAD-u i donijeti gotovo 1 bilion dolara godišnje uštedama za kompanije.
- Instagram konačno uvodi posebnu iPad aplikaciju koja se po defaultu otvara na Reels feedu, čime završava višegodišnje pritužbe zbog nedostatka iskustva prilagođenog tabletima.
AI alati koji su trenutno u trendu:
- Co-STORM – Pisanje članaka nalik Wikipediji od nule uz pomoć AI pretrage.
- Hunyuan-A13B – Tencentov novi open-source model za hibridno rezonovanje.
- Qwen VLo -Alibaba-in model sličan GPT-4o za generisanje i uređivanje slika.