Tesla mijenja pristup u treniranju Optimus robota

30 Septembra, 2025

Prema izvještaju Business Insidera, Tesla je napravila veliki zaokret u načinu na koji trenira svog humanoidnog robota Optimus. Umjesto dosadašnjeg oslanjanja na motion-capture odijela i VR headsetove, kompanija sada prelazi na vizuelni pristup, koristeći video snimke radnika koji obavljaju zadatke.

Ovaj pristup odražava metodologiju razvoja autonomne vožnje, gdje se masivni setovi video podataka koriste za treniranje neuronskih mreža da razviju prilagodljivo ponašanje. Radnici sada nose posebne kacige s pet Tesla-inženjerskih kamera koje bilježe detaljne pokrete ruku i prstiju iz više uglova, što daje bogat skup podataka za treniranje.

Promjena vodstva također je dio ove tranzicije – program je sada pod rukovodstvom Ashoka Elluswamyja, direktora za AI u Tesli, nakon što je bivši šef projekta Milan Kovac odstupio.

Stručnjaci naglašavaju da vizuelno učenje može omogućiti Optimusu da generalizuje vještine, odnosno uči širok spektar zadataka bez potrebe za svakim pojedinačnim treningom. Međutim, upozoravaju i da nedostatak fizičke povratne sprege (koju teleoperacija nudi) može ograničiti preciznost i prilagodljivost u složenim scenarijima.

Zašto je ovo važno? Tesla ovim potezom ubrzava proces prikupljanja podataka, što se uklapa u Elona Muska filozofiju da AI najbolje uči pomoću kamera – isti princip na kojem se zasniva i Teslina self-driving tehnologija. Ključno pitanje je hoće li kompanija uspjeti prikupiti dovoljno bogato anotiranih video podataka kako bi Optimus ovladao širokim spektrom kućnih i industrijskih zadataka.

Ukratko iz svijeta tehnologije:

Googleov product lead Logan Kilpatrick objavio je bananu emotikon na X-u, nagovještavajući da je „nano-banana“ model za uređivanje fotografija koji se testira na LM Arena vjerovatno iz Googlea.
OpenAI je najavio lansiranje ChatGPT Go, jeftinije pretplate posebno za Indiju, s cijenom manjom od 5 dolara mjesečno i mogućnošću plaćanja u lokalnoj valuti.
ElevenLabs je predstavio Chat Mode, omogućavajući korisnicima da na platformi grade isključivo tekstualne konverzacione agente pored sistema zasnovanih prvenstveno na glasu.
DeepSeek je lansirao svoj V3.1 model s većim kontekstualnim prozorom, dok kineski mediji odgađanje R2 izdanja pripisuju „perfekcionizmu“ izvršnog direktora Lianga Wenfenga.
Eight Sleep je najavio novu rundu finansiranja od 100 miliona dolara, s planovima za razvoj prvog svjetskog „Sleep Agenta“ za proaktivni oporavak i optimizaciju sna.