Google je lansirao Gemini Flash 2.5 Image, model poznat i kao Nano-Banana tokom testiranja, koji donosi napredne mogućnosti višestepenog uređivanja slika uz zadržavanje konzistentnosti likova i stilova. Ovaj iskorak donosi kreatorima veću kontrolu i preciznost u generisanju vizuala, uz prirodan tok editovanja kroz više koraka.
Model je tokom testiranja postao pravi hit, zauzevši prvo mjesto na LM Arena Image Edit leaderboardu, ostavljajući konkurente poput Flux-Kontexta daleko iza sebe. Posebno se izdvaja mogućnost multi-turn editovanja, što znači da korisnici mogu slojevito dodavati izmjene bez gubitka dosljednosti u vizuelnim elementima. Osim toga, podržava i blending slika, kombinovanje stilova i objekata, te napredne transformacije kroz jednostavne tekstualne naredbe.
Još jedna velika prednost je sposobnost multimodalnog rezonovanja – model koristi svjetsko znanje i kontekst kako bi donosio logičnije odluke prilikom generisanja. Primjer je dodavanje odgovarajućih biljaka u scenu, što ga čini pametnijim i realističnijim u odnosu na konkurenciju.
Cijena je postavljena na $0.039 po slici putem API-ja i u Google AI Studiju, što ga čini nešto povoljnijim od OpenAI-jevog gpt-image modela i BFL-ovog Flux-Kontexta.
Iako AI još uvijek nije spreman potpuno zamijeniti Photoshop i slične profesionalne alate, Gemini Flash 2.5 Image donosi nas korak bliže tom scenariju. Zahvaljujući dosljednosti likova i očuvanju vizuelnih detalja, ovaj model ima potencijal da pokrene kreativni talas sličan Studio Ghibli fenomenu, te da otvori vrata novoj generaciji viralnih aplikacija zasnovanih na AI uređivanju.
Ukratko iz svijeta tehnologije:
- OpenAI je najavio lansiranje ChatGPT Go, jeftinije pretplate posebno za Indiju, s cijenom manjom od 5 dolara mjesečno i mogućnošću plaćanja u lokalnoj valuti.
- ElevenLabs je predstavio Chat Mode, omogućavajući korisnicima da na platformi grade isključivo tekstualne konverzacione agente pored sistema zasnovanih prvenstveno na glasu.
- DeepSeek je lansirao svoj V3.1 model s većim kontekstualnim prozorom, dok kineski mediji odgađanje R2 izdanja pripisuju „perfekcionizmu“ izvršnog direktora Lianga Wenfenga.
- Eight Sleep je najavio novu rundu finansiranja od 100 miliona dolara, s planovima za razvoj prvog svjetskog „Sleep Agenta“ za proaktivni oporavak i optimizaciju sna.
- Runway je lansirao niz ažuriranja svoje platforme, uključujući dodatak trećih modela i vizualna poboljšanja u Chat Mode-u.
AI alati koji su trenutno u trendu:
- Wonda – Wondercraft-ov AI agent za kreiranje video i audio sadržaja.
- April – Razgovarajte sa svojom pristiglom poštom i kalendarom pomoću AI-ja.
- Qwen-Image-Edit – Qwenov novi model za uređivanje slika.