loader image

Ajla Karajko

ByteDance je upravo predstavio Seaweed – mali, ali ozbiljno moćan AI alat za generisanje videa

Dok svi pričaju o velikim modelima kao što su Google Veo, Sora ili Kling, ByteDance je odlučio da pokaže da nije sve u veličini. Njihov novi AI model zove se Seaweed – ima “samo” 7 milijardi parametara, ali po rezultatima može stajati rame uz rame s daleko većim i skupljim sistemima.

Šta to znači u praksi? 

Seaweed podržava više modova: tekst-u-video, slika-u-video, pa čak i generisanje videa vođeno zvukom. Trajanje izlaza ide do 20 sekundi, a kvalitet? Ljudske evaluacije ga stavljaju vrlo visoko – posebno u zadacima kao što su prevođenje slika u video, gdje u nekim slučajevima nadmašuje i Soru i Wan 2.1.

I nije samo “generiši video pa šta bude” – Seaweed može da upravlja složenim radnjama poput pričanja priče kroz više scena, kontrolisanog kretanja kamere, pa čak i sinhronizovanog zvuka i pokreta usana. Posebno je dobar u realističnoj animaciji ljudi, što znači da bi mogao imati ozbiljnu primjenu u stvarima poput digitalnih avatara, video tutorijala ili virtualnih influensera.

Ono što ovaj model čini još zanimljivijim je efikasnost – koristi daleko manje resursa od konkurenata, ali i dalje pruža rezultate koji su skoro pa vrhunski.

I dok Kina već vodi trku u AI video generaciji s modelima kao što su Wan i Kling, Seaweed je dokaz da ti za kreativnost ne treba masivan model – samo dobar dizajn i fokus na ono što zaista trebaš.


Ukratko iz svijeta tehnologije:

  • Liquid Sciences je predstavio Hyena Edge, hibridni AI sa “konvolucijskom” arhitekturom koja omogućava brže procesiranje i poboljšane benchmark testove na mobilnim uređajima.
  • OpenAI je predstavio novu lakšu verziju za duboko istraživanje, pokrenutu o4-mini modelom, kako bi proširio limite korištenja, navodeći da je “nekoliko puta inteligentniji” i puno jeftiniji za serviranje.
  • Digitalni izdavač Ziff Davis podnio je tužbu protiv OpenAI-a, optužujući kompaniju da je ukrala sadržaj sa svojih platformi (kao što su Mashable, PCMag i IGN) kako bi trenirala modele.
  • Moonshot AI je lansirao Kimi-Audio, novi open-source, SOTA audio model koji se odlikuje prepoznavanjem govora, audio-to-text i speech-to-speech razgovorima.
  • Figure AI i United Parcel Service (UPS) navodno razgovaraju o partnerstvu kako bi humanoide uveli u procese otpreme i logistike.


AI alati koji su trenutno u trendu:

  • Researcher & Analyst – Copilot agenti za istraživačke i zadatke u oblasti podataka i nauke.
  • KLING 2.0 – Napredna generacija i uređivanje AI videa i slika.
  • Retellio – AI agent koji pretvara snimke korisničkih poziva u sažete, AI-kurirane podcaste, ističući ključne uvide za poslovne lidere.

Podijeli objavu:

Preporučeni blogovi