Sora: OpenAI lansirao novi AI alat koji pretvara tekst u video. Šokantno je moćan

139

Krajem prošlog tjedna, OpenAI je najavio novi generativni AI sustav pod nazivom Sora, koji proizvodi kratke videozapise iz tekstualnih upita. Iako Sora još nije dostupna javnosti, visoka kvaliteta do sada objavljenih uzoraka rezultata izazvala je i uzbuđenje i zabrinute reakcije.

Ogledni videozapisi koje je objavio OpenAI, za koje tvrtka kaže da ih je stvorila izravno Sora bez izmjena, prikazuju rezultate iz upita poput “fotorealističnog videa izbliza dvaju gusarskih brodova koji se međusobno bore dok plove unutar šalice kave” i “povijesne snimke Kalifornije za vrijeme zlatne groznice”.

Na prvi pogled često je teško reći da ih generira AI, zbog visoke kvalitete videa, tekstura, dinamike scena, pokreta kamere i dobre razine dosljednosti.
Izvršni direktor OpenAI-ja Sam Altman također je objavio neke videozapise na X-u (bivši Twitter) generirane kao odgovor na upite koje su sugerirali korisnici, kako bi demonstrirao Sorine mogućnosti.

Kako Sora funkcionira?

Sora kombinira značajke alata za generiranje teksta i slika u ono što se naziva “model difuzijskog transformatora”.

Transformatori su vrsta neuronske mreže koju je prvi put predstavio Google 2017. Najpoznatiji su po upotrebi u velikim jezičnim modelima kao što su ChatGPT i Google Gemini. Difuzijski modeli, s druge strane, temelj su mnogih AI generatora slika. Rade tako da započinju s nasumičnim šumom i idu prema “čistoj” slici koja odgovara upitu za unos.

Komentari