Spoločnosť OpenAI, ktorú poznáme najmä vďaka vývoju umelej inteligencie a najznámejšieho programu v tejto oblasti ChatGPT, prináša ďalšiu užitočnú vychytávku. Tá zmení celkový pohľad na tvorbu videa, k čomu už nebudete potrebovať tisícové budgety a postačí vám len správne vymyslené zadanie. Sora, ako tento program nazvali, dokáže z vášho textu vytvoriť video za veľmi krátky čas.
Model Sora exceluje v generovaní komplexných scén s viacerými postavami, špecifickými typmi pohybu a presnými detailmi predmetov aj pozadia. Dokáže nielen presne interpretovať pokyny používateľa, ale aj realisticky reprezentovať požadované objekty a postavy vo fyzickom svete.
AI je schopná generovať celé videá naraz alebo len rozšíriť niektoré videá tak, aby boli dlhšie. Celý proces prebieha za využitia predvídacích schopností, čo zabezpečí, že predmet/postava aj keď víde na chvíľu zo záberu, dokáže sa vrátiť v rovnakej kvalite a štruktúre.
Nejde však zatiaľ o hotový produkt. Aj sám vývojár OpenAI priznáva, že musia doladiť slabiny. Zatiaľ najväčším problémom generovania videí sú zákony fyziky. Pri základoch ako chôdza či beh dokáže AI kopírovať z výcvikových videí ľudské počínanie, no napríklad pri takom odhryznutí zo sušienky sa môže stať (s veľkou pravdepodobnosťou), že sušienka ostane celá bez stôp po odhryznutí.
Je takéto niečo vôbec bezpečné?
Spoločnosť spolupracuje s viacerými odborníkmi na témy ako dezinformácie, nenávistný obsah a pod., ktorí majú za úlohu vymyslieť systém taký, aby sa predchádzalo zneužívaniu na nekalé účely. Vytvárajú aj nástroje, ktoré pomôžu s odhalením zavádzajúceho obsahu.
Rovnako tak je dôležité, aby bolo ľahko rozpoznateľné, ktoré video je reálne, a ktoré bolo vytvorené pomocou umelej inteligencie. Tá na svoju tvorbu využíva poznatky a moduly DALL-E 3, ktoré nájdeme aj napríklad v ChatGPT.