Technológie

Budúcnosť tvorby videí je tu. Sora AI na to potrebuje len jednu vetu

29. marca 2024

2 minút čítania

Spoločnosť OpenAI, ktorú poznáme najmä vďaka vývoju umelej inteligencie a najznámejšieho programu v tejto oblasti ChatGPT, prináša ďalšiu užitočnú vychytávku. Tá zmení celkový pohľad na tvorbu videa, k čomu už nebudete potrebovať tisícové budgety a postačí vám len správne vymyslené zadanie. Sora, ako tento program nazvali, dokáže z vášho textu vytvoriť video za veľmi krátky čas.

Model Sora exceluje v generovaní komplexných scén s viacerými postavami, špecifickými typmi pohybu a presnými detailmi predmetov aj pozadia. Dokáže nielen presne interpretovať pokyny používateľa, ale aj realisticky reprezentovať požadované objekty a postavy vo fyzickom svete.

AI je schopná generovať celé videá naraz alebo len rozšíriť niektoré videá tak, aby boli dlhšie. Celý proces prebieha za využitia predvídacích schopností, čo zabezpečí, že predmet/postava aj keď víde na chvíľu zo záberu, dokáže sa vrátiť v rovnakej kvalite a štruktúre.

Sora is here! It's a diffusion transformer that can generate up to a minute of 1080p video with great coherence and quality. @_tim_brooks and I have been working on this at @openai for a year, and we're pumped about pursuing AGI by simulating everything! https://t.co/DzbyReLJEc pic.twitter.com/IFqfh8H6FW
— Bill Peebles (@billpeeb) February 15, 2024

Nejde však zatiaľ o hotový produkt. Aj sám vývojár OpenAI priznáva, že musia doladiť slabiny. Zatiaľ najväčším problémom generovania videí sú zákony fyziky. Pri základoch ako chôdza či beh dokáže AI kopírovať z výcvikových videí ľudské počínanie, no napríklad pri takom odhryznutí zo sušienky sa môže stať (s veľkou pravdepodobnosťou), že sušienka ostane celá bez stôp po odhryznutí.

Je takéto niečo vôbec bezpečné?

Spoločnosť spolupracuje s viacerými odborníkmi na témy ako dezinformácie, nenávistný obsah a pod., ktorí majú za úlohu vymyslieť systém taký, aby sa predchádzalo zneužívaniu na nekalé účely. Vytvárajú aj nástroje, ktoré pomôžu s odhalením zavádzajúceho obsahu.

Rovnako tak je dôležité, aby bolo ľahko rozpoznateľné, ktoré video je reálne, a ktoré bolo vytvorené pomocou umelej inteligencie. Tá na svoju tvorbu využíva poznatky a moduly DALL-E 3, ktoré nájdeme aj napríklad v ChatGPT.

Pridaj komentár

Prihlásiť sa na odber noviniek

Na e-mail pošleme prehľad noviniek

Posledné

Kancelárie prerábajú na funkčné farmy. Pestuje sa tu naozaj všetko

Európa je najrýchlejšie sa otepľujúcim kontinentom na svete

Trávniky nahradia rastlinami: Ušetria tak milióny litrov vody

Trumpove opatrenia negatívne ovplyvňujú trh s pivom

Budúcnosť tvorby videí je tu. Sora AI na to potrebuje len jednu vetu

Pridaj komentár

Prihlásiť sa na odber noviniek

Budúcnosť tvorby videí je tu. Sora AI na to potrebuje len jednu vetu

Pridaj komentár

Prihlásiť sa na odber noviniek

Podobné články