Во нашите предвидувања за развојот на вештачката интелигенција за 2024 година пишувавме за развојот на АИ генерирани видеа, но никој не можеше да претпостави дека толку голем скок ќе се случи толку брзо.
„Sora“ на OpenAI веќе генерира реални видеа од текстуални наредби. Тука можете да видите некои од демо примерите. За жал OpenAI не кажа кога моделот ќе биде достапен за користење за општата популација. Она што е интересно е дека за тренирање не се користени реални видеа, туку синтетички податоци од Unreal Engine.
Sora ги комбинира аспектите на GPT и DALL-E за подобро да ја разбере физичката динамика и да ги одржува деталите низ генерираните снимки за реални резултати.
Иако податоците за обуката сè уште се непознати, се шпекулира дека моделот е развиен со помош на синтетички податоци од Unreal Engine, нарекувајќи го „симулација на многу светови, реални или фантастични“.