„Sora“ на OpenAI генерира реални видеа од текстуални наредби

Во нашите предвидувања за развојот на вештачката интелигенција за 2024 година пишувавме за развојот на АИ генерирани видеа, но никој не можеше да претпостави дека толку голем скок ќе се случи толку брзо.

„Sora“ на OpenAI веќе генерира реални видеа од текстуални наредби. Тука можете да видите некои од демо примерите. За жал OpenAI не кажа кога моделот ќе биде достапен за користење за општата популација. Она што е интересно е дека за тренирање не се користени реални видеа, туку синтетички податоци од Unreal Engine.

Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
Prompt: Extreme close up of a 24 year old woman’s eye blinking, standing in Marrakech during magic hour, cinematic film shot in 70mm, depth of field, vivid colors, cinematic
Prompt: A close up view of a glass sphere that has a zen garden within it. There is a small dwarf in the sphere who is raking the zen garden and creating patterns in the sand.

Sora ги комбинира аспектите на GPT и DALL-E за подобро да ја разбере физичката динамика и да ги одржува деталите низ генерираните снимки за реални резултати.

Иако податоците за обуката сè уште се непознати, се шпекулира дека моделот е развиен со помош на синтетички податоци од Unreal Engine, нарекувајќи го „симулација на многу светови, реални или фантастични“.

Напишете коментар

Вашата адреса за е-пошта нема да биде објавена. Задолжителните полиња се означени со *