Esta es Sora, la nueva IA de OpenAI para crear videos desde un texto simple

OpenAI anunció su nueva IA «Sora», basada en texto y a la que le podrás describir una escena y te creará un video de hasta 60 segundos.

Fabián Vega

De los creadores de ChatGPT y DALL*E llega Sora, una nueva inteligencia artificial (IA) capaz de convertir texto en video. Y a través de la cual podrás describir una escena para que te ayude a crear un video de máximo 60 segundos.

Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024

“Estamos enseñando a la IA a comprender y simular el mundo físico en movimiento, con el objetivo de entrenar modelos que ayuden a las personas a resolver problemas que requieren interacción en el mundo real.”

Con la capacidad suficiente para “simular el mundo físico en movimiento”

A través de su web oficial, OpenAI precisó que el objetivo de Sora es ayudar en contextos que requieren de “interacción en el mundo real”, pero donde las personas en ocasiones no pueden llegar, como una montaña, un desierto, o hasta el fondo marino.

🤯 Sora de OpenAI puede combinar videos. pic.twitter.com/Aj7RHiyByL
— MÜTÜÖ (@CanalMutuo) February 16, 2024

A pesar de que su capacidad se ve limitada a videos de 60 segundos, Sora fue entrenada para entender el lenguaje y el funcionamiento de las cosas en la realidad. Por lo que promete poder combinar varios videos cortos generados a través de ella en uno solo.

De momento y debido a que aún tiene algunos errores, Sora solo está disponible para el “Equipo rojo” de seguridad de OpenAI y algunos artistas visuales, diseñadores y cineastas que ayudarán a perfeccionar la IA, y a evaluar si pueden existir daños o riesgos para las personas conforme empiecen a familiarizarse con esta tecnología.

“El modelo actual tiene debilidades. Puede tener dificultades para simular con precisión la física de una escena compleja y puede no comprender instancias específicas de causa y efecto. Por ejemplo, una persona puede darle un mordisco a una galleta, pero después, es posible que la galleta no tenga una marca de mordisco.”

También se encuentra en una fase donde podrán detectar qué videos son creados con Sora, gracias a la implementación de Metadatos durante la creación de los videos. Los cuales permitirán diferenciar cuál es un video real y uno creado por la IA.

Prompt: “A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.” pic.twitter.com/0JzpwPUGPB
— OpenAI (@OpenAI) February 15, 2024

¿Cómo evitarán que Sora cree discursos de odio, desinformación y videos engaños?

El equipo de OpenAI especificó que los miembros de su “Equipo Rojo” (expertos en desinformación, contenido de odio y prejuicios) serán los encargados de probar el modelo en «condiciones adversas».

“Nuestro clasificador de texto comprobará y rechazará las indicaciones de entrada de texto que infrinjan nuestras políticas de uso, como las que solicitan violencia extrema, contenido sexual, imágenes de odio, semejanza de celebridades o la propiedad intelectual de otros.”

“Sora se basa en investigaciones anteriores en DALL· Modelos E y GPT. Utiliza la técnica de resubtitulado de DALL· E 3, que implica la generación de leyendas altamente descriptivas para los datos visuales de entrenamiento. Como resultado, el modelo puede seguir las instrucciones de texto del usuario en el video generado con mayor fidelidad.”

Han pasado menos de 24 horas desde que OpenAI anunció Sora, y la gente ya está enloqueciendo por ello.

Aquí tienes 10 ejemplos sorprendentes que no querrás perderte:

1. Perros de nievepic.twitter.com/Giq1K48zlI
— Alejandro | Copywriting Liberador (@CopyRebeldia) February 16, 2024

Esta es Sora, la nueva IA de OpenAI para crear videos desde un texto simple

Con la capacidad suficiente para “simular el mundo físico en movimiento”

¿Cómo evitarán que Sora cree discursos de odio, desinformación y videos engaños?

Entradas relacionadas