A principios de este año, OpenAI, los creadores de ChatGPT, anunciaron Sora, un generador de videos basado en inteligencia artificial. Algunas de las demostraciones que la compañía mostró fueron hiperrealistas, desde cachorros jugando en la nieve hasta la vista desde un vagón de metro viajando a través de un paisaje urbano. En resumen, fue impresionante y aterrador, como expliqué en mis primeras impresiones aquí.
Desde entonces, las noticias sobre Sora han sido bastante silenciosas: la compañía no ha puesto la plataforma a prueba pública, por lo que no hemos tenido muchas experiencias de primera mano. Pero eso está cambiando esta semana. No solo OpenAI está haciendo Sora más accesible, sino que están abriendo su generador de videos para cualquier persona con una cuenta de ChatGPT Plus. Las cosas están a punto de ponerse interesantes.
Novedades de Sora
OpenAI hizo el anuncio el lunes, tras una presentación anticipada de Marques Brownlee. Si seguiste de cerca el anuncio original de Sora, ninguno de los ejemplos aquí te sorprenderá: en resumen, Sora puede ser solicitado para generar videos fotorrealistas y cortos en varias situaciones diferentes. Tanto OpenAI como Marques Brownlee han mostrado tomas de drones sobre acantilados, animales en la naturaleza y personas realizando tareas "en cámara". Pero lo realmente nuevo hoy son varias funciones que OpenAI ha agregado al programa Sora en general.
Está "Storyboard", una especie de editor de video que te permite juntar diferentes solicitudes de video para crear videos más largos sobre un mismo tema. Por ejemplo, puedes hacer una solicitud para que aparezca una grúa de pie en el agua y otra para que esa grúa mueva su cabeza hacia el agua. Luego, Sora combinará esas dos solicitudes en un video continuo. "Recut" también actúa como un editor de video, pero aquí puedes aislar una parte específica de tu video y pedirle a Sora que la extienda. "Remix" abre un nuevo campo de solicitud, que te permite pedir cambios en un video ya existente. (También puedes elegir la "intensidad" del remix, lo que afecta cuánto del video realmente se modifica según tu solicitud). Finalmente, "Blend" te permite cambiar el sujeto de un video por otro. El ejemplo de Sora es convertir una mariposa de un video en una orquídea de otro clip.
De todas estas nuevas funciones, Storyboard parece ser la más interesante. Parece ser una solución inteligente para generar una escena compleja con múltiples acciones, ya que intentar meter todo eso en una sola solicitud probablemente fallará. Remix también podría ser útil en teoría para afinar detalles de un video sin tener que desechar la generación inicial. Pero al final, nuestro interés colectivo en el modelo proviene de su función básica: le das a Sora una idea para un video y ella lo genera por ti. O, subes una foto desde tu biblioteca y Sora anima los sujetos inanimados en una escena en movimiento.
Sora en acción
Cuando envías una solicitud, tu video se agrega a tu "cola" para su procesamiento. El tiempo que tarda un video en generarse depende de tus configuraciones, como resolución, duración y la cantidad de variaciones que generes. Yo tengo un plan estándar de ChatGPT Plus, por lo que estoy limitado a una resolución máxima de 720p y una duración máxima de cinco segundos. Los usuarios de ChatGPT Pro pueden aumentar esa resolución hasta 1080p, crear videos de hasta 20 segundos y generar hasta cuatro variaciones de su video.
Lamentablemente para mí, parece que todos están tratando de usar Sora en este momento. Mi primer y único intento de solicitud ("toma en movimiento de un taxi conduciendo por el centro de la ciudad") se quedó en espera de procesamiento todo el tiempo que estuve escribiendo este artículo. De hecho, OpenAI ha detenido la creación de cuentas por ahora, ya que demasiada gente está tratando de acceder al generador de videos.
Finalmente, mi video se generó, y fue tosco. La calidad del video del taxi y la ciudad fue bastante buena (de nuevo, muy fotorrealista), pero los movimientos del taxi fueron descontrolados. Primero, condujo en reversa, luego se transformó en un auto que iba en otra dirección, antes de acelerar mientras otro taxi entraba en primer plano. (Mi taxi original también desapareció en el aire, mientras que el nuevo taxi no tenía baúl; en su lugar, dos frentes).
Como está tomando tanto tiempo generar videos, por ahora, es útil ver a alguien como Marques Brownlee, quien ha pasado tiempo probando esta herramienta. En su reseña de Sora, él encuentra que la herramienta aún lucha con los problemas típicos de los videos generados por IA: los videos pueden parecer fotorrealistas, pero pierden realismo en el movimiento. Sora a menudo confunde qué pierna debe ir adelante y cuál atrás durante los ciclos de caminata, o "olvida" objetos por completo. Cuando Brownlee pidió un video de un revisor de tecnología cubriendo un smartphone, el revisor sostiene dos smartphones en sus manos, y uno simplemente desaparece sin razón. Algunos aspectos del video pueden ir a cámara lenta, mientras que otros van a velocidad normal, lo que se ve raro. Estos fallos son comunes en la mayoría de las salidas de Sora que he visto: si los buscas, los verás, y llaman la atención sobre la artificialidad del video.
Esto también ocurre con los videos de "baja calidad", como las generaciones de grabaciones de cámaras de seguridad o CCTV. Los autos se chocan y desaparecen, o las personas se mueven de manera poco realista. Pero debo decir que la baja calidad de estos videos facilita el engaño: si Sora puede comprender la física, las personas se divertirán inventando grabaciones de CCTV que no existen.
En la experiencia de Brownlee, lo que Sora hace mejor no es realista en absoluto: los gráficos en movimiento, por ejemplo, generalmente se ven bien, al igual que algunos clips de animaciones y personajes animados. Una animación del Empire State Building parece algo sacado de una serie de Netflix, por ejemplo. Y cuando Brownlee subió una imagen de personajes animados de hojas que DALL-E generó, Sora animó la imagen de manera algo creíble. Es más fácil ignorar las imperfecciones cuando el video no pretende ser real en absoluto.
Sora también parece ser decente generando tomas de drones y en movimiento: una toma de dron del monte Fuji o el puente Golden Gate aparece suave y fotorrealista. Si miras de cerca, podrías notar fallos e imperfecciones, como olas que no se comportan como deberían, pero probablemente podrías insertar estas tomas en programas y películas sin que muchas (o la mayoría) de las personas se den cuenta.
¿Qué sigue?
Sora me asustó en febrero cuando fue anunciada. En los diez meses que han pasado, sigo asustado, pero no porque los videos sean mucho mejores. De hecho, solo con lo que veo hoy, la calidad parece ser más o menos la misma, aunque con algunas nuevas funciones de IA que puedes usar para ajustar esos videos. El realismo sigue estando allí cuando está, al igual que los fallos, de los cuales hay muchos.
Lo que me asusta es la accesibilidad: una vez que OpenAI resuelva la demanda, Sora estará disponible para cualquier persona con una suscripción a ChatGPT Plus. Por $20, tendrás acceso a una herramienta que puede generar hasta 50 videos de cinco segundos al mes. Claro, cinco segundos no es mucho tiempo, por lo que sin algo de ingenio, estos videos probablemente no serán los más dañinos.
Ahí es donde entra ChatGPT Pro. Este plan es mucho más caro ($200 al mes), pero por esos $200, puedes crear hasta 500 videos, cada uno de hasta 1080p y hasta 20 segundos de duración. OpenAI dice que también puedes descargar estos videos sin marca de agua, lo que hará que la detección sea mucho más difícil.
Claro, la mayoría de nosotros no nos suscribiremos a Pro por esto, pero $200 no es un gran obstáculo para los actores malintencionados que quieran difundir desinformación. Imagina la próxima gran crisis polarizante, alimentada por una avalancha de videos que "prueban" lo que ocurrió de una u otra manera, cuando en realidad esos videos no son reales en absoluto. OpenAI tiene algunas funciones de seguridad integradas aquí, como bloquear materiales con derechos de autor o figuras notables para que no se incorporen en un video, pero veremos qué tan bien funcionan estos bloqueos en la práctica.
Cómo probar Sora
Actualmente, la creación de cuentas no está disponible para Sora, pero eso podría cambiar pronto. Si estás interesado en probar Sora por ti mismo, visita sora.com. Desde allí, haz clic en "iniciar sesión", luego autentica tu cuenta de ChatGPT. Recuerda, necesitas una cuenta de ChatGPT Plus ($20 al mes) o una cuenta de ChatGPT Pro ($200 al mes) para usar Sora.
Vía | You Can Now Try Out Sora, OpenAI's AI Video Generator | Lifehacker
https://tecnologiaconjuancho.com/nuevas-funciones-de-sora-genera-videos-realistas-en-pocos-pasos/