En OpenAI no quieren dejar de dar sorpresas día tras día, y tras anuncios previos como su singular suscripción de 200 dólares/mes a o1, ahora llega su esperado generador de vídeos por IA, Sora, o más bien una versión más pulida de lo que vimos en el anuncio preliminar. Se llama Sora Turbo, pero el nombre es quizás lo de menos.
Y lo es porque a pesar de que han pasado unos meses desde ese anuncio inicial, este modelo de IA de generación de vídeos sigue estando muy verde. Los propios responsables de OpenAI ya indicaron entonces cómo Sora "puede tener dificultades para simular con precisión la física de una escena compleja y puede no comprender instancias específicas de causa y efecto".
Y efectivamente, esos problemas existen. El análisis de la herramienta realizado por el youtuber Marques Brownlee incide precisamente en esos problemas. Al generar ciertas escenas, hay por ejemplo problemas con la "persistencia de los objetos": las personas, animales o cosas de la escena no se comportan de manera completamente real, y aquí la simulación de la física es deficiente. Ocurre también por ejemplo al ver un vídeo de un rinoceronte o una jirafa caminando: sus patas hacen cosas "raras".
La situación recuerda a la que vivimos con los modelos de IA generativa que generan imágenes. Su capacidad nos asombró nada más aparecer en escena, pero cometían errores terribles al representar las manos humanas. Con el tiempo, eso sí, esos problemas han ido desapareciendo, y hoy en día este tipo de herramientas ofrecen resultados mucho más realistas en este y otros muchos apartados.
Con Sora probablemente ocurrirá lo mismo, y como dice Brownlee, lo mejor de Sora es que esta es la peor versión que veremos: a partir de aquí todo irá mejorando y los problemas que ahora son claros irán mitigándose y, previsiblemente, desapareciendo.
Eso hace que hoy por hoy la utilidad real de Sora sea discutible. Es cierto que en algunos casos puede generar vídeos sorprendentes: los ejemplos que los usuarios empiezan a publicar por ejemplo en X lo demuestran. Otros, no obstante, indican cómo hay herramientas como la de Runway que hoy por hoy pueden ofrecer resultados aún mejores.
¿Plantea Sora una revolución en la producción y creación de vídeo? De momento no lo parece. Aun así, y como ocurre con los modelos de IA para texto e imagen, Sora puede convertirse sin duda en un asistente creativo especialmente llamativo. Puede que de momento no sirva para generar el resultado final, pero permite descubrir caminos e ideas creativas que quizás no habíamos tenido en cuenta.
Aun así, este anuncio de OpenAI es otra demostración clara de cómo la compañía necesita sacar pecho. La reciente y colosal ronda de inversión tiene que comenzar a dar frutos, y la empresa necesita mostrar productos que le permitan tener muchos más ingresos (y beneficios). Sora, como o1, es un intento de convencernos de que debemos pagar (cada vez más) por usar la IA.
La cuestión, claro, es si realmente conseguirán hacer precisamente eso. Convencernos. Con un Sora así de verde, parece difícil hacerlo, al menos para la mayoría de los usuarios.
via Robótica e IA - Xataka https://ift.tt/8aNjRl2
No hay comentarios:
Publicar un comentario