BITÁCORA

Google anuncia el desarrollo de Lumiere, un generador de texto a video de próxima generación basado en IA

Un equipo de investigadores de inteligencia artificial de Google Research ha desarrollado un generador de texto a video basado en inteligencia artificial de próxima generación llamado Lumiere. El grupo ha publicado un artículo que describe sus esfuerzos en el servidor de preimpresión arXiv .

En los últimos años, las aplicaciones de inteligencia artificial han pasado del laboratorio de investigación a la comunidad de usuarios en general; los LLM como ChatGPT, por ejemplo, se han integrado con los navegadores, lo que permite a los usuarios generar texto de formas sin precedentes.

Más recientemente, los generadores de texto a imagen han permitido a los usuarios crear imágenes surrealistas. Y los generadores de texto a video han permitido a los usuarios generar videoclips cortos usando nada más que unas pocas palabras. En este nuevo esfuerzo, el equipo de Google ha llevado esta última categoría a nuevas alturas con el anuncio de un generador de texto a vídeo llamado Lumiere .

Lumiere, que probablemente lleva el nombre de los hermanos Lumiere, quienes fueron pioneros en los primeros equipos de fotografía, permite a los usuarios escribir una oración simple como “dos mapaches leyendo libros juntos” y obtener un video completamente terminado que muestra a dos mapaches haciendo precisamente eso, y lo hace en resolución sorprendentemente alta. El nuevo generador representa un siguiente paso en el desarrollo de generadores de texto a video al crear resultados mucho más atractivos.

Google describe la tecnología detrás del nuevo generador como una “arquitectura innovadora de espacio-tiempo U-Net”. Fue diseñado para generar video animado en una sola pasada de modelo.

El video de demostración muestra que Google agregó funciones adicionales, como permitir a los usuarios editar un video existente resaltando una parte del mismo y escribiendo instrucciones, como “cambiar el color del vestido a rojo”. El generador también produce diferentes tipos de resultados, como estilizaciones, donde se crea el estilo de un tema en lugar de una representación a todo color. También permite subestilos, como diferentes referencias de estilo. También realiza imágenes cinematográficas, en las que un usuario puede resaltar parte o la totalidad de una imagen fija y animarla.

En su anuncio, Google no especificó si planea lanzar o distribuir Lumiere al público, probablemente debido a las obvias ramificaciones legales que podrían surgir debido a la posible creación de videos que violen las leyes de derechos de autor.

Fuente: Agencia ID.

 

Comments are closed.

IMPORTANTE:
Sí: El usuario podrá preguntar, felicitar, realizar críticas constructivas y/o contribuir con opiniones relevantes en el campo de la ingeniería e infraestructura.
No: Molestar, intimidar o acosar de ninguna manera.Tampoco utilizará el espacio para la promoción de productos o servicios comerciales, así como de cualquier actividad que pueda ser calificada como SPAM.

Para saber más consulta los Términos de Uso de INGENET.