INTELIGENCIA ARTIFICIAL DE GOOGLE CREA VÍDEO A PARTIR DE UN TEXTO

Por: web master En: octubre 7, 2022

Solo unos meses después del lanzamiento de Dalle-2 (Generador de imágenes con Inteligencia Artificial) Google anuncia el desarrollo de vídeo, el cual es un modo de Inteligencia Artificial de texto a vídeo el cuál es capaz de producir vídeos de 1280 x 768 a 24 cuadros por segundo; todo esto a partir de indicaciones por texto.

Según el trabajo de investigación de Google este proyecto incluye habilidades estilísticas notables como generar vídeos basados en el trabajo de artistas famosos como Vicente Van Gogh; generar objetos giratorios en 3D mientas este preserva la estructura, textura del objeto.

La clave de las capacidades de Imagen Video es una «cascada» de siete modelos de difusión que transforman el mensaje de texto inicial (como «un oso lavando los platos») en un video de baja resolución (16 cuadros, 24 × 48 píxeles, a 3 fps ), luego lo aumenta a resoluciones progresivamente más altas con velocidades de cuadro más altas con cada paso. El vídeo de salida final tiene una duración de 5,3 segundos.

Como dato interesante, es poco probable que podamos ver un lanzamiento público en el corto plazo, «Hemos decidido no lanzar el modelo de Imagen Vídeo o su código fuente hasta que se mitiguen estas preocupaciones», dice Google.