Inteligencia artificial convierte en arte tus palabras

Por: web master En: junio 10, 2022

Google ha presentado IMAGEN como una investigación, argumentando que por motivos éticos es mejor que siga sin ser un producto comercial y se mantenga como una herramienta para académicos y expertos, noticia que nos tiene decepcionados a todos, ya que muchos deseamos poder probar este gran funcionamiento IMAGEN el cual es similar al de DALL-E 2.

IMAGEN se basa en el modelo Transformer T5, presentado en 2020. Originalmente la IA produce imágenes de 64 x 64 píxeles, pero luego son escaladas a 1.024 x 1.024 píxeles. La misma resolución que DALL-E 2. Esta idea de escalado es la que permite aliviar la potencia de cálculo y permitir la generación de imágenes en pocos segundos.

Para comprobar qué IA es la que logra producir mejores imágenes, desde Google han creado el benchmark ‘DrawBench’. Según los resultados mostrados por el papel, la IA de Google cometió menos errores de comprensión a la hora de construir la imagen. Un ejemplo lo ponen con «Un panda haciendo latte art». La IA de Google entendió que era el animal quien debía realizar la acción, mientras que DALL-E 2 puso directamente un café con la cara de un panda.

Por último Google asegura que ha resuelto algunas de las lagunas de la herramienta de OpenAI y ha logrado generar imágenes que los humanos prefieren.

¡Increíble!