miércoles, 18 de mayo de 2022

El programa Dall-e

Se pronuncia "dalí": Dall-e es un programa informático, desarrollado desde el campo de la inteligencia artificial, que permite la realización de dibujos, gráficos e imágenes partiendo de instrucciones verbales y data acumulada en sus archivos. Fue dado a conocer oficialmente en enero de 2021, y poco a poco ha ido mejorándose en sus capacidades y funciones. Desarrollado por la empresa OpenAI, utiliza una versión de 12 mil millones de parámetros​ del modelo GPT-3 Transformer, que es un modelo de lenguaje de programación que emplea aprendizaje profundo para producir textos que simulan la redacción humana y con ello interpretar las entradas del lenguaje natural que el usuario emplea para expresar su intención visual. 

Puede crear imágenes de objetos realistas ("una caja de regalos con papel verde y un lazo rojo") así como objetos que no existen en la realidad ("una esfera con la textura de la piel de un cocodrilo"). Su nombre es un acrónimo de WALL·E y Salvador Dalí, y es capaz de generarlas a partir de indicaciones de lenguaje natural, que comprende con relativa facilidad -en inglés- y rara vez falla de manera notable. Las imágenes que genera Dall-e están seleccionadas por CLIP, que presenta las imágenes de más alta calidad. la empresa OpenAI se ha negado a publicar el código fuente de cualquiera de los modelos, pero una demostración controlada del programa está disponible en el sitio Web de OpenAI, donde se puede ver la salida de una selección limitada de mensajes de muestra.

Dall-e es capaz de generar imágenes en una variedad de estilos, desde imágenes fotorrealistas hasta pinturas y emoticonos. También puede manipular y reorganizar objetos en sus imágenes. Una habilidad puesta por sus creadores fue la correcta colocación de elementos diseñados en composiciones novedosas sin instrucciones explícitas. Citando a Wikipedia: "Por ejemplo, cuando se le pide que dibuje un rábano japonés sonándose la nariz, tomando un café con leche o montando un monociclo, Dall-e a menudo dibuja el pañuelo, manos y pies en lugares plausibles". Ahora bien, es cierto que el programa exhibe una amplia variedad de destrezas y habilidades, pero todavía queda por ver cómo se puede aplicar ampliamente. En esa dirección es que se ha propuesto la versión DALL-E 2, que explicaré en la siguiente publicación.

El sitio Web: https://openai.com/blog/dall-e/



No hay comentarios:

Publicar un comentario