Ciberestética: Stable Diffusion

martes, 24 de marzo de 2026

Stable Diffusion

Stable Diffusion es un modelo de inteligencia artificial de código abierto que genera imágenes a partir de descripciones en texto (aunque también puede hacer ediciones, variaciones y más). Es en realidad una matriz de aprendizaje profundo (deep learning) de código abierto capaz de generar imágenes digitales detalladas a partir de descripciones de texto, un proceso conocido como "text-to-image". Fue lanzado en 2022 por la empresa Stability AI en colaboración con instituciones académicas y destaca por ser uno de los motores más potentes en el ámbito de la inteligencia artificial generativa.

Como es un modelo de difusión latente, toma una descripción de texto (un "prompt"), parte de ruido aleatorio (como estática de televisión) y va desgranando esa imagen paso a paso, guiado por el texto, hasta formar una imagen coherente y detallada. A diferencia de otros, Stable Diffusion utiliza una técnica llamada Modelo de Difusión Latente (LDM). En términos sencillos, el proceso funciona así: uno, añadir ruido; el modelo se entrena tomando una imagen clara y añadiéndole "ruido" (puntos aleatorios como la estática de un televisor) hasta que la imagen original es irreconocible. Invertir el proceso; el núcleo de la IA aprende a "limpiar" ese ruido. Cuando se le da un comando de texto (por ejemplo: "Un astronauta montando un caballo en Marte"), el modelo empieza con un lienzo de puro ruido aleatorio y comienza a eliminarlo paso a paso, guiando los píxeles para que coincidan con tu descripción.

Sus principales características son su código abierto y gratuito (a diferencia de otros generadores, como Midjourney o DALL-E, su código está disponible públicamente). Puede ser usado en un computador personal si tiene una tarjeta gráfica (GPU) potente, o en plataformas en la nube. El control local. Al ejecutarlo localmente, no tienes censura estricta ni pagas por cada generación. Un ccosistema amplio, ya que existen muchas interfaces gráficas (como Automatic1111 o ComfyUI) que añaden funcionalidades extra: controlar la pose de los personajes, usar imágenes de referencia, mejorar rostros y otras.

Stable Diffusion ha cambiado la forma en que entendemos la materialidad de la imagen. Al ser una herramienta tan flexible, se utiliza no solo para el arte comercial, sino también en la investigación académica sobre la iconicidad, la estética de los algoritmos y la automatización de la producción visual.

Ciberestética

martes, 24 de marzo de 2026

Stable Diffusion

No hay comentarios:

Publicar un comentario

Translate

Vistas de página en total