Discusión y argumentación acerca de la definición y pertinencia del concepto de Estética Digital y sus implicaciones en la comunicación, arte y cultura.
La gran novela, Ana Karenina, es una de las obras más reconocidas de la literatura rusa, pues es una representación de la sociedad del periodo. En ella se contrapone la vida social sumida en las apariencias versus la existencia sencilla en la vida del campo. Fue creada por el gran escritor, León Tolstói (1828-1910), y en ella uno de los temas principales es la búsqueda de la felicidad, ya sea a través del amor o de la realización personal. Así, el autorr concluye que no existe la perfección ni un estilo de vida ideal. El ser humano debe aceptar las cosas buenas y malas que suceden, pues allí radica el encanto de estar vivo. De ese libro se cita esta frase:
"Toda la diversidad, la hermosura, el encanto de la vida, se componen de luces y sombras".
El día de ayer, además de muchas felicitaciones y una torta, recibí en un grupo de amigos de WhatsApp, jugadores de Scrabble, esta imagen de celebración cumpleañera hecha con un programa gráfico de inteligencia artificial por mi amgo Javier Lattuf. Me pareció también jocosa, y como es un resultado digital, me animo a ponerla también por aquí.
Hoy 5 de mayo estoy de cumpleaños, y le pedí a NanoBanana, la inteligencia artificial gráfica de Gemini, que me pusiera a celebrar. Tras algunos intentos, esto que ponggo acá es lo que se logró. Por supuesto no es muy auténtica, pero es simpática y aqui igual la muestro.
Este es un cortometraje realizado por los españoles Daniel Martínez Lara y Rafa Cano Méndez, en 2016, utilizando el programa de animación Blender, patrocinado por la Escuela de Animación Pepe School Land de Barcelona. El título del film, "Alike" (Semejante o Parecido), se refiere al eje central de la trama: en una vida ocupada, un padre responsable intenta enseñar el camino correcto a su hijo, a costa de sacrificios. Surje entonces la duda... ¿cuál es el camino correcto? ¿Debe ser la vida del hijo semejante a la del padre? Es un tema muy hermoso, bien presentado, con un uso acertado de los colores y las texturas. Hay mucha emotividad presente y un mensaje edificante, con una estética muy bien lograda. Han trabajado muchos colaboradores en la producción y en especial hay que destacar la música de Oscar Araujo y la gerencia de Eva Márquez Matías. El sitio Web: https://www.alike.es/.
En la entrada anterior cometé las ideas del filósofo francés Jacques Derrida respecto del uso del lenguaje, lo que él llama "logocentrismo" y su crítica a los conceptos de oralidad y escritura de la escuela estructuralista de Ferdinand de Saussure y Claude Lévi-Strauss. Vimos que si según las ideas de deconstrucción de Derrida, no hay razón para privilegiar el habla sobre la escritura. Esta es también es un sistema de "diferencias puras", en las que el significado está igual de cercano al pensamiento que en el lengauje oral.
Lo más revolucionario de las ideas de Derrida es que se invierte la jerarquía tradicional. Él propone el concepto de arqui-escritura (archi-écriture), que no es la escritura común (la literal, como tinta sobre papel); es una condición de posibilidad de todo lenguaje (oral y escrito). La arqui-escritura es la estructura de la diferencia, el espaciamiento, el rastro y la ausencia que permite que cualquier signo (sonoro o gráfico) funcione. Para que una palabra hablada signifique, debe poder repetirse sin la presencia de su emisor original (debe ser "iterable" o "citable"). Esa capacidad de funcionar en ausencia del referente y del destinatario es una característica escritural. Por tanto, el habla ya tiene en su núcleo la estructura de la escritura.
Habla también del "Suplemento Peligroso". Derrida analiza, sobre todo en los textos de Rousseau, a quien también critica, la figura del "suplemento". La escritura es vista como un suplemento externo que añade algo "extra" a la naturaleza pura del habla. Pero el suplemento tiene una lógica paradójica: Añade una ausencia. Es decir, añade algo que supuestamente falta en el origen (la presencia plena, natural, del sentido). A su vez, revela una falta originaria. Al tener que añadir la escritura para compensar algo, se demuestra que el "origen" (el habla pura, la presencia natural) nunca fue completo. El origen ya era un suplemento. Por lo tanto, la escritura no corrompe una inocencia original; más bien, revela que toda inocencia es un mito. La archi-escritura es el movimiento de esa suplementariedad.
En conclusión, ¿qué dice Derrida? No dice que debamos hablar por escrito o que el habla no exista. Su tesis es que el modelo de la escritura (entendido como diferencia, espaciamiento, rastro y ausencia) es más fundamental que el modelo de la voz. La escritura que él defiende no es la empírica, sino la arqui-escritura, que desmantela el sueño de una presencia plena e inmediata del sentido. El lenguaje, tanto hablado como escrito, está siempre ya marcado por esa diferencia originaria.
Ya en otras publicaciones anteriores me he refrido a las interesantes teorías del pensador francés nacido en Argelia, Jacques Derrida (1930-2004), entre las que destaca la gramatología y la deconstrucción, y una de sus propuestas más destacadas, la crítica al "logocentrismo". En su famoso libro de 1967, De la gramatología, Derrida lleva a cabo una deconstrucción sistemática de lo que él llama el logocentrismo de la tradición filosófica occidental. Para entender su posición sobre el lenguaje escrito y el hablado, hay que partir de esta crítica.
En principio, destaca lo que es el "Logocentrismo" y el privilegio de la voz. Derrida sostiene que, desde Platón y Aristóteles hasta Saussure y Lévi-Strauss, la filosofía y la lingüística han privilegiado el habla (la voz) sobre la escritura. A esto lo llama logocentrismo (del griego logos: palabra, razón, pensamiento). Así, el habla se considera natural, inmediata, presente. Cuando hablo, mi pensamiento (el logos) parece expresarse directamente, sin un intermediario artificial. El oyente tiene acceso casi transparente a mi "intención de significar". Hay una presencia casi mágica del sentido. La escritura, en cambio, es vista como un derivado, una técnica externa, un simple suplemento peligroso. Es una representación del habla (que ya es una representación del pensamiento). Es artificial, diferida, y puede operar sin la presencia del autor, prestando lugar a malentendidos.
De aquí parte su crítica al lingüista Ferdinand de Saussure respecto al "ethos" de la escritura. Derrida toma como blanco central de su análisis al famoso texto Curso de lingüística general, donde Saussure afirma que el objeto de estudio de la lingüística es la lengua oral. La escritura es solo una "representación" secundaria que oscurece el habla. Saussure llega a decir que la escritura tiene una "existencia fingida" y que su tiranía corrompe el lenguaje. Derrida señala que en este gesto hay una profunda contradicción.
Saussure define el signo lingüístico (significante/significado) por su diferencia y oposición con otros signos. Una palabra no tiene sentido por sí misma, sino por su diferencia con otras ("el lenguaje es una forma, no una sustancia"). Pero al privilegiar el habla, Saussure introduce un "ethos" (un valor, una creencia) no científico: la idea de que el significante acústico (el sonido) está más cerca del pensamiento (el significado) que el significante gráfico (la letra). Esta es una afirmación hipotética que no puede demostrarse.
Aquí es donde entra la deconstrucción de Derrida. Si el lenguaje se basa en la diferencia, entonces no hay razón para privilegiar el habla. La escritura también es un sistema de diferencias puras. De hecho, la escritura ejemplifica mejor ese principio de diferencia que el habla, porque en ella la ausencia del emisor es evidente. Esta propuesta es revolucionaria y será fuente de diversos debates en el último tercio del siglo XX. En la próxima publicación veremos más del desarrollo de estas ideas y cómo se entienden en el siglo XXI.
Este es un artista italiano, de apodo Zarodas, con una amplia trayectoria en el arte y la ilustración digital, que posee una estética propia muy identificada con la fantasía y el cuerpo humano. Aquí pongo sus "Ángeles Steampunk", que son parte de una serie de imágenes con ese estilo dorado, metalizado y recargado. Está en DeviantArt: https://www.deviantart.com/zarodas/.
En la misma línea de diversas publicaciones en este blog, en las que he desarrollado la idea de ciberestética, hoy señalo que es importante entender que esta forma estética no reemplaza a las anteriores, sino que las habita de una nueva manera. Un paisaje al óleo puede tener una belleza romántica o impresionista; pero un entorno virtual inmersivo, una visualización de datos en tiempo real o una obra de net.art que se autodestruye al ser vista, tienen una belleza de segundo orden: su cualidad estética depende de que entendamos su funcionamiento interno (el algoritmo, el protocolo, el flujo de datos). En la ciberestética, la forma ya no sigue a la función, sino que la función es la forma. El "cómo" se construye y circula la obra determina el "qué" percibimos como bello o significativo. Por lo tanto, vemos que una ciberestética del arte se define mejor no por una visión clásica, sino por una triple condición operativa: la Red, el Protocolo y la Falla.
Condición de Red (lo que conecta): la obra existe como nodo. Su significado no está en su interioridad (como un cuadro) sino en sus enlaces salientes y entrantes. Una obra con ciberestética es incompleta si se la aísla de su contexto de circulación, comentarios, remixes y ataques.
Condición de Protocolo (lo que gobierna): la experiencia estética ya no es la de un sujeto frente a un objeto, sino la de un usuario navegando un sistema regido por reglas invisibles (el algoritmo de recomendación, el código de la interfaz, la política de privacidad). La ciberestética nos vuelve sensibles a esas reglas; un hermoso interface puede ser atractivo, pero una obra ciberestética logra que sintamos el protocolo como si fuera una textura o un color.
Condición de Falla (lo que se desvía): paradójicamente, en un mundo que exige eficiencia, la ciberestética encuentra su momento más sublime en el error. El glitch, el retraso, el buffer, el virus, la saturación del servidor, el "404 Not Found": estos no son meros accidentes, sino alegorías negativas que revelan la materialidad oculta del ciberespacio. Nos recuerdan que lo virtual tiene cuerpo (de silicio, de electricidad, de latencia) y que ese cuerpo puede fallar. Esa fragilidad digital es su principal fuente de poesía.
En última instancia, definir una ciberestética es asumir una postura ética y epistemológica: el mundo ya no es algo que contemplamos, sino algo con lo que interactuamos y que procesamos. El arte con conciencia ciberestética nos enseña a habitar ese desajuste. Nos muestra que la belleza hoy puede ser un gráfico de tráfico de datos, la coreografía de un pulso cardíaco encendiendo luces en una sala oscura, o la elegante lentitud de una página web diseñada para colapsar. No es una estética del objeto acabado, sino una estética de la relación, del proceso y de la acción digital. Así, quien busque definirla no debe preguntarse "¿esto es bello?", sino más bien: "¿esta obra me hace sentir y pensar como un ser en red?" Y si la respuesta es afirmativa, habrá encontrado, aunque sea por un instante, el corazón de lo ciberestético.
Como continuación a lo que publiqué ayer, sigo hoy con el tema de la estética del ciberarte y paso a señalar algunas de sus características. Si bien este es un tema recurrente por aquí, considero que está siempre en constante cambio, más aún con el crecimiento del uso de la inteligencia artifical gráfica, por lo que tiene sentido retomarlo.
Se puede comprender la Ciberestética a través de sus principios operativos. Estas son las que podríamos llamar caracterísitcas difinitorias, que veremos a continuación:
Lo procesual sobre lo objetual. La obra no es un objeto estático, sino un proceso, un sistema vivo que se actualiza en tiempo real. El arte es el algoritmo, no su resultado final.
Interactividad y participación. El espectador deja de ser un observador pasivo para convertirse en un "usuario" o "prosumidor" (productor+consumidor). La obra se completa con su acción (clic, navegación, entrada de datos). La experiencia es performativa.
Estética del Glitch y la Ruina Digital. Lo bello ya no es lo pulcro y perfecto. Se valora el error, la distorsión, la pixelación, la fecha de corte (datamoshing), el ruido de datos. El glitch es una firma de autenticidad digital.
Modularidad y remezcla (Mashup). La obra es un agregado de fragmentos (muestras de audio, fragmentos de código, clips de vídeo) provenientes de diferentes fuentes. La originalidad reside en la recombinación y la contextualización.
Virtualidad y simulación. Se explora la diferencia entre lo "real" y lo "virtual". Creación de mundos simulados (Second Life, videojuegos) que tienen su propia física, leyes y belleza interna. Lo virtual ya no es "falso", sino un nuevo territorio ontológico.
Datalogía (la visualización de datos). Lo sublime contemporáneo es la enorme masa de datos invisible (big data). El arte ciberestético hace visible lo invisible: convierte tráfico de red, tuits, transacciones bancarias o tendencias de búsqueda en experiencias estéticas (sonoras o visuales).
Definir una ciberestética del arte no es, en el fondo, un ejercicio de catalogación académica, sino un acto de constatación histórica: estamos asistiendo al nacimiento de una nueva sensibilidad de época. Al igual que la estética barroca respondió a la tensión entre la Contrarreforma y el asombro científico, o la estética romántica surgió de la tormenta de la revolución y el yo, la ciberestética es el lenguaje sensible de la era de la información. Su definición no puede ser estática, porque su objeto de estudio -el ciberespacio- es un organismo vivo, en permanente reconfiguración.
Después de dos días de pausa tras la entrada cinco mil de este blog, regreso para retomar el tema que le dio origen: la Ciberestética. Durante estos casi 15 años, esta noción ha ido ampliando sus ámbitos, sobre todo con la llegada masiva de la inteligencia artificial y la creación de imágenes sintéticas. En pricnipio, no hay una única y cerrada definición ni es una escuela de pensamiento cerrada, sino más bien un campo de estudio emergente y en constante evolución. Durante este tiempo me he encontrado con diferentes aproximaciones, todas muy interesantes, en particular las que se relacionan con la idea de las artes contemporáneas.
Se puede definir, en principio, como el estudio de los patrones de belleza, percepción y experiencia sensible que emergen de la interacción entre el arte, la tecnología digital y el ciberespacio. Más aún, tiene que ver con los estilos y expresiones ligadas al uso de las herramientas cibernéticas e informáticas. Si mantenemos el concepto que he establecido para la ESTÉTICA, como el estudio y caracterización de los movimientos artísticos y culturales, que son expresión de diferentes momentos y sociedades en el mundo, que abarca el conjunto de elementos estilísticos y temáticos que caracterizan a un determinado autor o movimiento artístico, en un tiempo y lugar específico, la CIBERESTÉTICA es aquella que se refiere al conjunto de elementos estilísticos y temáticos que se caracterizan por tener origen en el uso de la herramienta informática y en los programas de computación; aplicándose a las artes visuales y multimediáticas, así como a la comunicación y otras manifestaciones culturales.
Vemos que esto va más allá de la aprecación del gusto y la belleza, por lo que para definir una ciberestética del arte, podemos abordarla desde tres niveles interconectados: su esencia, sus características definitorias y sus manifestaciones prácticas. Esta realidad no se refiere simplemente al arte hecho con computadoras (arte digital). Es una estética de los sistemas y los flujos de información. Propone una nueva sensibilidad artística donde el objeto de contemplación ya no es solo la imagen o el sonido, sino el proceso, el protocolo, la interacción y la propagación de datos.
En esencia, una obra con ciberestética no busca la perfección de la forma (como en el clasicismo) ni la expresión del yo (como en el romanticismo), sino la exploración de la lógica del ciberespacio: redes, algoritmos, simulación, realidad virtual, inteligencia artificial, bases de datos, virus, glitches, y la cultura de la remezcla. Aquí es donde he establecido también una diferenciación entre estética digital y ciberestética, pues si bien ambas están ligadas a la computación, la informática y la multimedialidad, la primera puede encontrarse en plataformas no conectadas, en tanto la segunda está ligada a la internet y sus conexiones. La ciberestética es la estética digital que viaja por la red de redes.
Estas ideas se concetan con las creaciones artísticas que buscan explorar los nuevos recursos y posiblidades que la tecnología ofrece, incluyendo el uso de la inteligencia artificial. En todo caso esta versión que he porpuesto es una visión personal que busca explicar parte de la gran expresión comunicacional y artística de esta época digitalizada, pero que sin duda se adapta a las tendiencias contemporáneas de cibercultura. Es, en definitiva, la estética de la era de la información: una sensibilidad que nace de vivir, percibir y sentir a través de interfaces, algoritmos y flujos de datos.
Esta de hoy, jueves 23 de abril de 2026, es la publicación número cinco mil (5.000) de este blog. Cincomil entradas desde que comencé el primero de enero de 2011. ¡Increible! Coincide con el día del libro, el día del idioma español y de la lengua inglesa (por Cervantes y Shakespeare), que no tienen que ver con la ciberestética pero sí con el lenguaje, la cultura y la literatura, temas recurrentes por aquí. ¡Nada, no voy a decir mucho más! Es para mi un gusto y un orgullo haberme mantenido constante y mostrar durante casi 184 meses, contenidos que me gustan y parecen importantes y entretenidos, que dejan algo en el ciberespacio. ¡Y ahora... a seguir!
Daniel Innerarity, filósofo español nacido en 1967, ha explorado las implicaciones de la inteligencia artificial generativa en el arte, cuestionando su verdadera creatividad. Argumenta que el arte generado por IA no es verdaderamente creativo, sino una recombinación de patrones extraídos de obras pasadas, como imitar estilos de Rembrandt o Beethoven mediante algoritmos estadísticos. Esta "creación artificial" produce resultados convincentes pero predecibles, incapaces de rupturas imprevisibles que definen la originalidad humana, como las fases tardías de Beethoven.
No obstante, él considera válido el rol auxiliar de la IA, cuando actúa como herramienta auxiliar para artistas, descargando tareas repetitivas como transposiciones musicales o instrumentación, democratizando el acceso a la experimentación creativa. Así, libera a los humanos para enfocarse en lo inimitable, revelando el núcleo auténtico del arte humano.
De alguna forma, Innerarity compara esto con la fotografía, que impulsó el impresionismo al desplazar la descripción realista en pintura; la IA podría redefinir el arte hacia la expresión única humana. En entrevistas recientes, reitera que la IA capta patrones pero su "originalidad" es combinatoria, no intensa. Pasa entonces a tratar una teoría crítica de la inteligencia artificial que va más allá de enfoques éticos, morales o estéticos, analizando las condiciones estructurales que permiten o impiden una IA responsable en las sociedades democráticas.
Así identifica como núcleo el problema de la externalización creciente de decisiones humanas a sistemas algorítmicos, que automatizan desde lo cotidiano hasta lo político, pasando por lo artístico, desplazando la capacidad decisoria humana. Esto no es mera instrumentalización, sino un reemplazo que cuestiona el lugar de la voluntad popular en la vida común y la democracia.
Innerarity aboga por una filosofía política de la IA que democratice el entorno algorítmico, garantizando igualdad y reflexión humana frente a la automaticidad, sin renunciar a sus beneficios. Esto incluye interrogantes sobre si los agregadores algorítmicos podrían suplir urnas electorales, por ejemplo, rechazando tal idea por ignorar el "yo aspiracional" democrático.
La relación entre el espectador y las imágenes en movimiento no es fija ni natural, sino profundamente histórica, técnica y política. El cine nació como estética de la multitud, un arte pensado para ser vivido en colectivo, donde la masa era a la vez tema y destinataria. Sin embargo, esa misma potencia agregadora derivó rápidamente en la figura del espectador pasivo, un sujeto inmovilizado ante el espectáculo, consumidor acrítico de narrativas cerradas y emociones prefabricadas.
Frente a esa pasividad, surge la necesidad de formar espectadores audiovisuales críticos, capaces de desmontar el dispositivo cinematográfico, reconocer sus tramas ideológicas y resistir la interpelación directa del medio. Esta figura alcanzó su madurez en la segunda mitad del siglo XX, especialmente en ámbitos educativos, cinéfilos y activistas.
Pero la revolución digital, la multiplicación de pantallas y la expansión de lo interactivo han traído una nueva figura: el espectador interactivo, propio de entornos multimedia y multimodales. Este espectador ya no solo mira o analiza, sino que elige, comenta, remezcla y participa. Su relación con las imágenes es más activa, pero también más fragmentada, y no necesariamente más crítica.
Esta idea se ubica en el entorno digital y poscinematográfico. Ya no hablamos solo de cine, sino de pantallas múltiples, plataformas y formatos híbridos. Son sus características la multimedia, un mismo contenido integra texto, imagen fija, imagen en movimiento, sonido, animación, hipervínculos (ej. documental interactivo, videoensayo); la multimodalidad, el espectador no solo recibe un modo (el visual narrativo), sino que combina modos de percepción: leer, mirar, escuchar, tocar (pantallas táctiles), elegir rutas; la interactividad, pues el espectador ya no es pasivo ni meramente crítico; actúa sobre el contenido y elige caminos narrativos (cine interactivo, Bandersnatch), comenta, remezcla, sube reacciones (YouTube, TikTok), participa en la creación colectiva (wikis, fandubs, memes) y hasta decide tiempos, ritmos y repeticiones (streaming, pausa, rebobinado).
Tenemos también la hipermediación, y ahora el espectador es consciente de la interfaz y la manipula. Rompe la ilusión de transparencia clásica del cine. Esto tiene que ver con la atención dividida y multitarea, pues ya no hay una pantalla sagrada y una sala oscura; el público interactivo mira el celular mientras ve una serie. Así, este espectador puede ser más libre o más disperso, pero ciertamente ha roto con la figura pasiva y monolítica del cine tradicional.
No asistimos a una sustitución lineal de un tipo de espectador por otro. Más bien, conviven hoy distintas modalidades de recepción: el espectador pasivo sigue existiendo en el consumo rápido de entretenimiento industrial; el crítico se refugia en la cinefilia y la academia; el interactivo navega entre plataformas; y la multitud ha migrado a las redes sociales y los eventos de streaming masivo.
Esta curiosa imagen que pongo hoy aquí, una colorida figura flotante, está realizada en Pixel Art, el arte que toma al pixel gráfico como fundamento, pero que además se mueve con la técnica GIF, Graphic Intechange Format, un formato digital de animación reiterativo. Hallada en la Web, esta es otra muestra de ciberarte por internet.
En los últimos tiempos dentro el campo de la internet y el ciberespacio, se han popularizado las aplicaciones e interacciones ligadas a la ide de "espacios liminares". En términos simples, un espacio liminal es un lugar de transición o umbral. La palabra viene del latín limen (umbral). Son espacios que deberían estar llenos de actividad pero que se muestran vacíos, inquietantes o suspendidos en el tiempo. Ejemplos característicos son los pasillos de hoteles o colegios de noche, los centros comerciales después del cierre, los aeropuertos a altas horas de la madrugada, los estacionamientos subterráneos vacíos y las salas de espera o vestíbulos abandonados.
Lo interesante ahora es que vemos nuevas tendencias en el espacio liminal dentro del digitalismo, pues este ha adoptado y transformado el concepto. Un modelo notable es el de los Backrooms y el "lore de niveles". Lo que empezó como una imagen viral (un pasillo de moqueta amarilla) se ha convertido en un enorme universo colaborativo. Ahora existen "niveles" del Backrooms, cada uno con reglas, entidades y estéticas liminales específicas. Es un fenómeno de narrativa colectiva en foros, wikis y YouTube.
De ahí pasamos al Dreamcore y Weirdcore. Estos son estilos visuales que llevan la liminalidad a lo onírico. El dreamcore usa imágenes borrosas, nostalgia artificial y texturas suaves; el weirdcore añade elementos surrealistas y mensajes crípticos. Son muy populares en TikTok, Instagram y Pinterest.
Igualmente, los videojuegos liminales han puesto de moda esta tendencia. Títulos como The Backrooms Game, Anemoiapolis, Pooll o The Complex: Found Footage están diseñados íntegramente para explorar espacios vacíos y la ansiedad que generan. También mods de juegos como Garry's Mod o Minecraft crean mapas liminales.
La generación de imágenes por inteligencia artificial también ha tenido que ver con este auge. Herramientas como Midjourney o DALL-E 3 han potenciado muchísimo la creación de espacios liminales. Los prompts específicos ("liminal space", "abandoned mall", "VHS aesthetic") producen imágenes hiperrealistas que antes requerían horas de edición.
En YouTube y Spotify hay canales dedicados a ambientes sonoros de espacios liminales: el zumbido de un aeropuerto vacío, el eco en un centro comercial cerrado, la lluvia en un estacionamiento. Se mezcla con lo nostálgico y lo perturbador suave. Así mismo, en sitios como VRChat o Meta Horizons, ya hay mundos diseñados como espacios liminales explorables. La tendencia actual es crear experiencias multijugador donde la rareza viene de encontrarse con otro usuario en un lugar que "debería" estar vacío.
La pesencia de estas formas audiovisuales es tan marcada, que hashtags como #liminalspaces, #backrooms, #dreamcore y #poolrooms tienen miles de millones de vistas. La tendencia actual es el "liminal horror de bajo presupuesto": videos caseros con efectos VHS, recorridos por lugares reales vacíos (como centros comerciales en decadencia) y ediciones que juegan con el "glitch". Autores contemporáneos (en ensayos, newsletters y canales de YouTube como Solar Sands o Nexpo) analizan cómo los espacios liminales reflejan la soledad digital: vivimos conectados pero físicamente aislados. Los centros comerciales vacíos se leen como metáforas del consumo sin comunidad, y los pasillos infinitos como la experiencia de navegar sin rumbo por internet.
¿Por qué está tan de moda ahora? Porque el espacio liminal captura una ansiedad muy actual: la de vivir en transición permanente (entre pantallas, entre trabajos, entre lugares, entre pandemias...). Además, la nostalgia por los 90 y 2000 (los espacios liminales suelen tener esa estética) conecta con el deseo de tiempos más sólidos.
"Quack!" es un cortometraje realizado por la promoción 2024 de alumnos del ESMA, Ecole Supérieure des Métiers Artistiques, que ya muchas otras veces he referido aquì en el blog por sus muy creativas producciones con estética digial. En este film, un gran huevo aparece cerca del arroyo donde viven dos pequeños espíritus del bosque. De él sale un patito, y ellos deciden emprender una aventura para devolverlo a su madre. Trabajaron en la dirección y producción Jeanne Audounet, Léa Burkart, Louis Herrero, Elio Humbert, Ariane Moulard, Marie-Lou Peyre, Maëlys Sabuco, y Julien Vannet. La música es de Arthur Troch y el sonido de Sébastien Fournier y Tristan Le Bozec. El estilo está muy bien logrado y en particular la representación del agua es excelente, porque además es un protagonista imporante de la historia. El sitio Web de ESMA: https://www.esma-3d.fr/.
Es una una conocida y graciosa frase la que pongo aquí hoy, en una viñeta hallada en la Web, para alegrar la tarde (y reflexionar con una filosofía jocosa).
Ya en varias publicaciones anteriores, algunas bastante recientes, he abordado este tema, pero dado que tiene cada vez más relevancia lo sigo tratando. La gobernanza digital sobre las imágenes sintetizadas por inteligencia artificial ha cobrado un nuevo aspecto, porque hace unos pocos días se hicieron públicas estadísticas que muestran el cada vez más indiscriminado uso de imágenes falsas y deepfakes en el campo de la comunicación, lo cual amenaza la credibilidad de todo mensaje visual.
Con anterioridad he señalado que la gobernanza digital de las imágenes sintéticas generadas por IA se refiere al conjunto de principios, políticas, normas técnicas y marcos legales que buscan regular el ciclo de vida de estas imágenes (creación, distribución, detección y uso) para maximizar sus beneficios y mitigar riesgos.
Los principales desafíos que la gobernanza busca abordar incluyen, justamente, la desinformación y deepfakes, las imágenes hiperrealistas de eventos que nunca ocurrieron o personas diciendo o haciendo cosas falsas, con potencial para manipular elecciones, generar pánico financiero o dañar reputaciones. Esto es fraude y suplantación de identidad con el uso en estafas de verificación biométrica, creación de perfiles falsos creíbles o ingeniería social. Ello incluye problemas con la privacidad y la honorabilidad. La generación de desnudos no consentidos (deepnudes) o imágenes de personas en situaciones comprometedoras sin su permiso, es tremendamente perjudicial.
Otro reto es la vulneración de derechos de autor y propiedad intelectual. Modelos de IA entrenados con millones de imágenes extraídas de internet sin consentimiento ni compensación a los autores originales, violentan todos los derechos y registros.
Un aspecto que ya he nombrado, que se aplica a los programas de conversación con IA pero que ahora se ha notado mucho en los programas de creación de imágenes, es el tema de los sesgos y la discriminación. Los modelos pueden perpetuar o amplificar estereotipos dañinos (raciales, de género, etc.) en las imágenes generadas.
Como vemos, hay mucho que enfrentar, discutir y establecer, siempre con el riesgo de pasar de una regulación a un control y de este a una censura. En próximas publicaciones seguiré abordando este tópico que es de total actualidad y globalidad.
Pongo hoy esta imagen humorístca hallada en la Web, que parodia las redes sociales y las relaciones entre gatos y humanos. ¿Gata tóxica, intensa? O puros celos gatunos... 😆
En la publicación anterior comenté sobre algunas de las ideas que el filósofo estadounidense Charles L. Stevenson propuso al respecto de la ética y su relación con el uso del lenguaje. Él señala dos significados en el lenguaje ético, el descriptivo y emotivo, que vienen de las creencias y las actitudes de cada sociedad. Esta es la base de su estructura mental para definir la ética y sus manifestaciones a través de los lenguajes.
Plantea entonces dos métodos del discurso moral. Dado que el desacuerdo moral es, fundamentalmente, un desacuerdo de actitudes, ¿cómo se resuelve? No mediante la razón pura o la demostración lógica (como en ciencia), sino mediante dos métodos:
a) Métodos descriptivos de la razón, que se usan para resolver desacuerdos en creencia. Se discuten hechos, causas, consecuencias. Si dos personas discrepan sobre si la eutanasia causa sufrimiento, pueden apelar a datos. Esto es útil, pero secundario. Si tras acordar los hechos siguen discrepando en su actitud (uno la aprueba y otro la rechaza), la razón pura no puede resolverlo.
b) Métodos persuasivos dinámicos, que son la forma genuina de resolver desacuerdos de actitud. Estos incluyen:
Apelaciones emocionales: usar un lenguaje vívido, ejemplos conmovedores, metáforas.
Persuasión "psicológica": reestructurar la percepción de la situación, resaltar ciertos valores olvidados.
Persuasión "lógica" (aparente): mostrar cómo la actitud del otro lleva a consecuencias que él mismo no aprueba (tratando de generar una inconsistencia en su sistema de actitudes).
Influencia no racional: repetición, autoridad, retórica.
En esencia, para Stevenson, la discusión moral no es una búsqueda de una verdad objetiva, sino un intento de influir en las actitudes del otro para lograr un acuerdo o un acercamiento. Por otro lado, él habla del papel de la definición persuasiva, que es una de sus ideas más originales. Una definición persuasiva es una estrategia retórica que cambia el significado descriptivo de un término (para hacerlo más favorable o desfavorable) sin alterar su significado emotivo (su carga de aprobación/desaprobación). Por ejemplo: decir que "el verdadero socialismo" no es el de los estados totalitarios, sino el de las comunidades libres y solidarias. Se conserva la palabra emotivamente positiva "socialismo", pero se redefine su contenido descriptivo para ajustarlo a la ideología del hablante. Esto muestra cómo el lenguaje ético se puede manipular para ganar aprobación hacia nuevas ideas.
En resumen, es innegable la importancia de Stevenson, porque rompe con el objetivismo moral tradicional. Niega que existan propiedades morales objetivas en el mundo. Asi mismo, supera el emotivismo radical de otros moralistas, como A.J. Ayer. Mientras Ayer decía que los juicios éticos son meras exclamaciones emocionales ("¡Bien!" o "¡Puaj!"), Stevenson añade el componente dinámico de influencia y reconoce el papel complejo de las creencias y la persuasión racional. Es un emotivismo más sofisticado.
Ofrece así una explicación plausible del desacuerdo moral. Explica por qué discutimos tan apasionadamente sobre valores sin llegar a una "prueba" concluyente. Conecta igualmente ética con retórica y psicología. Muestra que hacer ética es también usar el lenguaje de manera persuasiva.
Claro que hay otras cíticas frecuentes. Muchos filósofos (como Alasdair MacIntyre) dicen que su teoría reduce la razón moral a mera manipulación emocional, y que no puede explicar por qué usamos términos como "deber" con una fuerza que parece más que una simple preferencia personal. Tampoco explica cómo podemos debatir racionalmente sobre qué actitudes deberíamos tener. Son temas de debate que aún hoy se discuten. En definitiva, Stevenson lleva a escuchar el lenguaje moral no como un informe sobre el mundo, sino como una partitura emocional que expresa nuestros sentimientos más profundos y busca hacer que los demás bailen al mismo ritmo.
Charles Leslie Stevenson (1908-1979) fue un filósofo estadounidense, figura clave del emotivismo, teoría ética "Metaética" que floreció en el siglo XX como reacción contra las teorías éticas que veían los juicios morales como hechos objetivos. Esto significa que para Stevenson, la función principal del lenguaje ético no es describir hechos del mundo, sino expresar emociones e influir en las actitudes de los demás. Su obra más importante es "Ética y lenguaje" (1944), donde desarrolla su teoría de forma detallada y matizada. Veamos algunas de las ideas centrales de su pensamiento.
Para entender a Stevenson, hay que distinguir dos aspectos de la psicología moral, las creencias y las actitudes. Las creencias son nuestras ideas sobre cómo es el mundo (hechos). Por ejemplo, "Este medicamento alivia el dolor de cabeza". Son descriptivas y pueden ser verdaderas o falsas. Por otro lado, las actitudes son nuestras preferencias, gustos, deseos y disposiciones emocionales. Así por ejemplo, se dice "¡Me gusta que se alivie el dolor!" o "Quiero que se usen medicamentos efectivos". No son verdaderas ni falsas, sino que se tienen o no se tienen. Los desacuerdos morales, según Stevenson, suelen ser una mezcla compleja de desacuerdo en creencia (sobre los hechos) y desacuerdo en actitud (sobre lo que debemos preferir). El error clásico es pensar que todo desacuerdo moral es solo un desacuerdo en creencia.
Eso le lleva a hablar de dos significados en el lenguaje ético, el descriptivo y emotivo. Stevenson propone que términos como "bueno", "malo", "correcto", "deber", tienen dos tipos de significado, descriptivo y emotivo. El significado descriptivo se refiere a las propiedades empíricas o definibles del objeto. Por ejemplo, al decir "Juan es bueno", podría describirse que "Juan es honesto y ayuda a los demás". Este significado es secundario y variable entre diferentes personas y contextos.
En cambio, el significado emotivo (o dinámico) es la función principal del lenguaje. Es la capacidad de la palabra para expresar las actitudes del hablante y para provocar o reforzar actitudes similares en el oyente. Es como una "carga emocional" que tiene la palabra. Decir "bueno" es como decir "¡Lo apruebo! ¡Sigue esa línea de conducta!". Por ejemplo, si digo "La eutanasia es buena", no estoy diciendo un hecho objetivo sobre la eutanasia, estoy expresando mi actitud (aprobación, sentimiento favorable hacia la eutanasia, pero también estoy enfluyendo en el otro, intentando que también apruebe la eutanasia. En cambio, con el significado descriptivo ("la eutanasia pone fin al sufrimiento"), se da la razón para apoyar esa actitud, pero la palabra "buena" añade el empuje emocional.
Estas propuestas sobre la relación entre la ética y el lenguaje de Stevenson tienen otras aspectos a cuestionar, que además reciben críticas, incluyendo las implicaciones morales pertinentes, que estudiaremos en la siguiente publicación.
"Cualquier imagen tridimensional contiene una enorme cantidad de información: un montón de veces, la información almacenada en una imagen bidimensional".
MICHIO KAKU, físico teórico estadounidense de origen japonés, reconocido divulgador de la ciencia, nacido en 1947, a quien ya he citado antes en este blog.
En la Web y las redes sociales circulan hoy decenas de imágenes, datos e informaciones que en realidad son una desinformación médica y tratamientos falsos. Circulan imágenes generadas por inteligencia artificial de supuestos pacientes curados milagrosamente (antes/después de tratamientos falsos), imágenes microscópicas inventadas de bacterias o células para vender suplementos, y hasta fotos de instalaciones médicas lujosas que nunca existieron para captar pacientes en turismo de salud.
Lo casos más comunes hoy son los "deepfake doctors", videos generados por IA que muestran a falsos profesionales médicos dando consejos o vendiendo productos. Estos avatares pueden ser facsímiles de médicos reales (usando su imagen sin consentimiento), o figuras ficticias generadas completamente por IA.
El mecanismo combina modelos de difusión (como DALL-E, Midjourney) que crean el vídeo realista, modelos de lenguaje (LLMs) que generan el guión coherente y convincente y medios de difusión viral como las redes sociales. El resultado es tan creíble que incluso los familiares de los médicos reales suelen ser engañados.
Por otro lado, existen modelos generativos capaces de crear radiografías, resonancias o tomografías falsas que son indistinguibles de las reales para un ojo no entrenado. El estudio MedForensics ha documentado generación de imágenes falsas en seis modalidades médicas diferentes usando doce modelos generativos diferentes.
En todos estos casos, el riesgo es siempre grande. Personas que abandonan tratamientos reales por falsas promesas respaldadas por imágenes visualmente convincentes. Este es un asunto bien delicado y complicado, que se hace cada vez más difícil de enfrentar y resolver.
El aporte del psicólogo y pedagogo estadounidense, John Dewey (1859-1952), al estudio del arte es profundo y transformador, aunque opera desde una perspectiva filosófica diferente. No nos dio un método para clasificar el arte, sino una teoría sobre qué es la experiencia estética y cómo ocurre. Su obra fundamental en este campo es El arte como experiencia (1934), basada en sus conferencias en Harvard. Ya en publicaciones anteriores he hecho referencia a sus ideas, que aquí sigo desarrollando.
En primer término, rompe con la visión de museo como pedestal del arte. Dewey critica la tendencia a aislar el arte de la vida cotidiana; para él, el problema surge cuando guardamos una pintura en un museo o una sinfonía en una sala de conciertos, separándola de las experiencias vitales que la originaron. Su propuesta es reconectar la experiencia estética con los procesos de la vida diaria.
Así mismo, define la experiencia estética como una "experiencia consumatoria" y distingue entre el flujo caótico de experiencias cotidianas y una "experiencia consumatoria, que es aquella que tiene un inicio, un desarrollo y un clímax que nos llena de sentido. Por ejemplo, resolver un problema difícil, tener una conversación profunda o presenciar una obra de arte. Por esto él habla del arte como experiencia. La obra de arte no es el lienzo o la partitura, sino la interacción entre el objeto (estímulo) y el espectador (sujeto activo). La experiencia estética no es un lujo. Es la culminación exitosa de cualquier interacción organismo y su entorno. Ver una puesta de sol o escuchar una historia pueden ser arte si se viven plenamente.
Para Dewey, el arte no es solo expresión emocional ni solo técnica fría. Es un acto de construcción. Por ello, la emoción guía el hacer. El artista siente una cualidad emocional global (alegría, melancolía, tensión) que actúa como un "imán" que selecciona los materiales y las formas de su obra. El hacer tiene que ver con la creación y la producción. El artista trabaja los materiales (piedra, sonido, color) transformándolos. No es una copia de la realidad, es una recreación.
Esto implica también una percepción activa. El espectador no es pasivo. Para tener una experiencia estética, debe realizar su propio acto de recreación, siguiendo las pistas que el artista dejó en la obra. Si no hay esa participación activa, solo hay reconocimiento (saber qué es), no percepción (vivir su significado). Dewey rechaza la idea de que el arte sea solo un adorno o un escape de la realidad. Lo ve como el modo de comunicación más profundo y completo. Mientras que el lenguaje ordinario puede ser abstracto o informativo, el arte comunica la cualidad sentida de una experiencia. Un cuadro no te dice "el guerrero está triste", te hace sentir esa tristeza a través de líneas, colores y formas.
John Dewey aporta al estudio del arte la idea de que este no es un objeto sagrado para contemplar, sino un modelo de cómo toda experiencia humana puede volverse plena, significativa y comunitaria.
Esta imagen nos muestra rostros que parecen totalmente reales, pero en realidad son generados por programas gráficos de inteligencia artificial, que además han sido tratados y modificados para dar la sensación de arte digital, con estética de Glitch Art. Es todo un reto ahora identificar el origen y la veracidad de estas obras de ciberarte sintetizado, que sin embargo, destacan por su originalidad.
"La primera máxima de todo ciudadano ha de ser la de obedecer las leyes y costumbres de su país, y en todas las demás cosas gobernarse según las opiniones más moderadas y más alejadas del exceso".
RENÉ DESCARTES (1596-1650) Filósofo y matemático francés.
En publicaciones anteriores traté el tema del control o regulación posible (o necesario) sobre las imágenes sintéticas realizadas con inteligencia artificial. Hoy pongo aquí algunos ejemplos concretos de regulaciones y prácticas en diferentes países y sectores como forma de gobernanza respecto de las imágenes generadas con IA, hasta esta fecha.
Unión Europea (UE)
La UE está trabajando en la Ley de Inteligencia Artificial (AI Act), que busca regular el uso de sistemas de IA incluyendo aquellos que generan contenido visual. Esta ley impondrá obligaciones a los proveedores y usuarios para garantizar transparencia, seguridad y respeto a los derechos fundamentales. Por ejemplo, se requerirá etiquetar claramente las imágenes generadas por IA y evitar usos que puedan causar daño o engaño. Además, el Reglamento General de Protección de Datos (GDPR) protege la privacidad de las personas frente a la generación o manipulación de imágenes que puedan afectar su derecho a la imagen o datos personales.
Estados Unidos
Aunque no existe una ley federal específica sobre imágenes generadas con IA, algunos estados han comenzado a aprobar leyes relacionadas con deepfakes para prohibir su uso malicioso, especialmente en contextos políticos o de difamación. Plataformas como Twitter y Facebook han implementado políticas que exigen la identificación clara de contenido generado por IA para combatir la desinformación.
China
China ha establecido regulaciones estrictas sobre la generación de contenido por IA, incluyendo imágenes. Se exige que cualquier contenido generado por IA incluya marcas visibles que informen a los usuarios, y prohíbe la creación y difusión de contenido falso o dañino. Además, empresas tecnológicas deben cumplir con directrices estatales de censura y control.
Organizaciones internacionales
Organismos como la UNESCO o la OCDE están desarrollando recomendaciones para la gobernanza ética de la IA, que incluyen la regulación del contenido visual para promover la transparencia, evitar discriminación y proteger derechos humanos.
También el sector de entretenimiento y medios está incorporando ciertas regulaciones. En cine o publicidad, suelen usarse cláusulas contractuales para regular el uso de imágenes generadas por IA, protegiendo la imagen y derechos de actores o modelos virtuales. También se promueven estándares éticos para evitar la manipulación engañosa en noticias o campañas.
Estos ejemplos muestran que la regulación es un proceso activo y diverso, buscando balancear la innovación tecnológica con la protección social y ética. Es un tema aún delicado y polémico, pero estas acciones están demostrando que sí, en efecto, hay que hacer algo respecto al uso de la IA en las imágenes sintéticas. Pongo aquí también un interesante artículo sobre este asunto, publicado en la Web por el diario argentino La Capital: https://www.lacapitalmdp.com/ia-contra-ia-la-carrera-por-detectar-imagenes-falsas-en-pleno-tsunami-digital/
Lucas Gutiérrez, artista digital y diseñador industrial argentino, nacido en 1985 y radicado en Berlín, explora en sus obras la intersección entre programas informáticos y errores gráficos, creando objetos autónomos en un entorno virtual sin principio ni final, caracterizado por texturas macro y superficies imposibles; una propuesta que reflexiona sobre los nuevos paradigmas de la cultura digital desde una perspectiva metafísica, colorida y caótica.
Los últimos trabajos del artista, que ha ofrecido charlas y performances en espacios como el Centro Pompidou, son una original combinación de tecnología y abstracción dinámica que renueva los recursos digitales tridimensionales. Los ha presentado en IRCAM, Manifeste, Sonar+D, NYU Berlin/Tokio y sus obras se han mostrado en certámenes internacionales como The New Infinity, Berliner Festspiele, Immersion y CTM/transmediale, entre otros.
Su práctica explora la materialidad de lo digital a través de universos abstractos donde las superficies parecen convertirse en esculturas. En sus piezas, lo algorítmico adquiere textura, densidad y hasta latido propio. Lo que vemos nos hace dudar de si estamos frente a metal, plástico o pura simulación: la imagen deja de ser plana y empieza a comportarse como materia, que parte del diseño industrial.
Sus imágenes son conocidas por su estética abstracta y futurista y su capacidad para crear entornos profundamente inmersivos. Se mueve entre la cultura del remix y el desarrollo de proyectos audiovisuales en tiempo real, en los cuales fusiona influencias de diferentes contextos. La narrativa de Lucas Gutiérrez gira en torno a distopías y miedos sociales actuales desde un lenguaje metafísico lleno de caos y color. Su sitio Web es extraodinario, muy dinámico y completo. Aquí pongo el enlace y una entrevista muy interesante en la revista digital Planeta Urbano.
Un aspecto importante a considerar en el caso del uso indiscriminado de imágenes sintetizadas es cómo evitar que violen la privacidad individualk y violenten los derechos personales o colectivos. La gobernanza digital aplicada al control, supervisión o regulación de las imágenes generadas con inteligencia artificial (IA) es, en consecuencia, un tema muy relevante y en desarrollo actualmente.
Podemos revisar cómo se aplica:
1. Normativas y políticas claras. Se crean leyes y regulaciones que establecen qué tipo de imágenes generadas por IA están permitidas, cuáles podrían considerarse ilegales (por ejemplo, imágenes que promuevan el odio, la discriminación o la violencia), y cómo deben tratarse los derechos de autor o la privacidad.
2. Transparencia y etiquetado. Una práctica común es exigir que las imágenes generadas por IA sean etiquetadas claramente como tales para evitar la desinformación o el engaño. Esto forma parte de la gobernanza para garantizar que los usuarios sepan cuándo están viendo contenido manipulado o generado artificialmente.
3. Supervisión ética. Se establecen comités o grupos especializados que evalúan el impacto ético de estas tecnologías y sus usos, y proponen guías o recomendaciones para su aplicación responsable.
4. Control técnico y seguridad. Se implementan mecanismos tecnológicos para detectar imágenes falsas o manipuladas (deepfakes), y prevenir su uso fraudulento o malintencionado.
5. Participación y colaboración. La gobernanza digital promueve la participación de diferentes actores (gobiernos, empresas tecnológicas, expertos, sociedad civil) para que las regulaciones sean inclusivas y efectivas.
6. Protección de derechos. Se asegura la protección de derechos humanos, como la privacidad y la reputación, cuando se utilizan imágenes generadas por IA.
De esta forma, la gobernanza digital busca establecer un marco que permita aprovechar las ventajas de la IA para crear imágenes, pero minimizando riesgos asociados como la desinformación, violaciones a la privacidad o usos maliciosos. No obstante, sigue estando presente el asunto coercitivo y de regulaciòn, que puede derivar en censura y control punitivo. Es un problema candente, que recién está en la palestra.
Este es un tema muy actual y con muchas implicaciones hoy día: el enorme desarrollo que ha experimentado la difusión de imágenes visuales e incluso productos audiovisuales sintetizados con el uso de inteligencia artificial. Este crecimiento ha resultado en la proliferaciòn de noticias falsas (fake news) y suplantaciones (deepfakes) que retan la credibilidad y el sentido ético de la comunicación. En este sentido surge una nueva interrogante: ¿hay que controlar, regular o supervisar el uso de la IA en este tipo de imágenes? Entonces, ¿es posible establecer alguna forma de gobernanza de tipo digital para esta tendencia actual?
La gobernanza digital se refiere al conjunto de normas, políticas, procesos y mecanismos que regulan el uso, gestión y desarrollo de las tecnologías digitales y la información en una organización, comunidad o país. Su objetivo principal es asegurar que las tecnologías digitales se utilicen de manera eficiente, segura, ética y transparente para beneficiar a todos los actores involucrados.
En un contexto más amplio, la gobernanza digital abarca aspectos como:
- La regulación del acceso y uso de internet y otras plataformas digitales.
- La protección de datos personales y la privacidad.
- La ciberseguridad.
- La inclusión digital para que más personas puedan acceder y aprovechar estas tecnologías.
- La participación ciudadana a través de medios digitales.
- La transparencia y rendición de cuentas en el gobierno y en organizaciones mediante herramientas digitales.
Ahora bien, se puede pensar en extender la normativa para que abarque con precisión, justamente, el uso ético de la IA en las imágenes y videos sintetizados. Es por supuesto un tema polémico, porque raya con la censura y el control político, pero es necesario algún tipo de regulación o limitación en este sentido, porque cada vez más vemos como se hace patetente el manejo indiscriminado de rostros, espacios y hechos reales para presentar noticias no ciertas y acciones irreales o falsas, que son fuente de mentiras y desinformación. En la publicación de mañana veremos algunas propuestas para revisar esta compleja situación.
Esta imagen que muestro hoy es otro ejemplo de arte digital hecho con programas gráficos de ilustración 3D. Es una representación de un paisaje imaginario, con globos aerostáticos y palacios elevados, hallada en la Web.
A comienzos de marzo de 2026, Yang Hanhan, la directora de AIGC, de 35 años de Wuhan, capital de la provincia de Hubei en el centro de China, se sorprendió al descubrir que un cortometraje generado por inteligencia artificial sobre el antiguo general chino Huo Qubing, lanzado por su equipo apenas un mes antes, se había vuelto viral en el extranjero de manera silenciosa. En la película, no solo se despliegan escenas épicas de guerra una tras otra, sino que incluso los detalles, como el polvo arremolinado en una carga por el desierto, la tensión de los caballos de guerra relinchando y la sutil fruncida de ceño del protagonista, están representados con una delicadeza notable. Estos elementos rompen el estereotipo público del contenido producido por IA como tosco y de baja calidad.
El espectador internacional quedó cautivado por el espíritu juvenil y la devoción patriótica de Huo, así como por la estética oriental presentada a través de la IA. Sin embargo, este proyecto fue completado por un equipo de apenas tres personas, con solo 48 horas de trabajo y aproximadamente 3,000 yuanes (aproximadamente 435 dólares estadounidenses) en costos de computación, según Yang. "Producir un cortometraje de cuatro minutos en 48 horas se está convirtiendo en el estándar de la industria", afirma, agregando que a medida que la tecnología de IA continúa evolucionando y avanzando, la creación de cine y televisión de China y sus exportaciones culturales están siendo redefinidas.
A principios de 2025, Yang no tenía experiencia profesional en la industria del cine o la televisión. A medida que las plataformas de video con IA evolucionaban rápidamente, ella probó herramientas de video con IA por primera vez mientras promocionaba la especialidad de Wuhan, los "reganmian" o fideos secos y calientes. "Al principio, ninguno de nosotros tenía experiencia. Nos llevó más de una semana, entre cuatro personas, armar un video corto de un minuto", dijo. "El video no era excelente, pero vi la esperanza para esta industria".
Durante el último año, el equipo de Yang ha llevado a cabo una investigación profunda sobre una variedad de herramientas de creación de imágenes y videos con IA, tanto nacionales como internacionales, optimizando continuamente sus indicaciones y superando desafíos fundamentales en la creación con IA, como la coherencia de los personajes y la coherencia visual. A finales de enero de este año, Yang completó el guion del cortometraje Huo Qubing. Su equipo de tres se repartía claramente sus tareas: uno se encargaba de la dirección y la escritura, otro de la generación y edición de IA, y el tercero de la música y los efectos de sonido. Concentraron su energía durante cuatro días, trabajando un total de 48 horas, para completar el proyecto. "En la fase de producción de vídeo, primero generamos unas 1.700 imágenes con IA, seleccionamos 90 como storyboards para producir unos 500 clips de vídeo, y luego editamos, coordinamos y refinamos meticulosamente el metraje para dar vida a nuestra visión del joven héroe", explicó Yang. "De hecho, aún nos queda un camino técnico por delante antes de poder alcanzar nuestro sueño de crear una película cinematográfica con IA", afirmó, "pero el verdadero valor de la IA es liberar a los creadores de tareas tediosamente repetitivas, permitiéndoles dedicar más tiempo a ideas y a la narrativa. Al fin y al cabo, lo que realmente determina la calidad de una obra sigue siendo la estética, la emoción y el pensamiento del creador".
El equipo de Yang ahora cuenta con 20 miembros, con diversos antecedentes que van desde la interpretación musical y el diseño de productos hasta incluso la mecánica automotriz. "La IA empodera a cualquiera que tenga una historia para perseguir su sueño de hacer películas. Creo que esta es la mejor era para los narradores", dijo. Ella espera que su equipo desarrolle una serie de cortometrajes protagonizados por héroes chinos, como Yue Fei, Xin Qiji y Hua Mulan, que muestren sus historias y la profunda cultura china que aportan al mundo. Aquí pongo el video, que está en idioma chino, pero para apreciar la realización, basta, pues las imágenes hablan por sí solas. Este producto audiovisual puede redefinir la industria, el negocio, la estética y el futuro del cine. ¡Es un fenómeno impresionante!
En una entrada anterior hablé sobre el aprendizaje profundo o "Deep Learning", señalando qué representa y cómo ha ido evolucionando. En principio, es un concepto muy ligado al desarrollo de la inteligencia digital y que consiste en una forma de aprendizaje automático que utiliza redes neuronales artificiales para aprender de datos. Uno de los más destacados investigadores y pioneros en este campo es Yann LeCun, un informático franco-estadounidense especializado en aprendizaje automático, visión por computadora y neurociencia computacional, que además formó parte de la directiva de Meta en algún momento.
El Deep Learning, según LeCun, es un enfoque del aprendizaje automático que utiliza redes neuronales profundas con múltiples capas para aprender representaciones complejas de datos de manera jerárquica, inspiradas en el cerebro humano. Lo describe como modelos computacionales con varias capas de procesamiento que extraen abstracciones progresivas de grandes volúmenes de datos, revolucionando campos como el reconocimiento de imágenes, voz y lenguaje mediante retropropagación. Según este proceso, transforma IA en reconocimiento de objetos, segmentación semántica y más, con impacto en robótica y neurociencia computacional.
Estas propuestas surgen de las redes neuronales convolucionales (CNN, por sus siglas en inglés) son un tipo de red neuronal artificial diseñada para procesar datos estructurados como imágenes, inspiradas en el sistema visual humano. LeCun las desarrolló en la década de 1980, popularizando su uso con el modelo LeNet en 1989 para reconocer dígitos manuscritos mediante convoluciones y retropropagación y la aplicó en convoluciones aprendibles, superando limitaciones previas como el Neocognitron de Fukushima. LeNet-5, su arquitectura icónica de 1998, revolucionó el reconocimiento óptico de caracteres y sentó bases para el deep learning moderno en visión por computadora.
Las redes neuronales convolucionales de LeCun tienen aplicaciones modernas en visión por computadora, diagnóstico médico y vehículos autónomos, entre otros. Estas se basan en arquitecturas como LeNet, evolucionadas a modelos como ResNet y EfficientNet para procesar datos visuales complejos con alta precisión. Esta es una forma de Deep Learning actual usado por los programas de IA. Por ejemplo, en la visión por computadora, que se usa en clasificación de imágenes, detección de objetos y segmentación semántica, como en redes sociales para organizar fotos o en comercio minorista para escanear estanterías. También se aplica para la conducción autónoma, pues detectan señales y peatones en tiempo real para decisiones seguras.
En salud y biomedicina este Deep Learning con CNN se aplica en imágenes médicas, analizan radiografías, mamografías y tomografías para detectar tumores con AUC superior al 0.95, acelerando diagnósticos y planificación de tratamientos. También apoyan descubrimiento de fármacos prediciendo propiedades moleculares desde estructuras químicas.
Este desarrollo es muy importante hoy en día, están también presentes en otras áreas, pues procesan audio para asistentes como Siri o Alexa, reconociendo palabras clave y comandos de voz, o en análisis de video y predicción de comportamientos, como riesgos de enfermedades o patrones de clientes en tiendas, locales y espacios públicos. Estos avances siguen cambiando nuestra forma de vida.