En una entrada anterior hablé sobre el aprendizaje profundo o "Deep Learning", señalando qué representa y cómo ha ido evolucionando. En principio, es un concepto muy ligado al desarrollo de la inteligencia digital y que consiste en una forma de aprendizaje automático que utiliza redes neuronales artificiales para aprender de datos. Uno de los más destacados investigadores y pioneros en este campo es Yann LeCun, un informático franco-estadounidense especializado en aprendizaje automático, visión por computadora y neurociencia computacional, que además formó parte de la directiva de Meta en algún momento.
El Deep Learning, según LeCun, es un enfoque del aprendizaje automático que utiliza redes neuronales profundas con múltiples capas para aprender representaciones complejas de datos de manera jerárquica, inspiradas en el cerebro humano. Lo describe como modelos computacionales con varias capas de procesamiento que extraen abstracciones progresivas de grandes volúmenes de datos, revolucionando campos como el reconocimiento de imágenes, voz y lenguaje mediante retropropagación. Según este proceso, transforma IA en reconocimiento de objetos, segmentación semántica y más, con impacto en robótica y neurociencia computacional.
Estas propuestas surgen de las redes neuronales convolucionales (CNN, por sus siglas en inglés) son un tipo de red neuronal artificial diseñada para procesar datos estructurados como imágenes, inspiradas en el sistema visual humano. LeCun las desarrolló en la década de 1980, popularizando su uso con el modelo LeNet en 1989 para reconocer dígitos manuscritos mediante convoluciones y retropropagación y la aplicó en convoluciones aprendibles, superando limitaciones previas como el Neocognitron de Fukushima. LeNet-5, su arquitectura icónica de 1998, revolucionó el reconocimiento óptico de caracteres y sentó bases para el deep learning moderno en visión por computadora.
Las redes neuronales convolucionales de LeCun tienen aplicaciones modernas en visión por computadora, diagnóstico médico y vehículos autónomos, entre otros. Estas se basan en arquitecturas como LeNet, evolucionadas a modelos como ResNet y EfficientNet para procesar datos visuales complejos con alta precisión. Esta es una forma de Deep Learning actual usado por los programas de IA. Por ejemplo, en la visión por computadora, que se usa en clasificación de imágenes, detección de objetos y segmentación semántica, como en redes sociales para organizar fotos o en comercio minorista para escanear estanterías. También se aplica para la conducción autónoma, pues detectan señales y peatones en tiempo real para decisiones seguras.
En salud y biomedicina este Deep Learning con CNN se aplica en imágenes médicas, analizan radiografías, mamografías y tomografías para detectar tumores con AUC superior al 0.95, acelerando diagnósticos y planificación de tratamientos. También apoyan descubrimiento de fármacos prediciendo propiedades moleculares desde estructuras químicas.
Este desarrollo es muy importante hoy en día, están también presentes en otras áreas, pues procesan audio para asistentes como Siri o Alexa, reconociendo palabras clave y comandos de voz, o en análisis de video y predicción de comportamientos, como riesgos de enfermedades o patrones de clientes en tiendas, locales y espacios públicos. Estos avances siguen cambiando nuestra forma de vida.

No hay comentarios:
Publicar un comentario