Las matemáticas abren la 'caja negra' de cómo la IA toma decisiones: «Esto es solo el comienzo»
Muchas de las tecnologías actuales, desde los asistentes digitales como Siri y ChatGPT hasta las imágenes médicas y los coches autónomos, funcionan con aprendizaje automático, uno de los sistemas más reconocidos de Inteligencia Artificial (IA)
Una técnica novedosa utiliza las matemáticas para comprender exactamente cómo toman decisiones las redes neuronales, un proceso común pero poco comprendido en el campo del aprendizaje automático.
Muchas de las tecnologías actuales, desde los asistentes digitales como Siri y ChatGPT hasta las imágenes médicas y los coches autónomos, funcionan con aprendizaje automático, uno de los sistemas más reconocidos de Inteligencia Artificial (IA). Sin embargo, las redes neuronales (modelos informáticos inspirados en el cerebro humano) que se encuentran detrás de estos sistemas de aprendizaje automático han sido difíciles de entender, lo que a veces les ha valido el apodo de «cajas negras» entre los investigadores.
«Creamos redes neuronales que pueden realizar tareas específicas, al tiempo que nos permiten resolver las ecuaciones que rigen la actividad de las redes», dijo en un comunicado Lyle Muller, profesor de matemáticas y director del Laboratorio Fields de Ciencias de Redes de la Universidad de Western Ontario. «Esta solución matemática nos permite 'abrir la caja negra' para comprender con precisión cómo la red hace lo que hace».
Los hallazgos se publicaron en la revista PNAS, en colaboración con investigadores internacionales, incluido el catedrático de investigación en aprendizaje automático de la Universidad de Ámsterdam, Max Welling.
El equipo de Western Ontario demostró por primera vez este nuevo avance en una tarea llamada segmentación de imágenes, un proceso fundamental en la visión artificial en el que los sistemas de aprendizaje automático dividen las imágenes en partes distintas, como separar los objetos de una imagen del fondo.
A partir de formas geométricas simples, como cuadrados y triángulos, crearon una red neuronal que podía segmentar estas imágenes básicas.
A continuación, Muller y sus colaboradores utilizaron un enfoque matemático, que habían desarrollado previamente para estudiar otras redes, para investigar cómo la nueva red realizaba esta tarea de segmentación al analizar estas imágenes simples.
El enfoque matemático permitió al equipo comprender con precisión cómo se producía cada paso del cálculo. De manera algo sorprendente, el equipo descubrió que la red también podía segmentar (o ver e interpretar) un puñado de imágenes naturales, como fotografías de un oso polar caminando por la nieve o de un pájaro en estado salvaje.
«Al simplificar el proceso para obtener información matemática, pudimos construir una red que era más flexible que los enfoques anteriores y que también funcionaba bien con nuevas entradas que nunca había visto», dijo Muller, miembro del Instituto Occidental de Neurociencia.
«Lo que es particularmente emocionante es que esto es solo el comienzo, ya que creemos que esta comprensión matemática puede ser útil mucho más allá de este primer ejemplo».
Las implicaciones del trabajo se extienden más allá del procesamiento de imágenes.
En un estudio relacionado publicado en Communications Physics en 2024, Muller y su equipo desarrollaron una red «explicable» similar que podría realizar varias tareas, desde operaciones lógicas básicas hasta funciones de memoria y transmisión segura de mensajes.
En otra colaboración con el profesor de fisiología y farmacología Wataru Inoue y su equipo de investigación en la Facultad de Medicina y Odontología Schulich, incluso conectaron con éxito su red a una célula cerebral viva, creando un sistema híbrido que une redes neuronales artificiales y biológicas.
«Este tipo de comprensión fundamental es crucial a medida que continuamos desarrollando sistemas de IA más sofisticados en los que podamos confiar y depender», dijo Budzinski, investigador postdoctoral en el Laboratorio Fields de Ciencias de Redes.