Los dispositivos dotados de inteligencia artificial están cada vez más presentes en nuestro entorno. Son aparatos que aprenden a resolver problemas. Sus algoritmos los dotan de la capacidad para asimilar siguiendo una lógica basada en la repetición. Tal es así que los vehículos de conducción autónoma en la medida que circulan más, más amplían su campo de “conocimiento”. Pero el paso siguiente que ha marcado la ciencia es hacer que estos algoritmos aprendan como bebés, simplemente por curiosidad.
Un algoritmo de computadora equipado con una forma de curiosidad artificial puede aprender a resolver problemas difíciles incluso cuando no está claro de inmediato las acciones que podrían ayudarlo a alcanzar esta meta. Investigadores de la Universidad de California, Berkeley, desarrollaron un "modelo de curiosidad intrínseca" para hacer que su algoritmo de aprendizaje funcione incluso cuando no hay unas señales de retroalimentación fuerte, publicó Mit Technology Review.
El modelo de curiosidad desarrollado por este equipo ve que el software de inteligencia artificial (IA), que controla a un agente virtual en un videojuego, busca maximizar la comprensión de su entorno, especialmente los aspectos de ese entorno que lo afectan. La ciencia ha intentado en ocasiones anteriores dotar de curiosidad a los agentes de AI, pero estos intentos han sido en sistemas muy simples.
"Las recompensas en el mundo real son muy escasas", dice Pulkit Agrawal, un estudiante de doctorado en la UC Berkeley que llevó a cabo la investigación con sus colegas. "Los bebés hacen todos estos experimentos al azar, y se puede pensar en eso como una especie de curiosidad con la cual aprenden algunas habilidades, explica la revista tecnológica.
"Algunas técnicas poderosas de aprendizaje mecánico han hecho que las máquinas sean más inteligentes en los últimos años. Entre ellos, un método conocido como aprendizaje de refuerzo ha hecho posible que las máquinas logren cosas que serían difíciles de definir en códigos. El aprendizaje de refuerzo implica el uso de recompensas positivas para guiar el comportamiento de un algoritmo hacia un objetivo particular.
El aprendizaje de refuerzo fue una parte fundamental de AlphaGo, un programa desarrollado por DeepMind, para jugar con habilidades increíbles el abstracto y complejo juego de mesa de origen chino llamado GO. La ciencia está explorando una manera de imbuir las máquinas con otras habilidades que puedan ser imposibles de codificar manualmente. Por ejemplo, poder proporcionar la solución para que un brazo robot averigue por sí mismo cómo realizar una tarea deseada.
Sin embargo, como el aprendizaje de refuerzo tiene sus limitaciones, a menudo se necesita una gran cantidad de entrenamiento para que la IA aprenda una tarea. El proceso puede ser difícil si la retroalimentación requerida no está disponible de inmediato. Por ejemplo, el método no funciona para los juegos de ordenador en los que los beneficios de ciertos comportamientos no son inmediatamente obvios. Ahí es donde la curiosidad podría ayudar.
Los investigadores probaron el nuevo acercamiento con dos video-juegos simples: Mario Bros, un juego de plataformas clásico, y VizDoom, un video juego de tirador tridimensional. En ambos juegos, el uso de la curiosidad artificial hizo el proceso de aprendizaje más eficiente. En el juego en 3-D, por ejemplo, en lugar de pasar una cantidad excesiva de tiempo golpeando en las paredes, el agente se movió alrededor de su entorno, aprendiendo a navegar más rápidamente.
Incluso sin ninguna otra recompensa, el agente de IA fue capaz de navegar ambos juegos sorprendentemente bien. En Mario Bros aprendió a evitar ser asesinado porque esto disminuía su capacidad de explorar y aprender sobre su entorno.
La curiosidad artificial ha sido un área activa de investigación durante algún tiempo. Pierre-Yves Oudeyer, director de investigación del Instituto Francés de Investigación en Informática y Automatización, ha sido pionero en los últimos años en el desarrollo de programas informáticos y robots que muestran formas simples de curiosidad.
"Lo que es muy emocionante en este momento es que estas ideas, que fueron vistas como" exóticas "tanto por la corriente principal de la IA y los investigadores de la neurociencia, ahora se están convirtiendo en un tema importante en la IA y la neurociencia", dice Oudeyer a la revista tecnológica. El trabajo podría tener beneficios prácticos reales. El equipo de UC Berkeley está dispuesto a probarlo en robots que utilizan el aprendizaje de refuerzo para resolver cómo hacer cosas como agarrar objetos incómodos.
Agrawal dice que los robots pueden desperdiciar una enorme cantidad de tiempo realizando gestos al azar. Sin embargo, si el robot se dota de curiosidad debería explorar más rápidamente su entorno, experimentar con objetos cercanos y buscar las posibles soluciones.