Progreso en inteligencia artificial ha permitido la creación de IAs que realizan tareas que antes sólo eran posibles para los humanos, como traducción de idiomas , conducir coches , jugando a los juegos de mesa a nivel de campeón del mundo, y extracción de la estructura de las proteínas . Sin embargo, cada una de estas IAs ha sido diseñada y entrenada exhaustivamente para una sola tarea y tiene la capacidad de aprender sólo lo necesario para esa tarea específica.

Las IAs recientes que producen texto fluido incluso en las conversaciones con los seres humanos, y generar un arte impresionante y único puede dar la falsa impresión de una mente en funcionamiento . Pero incluso estos son sistemas especializados que llevan a cabo tareas estrechamente definidas y requieren cantidades masivas de entrenamiento.

Sigue siendo un reto de enormes proporciones combinar múltiples IAs en una que pueda aprender y realizar muchas tareas diferentes, y mucho menos perseguir la totalidad de las tareas realizadas por los humanos o aprovechar la gama de experiencias disponibles para los humanos que reducen la cantidad de datos que de otro modo se necesitarían para aprender a realizar estas tareas. Las mejores IA actuales en este sentido, como AlphaZero y Gato puede manejar una variedad de tareas que se ajustan a un solo molde, como el juego. Inteligencia general artificial (AGI) que sea capaz de realizar una gran cantidad de tareas sigue siendo difícil de conseguir.

En definitiva, los AGIs necesitan ser capaces de interactuar eficazmente entre sí y con las personas en diversos entornos físicos y contextos sociales, integrar la gran variedad de habilidades y conocimientos necesarios para ello y aprender de forma flexible y eficaz de estas interacciones.

Construir AGIs se reduce a construir mentes artificiales, aunque muy simplificadas en comparación con las mentes humanas. Y para construir una mente artificial, hay que empezar con un modelo de cognición.

De la inteligencia general humana a la artificial

Los humanos tienen un conjunto casi ilimitado de habilidades y conocimientos, y aprenden rápidamente nueva información sin necesidad de ser rediseñados para ello. Es concebible que se pueda construir una AGI con un enfoque fundamentalmente diferente al de la inteligencia humana. Sin embargo, como tres investigadores en AI y ciencia cognitiva Nuestro enfoque consiste en inspirarnos en la estructura de la mente humana. Trabajamos hacia la AGI tratando de entender mejor la mente humana, y entendemos mejor la mente humana trabajando hacia la AGI.

De la investigación en neurociencia En la actualidad, gracias a la ciencia cognitiva y a la psicología, sabemos que el cerebro humano no es ni un enorme conjunto homogéneo de neuronas ni un conjunto masivo de programas para tareas específicas que resuelven cada uno un único problema. Por el contrario, es un conjunto de regiones con diferentes propiedades que sustentan las capacidades cognitivas básicas que, en conjunto, forman la mente humana.

Estas capacidades incluyen la percepción y la acción; la memoria a corto plazo para lo que es relevante en la situación actual; la memoria a largo plazo para las habilidades, la experiencia y los conocimientos; el razonamiento y la toma de decisiones; la emoción y la motivación; y el aprendizaje de nuevas habilidades y conocimientos a partir de todo lo que una persona percibe y experimenta.

En lugar de centrarse en capacidades específicas de forma aislada, el pionero de la IA Allen Newell en 1990 sugirió desarrollar Teorías unificadas de la cognición que integran todos los aspectos del pensamiento humano. Los investigadores han sido capaces de construir programas de software llamados arquitecturas cognitivas que encarnan dichas teorías, lo que permite probarlas y perfeccionarlas.

Las arquitecturas cognitivas se basan en múltiples campos científicos con perspectivas distintas. La neurociencia se centra en la organización del cerebro humano, la psicología cognitiva en el comportamiento humano en experimentos controlados y la inteligencia artificial en las capacidades útiles.

El modelo común de cognición

Hemos participado en el desarrollo de tres arquitecturas cognitivas: ACT-R , Sube, y Sigma . Otros investigadores también se han ocupado de enfoques alternativos. Un trabajo identificó casi 50 arquitecturas cognitivas activas . This proliferation of architectures is partly a direct reflection of the multiple perspectives involved, and partly an exploration of a wide array of potential solutions. Yet, whatever the cause, it raises awkward questions both scientifically and with respect to finding a coherent path to AGI.

Afortunadamente, esta proliferación ha llevado al campo a un punto de inflexión importante. Los tres hemos identificado una sorprendente convergencia entre arquitecturas, que refleja una combinación de estudios neuronales, conductuales y computacionales. En respuesta, iniciamosa communitywide effort to capture this convergence de manera similar a la Modelo estándar de la física de partículas que surgieron en la segunda mitad del siglo XX.

un gráfico que muestra una cabeza y un cerebro humanos a la izquierda, una cabeza de robot con circuitos a la derecha, y un gráfico con cinco bloques de colores y flechas que conectan los bloques
Este modelo básico de cognición explica el pensamiento humano y proporciona un modelo para la verdadera inteligencia artificial. Andrea Stocco, CC BY-ND

This Modelo común de cognición divide el pensamiento humano en múltiples módulos, con un módulo de memoria a corto plazo en el centro del modelo. Los demás módulos (percepción, acción, habilidades y conocimientos) interactúan a través de él.

Learning, rather than occurring intentionally, happens automatically as a side effect of processing. In other words, you don’t decide what is stored in long-term memory. Instead, the architecture determines what is learned based on whatever you do think about. This can yield learning of new facts you are exposed to or new skills that you attempt. It can also yield refinements to existing facts and skills.

Los propios módulos funcionan en paralelo; por ejemplo, le permiten recordar algo mientras escucha y mira a su alrededor. Los cálculos de cada módulo son masivamente paralelos, lo que significa que muchos pequeños pasos computacionales ocurren al mismo tiempo. Por ejemplo, al recuperar un hecho relevante de un vasto conjunto de experiencias previas, el módulo de memoria a largo plazo puede determinar la relevancia de todos los hechos conocidos simultáneamente, en un solo paso.

Guiando el camino hacia la Inteligencia Artificial General

El Modelo Común se basa en el consenso actual de la investigación en arquitecturas cognitivas y tiene el potencial de guiar la investigación en inteligencia general tanto natural como artificial. Cuando se utiliza para modelar patrones de comunicación en el cerebro, el Modelo Común arroja resultados más precisos que los principales modelos de la neurociencia. Este amplía su capacidad para modelar seres humanos -el único sistema que ha demostrado ser capaz de la inteligencia general- más allá de las consideraciones cognitivas para incluir la organización del propio cerebro.

Estamos empezando a ver esfuerzos para relacionar las arquitecturas cognitivas existentes con el Modelo Común y utilizarlo como base para nuevos trabajos, por ejemplo, una IA interactiva diseñado para entrenar a las personas hacia un mejor comportamiento sanitario. Uno de nosotros participó en el desarrollo de una IA basada en Soar, denominada Rosie que aprende nuevas tareas mediante instrucciones en inglés de profesores humanos. Aprende 60 rompecabezas y juegos diferentes y puede transferir lo aprendido de un juego a otro. También aprende a controlar un robot móvil para realizar tareas como recoger y entregar paquetes y patrullar edificios.

Rosie es sólo un ejemplo de cómo construir una IA que se acerque a la AGI mediante una arquitectura cognitiva bien caracterizada por el Modelo Común. En este caso, la IA aprende automáticamente nuevas habilidades y conocimientos durante el razonamiento general que combina la instrucción en lenguaje natural de los humanos y una cantidad mínima de experiencia, es decir, una IA que funciona más como una mente humana que las IA actuales, que aprenden a través de la fuerza de cálculo bruta y cantidades masivas de datos.

Desde una perspectiva más amplia de la AGI, consideramos el Modelo Común como una guía para el desarrollo de tales arquitecturas e IAs, y como un medio para integrar los conocimientos derivados de esos intentos en un consenso que finalmente conduzca a la AGI.La conversación

This article is republished from La conversación bajo licencia Creative Commons. Lea el artículo original .

Crédito de la imagen: Shutterstock.com/wowG