Los bebés son bolas de alegría burbujeantes, mimosas y risueñas. También son máquinas de aprendizaje enormemente potentes. A los tres meses, ya intuyen cómo se comportan las cosas a su alrededor, sin que nadie les enseñe explícitamente las reglas del juego.

Esta capacidad, denominada «física intuitiva», parece extremadamente trivial a primera vista. Si lleno un vaso de agua y lo pongo sobre la mesa, sé que el vaso es un objeto, algo que puedo rodear con las manos sin que se me deshaga en las palmas. No se hundirá en la mesa. Y si empezara a levitar, me quedaría mirando y saldría corriendo de inmediato.

Los bebés desarrollan rápidamente esta capacidad al absorber datos de su entorno externo, formando una especie de «sentido común» sobre la dinámica del mundo físico. Cuando las cosas no se mueven como se esperaba -por ejemplo, en los trucos de magia en los que los objetos desaparecen- se muestran sorprendidos.

En el caso de la IA, es un asunto completamente diferente. Aunque los últimos modelos de IA ya han superado a los humanos, desde el juego hasta la resolución de enigmas científicos Pero todavía tienen dificultades para desarrollar la intuición sobre el mundo físico.

Este mes, los investigadores de DeepMind, propiedad de Google, se inspiraron en la psicología del desarrollo y construyó una IA que extrae de forma natural reglas sencillas sobre el mundo a través de la visualización de vídeos. Netflix and chill no funcionó por sí solo; el modelo de IA onlyaprendió las reglas de nuestro mundo físico cuando se le dio una idea básica de los objetos, como cuáles son sus límites, dónde están y cómo se mueven. Al igual que los bebés, la IA expresaba su «sorpresa» cuando se le mostraban situaciones mágicas que no tenían sentido, como una pelota rodando por una rampa.

Denominada PLATO (Physics Learning through Auto-encoding and Tracking Objects), la IA era sorprendentemente flexible. Sólo necesitaba un conjunto relativamente pequeño de ejemplos para desarrollar su «intuición». Una vez que la aprendía, el software podía generalizar sus predicciones sobre cómo se movían las cosas e interactuaban con otros objetos, así como sobre escenarios nunca antes encontrados.

En cierto modo, PLATO da en el clavo entre la naturaleza y la crianza. Los psicólogos del desarrollo llevan mucho tiempo discutiendo si el aprendizaje de los bebés puede lograrse a partir de la búsqueda de patrones en los datos de las experiencias. PLATO sugiere que la respuesta es no, al menos para esta tarea en particular. Tanto el conocimiento incorporado como la experiencia son fundamentales para completar la historia del aprendizaje.

Para ser claros, PLATO no es una réplica digital de un bebé de tres meses y nunca fue diseñado para serlo. Sin embargo, ofrece una visión del desarrollo potencial de nuestras mentes.

«La obra… está ampliando los límites de lo que la experiencia cotidiana puede y no puede explicar en términos de inteligencia». comentó Las doctoras Susan Hespos y Apoorva Shivaram, de la Universidad Northwestern y la Universidad Western Sydney, respectivamente, que no participaron en el estudio. Puede «indicarnos cómo construir mejores modelos informáticos que simulen la mente humana».

El dilema del sentido común

Con sólo tres meses, la mayoría de los bebés no se inmutan si se les cae un juguete al suelo; ya han captado el concepto de gravedad.

El modo en que esto ocurre sigue siendo desconcertante, pero hay algunas ideas. A esa edad, a los bebés todavía les cuesta retorcerse, gatear o moverse de alguna manera. La información que reciben del mundo exterior es principalmente a través de la observación. Esto es una gran noticia para la IA: significa que, en lugar de construir robots que exploren físicamente su entorno, es posible imbuir el sentido de la física en la IA a través de vídeos.

Es una teoría respaldada por el Dr. Yann LeCun, un destacado experto en IA y científico jefe de IA en Meta. En una charla de 2019 En la actualidad, el autor afirma que los bebés probablemente aprenden a través de la observación. Sus cerebros se basan en estos datos para formar una idea conceptual de la realidad. Por el contrario, incluso los modelos de aprendizaje profundo más sofisticados siguen luchando por construir un sentido de nuestro mundo físico, lo que limita su capacidad de relacionarse con el mundo, haciéndolos casi literalmente mentes en las nubes.

Entonces, ¿cómo se mide la comprensión de la física cotidiana por parte de un bebé? «Por suerte para nosotros, los psicólogos del desarrollo llevan décadas estudiando lo que los bebés saben sobre el mundo físico». escribió científico principal, el Dr. Luis Piloto. Una prueba especialmente potente es el paradigma de la violación de las expectativas (VoE). Si se le muestra a un bebé una pelota que rueda por una colina, que desaparece al azar o que de repente va en dirección contraria, el bebé se quedará mirando la anomalía durante más tiempo del que lo haría si cumpliera sus expectativas normales. Algo extraño ocurre.

Space Oddity

En el nuevo estudio, el equipo adaptó el VoE para probar la IA. Abordaron cinco conceptos físicos diferentes para construir PLATO. Entre ellos, la solidez, es decir, que dos objetos no pueden atravesarse mutuamente, y la continuidad, es decir, la idea de que las cosas existen y no se apagan incluso cuando están ocultas por otro objeto (la prueba «peek-a-boo»).

Para construir PLATO, el equipo comenzó con un método estándar en la IA con un enfoque de dos vertientes. Un componente, el modelo perceptivo, toma los datos visuales para analizar los objetos discretos de una imagen. El siguiente es el predictor de dinámica, que utiliza una red neuronal para tener en cuenta el historial de objetos anteriores y predecir el comportamiento del siguiente. En otras palabras, el modelo construye una especie de «motor de física» que mapea objetos o escenarios y adivina cómo se comportaría algo en la vida real. Esta configuración dio a PLATO una idea inicial de las propiedades físicas de los objetos, como su posición y la velocidad a la que se mueven.

A continuación vino el entrenamiento. El equipo mostró a PLATO menos de 30 horas de vídeos sintéticos de un conjunto de datos de código abierto . No se trata de vídeos de la vida real. Más bien, imagina animaciones de bloques de la vieja escuela de Nintendo de una pelota rodando por una rampa, rebotando en otra pelota, o desapareciendo de repente. Con el tiempo, PLATO aprendió a predecir cómo se movería un solo objeto en el siguiente fotograma del vídeo, y también actualizó su memoria para ese objeto. Con el entrenamiento, sus predicciones sobre la siguiente «escena» se hicieron más precisas.

A continuación, el equipo lanzó una llave inglesa a los radios. Presentaron a PLATO una escena normal y otra imposible, como la desaparición repentina de una pelota. Al medir la diferencia entre el evento real y las predicciones de PLATO, el equipo pudo medir el nivel de «sorpresa» de la IA, que se disparó en los eventos mágicos.

El aprendizaje se generalizó a otros objetos en movimiento. Desafiado con un un conjunto de datos completamente diferente desarrollado por el MIT, que incluía, entre otros elementos, conejos y bolos, PLATO discriminaba de forma experta entre sucesos imposibles y realistas. PLATO nunca había «visto» un conejo, pero sin ningún tipo de reentrenamiento, mostró su sorpresa cuando un conejo desafiaba las leyes de la física. Al igual que los bebés, PLATO fue capaz de captar su intuición física con tan sólo 28 horas de entrenamiento en vídeo.

Para Hespos y Shivaram, «estos hallazgos también son paralelos a las características que vemos en los estudios sobre bebés».

Intuición digital

PLATO no pretende ser un modelo de IA para el razonamiento infantil. Pero demuestra que el aprovechamiento de nuestros incipientes cerebros infantiles puede inspirar a los ordenadores con un sentido físico, incluso cuando el «cerebro» del software está literalmente atrapado dentro de una caja. No se trata sólo de construir robots humanoides. Desde las prótesis hasta los coches autodirigidos, una comprensión intuitiva del mundo físico sirve de puente entre el amorfo mundo digital de 0 y 1 y la realidad cotidiana.

No es la primera vez que los científicos de la IA piensan en turboalimentar las mentes de las máquinas con una pizca de ingenio infantil. Una idea es dotar a la IA de un sentido de la teoría de la mente, es decir, de la capacidad de distinguirse a sí misma de los demás y de imaginarse en el lugar de los demás. Se trata de una capacidad que se da de forma natural en los niños de unos cuatro años y que, si se incorpora a los modelos de IA, podría ayudarles a entender las interacciones sociales.

El nuevo estudio se basa en nuestros primeros meses de vida como un rico recurso para desarrollar la IA con sentido común. Por ahora, este campo está en sus inicios. Los autores publican su conjunto de datos para que otros se basen en ellos y exploren la capacidad de un modelo de IA para interactuar con conceptos físicos más complejos, incluidos los vídeos del mundo real. Por el momento, «estos estudios podrían servir como oportunidad de sinergia entre la IA y la ciencia del desarrollo», afirman Hespos y Shivaram.

Crédito de la imagen: thedanw de Pixabay