La campeona de bridge Sharon Osberg una vez escribió «Jugar al bridge es como dirigir un negocio. Se trata de cazar, perseguir, matizar, engañar, recompensar, poner en peligro, cooperar y, en un buen día, ganar».

Aunque no es de extrañar que el ajedrez cayera hace tiempo en manos de los superordenadores que calculan los números, cabría esperar que los humanos mantuvieran una ventaja más inexpugnable en el bridge, un juego de información incompleta, cooperación y comunicación astuta. A lo largo de milenios, nuestros cerebros han evolucionado para leer las sutiles señales faciales y el lenguaje corporal. Hemos creado sociedades extensas que dependen de la competencia y la cooperación de millones de personas. ¿Seguro que estas habilidades están fuera del alcance de las máquinas?

Por ahora, sí. Pero quizás no para siempre. En los últimos años, la IA más avanzada ha empezado a invadir parte de nuestro territorio más orgulloso: la capacidad de navegar por un mundo incierto en el que la información es limitada, el juego tiene infinitos matices y nadie triunfa solo.

La semana pasada, la empresa francesa NukkAI dio un paso más cuando su IA NooK para jugar al bridge superó a ocho campeones mundiales de bridge en una competición celebrada en París.

El juego estaba simplificado, y NooK no se enfrentó exactamente a los jugadores humanos -más adelante se habla de ello-, pero el rendimiento del algoritmo fue, por lo demás, espectacular. En particular, NooK es una especie de algoritmo híbrido que combina la IA simbólica (o basada en reglas) con el enfoque de aprendizaje profundo dominante en la actualidad. Además, a diferencia de sus compañeros de aprendizaje profundo, NooK es más transparente y puede explicar sus acciones.

“What we’ve seen represents a fundamentally important advance in the state of artificial intelligence systems,” Stephen Muggleton, a machine learning professor at Imperial College London, le dijo a The Guardian . En otras palabras, no está mal para un ordenador frío y calculador.

Caja negra, caja blanca

Para jugar al bridge, tal vez el juego de cartas o de mesa más difícil hasta ahora abordado por la IA, el equipo de NukkAI combinó el aprendizaje profundo por refuerzo con la IA simbólica, un enfoque famoso por el Deep Blue de IBM para derrotar a Garry Kasparov en el ajedrez en los años 90.

Los algoritmos de aprendizaje profundo por refuerzo están formados por una red de neuronas artificiales interconectadas. Para aprender un juego, un algoritmo se juega a sí mismo miles de millones de veces, evalúa su rendimiento después de cada ronda y mejora progresivamente afinando y resintonizando sus conexiones neuronales hasta que finalmente domina el juego.

En cambio, la IA simbólica se basa en reglas. Los ingenieros de software codifican las reglas que la IA debe conocer para tener éxito. Éstas pueden ser, por ejemplo, que un alfil puede moverse en diagonal cualquier número de casillas en un tablero de ajedrez, o que si un oponente sigue una estrategia concreta, el empleo de alguna contraestrategia aumenta las posibilidades de ganar. Este enfoque está bien para las partidas finitas, pero cuando el espacio de todas las jugadas posibles aumenta en las partidas complejas, se vuelve insostenible.

Por eso, la derrota en 2016 del campeón mundial de Go, Lee Sedol, a manos de AlphaGo, de DeepMind, fue todo un acontecimiento. En ese momento, los expertos no esperaban que la IA venciera a los mejores jugadores de Go en una década. AlphaGo demostró el sorprendente poder del aprendizaje profundo en comparación con la «vieja IA».

Pero el aprendizaje profundo tiene sus inconvenientes. Uno de ellos es que es una «caja negra». El modo en que los miles de millones de nodos de una red neuronal logran cualquier tarea es un misterio.

El movimiento 37 de AlphaGo contra Lee Sedol era una elección que ningún humano haría: calculó que las probabilidades de que un profesional hubiera elegido esa jugada eran de 1 entre 10.000, pero la hizo de todos modos y ganó. Aun así, el algoritmo no pudo explicar qué in its training informed its confidence. This opacity is a problem when the stakes are higher than a board game. To trust self-driving cars or medical algorithms making life-and-death decisions and diagnoses, we need to understand their rationale.

Una posible solución, defendida por investigadores como NukkAI, consistiría en combinar el aprendizaje profundo y la IA simbólica, explotando los puntos fuertes de cada uno en lo que se denomina un enfoque «neurosimbólico».

NooK, por ejemplo, aprende primero las reglas del juego y luego mejora sus habilidades jugando. La combinación perfecciona el «cerebro» probabilístico del algoritmo, Muggleton le dijo a The Telegraph, llevándolo más allá de las estadísticas. NooK, he said, uses “background knowledge much in the way that we augment our own learning with information from books and previous experience.” As a result, the algorithm can explain decisions: It’s a “white box” AI.

Por eso el bridge -un juego de comunicación y estrategia que se ha resistido a ser conquistado por la IA- es una gran prueba para este enfoque. «En el bridge, no se puede jugar si no se explica», dijo la cofundadora de NukkAI, Véronique Ventos. The Guardian .

Existen algoritmos para jugar al bridge, pero no se comparan con los mejores humanos. En la competición de NukkAI en París de hace poco más de una semana, la situación parece haber cambiado.

Diversión y juegos

ElNukkAI Challenge enfrentó a NooK con ocho campeones mundiales de bridge.

Cada campeón jugó diez series de diez partidos mientras que NooK jugó 80 conjuntos de diez partidas, es decir, 800 tratos directos. En lugar de jugar entre sí, los humanos y la IA jugaron las mismas manos contra los mismos oponentes, un par de bots de bridge (no construidos por NukkAI) llamados Wbridge5.

Agame of bridge comienza con la puja de los jugadores sobre cuántas bazas, o rondas de juego, creen que pueden ganar. La oferta más alta se denomina contrato, y quien establece el contrato es el declarante. El compañero del declarante, o el muñeco, deja su mano sobre la mesa boca arriba y sale del juego. El declarante juega ahora las dos manos contra sus oponentes y trata de ganar suficientes bazas para cumplir su oferta.

El Desafío NukkAI eliminó las pujas para simplificar el juego, y tanto los humanos como NooK asumieron el papel de declarante en cada partida, con la pareja de bots de bridge como oponentes (o defensores). La diferencia entre la puntuación de NooK y la de cada jugador humano se promedió en cada juego. NooK venció a sus rivales en 67, o el 83%, de los 80 sets jugados.

«Es bastante desesperante para los humanos», el campeón francés Thomas Bessis dijo . «Hay veces que no entendemos por qué la IA juega mejor que nosotros, pero es así. Es muy frustrante».

La victoria de NooK es una hazaña impresionante, pero hay son advertencias . Omitir el proceso de puja y jugar sólo el papel de declarante eliminó partes desafiantes y matizadas del juego en las que las parejas deben comunicarse entre sí y engañar a sus oponentes. Además, para un humano es un reto mantenerse concentrado durante 100 manos seguidas, pero no así para un ordenador. Por último, el cofundador de NukkAI, Jean-Baptiste Fantun, dijo que confiaba en que la máquina se impondría en miles de manos, pero era menos optimista sobre sus perspectivas en sólo 800. En otras palabras, cuanto más juegue, más probabilidades tendrá de ganar, así que jugar muchas manos consecutivas puede haber ayudado a la IA a superar a los humanos en este caso.

«Así que incluso en el puente, hay otras cosas que resolver», Fantun dijo . «Todavía tenemos una hoja de ruta por delante». Es decir, es demasiado decir que el bridge ha caído en manos de la IA, como el ajedrez o el Go. Pero que la IA supere a los mejores jugadores humanos en parte del juego es un hito clave en el mapa de Fantun. Y aunque algoritmos de IA cada vez más grandes Como el GPT-3 de OpenAI sigue impresionando, el rendimiento de NukkAI en el puente puede añadir peso al argumento a favor de un enfoque híbrido.

A continuación, tendrán que demostrar que NooK puede jugar y ganar.

Crédito de la imagen: T A T I A N A / Unsplash


¿Busca formas de adelantarse al ritmo del cambio? Replantea lo que es posible. Únase a una cohorte exclusiva de 80 ejecutivos en el emblemático Programa Ejecutivo (PE) de Singularity, un programa de transformación del liderazgo de cinco días de duración y totalmente inmersivo que altera las formas de pensar existentes. Descubra una nueva mentalidad, un conjunto de herramientas y una red de compañeros futuristas comprometidos con la búsqueda de soluciones para el rápido ritmo de cambio en el mundo. Haga clic aquí para obtener más información y presentar su solicitud hoy mismo.