Diseñar una proteína es un poco como hacer un armario. El primer paso es construir la columna vertebral que mantiene unida la proteína. Pero luego viene la parte más difícil: averiguar dónde instalar las bisagras en el andamio -es decir, encontrar los mejores «puntos calientes»- para colocar puertas, estantes y otros accesorios que, en última instancia, hacen que el armario sea totalmente funcional.

En cierto modo, las proteínas también tienen puntos calientes incrustados en sus estructuras. Haciendo honor a su nombre, «sitios funcionales», estos intrigantes recovecos forman intrincados muelles a los que se agarran otras proteínas o fármacos. Estos lugares son fundamentales para llevar a cabo la mayoría de los procesos biológicos básicos. También son una enorme mina de oro para diseñar nuevos tratamientos y fármacos.

¿El problema? Los sitios funcionales son difíciles de cartografiar. Tradicionalmente, los científicos han tenido que mutar una a una las zonas sospechosas de una proteína -cambiando un aminoácido por otro- para localizar los puntos de unión precisos. Como si se tratara de un detective que examina cientos de sospechosos, de los que podría haber muchos, es extremadamente tedioso.

A nuevo estudio en Ciencia derrumbó todo el libro de juegos. Dirigido por el Dr. David Baker, de la Universidad de Washington, un equipo recurrió a la «imaginación» de una IA para idear una miríada de sitios funcionales desde cero. Es la «creatividad» de una mente artificial en su máxima expresión: un algoritmo de aprendizaje profundo que predice el área general del sitio funcional de una proteína, pero luego esculpe la estructura.

Como prueba de realidad, el equipo utilizó el nuevo software para generar fármacos que combaten el cáncer y diseñar vacunas contra virus comunes, aunque a veces mortales. En uno de los casos, la mente digital ideó una solución que, cuando se probó en células aisladas, coincidía perfectamente con un anticuerpo existente contra un virus común. En otras palabras, el algoritmo «imaginó» un punto caliente de una proteína viral, haciéndola vulnerable como objetivo para diseñar nuevos tratamientos.

El algoritmo es la primera incursión del aprendizaje profundo en la construcción de proteínas en torno a sus funciones, lo que abre una puerta a tratamientos que antes eran inimaginables. Pero el software no se limita a los puntos calientes de las proteínas naturales. «Las proteínas que encontramos en la naturaleza son moléculas asombrosas, pero las proteínas diseñadas pueden hacer mucho más», dijo Baker en un comunicado de prensa. El algoritmo «hace cosas que ninguno de nosotros pensaba que sería capaz de hacer».

El punto caliente de las proteínas

El equipo de Baker no es ajeno a la predicción de proteínas con mentes artificiales. Hace unos años, revolucionaron el campo de la biología estructural con el lanzamiento de Rosetta, un programa informático capaz de predecir la estructura tridimensional de una proteína basándose únicamente en su secuencia de aminoácidos. Además, trazaron un mapa de los complejos proteicos y diseñaron «destornilladores» de proteínas a partir de cero para separar las interacciones proteicas no deseadas. A finales del año pasado, publicaron un red de aprendizaje profundo bautizado como trRosetta, un «arquitecto» de la IA que generaliza el modo en que las cadenas de aminoácidos se organizan en intrincadas estructuras a nanoescala.

Retrocedamos.

Es fácil imaginarse las proteínas como el ala de pollo carnosa y fibrosa que estoy mordiendo mientras escribo esta frase. Pero a nivel molecular son mucho más elegantes. Imagina varios bloques de Lego -aminoácidos- unidos por una cuerda. Ahora gire la cadena hasta que algunos bloques se enganchen entre sí. Así se forma una delicada estructura que suele parecerse a una hélice o a unas sábanas arrugadas. En algunas proteínas, estos bloques se ensamblan en complejos, por ejemplo, creando un canal que atraviesa la membrana protectora de la célula como una autopista interestatal patrullada.

Las proteínas impulsan todos los procesos biológicos, a menudo a través de una cascada de interacciones con otras proteínas o fármacos, que -dependiendo de la pareja- pueden desencadenar consecuencias completamente diferentes: ¿debe una célula vivir o morir? ¿Atacar a un posible invasor o retirarse? En otras palabras, las proteínas son los bloques de construcción de la vida, y analizando su estructura es como podemos hackear la vida.

La cuestión es que no todas las partes de una proteína son iguales. Si una proteína es un cuerpo humano, los sitios funcionales son sus «manos», donde se agarra a otra proteína o fármaco, provoca reacciones enzimáticas o lucha contra patógenos invasores. Estos sitios, incrustados directamente en la estructura de la proteína, son difíciles de localizar y aún más difíciles de recrear.

El nuevo estudio abordó el problema con una versión de Rosetta: con algunos conocimientos previos, ¿es posible que un ordenador sueñe con una cadena de aminoácidos que se pliegue de forma natural en un sitio funcional?

El soñador y el realista

El problema puede parecer exótico, pero existe un ejemplo anterior en un campo diferente. Utilizando una red neuronal, OpenAI creó una amplia gama de imágenes a partir de sólo pies de texto. Un derivado del generador de texto de Rockstar AI GPT-3 El algoritmo de DALL-E generaba imágenes fantásticas, pero de aspecto realista, a partir de simples indicaciones de texto, detectando patrones a partir de su entrenamiento. «Toma los recovecos más profundos y oscuros de tu imaginación y los convierte en algo inquietantemente pertinente». dijo El Dr. Hany Farid, de la Universidad de Berkeley, tras el lanzamiento de la herramienta.

La construcción del sitio funcional de una proteína es similar. Aquí, los aminoácidos son las letras y el sitio funcional de la proteína es la imagen. «La idea es la misma: las redes neuronales pueden entrenarse para ver patrones en los datos. Una vez entrenadas, se les puede dar una indicación y ver si son capaces de generar una solución elegante», explica el Dr. Joseph Watson, autor principal del nuevo trabajo. Pero en lugar de escribir una novela, el algoritmo podría ayudar a reescribir la vida.

El equipo comenzó con una creación anterior, trRosetta. Se trata de una red neuronal diseñada originalmente para soñar con nuevas proteínas a partir de las secuencias de aminoácidos y, al mismo tiempo, ser capaz de predecir su estructura, tan ajena a las naturales, que el equipo bautizó el funcionamiento interno del aprendizaje profundo como «alucinación». El algoritmo parecía perfecto: podía predecir tanto la secuencia de aminoácidos de una proteína como su estructura.

¿El hipo? No ha funcionado realmente. Por el contrario, la OG de la predicción de la estructura de las proteínas, RoseTTAFold se comportó como un campeón. El poder del algoritmo proviene de su diseño: modelar cada aminoácido a nanoescala, proporcionando coordenadas a cada átomo. Al igual que la localización de un lugar geográfico mediante Google Maps, esto proporciona un nivel de verdad de base para una estructura que una IA puede seguir rifeando, una especie de «alucinación restringida».

¿Traducción? RoseTTAFold puede predecir una estructura funcional -específica para el problema en cuestión- y presentar un boceto como diseño final.

Luego vino otro truco ingenioso, bautizado como «inpainting». En este caso, el equipo ocultó partes de la secuencia o estructura de la proteína. El software tuvo que aprender a descifrar la información de lo que es esencialmente una ruidosa interceptación de radio, en la que sólo se oyen las primeras palabras pero se intenta entender su significado rellenando los espacios en blanco. RoseTTAFold abordó el «problema de la recuperación de la información perdida» con gusto, autocompletando tanto las secuencias de aminoácidos como las estructuras para construir una determinada región funcional con gran fidelidad.

RoseTTAFold puede abordar los problemas de construir secuencias de aminoácidos y generar una columna vertebral para el sitio al mismo tiempo. Es como poner palabras en un papel: el escritor se asegura de que cada letra está en el lugar correcto, al tiempo que comprueba que la gramática y el significado tienen sentido.

Cuestionar la naturaleza de la realidad

Al poner a prueba su nueva creación, el equipo generó varios diseños de fármacos y vacunas que podrían luchar contra los virus y el cáncer o ayudar en problemas de salud de baja intensidad.

Para el autor principal, el Dr. Jue Wang, el algoritmo se volvió inesperadamente pertinente. Mientras trabajaba en el proyecto, su hijo de dos años fue hospitalizado en la unidad de urgencias por una infección pulmonar por el VRS (Virus Sincitial Respiratorio), un virus que normalmente presenta síntomas similares a los del resfriado, pero que puede ser mortal en los jóvenes y los ancianos.

En ese momento, Wang utilizaba el algoritmo para diseñar nuevos tratamientos, entre los que se encontraban posibles lugares del VRS contra los que probar vacunas y fármacos. Es una estructura relativamente bien mapeada. El software alucinó con diseños que recapitulaban dos sitios a los que las vacunas podrían unirse. Las pruebas realizadas con las proteínas alucinadas, reconstruidas en bacterias, se agarraron rápidamente a los anticuerpos existentes, una señal de que son funcionales y de que el enfoque de aprendizaje profundo funciona.

El incidente «me hizo darme cuenta de que incluso los problemas ‘de prueba’ en los que estábamos trabajando eran en realidad bastante significativos», dijo Wang.

En varias pruebas adicionales, el equipo diseñó sitios funcionales para una enzima, proteínas de unión a proteínas y proteínas que se aferran a los iones metálicos, es decir, cómo se absorbe el hierro y otros metales importantes.

Aunque es potente, tiene margen de crecimiento. El método abre la puerta a la desmitificación de las proteínas naturales, pero también al diseño potencial de otras nuevas para la biología sintética. «Se trata de nuevos enfoques muy potentes, pero todavía hay mucho margen de mejora», dijo Baker.

En conjunto, es otra victoria para el aprendizaje profundo y un fascinante escaparate de cómo la IA y la biología pueden hacer sinergia. «El aprendizaje profundo ha transformado la predicción de la estructura de las proteínas en los últimos dos años, y ahora estamos en medio de una transformación similar del diseño de proteínas», dijo Baker.

Crédito de la imagen: Ian C. Haydon/ Instituto de Diseño de Proteínas de la UW . Un nuevo software de inteligencia artificial entrenado en las estructuras de las proteínas puede generar proteínas funcionales, incluidas estas vacunas candidatas para el virus respiratorio RSV, en segundos.