La IA lo ha vuelto a hacer.

Tras resolver uno de los mayores misterios de la biología, la predicciónprotein structure—it decoded how proteins link up en complejos, y soñó nuevas estructuras proteicas que en última instancia pueden convertirse en fármacos para controlar nuestra biología básica, nuestra salud y nuestra vida.

Sin embargo, cuando se enfrentaba a enormes complejos de proteínas, la IA flaqueaba. Hasta ahora. En una hazaña alucinante, un nuevo algoritmo descifró la estructura del corazón de la herencia, un enorme complejo de aproximadamente 1.000 proteínas que ayuda a canalizar las instrucciones del ADN al resto de la célula. El modelo de IA se basa en AlphaFold de DeepMind y RoseTTAfold del laboratorio del Dr. David Baker en la Universidad de Washington, que se pusieron a disposición del público para seguir experimentando.

Nuestros genes están alojados en una estructura similar a un planeta, llamada núcleo por su protección. El núcleo es un castillo de alta seguridad: sólo se permite la entrada y salida de moléculas específicas para transmitir las instrucciones del ADN al mundo exterior, por ejemplo, a las fábricas de proteínas de la célula que traducen las instrucciones genéticas en proteínas.

En el centro de la regulación de este tráfico se encuentran los complejos de poros nucleares, o CNP (guiño a los jugadores). Son como puentes levadizos extremadamente intrincados que controlan estrictamente las entradas y salidas de los mensajeros moleculares. En los libros de texto de biología, los CNP suelen parecer miles de baches de dibujos animados salpicados en un globo terráqueo. En realidad, cada CNP es una maravilla arquitectónica masivamente compleja, con forma de rosquilla, y uno de los mayores complejos proteicos de nuestro cuerpo.

¿Por qué preocuparse? Como si se tratara de un enorme rompecabezas, resolver la estructura de las CNP es gratificante por sí mismo. Pero como controlan el modo en que la información del ADN se transmite al resto de la célula, las CNP son esenciales para la terapia génica y las vacunas de tipo ARNm, CRISPR y potencialmente otros tratamientos genéticos que aún no hemos imaginado.

«El CNP [es] un punto caliente para las mutaciones asociadas a la enfermedad y las interacciones entre el huésped y el patógeno». dijo El Dr. Di Jiang, redactor jefe de Ciencia , in a deep dive into NPCs for their latest issue. “The work reported here represents a triumph of experimental structural biology.”

Un enigma estructural

«Poros nucleares» suena a algo sacado de un vídeo de cuidado de la piel. Pero para los biólogos celulares son un enigma de décadas. «Los CNP son esenciales para la vida» explicó El Dr. Francis Collins, antiguo director de los Institutos Nacionales de Salud (NIH).

Nuestras hebras de ADN se enroscan alrededor de un carrete de proteínas. A continuación, se encuentran dentro del núcleo, que protege al ADN de sustancias químicas potencialmente dañinas, virus u otros residuos. Imagina que envuelves los agujeros de un donut en un envoltorio de plástico de doble capa: eso es la envoltura nuclear. Ahora haz unos cuantos agujeros en el envoltorio: esos son los CNP.

Estos aparentemente sencillos «agujeros en la pared» son guardianes críticos del control genético en las células. Nuestras células funcionan traduciendo el código del ADN en proteínas para construir tejidos físicos o controlar las funciones biológicas básicas: indicar a una célula cuándo debe dividirse o morir, equilibrar el metabolismo y rechazar a los invasores virales.

Pero el ADN está secuestrado en el interior del núcleo. Cientos de proteínas mensajeras tienen que entrar en el santuario nuclear para transcribir las instrucciones del ADN en ARNm y transportarlo de vuelta a las fábricas de proteínas de la célula. Cada recorrido tiene que sortear las CNP, que actúan como guardianes y canales en una misma estructura.

Los científicos han intentado durante mucho tiempo descifrar su estructura, utilizando trucos bioquímicos para alterar su funcionamiento normal, o rayos X para escanear su estructura cristalina. El trabajo ha sido absolutamente minucioso. A partir de esos datos, los científicos encontraron dos tipos principales de proteínas que forman la puerta de entrada a nuestra cámara de herencia.

El primer tipo construye el andamiaje de la puerta. Estas proteínas, denominadas NUP (nucleoporinas), forman un equipo para recubrir el túnel. El segundo tipo actúa como el barro de las paredes vivas. Estas proteínas son mucho más flexibles, se pegan a las proteínas del andamiaje y se extienden hasta el canal central, donde pueden agarrarse físicamente a la carga para ayudarla a avanzar.

Compuestas por casi 1.000 proteínas que forman unos 30 «muelles» diferentes, las estructuras de las CNP son difíciles de resolver porque cambian dinámicamente. Varias proteínas, por ejemplo, actúan como bisagras interconectadas para cambiar la configuración o el tamaño de los poros. Como toda la estructura «abarca íntimamente» la envoltura nuclear, no pueden estudiarse de forma aislada, explicó el equipo, dirigido por los doctores Gerhard Hummer y Martin Beck, del Instituto Max Planck de Biofísica, y el doctor Jan Kosinski, del Laboratorio Europeo de Biología Molecular. Hasta ahora, incluso con los medios bioquímicos más avanzados, los científicos sólo han resuelto el 46% de la estructura del CNP.

“It’s like when you disassemble and reassemble an electronic device. There will always be some screws left, and you just don’t know where they are supposed to be,” said Kosinski. Thanks to AI, “we finally managed to fit most of them, and now, we know exactly where they are, what they do, and how.”

Introduzca la IA

El equipo primero aprovechó y mejoró un método popular para analizar a los NPCs llamado cryo-ET análisis. El método saltó a la fama en 2015 por ser capaz de resolver estructuras celulares hasta una escala casi atómica. Uno de los problemas para resolver la estructura del CNP es la falta de resolución de los conjuntos de datos anteriores, explicó el equipo. En este caso, recogieron un «conjunto de datos aproximadamente cinco veces mayor» que en su anterior intento y utilizaron un nuevo método informático para analizar los datos.

Observando los mapas recién dibujados, el equipo pudo delinear la envoltura nuclear -el «envoltorio» del ADN- desde un estado constreñido a otro más relajado. Para profundizar, el equipo recurrió a AlphaFold y RoseTTAfold con el fin de predecir un conjunto completo de modelos para las proteínas del CNP. El dúo funcionó bien: el análisis pudo modelar la mayoría de las proteínas nucleares con gran confianza y se ajustó a los datos de los métodos tradicionales de análisis microscópico.

Luego vino la parte difícil. Al igual que los muelles de embarque en un astillero, las CNP están fuertemente vinculadas con vías de tráfico de proteínas, que suelen ser difíciles de modelar en 3D. Utilizando su modelo, el equipo trazó los «puntos de anclaje» de los enlazadores de proteínas al túnel principal de las CNP. El modelado posterior construyó un «mapa de Google» de cómo se conectan los enlazadores. Al igual que un astillero bien organizado, cada uno ayuda a mantener la estructura del CNP.

Hackear el corazón de la herencia

El uso de la IA para resolver las estructuras de las proteínas se ha anunciado como el avance de la década. Este estudio es uno de los primeros en mostrar la potencia del algoritmo en entornos complicados y desordenados del mundo real.

«Este trabajo ejemplifica cómo, en el futuro, la biología estructural abarcará la biología celular para crear modelos atómicos de conjuntos de moléculas cada vez más grandes que desempeñan diferentes funciones en distintas partes de la célula». dijo Beck.

La revolución ya está en marcha. En el mismo número de la revista, un equipo separado Dirigido por el Dr. Hao Wu, de la Facultad de Medicina de Harvard, combinó imágenes de microscopía con AlphaFold para resolver parte de la estructura del CNP utilizando los huevos de Xenopus laevis, una rana africana con garras que es una de las preferidas en la investigación bioquímica.

Pero la IA aún no es la salvadora. Como dice el Dr. Thomas Schwartz del MIT, que no participó en los estudios, señaló Las CNP son criaturas vivas que cambian su configuración. Por ejemplo, sus canales tienden a ser más anchos cuando están felizmente acurrucados dentro de la envoltura nuclear, frente a los que se sacan para estudiarlos al microscopio. En otras palabras, los complejos proteicos son difíciles de descifrar y controlar. Pero, al igual que la resolución de un gigantesco rompecabezas, la IA está de nuestro lado.

«Ahora podemos pensar en construir un modelo dinámico completo del CNP y simular el transporte nuclear con detalle atómico», dijo. Con la predicción de proteínas basada en la IA en marcha, lo más emocionante es lo que está por venir.

Crédito de la imagen: V. ALTOUNIAN/ CIENCIA