Dos metros de ADN se concentran en el núcleo de cada célula humana. Bin Zhang quiere saber cómo funciona la expresión génica en este minúsculo espacio

Anne Trafton Noticias del MIT

Dentro de cada célula humana se encuentran 2 metros de ADN comprimidos en un núcleo cuyo diámetro es de apenas una centésima de milímetro.

Para caber en ese diminuto espacio, el genoma debe plegarse formando una estructura compleja llamada cromatina, compuesta de ADN y proteínas. La estructura de dicha cromatina, a su vez, ayuda a determinar cuáles genes se expresarán en una célula determinada. Las neuronas, las células cutáneas y las células inmunitarias expresan genes diferentes según cuáles sean accesibles para su transcripción.

Descifrar estas estructuras experimentalmente es un proceso laborioso, lo que dificulta la comparación de las estructuras genómicas tridimensionales presentes en diferentes tipos de células. El profesor Bin Zhang del MIT está adoptando un enfoque computacional para abordar este desafío, utilizando simulaciones por computadora e inteligencia artificial generativa para determinar estas estructuras.

“La regulación de la expresión genética depende de la estructura tridimensional del genoma, por lo que la esperanza es que si podemos comprender plenamente esas estructuras, podremos comprender de dónde proviene esta diversidad celular”, afirma Zhang, profesor asociado de química.

De la granja al laboratorio

Zhang se interesó por primera vez en la química cuando su hermano, que era cuatro años mayor, compró algunos equipos de laboratorio y comenzó a realizar experimentos en casa.

Traía tubos de ensayo y reactivos a casa y hacía el experimento allí. En aquel entonces no tenía ni idea de lo que hacía, pero me fascinaban los colores brillantes, el humo y los olores que emanaban de las reacciones. Eso me cautivó muchísimo, dice Zhang.

Su hermano se convirtió más tarde en la primera persona de la aldea rural de Zhang en ir a la universidad. Esa fue la primera vez que Zhang intuyó que podría tener un futuro diferente al de seguir los pasos de sus padres, agricultores de la provincia china de Anhui.

“De niño, nunca me habría imaginado dedicarme a la ciencia ni trabajar como profesor en Estados Unidos”, dice Zhang. “Cuando mi hermano fue a la universidad, eso realmente abrió mi perspectiva y me di cuenta de que no tenía que seguir el camino de mis padres y convertirme en agricultor. Eso me llevó a pensar que podía ir a la universidad y estudiar más química”.

Zhang asistió a la Universidad de Ciencia y Tecnología de Hefei, China, donde se especializó en física química. Disfrutó de sus estudios y descubrió la química computacional y la investigación computacional, que se convirtieron en su nueva fascinación.

“La química computacional combina la química con otras materias que me apasionan —matemáticas y física— y aporta rigor y razonamiento a las reglas, que de otro modo serían más empíricas”, afirma. “Podría usar la programación para resolver problemas de química interesantes y poner a prueba mis propias ideas rápidamente”.

Tras graduarse de la universidad, decidió continuar sus estudios en Estados Unidos, donde recordaba haber considerado «la cumbre académica». En Caltech, trabajó con Thomas Miller, profesor de química que utilizaba métodos computacionales para comprender procesos moleculares como el plegamiento de proteínas.

Para su investigación doctoral, Zhang estudió una proteína transmembrana que actúa como canal para permitir el paso de otras proteínas a través de la membrana celular. Esta proteína, llamada translocón, también puede abrir una compuerta lateral dentro de la membrana, de modo que las proteínas que deben estar incrustadas en ella puedan salir directamente a ella.

«Es una proteína realmente extraordinaria, pero no estaba claro cómo funcionaba», dice Zhang. «Construí un modelo computacional para comprender los mecanismos moleculares que determinan las características moleculares que permiten que ciertas proteínas entren en la membrana, mientras que otras se secretan».

Volviendo al genoma

Tras finalizar sus estudios de posgrado, la investigación de Zhang se centró en el genoma y no en las proteínas. En la Universidad Rice, realizó un posdoctorado con Peter Wolynes, profesor de química que había realizado numerosos descubrimientos clave en la dinámica del plegamiento de proteínas. En la época en que Zhang se incorporó al laboratorio, Wolynes centró su atención en la estructura del genoma, y ​​Zhang decidió hacer lo mismo.

A diferencia de las proteínas, que tienden a tener regiones altamente estructuradas que pueden estudiarse mediante cristalografía de rayos X o crio-EM, el ADN es una molécula muy globular que no se presta a ese tipo de análisis.

Unos años antes, en 2009, investigadores del Instituto Broad, la Facultad de Medicina de la Universidad de Massachusetts, el MIT y la Universidad de Harvard desarrollaron una técnica para estudiar la estructura del genoma mediante la reticulación del ADN en el núcleo celular. Los investigadores pueden entonces determinar qué segmentos se encuentran cerca uno del otro fragmentando el ADN en muchos fragmentos diminutos y secuenciándolo.

Zhang y Wolynes utilizaron datos generados por esta técnica,  conocida como Hi-C , para explorar la cuestión de si el ADN forma nudos cuando se condensa en el núcleo, de forma similar a cómo una tira de luces navideñas puede enredarse cuando se mete en una caja para guardarla.

Si el ADN fuera como un polímero normal, cabría esperar que se enredara y formara nudos. Pero eso podría ser muy perjudicial para la biología, porque el genoma no permanece inactivo. Tiene que pasar por la división celular, y además toda esta maquinaria molecular tiene que interactuar con el genoma y transcribirlo en ARN, y la presencia de nudos crearía muchas barreras innecesarias, afirma Zhang.

Descubrieron que, a diferencia de las luces de Navidad, el ADN no forma nudos ni siquiera cuando está empaquetado en el núcleo de la célula, y construyeron un modelo computacional que les permitió probar hipótesis sobre cómo el genoma es capaz de evitar esos enredos.

Desde que se incorporó al profesorado del MIT en 2016, Zhang ha seguido desarrollando modelos del comportamiento del genoma en el espacio tridimensional mediante simulaciones de dinámica molecular. En un área de investigación, su laboratorio estudia cómo las diferencias entre las estructuras genómicas de las neuronas y otras células cerebrales dan lugar a sus funciones únicas, y también explora cómo el plegamiento incorrecto del genoma puede provocar enfermedades como el alzhéimer.

A la hora de conectar la estructura y la función del genoma, Zhang cree que los métodos de IA generativa también serán esenciales. En un  estudio reciente , él y sus estudiantes presentaron un nuevo modelo computacional, ChromoGen, que utiliza IA generativa para predecir las estructuras tridimensionales de las regiones genómicas, basándose en sus secuencias de ADN.

“Creo que en el futuro contaremos con ambos componentes: IA generativa y enfoques basados ​​en la química teórica”, afirma. “Se complementan a la perfección y nos permiten construir estructuras 3D precisas y comprender cómo surgen de las fuerzas físicas subyacentes”.