8 de noviembre de 2022

Las predicciones de la estructura 3D de las proteínas realizadas por una inteligencia artificial pueden revolucionar la investigación del cáncer y el descubrimiento de fármacos

Un grupo de investigadores entre los que se encuentra el Dr. Eduard Porta, líder del Grupo de Inmunogenómica del Cáncer del Instituto de Investigación contra la Leucemia Josep Carreras, acaba de publicar los resultados de su investigación sobre cómo aprovechar los resultados de AlphaFold2 en el mundo real. Este algoritmo, basado en la inteligencia artificial Deep Mind desarrollada por Google, permite predecir la estructura 3D de proteínas basándose simplemente en información genómica.

En un ser vivo, las proteínas lo constituyen prácticamente todo: desde las máquinas moleculares que ejecutan el metabolismo de cada célula, hasta la punta de tus cabellos. Codificadas en el ADN, una proteína puede representarse como un hilo de cientos de moléculas individuales llamadas aminoácidos, unidas entre sí. Dependiendo de su combinación particular de aminoácidos, una proteína se pliega de una forma u otra, dando como resultado una estructura 3D funcional. La forma hace la función y, con 20 aminoácidos diferentes disponibles, las combinaciones posibles son innumerables.

Las tecnologías genómicas actuales hacen que sea muy fácil conocer la secuencia de aminoácidos de una proteína, pero conocer su forma 3D exige procedimientos experimentales costosos y lentos, que no siempre tienen éxito. Durante décadas, los investigadores han tratado de comprender qué hace que una proteína se pliegue en una forma particular, para poder predecirlo a partir de su secuencia de aminoácidos.

AlphaFold2 es una red neuronal desarrollada por Deep Mind, una empresa de inteligencia artificial propiedad de Google, entrenada específicamente para resolver la estructura 3D de las proteínas precisamente a partir de su secuencia de aminoácidos. Su precisión impresionó a la comunidad científica hace algunos años después de sus victorias en el concurso internacional anual sobre modelado de estructuras de proteínas CASP, cuando su equipo presentó el proteoma completo para 11 especies diferentes, incluidos los humanos.

Para poner en contexto todos los datos publicados de un plumazo por AlphaFold2 (más de 300 mil modelos y creciendo), una comunidad de investigadores independientes, entre los cuales se encuentra el Dr. Eduard Porta, jefe del grupo de Inmunogenómica del Cáncer en el Instituto de Investigación contra la Leucemia Josep Carreras, comparó las nuevas estructuras predichas con las previamente disponibles y concluyó que AlphaFold2 contribuyó con un 25 % adicional de estructuras proteicas de alta calidad para las especies analizadas. El trabajo ha sido publicado recientemente en la prestigiosa revista Nature Structural Biology.

Se conoce el papel clave que juegan muchas proteínas en muchas enfermedades, como por ejemplo el cáncer, pero el desconocimiento de su funcionamiento a nivel molecular impide desarrollar estrategias específicas contra ellas. La información estructural de estas proteínas ayudará a los científicos a comprenderlas mucho mejor, saber con qué otras moléculas pueden interaccionar dentro de la célula y diseñar nuevos fármacos capaces de interferir con su función cuando se alteran.

Hay limitaciones, por supuesto, en las capacidades de AlphaFold2. El equipo científico descubrió que el algoritmo tiene problemas al intentar recrear complejos de proteínas. Esto es un problema ya que la mayoría de las proteínas trabajan junto con otras para realizar una función biológica concreta, por lo que sería muy deseable predecir cómo las diferentes proteínas podrían unirse entre sí. Otra limitación identificada es su incapacidad para mostrar la estructura de proteínas mutadas, con aminoácidos alterados en su secuencia. Las mutaciones a menudo dan como resultado una función anormal de las proteínas y son la causa de muchas enfermedades, como el cáncer.

Sin embargo, a pesar de sus limitaciones, el equipo reconoce la destacada contribución de AlphaFold2 a la biología estructural y computacional, que tendrá un gran impacto en la investigación básica y biomédica en los próximos años. No solo por su aportación directa (miles de nuevos modelos proteicos 3D muy fiables), sino también por iniciar una nueva era de herramientas computacionales basadas en inteligencia artificial, capaces de arrojar resultados que nadie puede anticipar aún.

De hecho, esta era ya ha comenzado y, recientemente, un equipo de Meta (anteriormente Facebook) ha utilizado una versión modificada de su predictor de lenguaje natural para "autocompletar" proteínas. Esta herramienta de inteligencia artificial, llamada ESMFold, parece ser menos precisa en comparación con su contraparte de Google, pero es 60 veces más rápida y puede superar algunas de las limitaciones identificadas de AlphaFold2, como el manejo de secuencias mutadas.

Con todo, como admiten los autores de la publicación, “la aplicación de AlphaFold2 [y de las próximas herramientas] tendrá un impacto transformador en las ciencias de la vida”.

 

Artículo de referencia:

Akdel, M., Pires, D.E.V., Pardo, E.P. et al. A structural biology community assessment of AlphaFold2 applications. Nat Struct Mol Biol (2022). https://doi.org/10.1038/s41594-022-00849-w