DeepMind sorprendió al mundo de la biología a fines del año pasado cuando su modelo de inteligencia artificial AlphaFold2 predijo la estructura de las proteínas (un problema común y muy difícil) con tanta precisión que muchos afirmaron que el antiguo problema de varias décadas estaba “resuelto”. Ahora los investigadores afirman haber superado a DeepMind de la misma manera que DeepMind ha superado al resto del mundo, con RoseTTAFold, un sistema que hace casi lo mismo a una fracción del costo de la informática. (Oh, y es gratis).

AlphaFold2 ha estado hablando de ellos en la industria desde noviembre, cuando venció a la competencia en CASP14, una competencia virtual entre algoritmos diseñados para predecir la estructura física de una proteína dada la secuencia de aminoácidos que la compone. El modelo de DeepMind estaba tan por delante del resto, tan preciso y confiable, que muchos en el campo hablaron (medio serios y de buen humor) de mudarse a un nuevo campo.

Pero un aspecto que no pareció satisfacer a nadie fueron los planes de DeepMind para el sistema. Esto no se describió de manera exhaustiva y abierta, y existía la preocupación de que la compañía (que es propiedad de Alphabet / Google) estuviera considerando mantener la salsa más o menos en secreto para sí misma, lo que sería su prerrogativa pero también algo poco ético. ayuda mutua. en el mundo científico.

Poner al día: En una especie de sorpresa, DeepMind publicó hoy métodos más detallados en la revista Nature. El código está disponible en GitHub. Esto alivia enormemente la preocupación antes mencionada, pero el avance que se describe a continuación sigue siendo muy relevante. También agregué un comentario de este equipo al final de la publicación.

Esta preocupación parece haber sido evocada, al menos en parte, por el trabajo de investigadores de la Universidad de Washington dirigido por David Baker y Minkyung Baek, publicado en el último número de la revista Science. Baker, como recordará, ganó recientemente un premio Breakthrough Prize por el trabajo de su equipo en la lucha contra el COVID-19 con proteínas modificadas.

LEER  Cómo recaudar fondos a través de Zoom de manera más efectiva - TechCrunch

El nuevo modelo del equipo, RoseTTAFold, hace predicciones con niveles similares de precisión utilizando métodos que Baker, respondiendo preguntas por correo electrónico, admitió francamente, inspirándose en los utilizados por AlphaFold2.

“El grupo AlphaFold2 presentó varios conceptos nuevos de alto nivel durante la reunión CASP14. A partir de estas ideas, y con una gran cantidad de intercambio de ideas colectivo con los colegas del grupo, Minkyung pudo hacer un progreso increíble en un período de tiempo muy corto ”, dijo. (“¡Ella es increíble!”, Agregó).

Ejemplos de estructuras proteicas predichas y sus verdades básicas. Una puntuación superior a 90 se considera extremadamente buena. Créditos de imagen: UW / Baek y col.

El grupo de Baker quedó aproximadamente en segundo lugar en CASP14, lo cual no es una hazaña pequeña, pero escuchar los métodos de DeepMind descritos los ha puesto incluso en un curso de colisión. Han desarrollado una red neuronal de “tres pistas” que tiene en cuenta simultáneamente la secuencia de aminoácidos (una dimensión), las distancias entre los residuos (dos dimensiones) y las coordenadas en el espacio (tres dimensiones). La mise en œuvre dépasse la complexité et dépasse largement le cadre de cet article, mais le résultat est un modèle qui atteint presque les mêmes niveaux de précision – des niveaux, il faut le répéter, qui étaient complètement sans précédent il y a moins d’ un año.

Además, RoseTTAFold alcanza este nivel de precisión mucho más rápido, es decir, con menos potencia de cálculo. Como dice el periódico:

DeepMind informó haber usado varias GPU durante días para hacer predicciones individuales, mientras que nuestras predicciones se realizan en una sola pasada a través de la red de la misma manera que se usaría para un servidor … la versión de extremo a extremo de RoseTTAFold requiere alrededor de 10 minutos en una GPU RTX2080 para generar coordenadas de la columna vertebral para proteínas con menos de 400 residuos.

¿Escucha eso? Es el sonido de miles de microbiólogos suspirando aliviados y rechazando borradores de correos electrónicos pidiendo tiempo para una supercomputadora. Puede que no sea fácil tener en sus manos una 2080 en estos días, pero el punto es que cualquier GPU de escritorio de alta gama puede hacer esta tarea en minutos, en lugar de requerir un rango de clúster alto que se ejecuta durante días.

LEER  Twitter dice preocupado por el acoso en India, pide 3 meses más para cumplir con las nuevas reglas de TI - TechCrunch

Los requisitos modestos hacen que RoseTTAFold sea adecuado para el alojamiento y la distribución públicos, algo que quizás nunca haya estado en las tarjetas de AlphaFold2.

“Tenemos un servidor público al que cualquiera puede enviar secuencias de proteínas y predecir las estructuras”, dijo Baker. “Ha habido más de 4.500 envíos desde que instalamos el servidor hace unas semanas. También hemos puesto a disposición el código fuente de forma gratuita.

Puede parecer muy especializado, y lo es, pero el plegamiento de proteínas siempre ha sido uno de los problemas más difíciles de la biología y un problema al que se han dedicado innumerables horas de informática de alto rendimiento. Quizás recuerde Folding @ Home, la popular aplicación de computación distribuida que permite a las personas donar sus ciclos de cómputo en un intento de predecir las estructuras de proteínas. El tipo de problema que podría haber tardado miles de días o semanas en resolverse, esencialmente utilizando soluciones de fuerza bruta y verificando su idoneidad, ahora se puede solucionar en minutos en un solo escritorio.

La estructura física de las proteínas es de suma importancia en biología, ya que son las proteínas las que realizan la gran mayoría de las tareas de nuestro organismo y las proteínas que necesitan ser cambiadas, eliminadas, mejoradas, etc. por razones terapéuticas; primero, sin embargo, deben entenderse, y hasta noviembre este entendimiento no podría lograrse de manera confiable mediante el cálculo. En CASP14 se demostró que era posible y ahora está ampliamente disponible.

LEER  El gigante de pagos Stripe lanza Stripe Tax para integrar los cálculos de impuestos sobre las ventas para más de 30 países - TechCrunch

Esto no es, de lejos, una “solución” al problema del plegamiento de proteínas, aunque se ha expresado el sentimiento. Ahora se puede predecir la estructura de la mayoría de las proteínas en reposo en condiciones neutrales, lo que tiene enormes repercusiones en múltiples dominios, pero las proteínas rara vez se encuentran “en reposo en condiciones neutrales”. Se retuercen y contorsionan para agarrar o liberar otras moléculas, para bloquear o deslizarse a través de puertas y otras proteínas y, en general, para hacer lo que hagan. Estas interacciones son mucho más numerosas, complejas y difíciles de predecir, y ni AlphaFold2 ni RoseTTAFold pueden hacerlo.

“Hay muchos capítulos emocionantes por venir … la historia apenas comienza”, dijo Baker.

Con respecto al artículo de DeepMind, Baker hizo el siguiente comentario en un espíritu de camaradería colegial:

He leído y creo que este es un buen artículo que describe un trabajo fantástico.

El artículo de DeepMind es en realidad muy complementario a nuestro artículo, y creo que es apropiado que no salga después del nuestro, porque nuestro trabajo se basa realmente en sus avances.

Creo que los lectores disfrutarán leyendo ambos artículos; están lejos de ser redundantes. Como señalamos en nuestro artículo, su método es más preciso que el nuestro, y ahora será muy interesante ver qué características de su enfoque son responsables de las diferencias restantes. Ya estamos utilizando RoseTTAFold para el diseño de proteínas y una predicción más sistemática de la estructura del complejo proteína-proteína, y estamos entusiasmados de mejorarlos rápidamente, así como el modelado tradicional de cadena única, incorporando ideas del artículo de DeepMind.

Si tiene curiosidad sobre la ciencia y las posibles repercusiones, considere leer esta descripción mucho más detallada y técnica de los métodos y los posibles pasos siguientes escritos como resultado del rendimiento CASP14 de AlphaFold2.

¡Haz clic para puntuar esta entrada!
(Votos: Promedio: )