Premio Nobel de Química 2024

El Premio Nobel de Química de 2024 ha recaído en David Baker, Demis Hassabis y John Jumper por sus trabajo en la predicción de las estructuras de las proteínas.

Si has estudiado algo de biología puede que, tal y como está enunciado arriba, el motivo del premio te choque. Pero ¿no se conoce ya la estructura de las proteínas desde hace mucho? ¿No eran una secuencia de aminoácidos que luego se pliegan y adquieren una conformación en 3D? Bueno, sí, pero…

Por ser más específicos, este año el Nobel de química se ha concedido en un 50% a David Baker de la Universidad de Washington, Seattle y en otro 50% a los trabajos de Demis Hassabis y John Jumper de Google DeepMind. David Baker ha sido premiado el diseño computacional de proteínas. En el caso de los científicos de Google DeepMind lo que se premia es un logro que se lleva persiguiendo durante cinco décadas: predecir la estructura terciaria de las proteínas a partir de su secuencia de aminoácidos.

Las proteínas y su estructura

 

De manera general podemos decir que las proteínas están formadas por cadenas de 20 aminoácidos diferentes. Imaginad un collar de cuentas de colores. Las proteínas son el collar y los aminoácidos cada una de esas cuentas. Podemos hacer muchos collares/proteínas poniendo más o menos cuentas/aminoácidos y cambiando el orden de estas cuentas/aminoácidos. Las proteínas son macromoléculas que se consideran la base misma de la vida. Participan en todas las reacciones químicas esenciales para la vida, son la base de la estructura de nuestro organismo, actúan como elementos de defensa, moléculas de señalización, hormonas… Por ello se dice que los aminoácidos son los bloques o ladrillos que construyen la vida.

La predicción de las estructuras terciarias de las proteínas

La estructura terciaria de las proteínas, es decir, la forma en que se colocan en el espacio en tres dimensiones es esencial para su funcionalidad. Desde los años 70 se ha intentado predecir esta estructura tridimensional a partir de la estructura primaria, de la simple secuencia de aminoácidos.

Los científicos saben desde unos doscientos años que las proteínas son moléculas esenciales para la vida. Pero no fue hasta la década de los cincuenta del siglo pasado cuando empezaron a disponer de los primeros métodos para estudiarlas en mayor profundidad. Uno de los primeros hitos, a finales de esos años 50, fue el desarrollo de la cristalografía de rayos X para estudiar la estructura tridimensional de las proteínas. Básicamente consistía en cristalizar una proteína pura y utilizar rayos X para determinar su estructura. El esfuerzo que supone cristalizar cada proteína para esta técnica es bastante grande. En 1961, el científico Christian Anfinsen concluyó que la estructura 3D de una proteína dependía exclusivamente de su secuencia de aminoácidos. De primeras esto nos puede llevar a pensar algo como “ah, pues qué fácil, si sé la secuencia de aminoácidos, sé la estructura de manera casi automática”. Pues no. Otro científico estadounidense, Cyrus Levinthal calculó que para una proteína de solo 100 aminoácidos (esto es una proteína muy pequeña, la mayoría son bastante más grandes) hay la menos 1047 estructuras 3D posibles… Tenemos un problema… o varios. Pero de eso va la ciencia. Uno de los problemas es ¿qué estructura 3D es la “correcta”? Pero hay más: ¿cómo es posible que la decisión de qué estructura escoge la proteína se tome de manera inmediata en la célula? ¿qué es lo que determina que se escoja una opción y no otra?  Una cosa que sí estaba clara era que la estructura 3D dependía SOLO de la secuencia de aminoácidos. Por lo tanto, los investigadores se pusieron a buscar la manera de predecir esa estructura a partir de la secuencia primaria. Eso evitaría tener que cristalizar las proteínas y pasarlas por los rayos X y ahorrar un montón de tiempo, esfuerzo y dinero.

El problema era tan complicado que pese a tener a miles de científicos trabajando en ello, hacer proyectos colaborativos gigantescos, no se empezaron a lograr resultados hasta ¡2018! Décadas para lograr avances realmente significativos.

Y ¿qué pasó en 2018? Pues que Demis Hassabis se incorporó al proyecto CASP, que llevaba desde 1994 intentando resolver el problema de la predicción de la estructura 3D. Hassabis es una persona brillante. Con solo 13 adquirió el grado de maestro en ajedrez. Siendo aún menor de edad comenzó a programar y muy pronto empezó a explorar el campo de la inteligencia artificial, a la vez que estudiaba neurociencia. En 2010 cofundó DeepMind, empresa que desarrollaba modelos de inteligencia artificial y que fue comprada por Google en 2014. Hasta ese momento no era una empresa o una persona muy conocida para el gran público. Pero en 2016 su programa AlphaGo fue capaz de derrotar a Lee Sedol, gran maestro de Go (un juego oriental más complejo que el ajedrez). Esta historia la podéis leer en el magnífico libro MANIAC, de Benjamin Labatut. Pero Hassabis no quería que la máquina derrotara al humano en Go o en ajedrez. Él estaba realmente interesado en el potencial de los modelos de inteligencia artificial y por eso se enroló en el proyecto CASP.

Hassabis desarrolló AlphaFold, que logró casi un 60% de exactitud en la predicción, frente al 40% que se había logrado en los años anteriores. Estaba muy muy bien… pero aún lejos del 90% requerido para que un modelo se considerara fiable.

Funcionamiento de la IA AlphaFold2

Así funciona AlphaFold2

Pero tras denodados esfuerzos, no lograron mejorar el rendimiento. Hasta que se incorporó Jumper al equipo. Ya tenía experiencia en la simulación de proteínas y aportó un montón de ideas creativas para mejorar AlphaFold.

En 2020 Hassabis y Jumper presentaron un nuevo modelo de inteligencia artificial, AlphaFold2. El uso de redes neuronales permitía encontrar patrones entre cantidades gigantescas de datos de una manera flexible y eficaz. Entrenaron a AlphaFold2 con las bases de datos de las estructuras de proteínas y con las de secuencias de aminoácidos y empezaron a obtener buenos resultados. De hecho, tenían una tasa de éxito similar a la de la cristalografía de rayos X. Con esta aproximación computacional han sido capaces de predecir la estructura 3D de cualquier proteína conocida (unos 200 millones de proteínas). Para hacernos una idea de su importancia, basta con aportar un dato. AlphaFold2 solo tiene cuatro años de vida. En esos cuatro años ya ha sido utilizado por más de dos millones de personas en 190 países diferentes. Esto ha sido posible, en parte, a que Google DeepMind ha hecho público el código de AlphaFold2. Actualmente predecir la estructura terciaria de una proteína lleva tan solo unos minutos. Anteriormente se tardaba años por cada proteína. Las aplicaciones prácticas de conocer la estructura terciaria de las proteínas son enormes y van desde la investigación de nuevos fármacos hasta la búsqueda de enzimas biorreparadoras.

Crear nuevas proteínas

 

David Baker creó, a finales de los años 90, un software que podía predecir las estructuras de las proteínas y lo llamó Rosetta. Llevaba tiempo estudiando el plegamiento de las proteínas, es decir, cómo se doblan en el espacio estas moléculas. Tras ver que Rosetta se desempeñaba con bastante éxito, se le ocurrió utilizarlo de manera inversa. En vez de introducir en el ordenador la secuencia de aminoácidos y ver la predicción de estructura terciaria de la proteína, su equipo pensó que podrían introducir la estructura 3D deseada y a partir de ahí obtener secuencias de aminoácidos que permitieran llegar a esa estructura 3D. Esto significaba, ni más ni menos que crear proteínas completamente nuevas. Hasta ese momento el diseño de las proteínas se hacía a partir de las ya existentes. El hecho de hacerlo de la manera que proponían Baker y su equipo ensanchaba de manera brutal el campo para crear nuevas proteínas.

El equipo de Baker logró en 2003 utilizar aminoácidos para diseñar una nueva proteína que no se parecía a ninguna otra existente gracias a Rosetta. Diseñaron una estructura (Top7, en la imagen) completamente nueva y la introdujeron en Rosetta. Rosetta les devolvió una predicción de una secuencia de aminoácidos para esa estructura.

Estructura 3D de proteína

Estructura 3D de Top7, la primera proteína totalmente de novo

¿Y cómo sabían si efectivamente esa secuencia se plegaba así? Para eso están los laboratorios, no todo va a ser ordenadores. Fabricaron el gen para esa secuencia de aminoácidos, lo introdujeron en bacterias y éstas produjeron la proteína. Y, volviendo al método estándar, la cristalografía de rayos X, estudiaron su estructura tridimensional. La estructura coincidía sorprendentemente con la creada por el equipo de científicos. Era, además, la proteína de novo (creada a partir de cero) más grande producida hasta la fecha, con 93 aminoácidos.

Desde entonces su grupo de investigación ha continuado creando multitud de proteínas nuevas, con aplicaciones muy variadas, que van desde su uso como microsensores hasta utilidades terapéuticas.

Estructura 3D de nuevas proteínas

Estructura de nuevas proteínas creadas con Rosetta

El grupo de Baker también hizo público el código de Rosetta, de tal manera que cualquier investigador se pudiera beneficiar de él.

En definitiva, el Nobel de Química de este año tiene que ver con la manera en la que los ordenadores nos permiten conocer y diseñar proteínas de una manera impensable hace unas décadas. Y destaca las aplicaciones de esas investigaciones en campos tan diversos y sugerentes como el desarrollo acelerado de vacunas, el diseño de nuevos fármacos, nanosensores o avances en química verde

Experimentos Históricos, un nuevo canal de divulgación en Youtube
Proyecto Bow: nanopartículas recubiertas de vesículas extracelulares

About the Author: Alberto Morán

Licenciado en farmacia por la Universidad Complutense de Madrid. Realicé mi tesis doctoral en el Departamento de Bioquímica y Biología Molecular de la Facultad de Farmacia. Posteriormente hice un Máster en Dirección de Empresas Biotecnológicas. Trabajé casi un año en una consultoría de biotecnología. Posteriormente fui investigador y docente en la Universidad Complutense de Madrid durante siete años. Mi carrera investigadora se desarrolló en el estudio de los mecanismos moleculares del cáncer (colon y pulmón esencialmente). En noviembre de 2012 abandoné definitivamente el laboratorio. En la actualidad soy titular de una oficina de farmacia.

¡Compartir artículo!

Leave A Comment

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.