O catálogo máis completo das proteínas abre unha nova xanela ás ciencias da vida

Unha colaboración da empresa DeepMind e o Laboratorio Europeo de Bioloxía Molecular consegue predicir a estrutura da meirande parte do proteoma humano

O primeiro catálogo das proteínas recolle as relacionadas coa E. coli, a mosca da froita, o rato, o peixe cebra, o parasito da malaria e as bacterias da tuberculose. Fonte: EMBL.
O primeiro catálogo das proteínas recolle as relacionadas coa E. coli, a mosca da froita, o rato, o peixe cebra, o parasito da malaria e as bacterias da tuberculose. Fonte: EMBL.

Un inxente traballo de procesamento de datos no que colaboraron a empresa DeepMind, de Google, e o Laboratorio Europeo de Bioloxía Molecular (EMBL), o principal laboratorio europeo en ciencias da vida, presentou a pasada semana un avance que vai supoñer nos vindeiros anos unha nova xanela para a investigación do corpo humano: unha base de datos libre e aberta para a comunidade científica na que se recollen os modelos de predicións das estruturas do proteoma humano (o conxunto completo de proteínas codificadas polo xenoma humano) máis completa e precisa ata a data.

Este catálogo incluirá unhas 20.000 proteínas expresadas polo xenoma humano. A base de datos e o sistema de intelixencia artificial brindan aos biólogos estruturais novas e poderosas ferramentas para examinar a estrutura tridimensional das proteínas, e ofrecen un tesouro de datos que podería abrir o camiño a futuros avances e presaxiar unha nova era para a bioloxía baseada na intelixencia artificial.

En decembro de 2020, os organizadores da avaliación comparativa Critical Assessment of Protein Structure Prediction (CASP) recoñeceron AlphaFold como unha solución ao gran desafío de máis de 50 anos de predicir a estrutura de proteínas, o que significou un logro asombroso no campo.

A base de datos de estrutura de proteínas AlphaFold (AlphaFold Protein Structure Database) baséase nesta innovación e nos descubrimentos de xeracións de científicos e científicas, desde os pioneiros e as pioneiras da cristalografía e a análise de estrutura das proteínas, ata os miles de especialistas en predición e biólogos e biólogas estruturais que pasaron anos experimentando con proteínas desde entón e que compartiron os seus resultados de forma aberta.

A base de datos amplía enormemente o coñecemento acumulado sobre as estruturas de proteínas, máis que duplicando o número de estruturas de proteínas humanas con predicións de alta precisión dispoñibles para os investigadores. Avanzar na comprensión destes compoñentes básicos da vida, que sustentan os procesos biolóxicos en todos os seres vivos, permitirá aos investigadores dunha gran variedade de campos acelerar o seu traballo.

Dous artigos publicados nas últimas dúas semanas na revista Nature describen a metodoloxía da última e innovadora versión de AlphaFold, o sofisticado sistema de intelixencia artificial anunciado en decembro pasado que impulsa estas predicións de estrutura, e o seu código fonte aberto, así como a imaxe máis completa das proteínas que compoñen o proteoma humano, coa publicación das proteínas de 20 organismos adicionais que son importantes para a investigación biolóxica.

“O noso obxectivo en DeepMind sempre foi construír intelixencia artificial e utilizala como unha ferramenta para axudar a acelerar o ritmo do descubrimento científico, e mellorar así o coñecemento do mundo que nos rodea”, explica o fundador e director executivo de DeepMind, Demis Hassabis.

“Cremos que esta é a contribución máis significativa que fixo a intelixencia artificial ao avance do coñecemento científico ata a data”, di Demis Hassabis, director de DeepMind

“Utilizamos AlphaFold para xerar a imaxe máis completa e precisa do proteoma humano. Cremos que esta é a contribución máis significativa que fixo a intelixencia artificial ao avance do coñecemento científico ata a data, e é un gran exemplo dos tipos de beneficios que a intelixencia artificial pode achegar á sociedade”, continúa.

A capacidade de predicir computacionalmente a forma dunha proteína a partir da súa secuencia de aminoácidos, en lugar de ter que determinala experimentalmente con técnicas minuciosas, laboriosas, e a miúdo custosas, xa está a axudar aos científicos para lograr en meses o que antes requiría anos de traballo.

“A base de datos AlphaFold é un exemplo perfecto do círculo virtuoso da ciencia aberta”, explica a directora xeral do EMBL, Edith Heard. “ AlphaFold foi adestrado utilizando datos de recursos públicos creados pola comunidade científica, polo que ten sentido que as súas predicións sexan públicas. Compartir as predicións de AlphaFold de forma aberta e gratuíta permitirá aos investigadores de todo o mundo obter novos coñecementos e impulsar novos descubrimentos. Creo que AlphaFold é unha verdadeira revolución para as ciencias da vida, así como foi a xenómica hai varias décadas e estou moi orgullosa de que o EMBL puidese axudar a DeepMind a permitir o acceso aberto a este recurso extraordinario”, engade.

AlphaFold xa está a ser utilizado por socios como a Iniciativa de Medicamentos para Enfermidades Desatendidas (DNDi, polas súas siglas en inglés), que avanzou na súa investigación sobre curas que salvan vidas para enfermidades que afectan de maneira desproporcionada ás zonas máis empobrecidas do mundo, ou o Centro de Innovación Encimática (CEI) que utiliza AlphaFold para axudar a deseñar encimas máis rápidas para reciclar algúns dos plásticos máis contaminantes dun só uso.

AlphaFold axudou a acelerar a investigación daqueles científicos e científicas que traballan na determinación experimental da estrutura das proteínas. Por exemplo, un equipo da Universidade de Colorado en Boulder utiliza as predicións de AlphaFold para estudar a resistencia aos antibióticos, mentres que un grupo da Universidade de California en San Francisco utilizounas para estudar a bioloxía do SARS- CoV-2.

A base de datos de estrutura de proteínas AlphaFold está baseada en moitas contribucións da comunidade científica internacional, así como nas refinadas innovacións algorítmicas de AlphaFold e nas décadas de experiencia do Instituto Europeo de Bioinformática do EMBL (EMBL-EBI) compartindo datos biolóxicos mundiais. DeepMind e o EMBL-EBI están a dar libre acceso ás predicións de AlphaFold para que calquera poida usar o sistema co fin de permitir e acelerar a investigación e explorar novas vías de coñecemento científico.

“Este será un dos conxuntos de datos máis importantes desde o mapa do Xenoma Humano”, recalca o Director Xeneral Adxunto do EMBL e o director do EMBL-EBI, Ewan Birney. “Facer que as predicións de AlphaFold sexan accesibles á comunidade científica internacional abre moitas novas vías de investigación, desde enfermidades desatendidas ata novas encimas para a biotecnoloxía e moito máis. Esta é unha nova e gran ferramenta científica, que complementa as tecnoloxías existentes e permitiranos ampliar os límites da nosa comprensión do mundo “.

Entre as primeiras máis de 350.000 estruturas publicadas na base de datos, ademais do proteoma humano, están as proteínas de 20 organismos biolóxicamente significativos como E. coli, a mosca da froita, o rato, o peixe cebra, o parasito da malaria e as bacterias da tuberculose. Realizáronse moitas investigacións importantes sobre estes organismos, e ter estas estruturas a disposición permitirá a moitos investigadores de campos moi diferentes, desde a neurociencia ata a medicina, acelerar o seu traballo.

A base de datos e o sistema serán actualizados periodicamente a medida que se continúe investindo en melloras futuras de AlphaFold, e nos próximos meses planéase expandir enormemente a cobertura a case todas as proteínas secuenciadas coñecidas pola ciencia: máis de 100 millóns de estruturas que inclúen a maioría de UniProt, a base de datos referencia.


Referencias:

DEIXAR UNHA RESPOSTA

Please enter your comment!
POLÍTICA DE COMENTARIOS:

GCiencia non publicará comentarios ofensivos, que non sexan respectuosos ou que conteñan expresións discriminatorias, difamatorias ou contrarias á lexislación vixente.

GCiencia no publicará comentarios ofensivos, que no sean respetuosos o que contentan expresiones discriminatorias, difamatorias o contrarias a la ley existente.

Please enter your name here

Este sitio emprega Akismet para reducir o spam. Aprende como se procesan os datos dos teus comentarios.