Os xenomas son ferramentas inestimábeis á hora de inferir a historia demográfica e adaptativa das poboacións humanas, incluíndo migracións, divisións poboacionais, misturas e adaptacións xenéticas. Logo, a caracterización das secuencias do xenoma humano moderno e antigo ten revelado características descoñecidas do noso pasado evolutivo. E, a medida que a xeración destes datos xenómicos segue acelerándose, mediante a secuenciación de biobancos a escala poboacional e de mostras antigas de todo o mundo, tamén o fai o potencial para xerar unha comprensión cada vez máis detallada de como evolucionaron as poboacións.
Agora, un equipo internacional de científicos aplicou un novo método non paramétrico que, combinando datos de rexisto en árbore de xenomas humanos antigos e modernos, lles permitiu construír a xenealoxía humana máis grande até a data e inferir eventos clave da historia humana, xunto cos seus tempos e localizacións xeográficas. Con esta técnica, o ancestro de dous individuos asígnase xeograficamente ao punto medio entre a localización xeográfica destes seus dous desdendentes e vanse determinando os seus devanceiros no pasado. Un método que utiliza xenomas antigos para calibrar tempos de coalescencia xenómica. Isto permite determinar como os nosos xenomas foron cambiando ao longo do tempo e entre as poboacións, informando sobre a evolución da nosa especie.
Unha variación xenética histórica
Posto que as rexións xenómicas individuais só son herdanza dun dos proxenitores, a ascendencia de cada punto do xenoma pode considerarse como unha árbore. Logo, o conxunto destas, coñecido como ‘secuencia arbórea’ ou ‘gráfico de recombinación ancestral’, enlaza as rexións xenéticas a través do tempo cos devanceiros nos que apareceu por primeira vez a variación.
Para esta secuencia arbórea empregáronse oito bases de datos diferentes que incluíron un total de 3.609 secuencias xenómicas individuais de 215 poboacións. Os xenomas antigos incluían mostras procedentes de todo o mundo, e con idades comprendidas entre 1.000 e máis de 100.000 anos. Os algoritmos predixeron onde debían estar presentes os devanceiros comúns nas árbores evolutivas para explicar os patróns de variación xenética. A rede resultante contiña case 27 millóns de ancestros e 231 millóns de liñaxes ancestrais que unen xenomas destes conxuntos de datos non tempo.
Após engadir os datos de localización destes xenomas de mostra, os autores utilizaron a rede para estimar onde viviran os devanceiros comúns. Os resultados recapitularon con éxito acontecementos fundamentais da historia evolutiva humana, incluída a migración fóra de África, cuxo sinal está claramente presente en todo o xenoma. Nesta liña, os investigadores puideron observar sinais de liñaxes ancestrais moi profundos en África, así como a introgresión ou incorporación arcaica de xenes en Oceanía.
As pistas que esconden as mutacións
O método empregado, que tamén ten en conta os datos que faltan e os erróneos, utiliza xenomas antigos fragmentados para axudar a identificar o momento da aparición dos alelos. Unhas variantes xenéticas que aparecen por mutación nalgún momento e que, de se estableceren a partir dese instante, fan que esa posición xenómica sexa variábel na poboación.
Para facilitar o proceso, os investigadores botaron man de xenomas antigos de baixa calidade para axudar a determinar a súa idade. Así, para cada alelo preguntáronse cando se vía por primeira vez. Se, por exemplo, se observa nun xenoma de hai 5.000 anos, saberán con certeza que esa mutación ten máis desa idade. E, aínda que este estudo está centrado nos seres humanos, esta metodoloxía tamén é válida para a maioría dos seres vivos.
Limitacións do estudo
Non obstante, unha das principais limitacións deste traballo é que fai uso dun método relativamente simple para estimar a localización dos nosos antepasados. Amais, as estimacións xeográficas vense limitadas pola das secuencias xenómicas, e unha relativa escasez de mostras pode dificultar a precisión da reconstrución de certas migracións. Do mesmo xeito, se se tivesen producido grandes migracións históricas que non deixasen descendentes locales, a precisión tamén se vería diminuída.
Finalmente, e malia que o método ten en conta os erros dos conxuntos de datos xenéticos que emprega —como o sesgo das bases de datos cara a poboacións moi estudadas, especialmente a europea— non o fai á perfección. Unha marxe de erro que tamén pode afectar ás estimacións de idade e ubicación dos nosos devanceiros. Secasí, o estudo pode servir de primeiro paso para futuros métodos de inferencia espazo-temporal mellorados que dilucidarán mellor os camiños e os tempos das migracións históricas da nosa especie.
Referencia: A unified genealogy of modern and ancient genomes (Publicado en Science)