Ferramentas computacionais alimentam a reconstrução de uma nova e melhorada árvore genealógica de pássaros

A árvore genealógica atualizada das aves, publicada na Nature, delineia 93 milhões de anos de relações evolutivas entre 363 espécies de aves. Crédito: Jon Fjeldså (desenhos) e Josefin Stiller

doi.org/10.1038/s41586-024-07323-1
Credibilidade: 999
#Pássaros 

Uma equipe internacional de cientistas construiu a maior e mais detalhada árvore genealógica de aves até à data – um gráfico intrincado que delineia 93 milhões de anos de relações evolutivas entre 363 espécies de aves, representando 92% de todas as famílias de aves.

O avanço foi possível em grande parte graças aos métodos computacionais de ponta desenvolvidos por engenheiros da Universidade da Califórnia em San Diego, combinados com os recursos de supercomputação de última geração da universidade no San Diego Supercomputer Center.

Estas tecnologias permitiram aos investigadores analisar grandes quantidades de dados genómicos com elevada precisão e velocidade, estabelecendo as bases para a construção da árvore genealógica de aves mais abrangente alguma vez montada.

O avanço é detalhado em dois artigos complementares publicados em 1º de abril na Nature e no Proceedings of the National Academy of Sciences (PNAS).

A árvore genealógica atualizada, publicada na revista Nature, revelou padrões na história evolutiva das aves após o evento cataclísmico de extinção em massa que eliminou os dinossauros há 66 milhões de anos.

Os investigadores observaram aumentos acentuados no tamanho efectivo da população, nas taxas de substituição e no tamanho relativo do cérebro nas primeiras aves, lançando uma nova luz sobre os mecanismos adaptativos que impulsionaram a diversificação aviária no rescaldo deste evento crucial.

No artigo publicado na PNAS, os investigadores examinaram de perto um dos ramos da nova árvore genealógica e descobriram que os flamingos e as pombas estão mais distantemente relacionados do que as análises anteriores do genoma tinham mostrado.

O trabalho faz parte do Projeto Bird 10.000 Genomes (B10K), um esforço multi-institucional liderado pela Universidade de Copenhague, pela Universidade de Zhejiang e pela UC San Diego que visa gerar rascunhos de sequências genômicas para cerca de 10.500 espécies de aves existentes.

“Nosso objetivo é reconstruir toda a história evolutiva de todas as aves”, disse Siavash Mirarab, professor de engenharia elétrica e de computação na Escola de Engenharia Jacobs da UC San Diego, que é co-autor sênior do artigo da Nature, bem como primeiro e co-autor correspondente no artigo PNAS.

Juntando as peças do passado.

No centro destes estudos está um conjunto de algoritmos conhecido como ASTRAL, que o laboratório de Mirarab desenvolveu para inferir relações evolutivas com escalabilidade, precisão e velocidade sem precedentes.

Ao aproveitar o poder desses algoritmos, a equipe integrou dados genômicos de mais de 60.000 regiões genômicas, fornecendo uma base estatística robusta para suas análises.

Os pesquisadores examinaram então a história evolutiva de segmentos individuais do genoma.

A partir daí, eles montaram um mosaico de árvores genéticas, que foram então compiladas em uma árvore de espécies abrangente.

Esta abordagem meticulosa permitiu aos investigadores construir uma nova e melhorada árvore genealógica de aves que delineia eventos ramificados complexos com notável precisão e detalhe, mesmo em casos de incerteza histórica.

“Descobrimos que o nosso método de adicionar dezenas de milhares de genes à nossa análise era realmente necessário para resolver as relações evolutivas entre as espécies de aves”, disse Mirarab.

“Você realmente precisa de todos esses dados genômicos para recuperar o que aconteceu neste determinado período de tempo, 65-67 milhões de anos atrás, com alta confiança.” A capacidade da equipe de conduzir essas análises em enormes conjuntos de dados foi possível porque o laboratório de Mirarab projetou seus métodos computacionais para rodar em poderosas máquinas GPU.

Eles executaram seus cálculos no supercomputador “Expanse” no Supercomputador San Diego da UC San Diego.

No estudo publicado na PNAS, os pesquisadores examinaram de perto um dos ramos da árvore genealógica atualizada das aves e descobriram que grupos incluindo flamingos e pombas são mais distantemente relacionados do que as análises anteriores do genoma haviam mostrado e atribuíram o resultado a uma região incomum do cromossomo. 4. Crédito: Ed Braun (desenhos), Daniel J. Field (imagens de pássaros) e Siavash Miarab

“Tivemos a sorte de ter acesso a um supercomputador de última geração”, disse Mirarab.

“Sem o Expanse, não teríamos sido capazes de executar e reexecutar nossas análises em conjuntos de dados tão grandes em um período de tempo razoável.” Os pesquisadores também analisaram os efeitos de diferentes métodos de amostragem do genoma na precisão da árvore.

Eles mostraram que duas estratégias – sequenciar muitos genes de cada espécie, bem como sequenciar muitas espécies – combinadas são importantes para reconstruir esta história evolutiva.

“Como utilizámos uma mistura de ambas as estratégias, pudemos testar qual abordagem tem impactos mais fortes na reconstrução filogenética”, disse Josefin Stiller, professor de biologia na Universidade de Copenhaga e autor principal do artigo da Nature.

“Descobrimos que era mais importante amostrar muitas sequências genéticas de cada organismo do que amostrar uma gama mais ampla de espécies, embora o último método nos tenha ajudado a datar quando diferentes grupos evoluíram.” Corrigindo o passado.

Com a ajuda dos seus métodos computacionais avançados, os investigadores também conseguiram esclarecer algo invulgar que tinham descoberto num dos seus estudos anteriores: uma seção específica de um cromossoma no genoma da ave permaneceu inalterada durante milhões de anos, anulada.

dos padrões esperados de recombinação genética.

Esta anomalia levou inicialmente os investigadores a agrupar incorretamente os flamingos e as pombas como primos evolutivos, pois pareciam intimamente relacionados com base nesta seção inalterada do DNA.

Isso porque a análise anterior se baseou nos genomas de 48 espécies de aves.

Mas, ao repetir a análise usando os genomas de 363 espécies, surgiu uma árvore genealógica mais precisa que afastou os pombos dos flamingos.

Além disso, usando seis genomas de alta qualidade fornecidos pelo Projeto Genoma de Vertebrados (VGP) – liderado pelo coautor Erich Jarvis, professor de neurobiologia na Universidade Rockefeller – Mirarab e colegas foram capazes de detectar e explicar supostamente este padrão surpreendente.

“O que é surpreendente é que este período de recombinação suprimida pode induzir em erro a análise”, disse Edward Braun, professor de biologia na Universidade da Florida e co-autor do artigo do PNAS.

“E porque poderia enganar a análise, foi na verdade detectável mais de 60 milhões de anos no futuro.

Essa é a parte legal.” Próximos passos.

O impacto deste trabalho vai muito além do estudo da história evolutiva das aves.

Os métodos computacionais pioneiros do laboratório de Mirarab tornaram-se uma das ferramentas padrão para reconstruir árvores evolutivas para uma variedade de outros animais.

Seguindo em frente, a equipe continua seus esforços para construir um quadro completo da evolução das aves.

Os biólogos estão trabalhando no sequenciamento dos genomas de outras espécies de aves na esperança de expandir a árvore genealógica para incluir milhares de gêneros de aves.

Entretanto, os cientistas computacionais liderados por Mirarab estão a refinar os seus algoritmos para acomodar conjuntos de dados ainda maiores, a fim de garantir que as análises em estudos futuros sejam conduzidas com alta velocidade e precisão.


Publicado em 03/04/2024 02h20

Artigo original:

Estudo original: