Um projeto de genoma mais inclusivo visa capturar toda a diversidade humana

Imagem via Unsplash

Os pesquisadores estão construindo um “pangenoma” humano que representaria a totalidade da variação genética humana. Mas nem todos estão prontos para assinar.

Vários anos atrás, após uma busca exaustiva por variações desconhecidas no genoma humano, Evan Eichler tropeçou em algo extraordinário. Eichler, geneticista da Universidade de Washington em Seattle, e seus colegas encontraram um enorme trecho de DNA, com cerca de 400.000 letras, que continha cópias extras de genes – provavelmente transmitidos de um antigo grupo de hominídeos conhecido como Denisovans. Apareceu em cerca de 80% das pessoas que vivem em Papua Nova Guiné, mas praticamente em nenhum outro lugar.

“Ficamos chocados com o tamanho”, diz Eichler. “Sempre soubemos que haveria segmentos arcaicos em nosso genoma.” Mas a extensão do segmento e sua ausência em grande parte do mundo, diz ele, “transformaram nosso pensamento”.

Essa e outras descobertas inesperadas deixaram Eichler e outros geneticistas cada vez mais insatisfeitos com a amplitude e a profundidade dos mapas disponíveis do genoma humano. O primeiro esboço do genoma do Projeto Genoma Humano de US$ 2,7 bilhões, lançado em 2001, deveria se tornar um ponto de referência para futuras pesquisas genéticas. Mas 93% de sua sequência veio de apenas 11 indivíduos, muitos dos quais foram recrutados por meio de um anúncio de jornal em Buffalo, Nova York; 70% do DNA vem de apenas um homem.

Em 2003, esse genoma de referência, conhecido como GRCh38, seria considerado tecnicamente completo, mas ainda tinha centenas de lacunas e seções contendo muitos erros. Essas deficiências vieram com consequências. Eichler trabalhou com geneticistas clínicos no centro médico de sua universidade e descobriu que o genoma de referência não possui uma região que tenha variantes associadas à síndrome de Baratela-Scott, que pode causar atrasos cognitivos e malformações esqueléticas em crianças. Como essa parte estava faltando, não havia uma maneira rápida de os médicos verificarem se há erros de DNA lá.

Os mapas do genoma melhoraram, mas ainda não capturam adequadamente a vasta diversidade da humanidade. Por exemplo, em 2018, um grupo de pesquisadores sequenciou 910 indivíduos de ascendência africana e descobriu uma sequência composta por 300 milhões de letras ou bases de DNA que não eram familiares. Isso é aproximadamente 10% de todo o genoma.

Para criar uma referência mais completa e representativa, Eichler uniu forças com vários cientistas de destaque, principalmente nos Estados Unidos. Seu objetivo é capturar quase toda a variabilidade genética humana – o número vertiginoso de remixes genéticos na espécie humana, incluindo adições, exclusões e outros tipos de mutação.

Em vez de representar o genoma como uma leitura linear de um único indivíduo, ele conteria vários caminhos que se ramificavam como o emaranhado de linhas de trem no mapa do metrô de Londres. Isso representaria as variedades de sequência que podem ser encontradas em diferentes populações, como o longo trecho de DNA encontrado em muitas pessoas da Papua Nova Guiné.

Em 2019, Eichler e seus colegas iniciaram o Projeto Pangenoma Humano, um esforço de US$ 30 milhões financiado pelo Instituto Nacional de Pesquisa do Genoma Humano dos EUA (NHGRI) em Bethesda, Maryland. O objetivo inicial é fazer o sequenciamento detalhado do genoma com qualidade de referência de cerca de 350 pessoas de diferentes origens e compartilhar esses dados da maneira mais livre possível.

O esforço representará um desafio técnico significativo, mas os cientistas por trás dele, incluindo Karen Miga, da Universidade da Califórnia, em Santa Cruz, e Ting Wang, da Escola de Medicina da Universidade de Washington, em St. Louis, argumentam que vale a pena. Eles vêem isso como crucial para tornar a medicina genômica mais equitativa. “Considerar a diversidade é servir melhor à humanidade”, diz Wang. “Trata-se de equidade e igualdade. Trata-se de construir um recurso genômico mais inclusivo para a humanidade.”

Os pesquisadores do esforço pangenoma estão cientes da história de missões passadas para capturar a diversidade genética humana, algumas das quais eram vistas como projetos “vampiros” que coletavam dados de populações marginalizadas e não respeitavam suas necessidades e desejos. Em resposta a isso, o esforço pangenoma envolve bioeticistas ao longo do projeto, não apenas em momentos periódicos, como foi feito por iniciativas no passado. “Eles não são uma entidade separada trabalhando em silos, estão envolvidos em todas as etapas do projeto, incluindo todas as decisões técnicas”, diz Wang.

No entanto, alguns geneticistas focados nas necessidades das comunidades indígenas desconfiam da iniciativa. Eles não estão pedindo o fim do Projeto Pangenoma Humano em si, mas dizem que grupos marginalizados merecem o controle de seus dados genéticos e dos sequenciadores também. “À medida que nos posicionamos para controlar essas tecnologias, estamos capacitando nossas comunidades”, explica Keolu Fox, geneticista da Universidade da Califórnia, em San Diego, nativo do Havaí. “Nada é tão real quanto nós. Somos das nossas comunidades.”

Panorâmica

O conceito de pangenoma remonta ao estudo de uma bactéria conhecida como Streptococcus agalactiae, ou estreptococo do grupo B, que pode causar infecções mortais em recém-nascidos. Cientistas analisando seis cepas da bactéria publicaram um artigo em 2005 tentando capturar todas as nuances genéticas do micróbio. O que eles produziram foi um genoma central compartilhado por todas as seis cepas e um genoma “dispensável” de genes parcialmente compartilhados e específicos de cepas.

Foi uma tarefa complicada, porque as bactérias trocam e compartilham pedaços de DNA, mesmo com outras espécies, principalmente por meio de um processo conhecido como transferência horizontal de genes. “Muitas coisas podem acontecer em bactérias”, diz Candice Hirsch, geneticista de plantas da Universidade de Minnesota em Saint Paul. Como resultado, os biólogos estão continuamente atualizando os genomas bacterianos de referência. Os humanos, por outro lado, não adicionam novas variações tão facilmente. Isso torna a caracterização de um pangenoma humano mais viável, diz Hirsch.

Mas o que falta em dinâmica, o genoma humano compensa em comprimento e repetição. O cromossomo 1, por exemplo, o maior dos 24 cromossomos humanos diferentes, se estende por cerca de 250 milhões de pares de bases. Isso é mais de 100 vezes o comprimento de S. agalactiae. E está repleto de longos trechos de sequências simples e repetidas e duplicações de outros segmentos mais complexos. Até a década passada, a principal opção dos cientistas para sequenciar o DNA envolvia quebrá-lo em fragmentos e lê-lo em pequenos pedaços. Isso permite que eles detectem alterações de uma única letra no DNA com relativa facilidade. Mas as leituras curtas tornam difícil reconhecer quando um longo trecho de DNA contém mais de uma cópia de um gene. Eichler, que se especializou na identificação de variantes estruturais, como duplicações e deleções de genes, optou por uma abordagem mais nova, chamada “sequenciamento de leitura longa”, que analisa trechos maiores de DNA de cada vez. Foi isso que lhe permitiu encontrar a variante anteriormente despercebida em pessoas de Papua Nova Guiné.

Em 2018, Eichler e outros cientistas se reuniram no NHGRI para discutir um esforço de pangenoma humano. Lá, Eichler se reconectou com um colega cientista que compartilhava sua paixão pela tecnologia de leitura longa, Erich Jarvis, neurocientista e biólogo molecular da Universidade Rockefeller, em Nova York.

“Ficamos levantando as mãos e dizendo: ‘Você não será capaz de fazer isso a menos que tenha genomas de referência de alta qualidade'”, lembra Jarvis. Mas o sequenciamento de leitura longa exigiria mais dinheiro, e nem todos estavam dispostos a implantá-lo. Jarvis se lembra de se sentir frustrado com alguns dos debates. “Eu até lasquei um pouco do meu dente da frente em um garfo em um restaurante. Eu estava mordendo com tanta força”, diz ele. Em última análise, ele e outros que pressionavam pela abordagem de leitura longa venceram.

Miga, que traz para o projeto a reputação de completar seções de DNA de difícil leitura, já estava usando a tecnologia de leitura longa. Ela, junto com Jarvis, Eichler e outros, publicou o primeiro genoma humano completamente sequenciado, capturando todos os 3 bilhões de letras, incluindo as seções confusas e altamente repetitivas que cobrem as extremidades dos cromossomos – conhecidas como telômeros. Essa primeira sequência genômica de telômero a telômero corrigiu vários erros de referências anteriores e descobriu cerca de 100 genes despercebidos que provavelmente codificam proteínas.

Não foi uma façanha simples, no entanto. Normalmente, as células humanas contêm dois conjuntos de 23 cromossomos – um de um óvulo e outro de um espermatozóide. Mas sequências duplicadas e outras variações estruturais do DNA se misturam quando as máquinas tentam ler os dois conjuntos ao mesmo tempo. Para contornar isso, os cientistas analisaram o DNA de uma linhagem celular derivada do que é conhecido como gravidez molar, na qual um espermatozóide fertiliza um óvulo sem núcleo. O DNA continha apenas um conjunto de cromossomos.

Os 350 genomas para o Projeto Pangenoma Humano, por outro lado, virão de linhagens de células diplóides, ou seja, células que contêm cópias de ambos os pais, de modo que os cientistas terão que usar ferramentas computacionais complexas para separar os genomas e garantir que eles capturem o variação estrutural com precisão.

O esforço do pangenoma já completou cerca de 70 genomas detalhados. O objetivo é terminar as versões de telômero a telômero de todos os 350 até o final da concessão, em meados de 2024.

E os cientistas já estão trabalhando em maneiras de visualizar a diversidade e mostrar as variações. Até agora, inclusive para o genoma de referência GRCh38, a convenção era ter uma representação linear simples e um banco de dados complementar com variações listadas para diferentes posições na sequência, como alterações de uma única letra. “A comunidade usa essa ficção conveniente de sequência de referência linear há 20 anos”, diz Benedict Paten, biólogo computacional da Universidade da Califórnia, Santa Cruz. Paten, cujo escritório fica ao lado do de Miga, está colaborando com um grupo para melhorar a sofisticação da visualização do pangenoma. Nesta nova visualização, as linhas coloridas representam variantes distintas. Variações mais frequentes são indicadas com linhas mais grossas. “Tornar a variação humana intuitiva e fácil de entender faz parte de nossa missão na integração do pangenoma”, diz Paten (consulte ‘Visualizando um pangenoma’).


Erros e partidas

Muitas das 350 pessoas cujos genomas serão analisados no Projeto Pangenoma Humano participaram do Projeto 1000 Genomas, um esforço lançado em 2008 para catalogar variantes comuns e raras de 26 populações diversas. As amostras de DNA que foram coletadas como parte desse esforço serão recuperadas do armazenamento a frio e reaproveitadas para as leituras mais detalhadas do projeto de sequenciamento do pangenoma. Os formulários de consentimento que esses indivíduos assinaram anos atrás também cobrem o uso de seus dados de DNA para o novo projeto. Mas o Projeto Pangenoma Humano está tomando outras medidas para garantir a coleta e o uso éticos de dados genéticos. Em contraste com outros grandes esforços de sequenciamento genético, nos quais os cientistas tomaram decisões e só depois as examinaram por um Conselho de Revisão Institucional, por exemplo, o Projeto Pangenoma Humano tem especialistas em ética social que estão “incorporados” no processo de tomada de decisão e verificam continuamente o projeto, diz Eichler.

Como Wang coloca: “É realmente sobre como orientar os cientistas nerds que podem não pensar em questões sociais a fazer sua ciência da maneira mais apropriada”.

De muitas maneiras, os líderes do projeto pangenoma estão tentando superar o legado eticamente espinhoso de empreendimentos passados. O Projeto de Diversidade do Genoma Humano, por exemplo, lançado em 1991 como um esforço para coletar informações de DNA de pessoas ao redor do mundo, gerou forte oposição de várias comunidades. Grupos indígenas, entre outros, sentiam-se tratados como fósseis vivos, caminhando para a extinção.

“Os cientistas estavam coletando dados genômicos de povos indígenas em grande parte para o benefício de outros povos não indígenas, o que, quando feito sem considerar a soberania de dados indígenas, é um meio de extração contínua de dados”, diz Krystal Tsosie, geneticista e bioeticista da Vanderbilt University em Nashville, Tennessee, e membro da Nação Navajo.

A década seguinte trouxe ainda mais preocupação com transgressões éticas em estudos genéticos de grupos sub-representados, principalmente quando a tribo Havasupai entrou com uma ação judicial contra o Conselho de Regentes do Arizona e pesquisadores da Universidade Estadual do Arizona em 2004. Membros da tribo doaram seu DNA para estudos genéticos sobre diabetes tipo 2, mas descobriram que havia sido usado sem o seu consentimento para estudos sobre esquizofrenia e migração.

Os pesquisadores também usaram palavras estigmatizantes como “inbreeding” para explicar fenômenos genéticos que na verdade eram consequência de gargalos populacionais relacionados a eventos genocidas, diz Tsosie. Ela acrescenta que, no passado, os geneticistas que faziam projetos de sequenciamento costumavam usar linguagem racial e não reconheceram adequadamente o legado duradouro do colonialismo na ciência e a ameaça que isso representa para os povos indígenas.

Por vários anos, Fox e outros vêm pedindo um afastamento maciço dessa abordagem. Eles dizem que os grupos indígenas deveriam ter maior agência quando se trata de coleta de seus dados genéticos. Fox, que foi aluno de pós-graduação no laboratório de Eichler, diz que não está convencido de que o projeto pangenoma e outros como ele estejam envolvendo os diversos grupos que procuram amostrar de uma maneira que realmente os empodere. “Eu amo Evan, cara. Quando tenho problemas, ligo para ele pedindo conselhos”, diz ele. “Apesar disso, você sabe, não concordamos em tudo.”

Membros do Native BioData Consortium incluindo Joseph Yracheta (extrema direita) usando uma máquina de sequenciamento de genoma.Crédito: Joseph Yracheta

Fox defende uma abordagem que coloca o poder de sequenciamento nas mãos do povo. Ele e Tsosie estão envolvidos no Native BioData Consortium, um instituto de pesquisa sem fins lucrativos liderado por cientistas indígenas e membros tribais nos Estados Unidos que vem trabalhando para ajudar grupos indígenas a adquirir e executar sequenciadores de DNA em seu próprio território. O primeiro sequenciador foi entregue na reserva Cheyenne River Sioux em dezembro de 2020, diz o cofundador do consórcio Joseph Yracheta, geneticista de saúde pública da Johns Hopkins Bloomberg School of Public Health em Baltimore. Em fevereiro, Yracheta se juntou a um grupo de trabalho do Projeto Pangenoma Humano focado nas implicações éticas, legais e sociais do projeto.

Fox está atualmente focado na complexidade genética encontrada nas ilhas do Pacífico. Ele e seus colegas de equipe estão adotando uma abordagem holística para sequenciar os genomas de espécies agrícolas e outros organismos no ambiente em conjunto e estão construindo um instituto de genômica para servir à comunidade. A Fox observa que as tecnologias mais recentes, como um sistema de computador de “livro distribuído” que vincula com segurança uma pessoa a seus dados genéticos, podem dar às pessoas maior autonomia sobre quem elas permitem acessar e usar suas informações. “Existem tantos avanços na ciência de dados no momento que realmente permitem um novo nível de agência para os participantes”, diz Fox.

Eichler apoia o caminho de Fox. “Eu aplaudo seus esforços para envolver cientistas indígenas na pesquisa genômica – precisamos mais disso”, diz Eichler. “Não é um cenário ou-ou, no entanto, na minha opinião.” Ele acrescenta que o Projeto Pangenoma Humano está incentivando os cientistas indígenas a gerar seus próprios genomas de referência. Nesses cenários, “trabalharemos juntos para que isso aconteça, fornecendo conhecimentos e ferramentas conforme necessário”.

Nenhuma mutação sem representação

Tsosie diz que grupos indígenas podem colaborar com grandes projetos de diversidade no futuro, mas que isso teria que acontecer de uma forma que garantisse que essas comunidades pudessem fazer seu próprio sequenciamento. Além disso, embora esses grandes projetos de genoma sejam muitas vezes esforços de dados abertos, Tsosie diz que seria sensato que houvesse proteções adicionadas às sequências de DNA depositadas dos povos indígenas, de modo que estejam disponíveis apenas por meio de solicitações de acesso para evitar a exploração. “Se vai acontecer, precisa acontecer da melhor maneira que represente os povos indígenas”, diz ela.

Não são apenas os defensores das comunidades indígenas nos Estados Unidos que manifestaram preocupações sobre representação e propriedade de dados. Outros argumentaram que o projeto pangenoma não envolveu adequadamente pesquisadores de regiões fora dos Estados Unidos, de acordo com Jarvis, que está no comitê de amostragem do projeto. Ele reconhece que alguns veem a iniciativa como um esforço em grande parte dos EUA, mas diz que ele e seus colaboradores estão trabalhando para ampliá-la e envolver cientistas e participantes de diferentes partes do mundo. Por exemplo, eles entraram em contato com líderes do programa Human Heredity and Health in Africa (H3Africa) para envolver cientistas na África que podem fazer sequenciamento em países de lá. (Nenhum esforço de sequenciamento parece imune a desafios éticos, no entanto – até mesmo o programa H3Africa teve que abranger regras e normas de diferentes países que regem o uso de dados de participantes, por exemplo.)

Jarvis diz que quer que o Projeto Pangenoma Humano alcance uma melhor representação da diversidade genética humana. “Sou uma pessoa de cor. Eu cresci como um afro-americano. Cresci como uma minoria sub-representada nas ciências”, diz ele. “Minha diversidade não é representada. Então, tenho uma motivação pessoal e social para garantir que esse pangenoma realmente represente as populações.”

À medida que avançam, os cientistas também reconhecem que 350 genomas não representarão toda a diversidade humana. Em última análise, o verdadeiro número de genomas necessários para fazer isso é difícil de definir, e a genética muitas vezes nos ensina que diferenças raras podem ser importantes. “Acho que não existe nenhum número mágico”, diz Adam Phillippy, chefe da Seção de Informática do Genoma do NHGRI e investigador do projeto pangenoma.

Fazer malabarismo com o enorme empreendimento científico enquanto tenta evitar armadilhas éticas é algo que pesa muito sobre os pesquisadores do pangenoma. “Tenho certeza de que faremos coisas que as pessoas vão criticar daqui a cinco ou dez anos. Tenho quase 100% de certeza disso”, diz Eichler. “Mas se pudermos entrar com a consciência limpa e dizer que tentamos fazer tudo o que podíamos para fazer certo, sinto que isso é algo”.


Publicado em 19/03/2022 10h01

Artigo original:

Estudo original: