O Machine Learning oferece uma visão em alta definição de como os genomas se organizam em células individuais

Crédito CC0: domínio público

Dentro dos limites microscópicos de uma única célula humana, as intrincadas dobras e arranjos de proteínas e feixes de DNA ditam o destino de uma pessoa: quais genes são expressos, quais são suprimidos e – mais importante – se eles permanecem saudáveis ou desenvolvem doenças.

Apesar do impacto potencial que esses pacotes têm na saúde humana, a ciência sabe pouco sobre como o dobramento do genoma acontece no núcleo da célula e como isso influencia a maneira como os genes são expressos. Mas um novo algoritmo desenvolvido por uma equipe do Departamento de Biologia Computacional da Carnegie Mellon University oferece uma ferramenta poderosa para ilustrar o processo em uma resolução sem precedentes.

O algoritmo, conhecido como Higashi, é baseado no aprendizado de representação de hipergrafo – a forma de Machine Learning que pode recomendar música em um aplicativo e realizar o reconhecimento de objetos 3D.

O aluno de doutorado da Escola de Ciência da Computação Ruochi Zhang liderou o projeto com o doutorado. candidato Tianming Zhou e Jian Ma, o professor de Biologia Computacional Ray e Stephanie Lane. Zhang nomeou Higashi em homenagem a um doce tradicional japonês, continuando uma tradição que ele começou com outros algoritmos que desenvolveu.

“Ele aborda a pesquisa com paixão, mas também com senso de humor às vezes”, disse Ma.

Sua pesquisa foi publicada na Nature Biotechnology e conduzida como parte de um centro de pesquisa multi-institucional que busca um melhor entendimento tanto da estrutura tridimensional dos núcleos celulares quanto de como as mudanças nessa estrutura afetam as funções celulares na saúde e na doença. O centro de US $ 10 milhões foi financiado pelo National Institutes of Health e é dirigido pelo CMU, com Ma como seu investigador principal.

O algoritmo é a primeira ferramenta a usar redes neurais sofisticadas em hipergrafos para fornecer uma análise de alta definição da organização do genoma em células individuais. Onde um gráfico comum une dois vértices em uma única interseção, conhecida como aresta, um hipergrafo une vários vértices à aresta.

Os cromossomos são constituídos por um complexo DNA-RNA-proteína chamado cromatina, que se dobra e se organiza para caber no núcleo da célula. O processo influencia a forma como os genes são expressos, aproximando os elementos funcionais de cada ingrediente, permitindo que eles ativem ou suprimam uma característica genética específica.

O algoritmo Higashi funciona com uma tecnologia emergente conhecida como Hi-C de uma única célula, que cria instantâneos de interações da cromatina que ocorrem simultaneamente em uma única célula. Higashi fornece uma análise mais detalhada da organização da cromatina nas células individuais de tecidos complexos e processos biológicos, bem como como suas interações variam de célula para célula. Esta análise permite que os cientistas vejam variações detalhadas na dobra e organização da cromatina de célula para célula – incluindo aquelas que podem ser sutis, mas importantes na identificação de implicações para a saúde.

“A variabilidade da organização do genoma tem fortes implicações na expressão gênica e no estado celular”, disse Ma.

O algoritmo de Higashi também permite que os cientistas analisem simultaneamente outros sinais genômicos perfilados em conjunto com Hi-C de célula única. Eventualmente, esse recurso permitirá a expansão da capacidade de Higashi, que é oportuna devido ao crescimento esperado de dados de célula única que Ma espera ver nos próximos anos por meio de projetos como o Programa Nucleome NIH 4D ao qual seu centro pertence. Esse fluxo de dados criará oportunidades adicionais para projetar mais algoritmos que promoverão a compreensão científica de como o genoma humano é organizado dentro da célula e sua função na saúde e na doença.

“Esta é uma área que se move rapidamente”, disse Ma. “A tecnologia experimental está avançando rapidamente, assim como o desenvolvimento computacional.”


Publicado em 13/10/2021 09h02

Artigo original:

Estudo original: