Pesquisadores quebram assinatura do genoma do COVID-19

MoDMap3D de (a) 3273 seqüências virais do Teste-1 representando 11 famílias virais e reino Riboviria, (b) 2779 sequências virais do Teste-2 classificando 12 famílias virais do reino Riboviria, (c) 208 sequências de Coronaviridae do Teste-3a classificadas em gêneros. Crédito: PLOS ONE (2020). DOI: 10.1371 / journal.pone.0232391

Usando o aprendizado de máquina, uma equipe de cientistas e biólogos ocidentais da computação identificou uma assinatura genômica subjacente para 29 sequências diferentes de DNA do COVID-19.

Essa nova ferramenta de descoberta de dados permitirá que os pesquisadores classifiquem rápida e facilmente um vírus mortal como o COVID-19 em apenas alguns minutos – um processo e ritmo de alta importância para o planejamento estratégico e a mobilização de necessidades médicas durante uma pandemia.

O estudo também apóia a hipótese científica de que o COVID-19 (SARS-CoV-2) tem sua origem em morcegos como o Sarbecovírus, um subgrupo de Betacoronavírus.

Os resultados, Aprendizado de máquina usando assinaturas genômicas intrínsecas para classificação rápida de novos patógenos: estudo de caso COVID-19, foram publicados hoje no PLOS ONE.

O sistema de classificação “ultrarrápido, escalável e altamente preciso” utiliza um novo software especializado e baseado em gráficos e uma abordagem de árvore de decisão para ilustrar a classificação e obter a melhor escolha dentre todos os resultados possíveis. Todo o método utiliza um novo software especializado baseado em gráficos para ilustrar a melhor opção dentre todos os resultados possíveis testados.

A professora de biologia Kathleen Hill co-liderou o estudo com colaboradores ocidentais em Ciência da Computação e Ciências Estatísticas e Atuariais, juntamente com outros membros do Departamento de Ciência da Computação da Universidade de Waterloo.

O método de aprendizado de máquina alcança uma classificação 100% precisa das seqüências COVID-19 e, mais importante, descobre as relações mais relevantes entre mais de 5.000 genomas virais novamente em minutos.

“Tudo o que precisávamos era da sequência de DNA COVID-19 para descobrir seu próprio padrão de sequência intrínseca. Usamos esse padrão de assinatura e uma abordagem lógica para combinar esse padrão o mais próximo possível de outros vírus e alcançamos um bom nível de classificação em minutos – não dias, não horas, mas minutos “, disse Hill.

Essa ferramenta de classificação já foi usada para analisar mais de 5.000 sequências genômicas virais únicas, incluindo as 29 sequências COVID-19 disponíveis em 27 de janeiro.

Hill acredita que a ferramenta, capaz de classificar qualquer sequência de vírus recém-descoberta COVID-19 ou de outra forma, será um componente essencial no kit de ferramentas para desenvolvedores de vacinas e medicamentos, profissionais de saúde de primeira linha, pesquisadores e cientistas durante esta pandemia global e além.


Publicado em 30/04/2020 05h25

Artigo original:

Estudo original:


Achou importante? Compartilhe!


Assine nossa newsletter e fique informado sobre Astrofísica, Biofísica, Geofísica e outras áreas. Preencha seu e-mail no espaço abaixo e clique em “OK”: