Uma abordagem de aprendizado de máquina para encontrar opções de tratamento para COVID-19

Credit: CC0 Public Domain

Quando a pandemia de COVID-19 aconteceu no início de 2020, médicos e pesquisadores correram para encontrar tratamentos eficazes. Havia pouco tempo de sobra. “Fazer novos medicamentos leva uma eternidade”, diz Caroline Uhler, bióloga computacional do Departamento de Engenharia Elétrica e Ciência da Computação do MIT e do Instituto de Dados, Sistemas e Sociedade, e membro associado do Broad Institute of MIT e Harvard. “Realmente, a única opção conveniente é reaproveitar os medicamentos existentes”.

A equipe de Uhler desenvolveu agora uma abordagem baseada em aprendizado de máquina para identificar medicamentos já existentes no mercado que poderiam ser reutilizados para combater o COVID-19, especialmente em idosos. O sistema é responsável por mudanças na expressão gênica nas células pulmonares causadas tanto pela doença quanto pelo envelhecimento. Essa combinação poderia permitir que os especialistas médicos procurassem medicamentos mais rapidamente para testes clínicos em pacientes idosos, que tendem a apresentar sintomas mais graves. Os pesquisadores identificaram a proteína RIPK1 como um alvo promissor para os medicamentos COVID-19 e identificaram três medicamentos aprovados que atuam na expressão de RIPK1.

A pesquisa aparece hoje na revista Nature Communications. Os co-autores incluem MIT Ph.D. alunos Anastasiya Belyaeva, Adityanarayanan Radhakrishnan, Chandler Squires e Karren Dai Yang, bem como Ph.D. estudante Louis Cammarata da Universidade de Harvard e colaborador de longa data G.V. Shivashankar da ETH Zurique, na Suíça.

No início da pandemia, ficou claro que o COVID-19 prejudicava mais os pacientes mais velhos do que os mais jovens, em média. A equipe de Uhler se perguntou por quê. “A hipótese predominante é o envelhecimento do sistema imunológico”, diz ela. Mas Uhler e Shivashankar sugeriram um fator adicional: “Uma das principais mudanças no pulmão que ocorre com o envelhecimento é que ele se torna mais rígido”.

O enrijecimento do tecido pulmonar mostra padrões diferentes de expressão gênica do que em pessoas mais jovens, mesmo em resposta ao mesmo sinal. “Trabalhos anteriores do laboratório Shivashankar mostraram que se você estimular células em um substrato mais rígido com uma citocina, semelhante ao que o vírus faz, elas ativam genes diferentes”, disse Uhler. “Então, isso motivou essa hipótese. Precisamos olhar para o envelhecimento junto com o SARS-CoV-2 – quais são os genes na interseção dessas duas vias?” Para selecionar medicamentos aprovados que possam atuar nessas vias, a equipe se voltou para big data e inteligência artificial.

Os pesquisadores se concentraram nas candidatas a reaproveitamento de drogas mais promissoras em três grandes etapas. Primeiro, eles geraram uma grande lista de possíveis drogas usando uma técnica de aprendizado de máquina chamada autoencoder. Em seguida, eles mapearam a rede de genes e proteínas envolvidas no envelhecimento e na infecção por SARS-CoV-2. Finalmente, eles usaram algoritmos estatísticos para entender a causalidade naquela rede, permitindo-lhes localizar genes “upstream” que causaram efeitos em cascata por toda a rede. Em princípio, os medicamentos que visam esses genes e proteínas upstream devem ser candidatos promissores para os ensaios clínicos.

Para gerar uma lista inicial de drogas potenciais, o autoencoder da equipe se baseou em dois conjuntos de dados principais de padrões de expressão gênica. Um conjunto de dados mostrou como a expressão em vários tipos de células respondeu a uma variedade de drogas já existentes no mercado, e o outro mostrou como a expressão respondeu à infecção com SARS-CoV-2. O autoencoder vasculhou os conjuntos de dados para destacar drogas cujos impactos na expressão gênica pareciam neutralizar os efeitos do SARS-CoV-2. “Esta aplicação de codificadores automáticos foi desafiadora e exigiu percepções fundamentais sobre o funcionamento dessas redes neurais, que desenvolvemos em um artigo publicado recentemente no PNAS”, observa Radhakrishnan.

Em seguida, os pesquisadores estreitaram a lista de drogas potenciais, analisando as principais vias genéticas. Eles mapearam as interações de proteínas envolvidas no envelhecimento e nas vias de infecção por SARS-CoV-2. Em seguida, eles identificaram áreas de sobreposição entre os dois mapas. Esse esforço identificou a rede de expressão gênica precisa que uma droga precisaria ter como alvo para combater COVID-19 em pacientes idosos.

“Nesse ponto, tínhamos uma rede não direcionada”, diz Belyaeva, o que significa que os pesquisadores ainda não tinham identificado quais genes e proteínas estavam “a montante” (ou seja, eles têm efeitos em cascata na expressão de outros genes) e quais estavam “a jusante” ( ou seja, sua expressão é alterada por mudanças anteriores na rede). Um candidato a medicamento ideal teria como alvo os genes na extremidade upstream da rede para minimizar os impactos da infecção.

“Queremos identificar uma droga que tenha efeito sobre todos esses genes expressos diferencialmente”, diz Belyaeva. Portanto, a equipe usou algoritmos que inferem causalidade em sistemas de interação para transformar sua rede não direcionada em uma rede causal. A rede causal final identificou RIPK1 como um gene / proteína alvo para drogas COVID-19 potenciais, uma vez que tem vários efeitos a jusante. Os pesquisadores identificaram uma lista de medicamentos aprovados que atuam no RIPK1 e podem ter potencial para tratar COVID-19. Anteriormente, esses medicamentos foram aprovados para uso no câncer. Outros medicamentos também identificados, incluindo ribavirina e quinapril, já estão em ensaios clínicos para COVID-19.

Uhler planeja compartilhar as descobertas da equipe com empresas farmacêuticas. Ela enfatiza que antes que qualquer um dos medicamentos identificados possa ser aprovado para uso reaproveitado em pacientes idosos com COVID-19, testes clínicos são necessários para determinar a eficácia. Embora este estudo específico tenha se concentrado no COVID-19, os pesquisadores afirmam que sua estrutura é extensível. “Estou muito animado que esta plataforma pode ser aplicada de forma mais geral a outras infecções ou doenças”, disse Belyaeva. Radhakrishnan enfatiza a importância de reunir informações sobre como várias doenças afetam a expressão gênica. “Quanto mais dados tivermos neste espaço, melhor isso pode funcionar”, diz ele.


Publicado em 18/02/2021 21h53

Artigo original: