O ‘Unknome’: um banco de dados no genoma humano sobre o qual não sabemos quase nada

Pesquisadores do Reino Unido desenvolveram um banco de dados acessível ao público, o “unnome”, que lista milhares de proteínas pouco estudadas e codificadas por genes humanos. Ao atribuir uma pontuação de “conhecimento” a cada proteína com base no conhecimento científico existente, a plataforma ajuda os investigadores a explorar as funções destas proteínas, muitas das quais desempenham papéis críticos nos processos celulares.

É necessário acelerar a pesquisa, aprimorando o foco em proteínas desconhecidas.

Pesquisadores do Reino Unido desenvolveram um novo banco de dados acessível ao público e esperam vê-lo diminuir com o tempo. Isto porque é um compêndio de milhares de proteínas pouco estudadas, codificadas por genes do genoma humano, cuja existência é conhecida, mas cujas funções, na sua maioria, não o são.

O banco de dados, apelidado de “desconhecido”, é o trabalho de Matthew Freeman, da Dunn School of Pathology, Universidade de Oxford, Inglaterra, e Sean Munro, do Laboratório MRC de Biologia Molecular em Cambridge, Inglaterra, e colegas, e é descrito no revista de acesso aberto PLOS Biology. As suas próprias investigações de um subconjunto de proteínas na base de dados revelam que a maioria contribui para funções celulares importantes, incluindo o desenvolvimento e a resiliência ao stress.

A sequenciação do genoma humano deixou claro que este codifica milhares de sequências proteicas prováveis, cujas identidades e funções ainda são desconhecidas. Existem múltiplas razões para isto, incluindo a tendência de concentrar os escassos dólares de investigação em alvos já conhecidos, e a falta de ferramentas, incluindo anticorpos, para interrogar as células sobre a função destas proteínas.

Mas os riscos de ignorar estas proteínas são significativos, argumentam os autores, uma vez que é provável que algumas, talvez muitas, desempenhem papéis importantes em processos celulares críticos e possam fornecer informações e alvos para intervenção terapêutica.

Para promover uma exploração mais rápida de tais proteínas, os autores criaram a base de dados desconhecida, que atribui a cada proteína uma pontuação de “conhecimento”, refletindo as informações da literatura científica sobre função, conservação entre espécies, compartimentalização subcelular e outros elementos.

Com base neste sistema, existem muitos milhares de proteínas cujo conhecimento é próximo de zero. Estão incluídas proteínas de organismos modelo, juntamente com aquelas do genoma humano. A base de dados é aberta a todos e personalizável, permitindo ao usuário fornecer seus próprios pesos para diferentes elementos, gerando assim seu próprio conjunto de pontuações de conhecimento para priorizar sua própria pesquisa.

Para testar a utilidade da base de dados, os autores escolheram 260 genes em humanos para os quais havia genes comparáveis em moscas, e que tinham pontuações de conhecimento de 1 ou menos em ambas as espécies, indicando que quase nada se sabia sobre eles. Para muitos deles, um nocaute completo do gene era incompatível com a vida na mosca; knockdowns parciais ou knockdowns específicos de tecidos levaram à descoberta de que uma grande fração contribuiu para funções essenciais que influenciam a fertilidade, o desenvolvimento, o crescimento dos tecidos, o controle de qualidade das proteínas ou a resistência ao estresse.

Os resultados sugerem que, apesar de décadas de estudo detalhado, existem milhares de genes de moscas que continuam sendo compreendidos mesmo ao nível mais básico, e o mesmo é claramente verdade para o genoma humano. “Esses genes não caracterizados não mereceram sua negligência”, disse Munro. “Nosso banco de dados fornece uma plataforma poderosa, versátil e eficiente para identificar e selecionar genes importantes de função desconhecida para análise, acelerando assim o fechamento da lacuna no conhecimento biológico que o desconhecido representa.”

Munro acrescenta: “O papel de milhares de proteínas humanas permanece obscuro e, no entanto, a investigação tende a concentrar-se naquelas que já são bem compreendidas. Para ajudar a resolver isso, criamos um banco de dados Unknome que classifica as proteínas com base no pouco que se sabe sobre elas e, em seguida, realizamos triagens funcionais em uma seleção dessas proteínas misteriosas para demonstrar como a ignorância pode impulsionar a descoberta biológica.”

Publicado em 16/09/2023 17h32

Artigo original:

https://scitechdaily.com/the-unknome-a-database-of-human-genes-we-know-almost-nothing-about/

Estudo original:

https://doi.org/10.1371/journal.pbio.3002222