27 milhões de morfologias de galáxias quantificadas e catalogadas com a ajuda de aprendizado de máquina

Uma imagem de NGC 1365 coletada pelo Dark Energy Survey. Também conhecida como a Grande Galáxia Espiral Barrada, NGC 1365 é um exemplo de uma galáxia espiral e está localizada a cerca de 56 milhões de anos-luz de distância. Crédito: DECam, DES Collaboration

A pesquisa do Departamento de Física e Astronomia da Penn produziu o maior catálogo de classificação da morfologia de galáxias até hoje. Liderado pelos ex-pós-doutorandos Jesús Vega-Ferrero e Helena Domínguez Sánchez, que trabalharam com a professora Mariangela Bernardi, este catálogo de 27 milhões de morfologias de galáxias fornece insights importantes sobre a evolução do universo. O estudo foi publicado em Avisos Mensais da Royal Astronomical Society.

Os pesquisadores usaram dados do Dark Energy Survey (DES), um programa de pesquisa internacional cujo objetivo é obter imagens de um oitavo do céu para entender melhor o papel da energia escura na expansão acelerada do universo.

Um subproduto desta pesquisa é que os dados do DES contêm muito mais imagens de galáxias distantes do que outras pesquisas até agora. “As imagens do DES nos mostram como as galáxias eram há mais de 6 bilhões de anos”, diz Bernardi.

E como o DES tem milhões de imagens de alta qualidade de objetos astronômicos, é o conjunto de dados perfeito para estudar a morfologia da galáxia. “A morfologia da galáxia é um dos principais aspectos da evolução da galáxia. A forma e a estrutura das galáxias têm muitas informações sobre a forma como foram formadas, e conhecer suas morfologias nos dá pistas sobre os caminhos prováveis para a formação das galáxias, “Domínguez Sánchez diz.

Anteriormente, os pesquisadores haviam publicado um catálogo morfológico para mais de 600.000 galáxias do Sloan Digital Sky Survey (SDSS). Para fazer isso, eles desenvolveram uma rede neural convolucional, um tipo de algoritmo de aprendizado de máquina, que foi capaz de categorizar automaticamente se uma galáxia pertencia a um dos dois grupos principais: galáxias espirais, que têm um disco giratório onde nascem novas estrelas, e galáxias elípticas, que são maiores e feitas de estrelas mais velhas que se movem mais aleatoriamente do que suas contrapartes espirais.

Mas o catálogo desenvolvido usando o conjunto de dados SDSS foi feito principalmente de galáxias próximas e brilhantes, diz Vega-Ferrero. Em seu último estudo, os pesquisadores queriam refinar seu modelo de rede neural para poder classificar galáxias mais fracas e distantes. “Queríamos ultrapassar os limites da classificação morfológica e tentar ir além, para objetos mais fracos ou mais distantes”, diz Vega-Ferrero.

Imagens de uma espiral simulada (topo) e galáxia elíptica em diferentes níveis de qualidade de imagem e redshift, ilustrando como galáxias mais fracas e distantes podem parecer dentro do conjunto de dados DES. Crédito: Jesus Vega-Ferrero e Helena Dominguez-Sanchez

Para fazer isso, os pesquisadores primeiro tiveram que treinar seu modelo de rede neural para poder classificar as imagens mais pixeladas do conjunto de dados DES. Eles primeiro criaram um modelo de treinamento com classificações morfológicas previamente conhecidas, composto por um conjunto de 20.000 galáxias que se sobrepunham entre DES e SDSS. Em seguida, eles criaram versões simuladas de novas galáxias, imitando a aparência das imagens se estivessem mais distantes usando o código desenvolvido pelo cientista Mike Jarvis.

Uma vez que o modelo foi treinado e validado em galáxias simuladas e reais, ele foi aplicado ao conjunto de dados DES, e o catálogo resultante de 27 milhões de galáxias inclui informações sobre a probabilidade de uma galáxia individual ser elíptica ou espiral. Os pesquisadores também descobriram que sua rede neural era 97% precisa na classificação da morfologia das galáxias, mesmo para galáxias muito fracas para serem classificadas a olho nu.

“Nós forçamos os limites em três ordens de magnitude, para objetos que são 1.000 vezes mais fracos do que os originais”, diz Vega-Ferrero. “É por isso que conseguimos incluir muito mais galáxias no catálogo.”

“Catálogos como este são importantes para estudar a formação de galáxias”, diz Bernardi sobre a importância desta última publicação. “Este catálogo também será útil para ver se a morfologia e as populações estelares contam histórias semelhantes sobre como as galáxias se formaram.”

Para o último ponto, Domínguez Sánchez está atualmente combinando suas estimativas morfológicas com medidas da composição química, idade, taxa de formação de estrelas, massa e distância das mesmas galáxias. A incorporação dessas informações permitirá aos pesquisadores estudar melhor a relação entre a morfologia das galáxias e a formação estelar, trabalho que será crucial para um entendimento mais profundo da evolução das galáxias.

Bernardi diz que há uma série de questões em aberto sobre a evolução da galáxia que tanto este novo catálogo quanto os métodos desenvolvidos para criá-lo podem ajudar a resolver. A próxima pesquisa LSST / Rubin, por exemplo, usará métodos de fotometria semelhantes ao DES, mas terá a capacidade de gerar imagens de objetos ainda mais distantes, proporcionando uma oportunidade de obter um entendimento ainda mais profundo da evolução do universo.


Publicado em 13/04/2021 09h26

Artigo original:

Estudo original: