Tese de Doutorado
DOI
https://doi.org/10.11606/T.43.2024.tde-15072024-101341
Documento
Autor
Nome completo
Natalí Soler Matubaro de Santi
E-mail
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
São Paulo, 2024
Orientador
Banca examinadora
Abramo, Luis Raul Weber (Presidente)
Bom, Clécio Roque de
Fuente, Raul Esteban Angulo de La
Sheth, Ravi Kiran
Sodre Junior, Laerte
Título em inglês
Machine learning methods for extracting cosmological information
Palavras-chave em inglês
Cosmological parameters inference
Cosmological simulations
Halo-galaxy connection
Machine learning algorithms
Resumo em inglês
The new era of cosmological observations is generating vast amounts of data, increasing the pressure for improvements in both existing and new techniques to analyze this data. Machine Learning (ML) methods are currently at the cutting edge in terms of new techniques and tools, often surpassing traditional methods. In this work, we employ a series of ML techniques to: (1) improve cosmological covariance matrices, (2) investigate the halo-galaxy connection, and (3) perform robust field-level likelihood-free inference with galaxies and halos. Parameter inference is a key aspect in Cosmology, and here we present two different approaches: the use of traditional methods, aimed at obtaining accurate and precise cosmological covariance matrices using image denoising techniques, and a novel approach, which involves deriving parameters directly by converting galaxy/halo catalogs into graphs, without cuts on scale, and then feeding these graphs into graph neural networks to predict the parameters. Simultaneously, the relationship between galaxies and halos is central to describing galaxy formation and is a fundamental step towards extracting precise cosmological information from galaxy maps. We address this problem with a sequence of approaches, ranging from using raw methods and augmenting the data set to stacking methods and converting a regression problem into a classification one, to recover galaxy properties along with their stochasticity. All of these projects aim at improving the extraction of information from simulations by enhancing the accuracy and precision of the derived constraints, thereby impacting cosmological parameters and the halo-galaxy connection. These are the initial steps before applying this new set of innovative methodologies to real data, for both current and next-generation surveys.
Título em português
Métodos de aprendizado de máquina para obtenção de informações cosmológicas
Palavras-chave em português
Algoritmos de aprendizado de máquina
Conexão galáxia-halo
Inferência de parâmetros cosmológicos
Simulações cosmológicas
Resumo em português
A nova geração de observações cosmológicas está gerando uma enorme quantidade de dados e aumentando a pressão pelo desenvolvimento de novas e já existentes técnicas para a análise dos mesmos. Métodos de Aprendizado de Máquina (AM) tem se mostrado como uma excelente e revolucionária alternativa para essa função, muitas vezes superando os métodos tradicionais. Neste trabalho nós utilizamos uma série de técnicas de AM para: (1) melhorar matrizes de covariância cosmológicas, (2) investigar a conexão galáxia-halo, e (3) realizar uma inferência robusta de parâmetros cosmológicos, livre de verossimilhança, usando apenas o campo de galáxias e halos. A inferência de parâmetros é uma atividade central em Cosmologia e aqui nós apresentamos duas diferentes soluções: o uso de métodos tradicionais, para a obtenção de matrizes de covariância cosmológicas precisas e acuradas por meio uma técnica de remoção de ruído de imagens e um método novo, que envolve converter catálogos de galáxias e halos em grafos para alimentar uma rede neural gráfica capaz de diretamente inferir os parâmetros. Ao mesmo tempo, sabendo que a relação entre galáxias e halos é fundamental para descrever a formação de galáxias e para inferir informação cosmológica a partir das galáxias, nós desenvolvemos uma série de metodologias para obter essa conexão. Usamos métodos de AM diretamente nas propriedades de halos e galáxias, fizemos o mesmo para um conjunto de dados aumentado e usamos ambas as predições para obter modelos empilhados. Convertemos o problema de regressão em classificação, sendo capazes de recuperar não apenas as propriedades das galáxias, mas também sua estocasticidade. Todos esses diferentes projetos focam em aperfeiçoar a obtenção de informação cosmológica de simulações, melhorando sua acurácia e precisão, tanto para os parâmetros cosmológicos, quanto para a conexão galáxia-halo. Estes são os passos iniciais da futura aplicação de metodologias inovadoras em dados reais para a próxima e atual geração de observações.
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Data de Publicação
2024-07-24