Dissertação de Mestrado
Documento
Dissertação de Mestrado
Autor
Hattori, Emily
(
)
Nome completo
Emily Hattori
E-mail
Unidade da USP
Instituto de Matemática e Estatística
Programa ou Especialidade
Data de Defesa
2025-07-29
Imprenta
São Paulo, 2025
Orientador
Banca examinadora
Queiroz, Francisco Felipe de (Presidente)
Guerra, Renata Rojas
Medeiros, Rodrigo Matheus Rocha de
Título em português
Modelos de regressão power logit inflacionados em zero e um
Palavras-chave em português
Dados de frações, Distribuições power logit, Modelos de regressão power logit inflacionados, Proporções contínuas
Resumo em português
Dados limitados no intervalo unitário contêm informações que podem levar a conclusões práticas em diversos contextos, como na educação, saúde e economia. Alguns exemplos são a taxa de desmatamento e a taxa de conclusão de um curso. Dados assim podem ser assimétricos, possuir a dispersão dependendo da média e possuir valores nas fronteira. Modelos de regressão beta são amplamente utilizados em aplicações dessa natureza. Apesar da regressão beta permitir interpretação direta dos parâmetros, assimetria e heterocedasticidade e ter um grau de flexibilidade, a inferência, baseada em métodos de máxima verossimilhança ou bayesianos, pode ser influenciada por observações atípicas. Nesta dissertação, estudamos os modelos power logit, uma classe altamente flexível com modelos de regressão com parâmetros interpretáveis, adequados para modelagem de dados limitados com diferentes características, e os modelos power logit inflacionados em zero ou um, nos quais a variável resposta pode assumir um dos valores das fronteiras. Muitas vezes, dados de proporção apresentam valores em ambos os extremos do intervalo, como, por exemplo, proporção de leitos do SUS em municípios de São Paulo; têm municípios que não tem nenhum leito do SUS e, em alguns municípios, todos os leitos são do SUS. Nestes casos, os modelos power logit e power logit inflacionados em zero ou um não são adequados. Dessa forma, neste trabalho, contribuímos propondo as distribuições power logit inflacionadas em zero e um e seus respectivos modelos de regressão. Neste trabalho, contribuímos propondo os modelos de regressão power logit inflacionados em zero e um. A inferência sobre os parâmetros do modelo é desenvolvida via máxima verossimilhança. Resultados numéricos sugerem que os estimadores dos parâmetros do modelo têm boas propriedades em amostras de tamanho finito. Adicionalmente, métodos de diagnóstico são propostos e os modelos são aplicados em conjuntos de dados reais.
Título em inglês
Zero-and-one inflated power logit regression models
Palavras-chave em inglês
Continuous proportions, Fractional data, Inflated power logit models, Power logit distributions
Resumo em inglês
Data bounded within the unit interval contain information that can lead to practical conclusions in various contexts, such as education, health, and economics. Examples include course completion rates, disease incidence rates, and default probabilities. Data of this nature may exhibit skewness and dispersion depending on the mean. Beta regression models are widely used in practice to describe the behavior of bounded data, as they allow for direct interpretation of parameters and can model both skewness and heteroscedasticity. Often, proportion data include values at the boundaries of the interval. In such cases, inflated beta regression models can be used. However, inference in these modelsbased on maximum likelihood or Bayesian methods, can be sensitive to outliers. An alternative is the class of zero or one inflated power logit models, which include more parameters and therefore offer greater flexibility to accommodate different data patterns, while still providing interpretable regression parameters. Nevertheless, these models are not suitable for data with observations at both boundaries. For example, the proportion SUS (Brazils public healthcare system) beds across cities in São Paulo includes cases where some cities have no SUS beds at all, while in others all beds belong to SUS. Therefore, in this work, we contribute by proposing the zero-and-one inflated power logit distributions and their respective regression models. Inference for the model parameters is developed via maximum likelihood. Numerical results suggest that the estimators exhibit good properties in finite samples. Additionally, diagnostic methods are proposed, and the models are applied to a real dataset.
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso: Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Data de Publicação
2025-10-01
Trabalhos decorrentes
AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.