• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Doctoral Thesis
DOI
https://doi.org/10.11606/T.104.2022.tde-05042023-103310
Document
Author
Full name
Cristel Ecaterin Vera Tapia
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Carlos, 2022
Supervisor
Committee
Gallo, Alexsandro Giacomo Grimbert (President)
Cerqueira, Andressa
Galves, Jefferson Antonio
Garcia, Nancy Lopes
Oliveira, Aline Duarte de
Title in Portuguese
Estimação do número de comunidades no modelo estocástico de blocos com correção de grau
Keywords in Portuguese
Estimação do número de comunidades
Modelo estocástico de blocos com correção de grau
Modelo estocástico de blocos de Poisson
regime semi-esparso.
Abstract in Portuguese
O modelo estocástico de blocos (SBM, do inglês Stochastic Block Model) é um modelo de grafos aleatórios em que o conjunto de vértices é dividido em blocos, e a probabilidade de conexão entre cada par de vértices depende dos blocos aos quais os vértices pertencem. O SBM foi introduzido por Holland et al. (1983), é tipicamente aplicado em grafos simples, com cada entrada da matriz de adjacência seguindo uma distribuicao de Bernoulli. Karrer e Newman (2011) estenderam o modelo em duas direções: definiram o modelo multigrafo ou também conhecido como modelo estocástico de blocos de Poisson (Poisson SBM), em que as entradas da matriz de adjacência seguem a distribuição de Poisson, e introduziram o modelo estocástico de blocos com correção de grau (DCSBM, do inglês Degree Corrected Stochastic Block Model), que permite que a distribuição dos graus dos vértices dependa também dos vértices, e não somente dos blocos aos quais pertencem. A presente tese e dedicada ao problema de estimacao do número de comunidades no Poisson SBM e no DCSBM. Consideramos o regime denso, no qual a probabilidade de conexão entre pares de vértices não depende do tamanho do grafo e também o regime semi-esparso, no qual a probabilidade de conexão entre pares de vértices pode decair para 0 (numa certa taxa) com o tamanho do grafo. Neste contexto geral, provamos que o estimador do número de comunidades introduzido por Cerqueira e Leonardi (2020) (com as devidas alterações) é fortemente consistente.
Title in English
Estimation of the number of communities in the degree corrected stochastic block model
Keywords in English
: Poisson stochastic block model
Degree corrected stochastic block model
Estimation of the number of communities
semi-sparse regime
Abstract in English
The stochastic block model (SBM) is a random graph model that splits the set of vertices into blocks, and the probability connection between each pair of vertices depends on the blocks to which the vertices belong. The SBM was introduced by Holland et al. (1983) and it is traditionally applied to simple graphs, with each entry in the adjacency matrix following the Bernoulli distribution. Karrer and Newman (2011) extended the model in two directions: they defined the multigraph model or also known as Poisson stochastic block model (Poisson SBM), in which the entries of the adjacency matrix follow the Poisson distribution, and introduced the degree corrected stochastic block model (DCSBM) that allows the degree distribution of vertices also depend on the vertices, and not just on the blocks they belong to. This thesis is devoted to the problem of estimating the number of communities in the Poisson SBM and DCSBM. We consider the dense regime, in which the probability of connection between pairs of vertices does not depend on the size of the graph and also the semi-sparse regime, in which the probability of connection between pairs of vertices can decay to 0 (at a certain rate) with the size of the graph. In this general context, we prove that the estimator of the number of communities introduced by Cerqueira and Leonardi (2020) (with the necessary changes) is strongly consistent.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2023-05-11
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors
CeTI-SC/STI
Digital Library of Theses and Dissertations of USP. Copyright © 2001-2024. All rights reserved.