Disertación de Maestría
DOI
https://doi.org/10.11606/D.3.2021.tde-04112021-120207
Documento
Autor
Nombre completo
Rodrigo Ajauskas
Dirección Electrónica
Instituto/Escuela/Facultad
Área de Conocimiento
Fecha de Defensa
Publicación
São Paulo, 2021
Director
Tribunal
Strambi, Orlando (Presidente)
Pereira, Rafael Henrique Moraes
Pitombo, Cira Souza
Título en portugués
Procedimento para geração de populações sintéticas com base em dados disponÃveis no Brasil.
Palabras clave en portugués
Planejamento de transportes
População
Transporte urbano
Resumen en portugués
A presente pesquisa teve como objetivos principais a disponibilização de um gerador de populações sintéticas adaptado para o Brasil e a produção de uma população sintética de domicÃlios e indivÃduos para a Região Metropolitana de São Paulo. Modelos mais modernos de previsão da demanda por transportes exigem dados de entrada desagregados sobre a população que, apesar de serem coletados por institutos nacionais de geografia e estatÃstica, são disponibilizados apenas de forma agregada por questões de privacidade. Assim, é necessário recriar esta população com suas respectivas caracterÃsticas, em um processo conhecido na literatura por geração de populações sintéticas. O processo se baseia principalmente em dados disponibilizados pelo Censo, nas formas de: (i) totais marginais ou de controle para cada atributo de interesse, agregados por zonas (setores censitários); e (ii) amostras da população com informações completas, porém com menor precisão espacial, no nÃvel de região (áreas de ponderação), a serem utilizadas como matrizes semente para a geração de uma população. Considerando as diferentes abordagens teóricas e a disponibilidade de códigos livres, foi selecionado o PopulationSim como gerador de populações sintéticas para adaptação nesta dissertação. O PopulationSim pertence à categoria de métodos de reconstrução sintética e se baseia no conceito de maximização de entropia, apresentando caracterÃsticas de flexibilidade que o tornam vantajoso em relação a outros geradores, incluindo a possibilidade de se utilizar totais de controle inconsistentes, controles em múltiplas escalas geográficas e controlar tanto atributos de domicÃlios como de indivÃduos. Na aplicação para a Região Metropolitana de São Paulo (RMSP), foram utilizados dados do Censo 2010 do IBGE e da Pesquisa OD 2017 de São Paulo. Foram selecionados atributos no nÃvel dos domicÃlios e dos indivÃduos para a geração da população. Um conjunto de códigos foi desenvolvido de forma complementar para permitir a leitura das bases de dados nacionais e a preparação dos arquivos utilizados pelo PopulationSim. Foram também desenvolvidos códigos adicionais para o procedimento de validação dos resultados. Os resultados obtidos apresentam indicadores de qualidade de ajuste satisfatórios; a validação dos geradores, porém, padece da ausência de uma base real de dados desagregados da população para comparação. Os arquivos contendo a população sintética de domicÃlios e indivÃduos para a RMSP foram disponibilizados em um repositório onde constam também um tutorial de aplicação e os códigos desenvolvidos especificamente para aplicação no Brasil.
Título en inglés
Synthetic population generation using Brazilian data.
Palabras clave en inglés
Activity-based models
Population synthesizers
Synthetic population generation
Resumen en inglés
This research has two main objectives: (i) to adapt a population synthesizer and make it available to applications in Brazil and (ii) to provide results in the form of a synthetic population of households and individuals for the Metropolitan Area of São Paulo (RMSP). Modern travel demand forecasting models require disaggregate data about the population and its characteristics. While this data is usually collected in national censuses, they are only released as aggregate values, to preserve privacy. Therefore, the population needs to be recreated in a process known as population synthesis, based on data provided by the census in the form of (i) marginal or control totals, for each attribute of interest, and (ii) population samples, with complete information about each household and individual, although at a more aggregate spatial level, to be used as seed matrices in the synthesis process. Considering the theoretical approaches and the availability of open-source codes, the synthesizer PopulationSim was selected to be adapted to Brazil. PopulationSim is a synthetic reconstruction method that is based on the concept of entropy maximization and allows flexibility for the use of conflicting control totals, multiple geographic scales and controls both for household and persons attributes. The application of the synthesizer for generating RMSPs synthetic population used data from the 2010 national Census and from the Origin-Destination survey conducted in the region in 2017. Attributes of interest at the household and individual level were selected for the application. A package of codes was specifically developed for reading the Census and OD survey data files and preparing them in the format required by PopulationSim. Additional codes were developed to extend the validation procedures. The results present satisfactory values for the validation metrics; population synthesizers, though, lack the existence of a ground truth for the assessment of the results. The files containing the synthetic population of households and individuals for the Metropolitan Area of São Paulo are available for download at a data repository, which also includes a tutorial and the codes developed for the application of PopulationSim to any area in Brazil.
ADVERTENCIA - La consulta de este documento queda condicionada a la aceptación de las siguientes condiciones de uso:
Este documento es únicamente para usos privados enmarcados en actividades de investigación y docencia. No se autoriza su reproducción con finalidades de lucro. Esta reserva de derechos afecta tanto los datos del documento como a sus contenidos. En la utilización o cita de partes del documento es obligado indicar el nombre de la persona autora.
Fecha de Publicación
2021-11-05