• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Master's Dissertation
DOI
https://doi.org/10.11606/D.3.2021.tde-04112021-120207
Document
Author
Full name
Rodrigo Ajauskas
E-mail
Institute/School/College
Knowledge Area
Date of Defense
Published
São Paulo, 2021
Supervisor
Committee
Strambi, Orlando (President)
Pereira, Rafael Henrique Moraes
Pitombo, Cira Souza
 
Title in Portuguese
Procedimento para geração de populações sintéticas com base em dados disponíveis no Brasil.
Keywords in Portuguese
Planejamento de transportes
População
Transporte urbano
Abstract in Portuguese
A presente pesquisa teve como objetivos principais a disponibilização de um gerador de populações sintéticas adaptado para o Brasil e a produção de uma população sintética de domicílios e indivíduos para a Região Metropolitana de São Paulo. Modelos mais modernos de previsão da demanda por transportes exigem dados de entrada desagregados sobre a população que, apesar de serem coletados por institutos nacionais de geografia e estatística, são disponibilizados apenas de forma agregada por questões de privacidade. Assim, é necessário recriar esta população com suas respectivas características, em um processo conhecido na literatura por geração de populações sintéticas. O processo se baseia principalmente em dados disponibilizados pelo Censo, nas formas de: (i) totais marginais ou de controle para cada atributo de interesse, agregados por zonas (setores censitários); e (ii) amostras da população com informações completas, porém com menor precisão espacial, no nível de região (áreas de ponderação), a serem utilizadas como matrizes semente para a geração de uma população. Considerando as diferentes abordagens teóricas e a disponibilidade de códigos livres, foi selecionado o PopulationSim como gerador de populações sintéticas para adaptação nesta dissertação. O PopulationSim pertence à categoria de métodos de reconstrução sintética e se baseia no conceito de maximização de entropia, apresentando características de flexibilidade que o tornam vantajoso em relação a outros geradores, incluindo a possibilidade de se utilizar totais de controle inconsistentes, controles em múltiplas escalas geográficas e controlar tanto atributos de domicílios como de indivíduos. Na aplicação para a Região Metropolitana de São Paulo (RMSP), foram utilizados dados do Censo 2010 do IBGE e da Pesquisa OD 2017 de São Paulo. Foram selecionados atributos no nível dos domicílios e dos indivíduos para a geração da população. Um conjunto de códigos foi desenvolvido de forma complementar para permitir a leitura das bases de dados nacionais e a preparação dos arquivos utilizados pelo PopulationSim. Foram também desenvolvidos códigos adicionais para o procedimento de validação dos resultados. Os resultados obtidos apresentam indicadores de qualidade de ajuste satisfatórios; a validação dos geradores, porém, padece da ausência de uma base real de dados desagregados da população para comparação. Os arquivos contendo a população sintética de domicílios e indivíduos para a RMSP foram disponibilizados em um repositório onde constam também um tutorial de aplicação e os códigos desenvolvidos especificamente para aplicação no Brasil.
 
Title in English
Synthetic population generation using Brazilian data.
Keywords in English
Activity-based models
Population synthesizers
Synthetic population generation
Abstract in English
This research has two main objectives: (i) to adapt a population synthesizer and make it available to applications in Brazil and (ii) to provide results in the form of a synthetic population of households and individuals for the Metropolitan Area of São Paulo (RMSP). Modern travel demand forecasting models require disaggregate data about the population and its characteristics. While this data is usually collected in national censuses, they are only released as aggregate values, to preserve privacy. Therefore, the population needs to be recreated in a process known as population synthesis, based on data provided by the census in the form of (i) marginal or control totals, for each attribute of interest, and (ii) population samples, with complete information about each household and individual, although at a more aggregate spatial level, to be used as seed matrices in the synthesis process. Considering the theoretical approaches and the availability of open-source codes, the synthesizer PopulationSim was selected to be adapted to Brazil. PopulationSim is a synthetic reconstruction method that is based on the concept of entropy maximization and allows flexibility for the use of conflicting control totals, multiple geographic scales and controls both for household and persons attributes. The application of the synthesizer for generating RMSPs synthetic population used data from the 2010 national Census and from the Origin-Destination survey conducted in the region in 2017. Attributes of interest at the household and individual level were selected for the application. A package of codes was specifically developed for reading the Census and OD survey data files and preparing them in the format required by PopulationSim. Additional codes were developed to extend the validation procedures. The results present satisfactory values for the validation metrics; population synthesizers, though, lack the existence of a ground truth for the assessment of the results. The files containing the synthetic population of households and individuals for the Metropolitan Area of São Paulo are available for download at a data repository, which also includes a tutorial and the codes developed for the application of PopulationSim to any area in Brazil.
 
WARNING - Viewing this document is conditioned on your acceptance of the following terms of use:
This document is only for private use for research and teaching activities. Reproduction for commercial use is forbidden. This rights cover the whole data about this document as well as its contents. Any uses or copies of this document in whole or in part must include the author's name.
Publishing Date
2021-11-05
 
WARNING: Learn what derived works are clicking here.
All rights of the thesis/dissertation are from the authors.
CeTI-SC/STI
© 2001-2024. Digital Library of Theses and Dissertations of USP.