• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Tesis Doctoral
DOI
https://doi.org/10.11606/T.55.2023.tde-10042023-104306
Documento
Autor
Nombre completo
Viviana Elizabeth Romero Noguera
Dirección Electrónica
Instituto/Escuela/Facultad
Área de Conocimiento
Fecha de Defensa
Publicación
São Carlos, 2023
Director
Tribunal
Aguiar, Cristina Dutra de (Presidente)
Braga, Rosana Teresinha Vaccare
Maciel, Cristiano
Pigatto, Daniel Fernando
Título en portugués
Análise de dados do ENEM baseada em data warehousing, mineração de dados, estatística inferencial e processamento paralelo e distribuído
Palabras clave en portugués
: ENEM
análise de dados
data warehousing
mineração de dados
processamento paralelo e distribuído.
Resumen en portugués
Em 1998, o Ministério da Educação criou o ENEM, um exame nacional brasileiro padronizado que visa avaliar as competências e habilidades básicas dos alunos. O ENEM é uma avaliação que tem forte influência nas políticas educacionais, nos currículos dos diferentes níveis de ensino e também no futuro dos avaliados. Considerando o escopo da educação, setor fundamental para o crescimento e desenvolvimento de um país, a análise dos dados do ENEM pode revelar informações relevantes para subsidiar a tomada de decisão das instituições de ensino, a definição de investimentos governamentais e planos estratégicos e a formulação de políticas públicas de educação com base no desempenho cognitivo dos alunos. A análise dos dados do ENEM é uma questão desafiadora devido ao grande número de variáveis coletadas e ao grande volume de dados disponibilizados. Essas variáveis referem-se aos dados pessoais e às notas obtidas por cada participante, às respostas das questões de múltipla escolha e às respostas dos questionários. Com o objetivo de auxiliar os gestores educacionais no processo de tomada de decisão educacional, nesta tese é proposta uma arquitetura baseada em data warehousing, mineração de dados, estatística inferencial e processamento paralelo e distribuído voltada à análise de dados do ENEM. A arquitetura é composta por cinco camadas: (i) conexão de dados, relacionada com a extração e tratamento dos dados do ENEM; (ii) gerenciamento de dados, voltada ao armazenamento dos dados e metadados relacionados em repositórios especializados, de acordo com as necessidades das análises educacionais; (iii) análise de dados, que tem como objetivo extrair informações úteis e auxiliar na tomada de decisão estratégica; (iv) apresentação de dados, composta por ferramentas de visualização que permitem que cientistas de dados e gestores educacionais visualizem graficamente os resultados de suas análises; e (v) gerenciador de fluxo de trabalho, voltada à automação das tarefas complexas que são executadas na manipulação do grande volume de dados do ENEM. Adicionalmente, são apresentados dois pipelines, os quais exemplificam a instanciação da arquitetura proposta com tecnologias e ferramentas de código aberto relacionadas. A arquitetura foi validada por meio de quatro cenários de uso, cada qual com um objetivo de análise específico. Para cada cenário de uso, foi feita uma discussão relacionada aos impactos das análises dentro do contexto educacional. Os resultados demonstraram a aplicabilidade da arquitetura no suporte ao processo da tomada de decisão educacional.
Título en inglés
R. ENEM data analysis based on data warehousing, data mining, inferential statistics and parallel and distributed processing.
Palabras clave en inglés
data analysis
data mining
data warehousing
ENEM
parallel and distributed processing.
Resumen en inglés
In 1998, the Ministry of Education created the Brazilian High School National Exam or ENEM, a standardized Brazilian national exam to assess students essential competencies and skills. The ENEM is an assessment that strongly influences educational policies, the curricula of different levels of education, and the future of the students assessed. Considering the scope of education, an important issue related to the countrys growth and development, analyzing the ENEM data can reveal relevant information. For instance, the analyses can support educational decisionmaking, the definition of government investments and strategic plans, and the formulation of public education policies based on the students cognitive performance. The analysis of ENEM data is challenging due to the large number of variables collected and the large volume of data available. These variables refer to personal data and the scores obtained by each participant, the answers to the multiple-choice questions, and the answers to the questionnaires. To help educational managers in the educational decision-making process, in this thesis, we propose an architecture based on data warehousing, data mining, inferential statistics, and parallel and distributed processing aimed at analyzing ENEM data. The architecture is composed of five layers: (i) Data connection, related to the extraction and processing of ENEM data; (ii) Data management, aimed at storing data and related metadata in specialized repositories according to the needs of educational analyzes; (iii) Data analysis, which aims to extract useful information and assist in strategic decision-making; (iv) Data presentation, consisting of data visualization tools that allow data scientists and educational managers to graphically visualize the results of their analyses; and (v) Workflow manager, aimed at automating the complex tasks that are performed in the manipulation of the large volume of ENEM data. Additionally, we present two pipelines that exemplify the proposed architectures instantiation with related open-source technologies and tools. We validated the architecture through four different scenarios, each with a specific analysis objective. For each scenario, we discuss the impact of the analysis on the educational sector. The results demonstrated the architectures applicability in supporting the educational decision-making process.
 
ADVERTENCIA - La consulta de este documento queda condicionada a la aceptación de las siguientes condiciones de uso:
Este documento es únicamente para usos privados enmarcados en actividades de investigación y docencia. No se autoriza su reproducción con finalidades de lucro. Esta reserva de derechos afecta tanto los datos del documento como a sus contenidos. En la utilización o cita de partes del documento es obligado indicar el nombre de la persona autora.
Fecha de Publicación
2023-05-11
 
ADVERTENCIA: Aprenda que son los trabajos derivados haciendo clic aquí.
Todos los derechos de la tesis/disertación pertenecen a los autores
CeTI-SC/STI
Biblioteca Digital de Tesis y Disertaciones de la USP. Copyright © 2001-2024. Todos los derechos reservados.