• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Disertación de Maestría
DOI
https://doi.org/10.11606/D.45.2023.tde-19012024-181048
Documento
Autor
Nombre completo
Luiz Felipe Fronchetti Dias
Dirección Electrónica
Instituto/Escuela/Facultad
Área de Conocimiento
Fecha de Defensa
Publicación
São Paulo, 2023
Director
Tribunal
Gerosa, Marco Aurélio (Presidente)
Maia, Marcelo de Almeida
Pinto, Gustavo Henrique Lima
Título en portugués
Um modelo de classificação de documentação para novatos em projetos de software livre
Palabras clave en portugués
Análise de documentação
Novatos
Software livre e de código aberto
Resumen en portugués
Projetos de software livre contam com contribuições voluntárias para se manterem ativos. Embora importantes para sustentabilidade de projetos de software livre, novos contribuidores tendem a enfrentar dificuldades ao ingressar em projetos neste contexto. O acúmulo de dificuldades tende a influenciar na desistência da participação dos novos contribuidores, que acabam por não contribuir com os projetos. Entre as dificuldades constatadas na literatura, se encontram barreiras relacionadas a problemas na documentação dos projetos que, muitas vezes, não correspondem às necessidades que novos contribuidores enfrentam durante o processo de contribuição. Esta pesquisa se concentra na construção de um modelo de classificação capaz de identificar parágrafos em arquivos de documentação de projetos de software livre que sejam relevantes a novos contribuidores durante o processo de contribuição. Seis categorias de informação conhecidas por serem relevantes a novos contribuidores foram definidas como escopo para classificação dos arquivos de documentação. Entre as informações compreendias pelas categorias, se encontram tópicos como a maneira de lidar com código, a submissão das contribuições e o contato com a comunidade. Arquivos de contribuição (CONTRIBUTING.md) de 9.514 mil projetos de software livre foram extraídos da plataforma de codificação GitHub, dos quais 500 foram selecionados e seus parágrafos analisados qualitativamente para compor a amostra de treinamento do classificador. Diferentes algoritmos de classificação foram treinados, e o classificador LinearSVC foi escolhido para treinar o modelo de classificação final (f-measure: 0.651). O modelo gerado foi então utilizado para predição dos parágrafos dos demais projetos extraídos, e uma amostra das predições foi avaliada através de um questionário com desenvolvedores. Através deste estudo, foi possível observar que a grande maioria dos projetos extraídos (63%) sequer forneciam o arquivo de contribuição analisado em seus repositórios de código. Dos projetos que continham um arquivo de contribuição, a grande maioria (77%) apresentaram apenas entre duas a quatro categorias de informação relevantes a novos contribuidores. Com 74% das predições sendo consideradas extremamente ou ligeiramente adequadas pelos desenvolvedores no questionário, tais resultados indicam a necessidade de um melhor suporte a novatos nos arquivos de contribuição de projetos de software livre.
Título en inglés
A classification model of documentation relevant for newcomers in open-source projects
Palabras clave en inglés
Documentation analysis
Free/libre and open source software
newcomers
Resumen en inglés
Open-source projects depend on newcomers to remain active. Although important for the sustainability of open source projects, new contributors face difficulties joining projects in this context. The increase in difficulties influences newcomers to give up contributing to the projects. Among the difficulties found in the literature, there are barriers related to problems in the documentation files of these projects, which do not support new contributors' needs while attempting to contribute to a project. Our research focuses on building a classification model capable of identifying paragraphs in documentation files of open-source projects relevant to new contributors during their contribution process. Six categories of information relevant to newcomers were used to classify the documentation files. Among the information comprised by these categories, topics such as how to deal with code, the submission of contributions, and how newcomers should contact the community were analyzed. Contribution files (CONTRIBUTING.md) of 9,514 open source projects were extracted from the GitHub platform, of which 500 were selected and their paragraphs analyzed qualitatively to compose the classifier's training sample. Different classification algorithms were trained, and the LinearSVC classifier was chosen to train the final classification model (f-measure: 0.651). The final model was then used to predict the paragraphs of the remaining projects, and a sample of the predictions was evaluated through a questionnaire with software developers. Through this study, it was possible to observe that most of the open-source projects analyzed (63%) did not even provide a contribution file in their code repositories. From the projects that contained a contribution file, the vast majority (77%) presented between two to four categories of information relevant to newcomers. With 74% of the predictions considered extremely or slightly adequate by the developers in the questionnaire, such results indicate the need for better support for newcomers in the contribution files of open-source projects.
 
ADVERTENCIA - La consulta de este documento queda condicionada a la aceptación de las siguientes condiciones de uso:
Este documento es únicamente para usos privados enmarcados en actividades de investigación y docencia. No se autoriza su reproducción con finalidades de lucro. Esta reserva de derechos afecta tanto los datos del documento como a sus contenidos. En la utilización o cita de partes del documento es obligado indicar el nombre de la persona autora.
Dissertacao.pdf (3.60 Mbytes)
Fecha de Publicación
2024-01-24
 
ADVERTENCIA: Aprenda que son los trabajos derivados haciendo clic aquí.
Todos los derechos de la tesis/disertación pertenecen a los autores
CeTI-SC/STI
Biblioteca Digital de Tesis y Disertaciones de la USP. Copyright © 2001-2024. Todos los derechos reservados.