• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Dissertação de Mestrado
DOI
https://doi.org/10.11606/D.45.2023.tde-19012024-181048
Documento
Autor
Nome completo
Luiz Felipe Fronchetti Dias
E-mail
Unidade da USP
Área do Conhecimento
Data de Defesa
Imprenta
São Paulo, 2023
Orientador
Banca examinadora
Gerosa, Marco Aurélio (Presidente)
Maia, Marcelo de Almeida
Pinto, Gustavo Henrique Lima
Título em português
Um modelo de classificação de documentação para novatos em projetos de software livre
Palavras-chave em português
Análise de documentação
Novatos
Software livre e de código aberto
Resumo em português
Projetos de software livre contam com contribuições voluntárias para se manterem ativos. Embora importantes para sustentabilidade de projetos de software livre, novos contribuidores tendem a enfrentar dificuldades ao ingressar em projetos neste contexto. O acúmulo de dificuldades tende a influenciar na desistência da participação dos novos contribuidores, que acabam por não contribuir com os projetos. Entre as dificuldades constatadas na literatura, se encontram barreiras relacionadas a problemas na documentação dos projetos que, muitas vezes, não correspondem às necessidades que novos contribuidores enfrentam durante o processo de contribuição. Esta pesquisa se concentra na construção de um modelo de classificação capaz de identificar parágrafos em arquivos de documentação de projetos de software livre que sejam relevantes a novos contribuidores durante o processo de contribuição. Seis categorias de informação conhecidas por serem relevantes a novos contribuidores foram definidas como escopo para classificação dos arquivos de documentação. Entre as informações compreendias pelas categorias, se encontram tópicos como a maneira de lidar com código, a submissão das contribuições e o contato com a comunidade. Arquivos de contribuição (CONTRIBUTING.md) de 9.514 mil projetos de software livre foram extraídos da plataforma de codificação GitHub, dos quais 500 foram selecionados e seus parágrafos analisados qualitativamente para compor a amostra de treinamento do classificador. Diferentes algoritmos de classificação foram treinados, e o classificador LinearSVC foi escolhido para treinar o modelo de classificação final (f-measure: 0.651). O modelo gerado foi então utilizado para predição dos parágrafos dos demais projetos extraídos, e uma amostra das predições foi avaliada através de um questionário com desenvolvedores. Através deste estudo, foi possível observar que a grande maioria dos projetos extraídos (63%) sequer forneciam o arquivo de contribuição analisado em seus repositórios de código. Dos projetos que continham um arquivo de contribuição, a grande maioria (77%) apresentaram apenas entre duas a quatro categorias de informação relevantes a novos contribuidores. Com 74% das predições sendo consideradas extremamente ou ligeiramente adequadas pelos desenvolvedores no questionário, tais resultados indicam a necessidade de um melhor suporte a novatos nos arquivos de contribuição de projetos de software livre.
Título em inglês
A classification model of documentation relevant for newcomers in open-source projects
Palavras-chave em inglês
Documentation analysis
Free/libre and open source software
newcomers
Resumo em inglês
Open-source projects depend on newcomers to remain active. Although important for the sustainability of open source projects, new contributors face difficulties joining projects in this context. The increase in difficulties influences newcomers to give up contributing to the projects. Among the difficulties found in the literature, there are barriers related to problems in the documentation files of these projects, which do not support new contributors' needs while attempting to contribute to a project. Our research focuses on building a classification model capable of identifying paragraphs in documentation files of open-source projects relevant to new contributors during their contribution process. Six categories of information relevant to newcomers were used to classify the documentation files. Among the information comprised by these categories, topics such as how to deal with code, the submission of contributions, and how newcomers should contact the community were analyzed. Contribution files (CONTRIBUTING.md) of 9,514 open source projects were extracted from the GitHub platform, of which 500 were selected and their paragraphs analyzed qualitatively to compose the classifier's training sample. Different classification algorithms were trained, and the LinearSVC classifier was chosen to train the final classification model (f-measure: 0.651). The final model was then used to predict the paragraphs of the remaining projects, and a sample of the predictions was evaluated through a questionnaire with software developers. Through this study, it was possible to observe that most of the open-source projects analyzed (63%) did not even provide a contribution file in their code repositories. From the projects that contained a contribution file, the vast majority (77%) presented between two to four categories of information relevant to newcomers. With 74% of the predictions considered extremely or slightly adequate by the developers in the questionnaire, such results indicate the need for better support for newcomers in the contribution files of open-source projects.
 
AVISO - A consulta a este documento fica condicionada na aceitação das seguintes condições de uso:
Este trabalho é somente para uso privado de atividades de pesquisa e ensino. Não é autorizada sua reprodução para quaisquer fins lucrativos. Esta reserva de direitos abrange a todos os dados do documento bem como seu conteúdo. Na utilização ou citação de partes do documento é obrigatório mencionar nome da pessoa autora do trabalho.
Dissertacao.pdf (3.60 Mbytes)
Data de Publicação
2024-01-24
 
AVISO: Saiba o que são os trabalhos decorrentes clicando aqui.
Todos os direitos da tese/dissertação são de seus autores
CeTI-SC/STI
Biblioteca Digital de Teses e Dissertações da USP. Copyright © 2001-2024. Todos os direitos reservados.