• JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
  • JoomlaWorks Simple Image Rotator
 
  Bookmark and Share
 
 
Thèse de Doctorat
DOI
https://doi.org/10.11606/T.3.2021.tde-10082021-160557
Document
Auteur
Nom complet
Roberto Fray da Silva
Adresse Mail
Unité de l'USP
Domain de Connaissance
Date de Soutenance
Editeur
São Paulo, 2021
Directeur
Jury
Cugnasca, Carlos Eduardo (Président)
Corrêa, Pedro Luiz Pizzigatti
Gonda, Luciano
Kobayashi, Guiou
Santos, Ivairton Monteiro
Titre en anglais
Automated stock trading system using deep reinforcement learning and price and sentiment prediction modules.
Mots-clés en anglais
Deep learning
Deep reinforcement learning
Price prediction
Sentiment analysis
Stock trading
Resumé en anglais
The artificial intelligence models are considered state of the art in several domains.The deep reinforcement learning models, one of the main categories of artificial intelligence's models, have a high potential for being applied on domains with high complexity, nonlinearities, and the existence of autocorrelation, seasonal and cyclical components,and noise. One highly relevant domain that presents these characteristics is stock markettrading. Recent works were conducted in this domain using deep reinforcement learning. Nevertheless, these did not consider integrating other relevant components such as price time series prediction and market sentiment analysis. Another critical gap is the lack of comparison of different deep reinforcement learning models in different stock trading scenarios. Besides being an important developing market, the Brazilian stock market is one of the 20 biggest markets in the world. A critical problem for all the investors in this stock market is how to improve the strategies and systems used for improving returns, considering their associated risks. This research aims to investigate and propose a system for automatic asset trading considering multiple features, time series prediction, sentiment analysis, and deep reinforcement learning models. The methodology used was a simulation of the market environment simulation, considering one asset and the evaluation of two relevant scenarios. Eight versions of the proposed system were implemented and evaluated, considering six relevant domain metrics and the buy-and-hold strategy, the main baseline model in the literature. For the first scenario, which simulated a cycle with upward and downward trends, the system's configuration that presented the best results used the price prediction component obtained from a recurrent neural network with a maximum order size of 200 stocks. It obtained better results than the baseline model. For the second scenario, which simulated a deep downward trend, all the system configurations presented better results than the baseline model. The configuration using a recurrent neural network for price prediction and a maximum order size of 10 stocks presented the best results. The main contribution of this research for the deep reinforcement learning area was the proposal of a system that uses additional time series analysis and sentiment analysis features extracted with deep learning models. The main contribution of this research for stock market trading was to propose the use of deep reinforcement learning considering as features: market prices, volume traded, technical indicators, and price and market sentiment predictions obtained using deep learning models. The proposed system can be used in different markets and assets and adapted to other sub-domains.
Titre en portugais
Sistema automático para negociação utilizando aprendizagem por reforço profundo e módulos de previsão de preços e de sentimentos.
Mots-clés en portugais
Análise de sentimentos
Aprendizagem por reforço profunda
Aprendizagem profunda
Inteligência artificial
Negociação de Ações
Previ são de preços
Resumé en portugais
Os modelos de inteligência artificial são considerados o estado da arte em diversos domínios. Os modelos de aprendizagem por reforço profundo, uma das principais categorias de modelos de inteligência artificial, apresentam um grande potencial de aplicação em domínios que apresentam alta complexidade, não linearidade e existência de autocorrelação e de componentes sazonais, cíclicos e de ruído. Um domínio de grande relevância que apresenta estas características é o de negociação no mercado de ações. Trabalhos recentes foram realizados neste domínio utilizando aprendizagem por reforço profundo, porém sem uma integração com outros componentes relevantes como previsão de séries históricas de preços e análise de sentimentos de mercado. Uma outra lacuna importante é a falta de comparação entre modelos distintos de aprendizagem por reforço profundo em diferentes cenários de negociação de ações. O mercado de ações brasileiro é um dos 20 maiores do mundo, além de ser um importante mercado em desenvolvimento. Um problema crítico para todos os investidores nesse mercado é como melhorar as estratégias e sistemas utilizados para aumentar os retornos, considerando os riscos associados a estes. O objetivo deste trabalho foi investigar e propor um sistema para a negociação automática de ativos considerando múltiplas variáveis, previsões de séries históricas, análise de sentimentos e modelos de aprendizagem por reforço profundo. A metodologia utilizada foi a simulação do funcionamento do mercado, considerando um ativo, e a avaliação de dois cenários relevantes. Foram implementadas e avaliadas oito versões do sistema proposto, considerando seis métricas relevantes para o domínio e a estratégia de buy-and-hold, o principal modelo de comparação na literatura. Para o primeiro cenário, que simulou um ciclo com aumento e queda de preços, a configuração do sistema que apresentou melhores resultados utilizou o componente de previsão de preços obtido por uma rede neural recorrente com um tamanho máximo de ordem de 200 ações. Este superou o modelo de comparação. Para o segundo cenário, o qual simulou uma queda acentuada nos preços, todas as versões do sistema apresentaram melhores resultados que o modelo de comparação. A configuração utilizando uma rede neural recorrente para o componente de previsão de preços com um tamanho máximo de ordem de 10 ações demonstrou os melhores resultados. A principal contribuição desta pesquisa para a área de aprendizagem por reforço profundo foi propor um sistema que utiliza variáveis adicionais relacionadas à análise de séries temporais e análise de sentimentos, extraídas por modelos de aprendizagem profunda. A principal contribuição desta pesquisa para a negociação de ações foi propor a utilização de aprendizagem por reforço profundo considerando como entradas os preços de mercado, o volume transacionado, indicadores técnicos de mercado e as previsões de preços e de sentimentos de mercado obtidos através de modelos de aprendizagem profunda. O sistema proposto pode ser utilizado em diferentes mercados e ativos e pode ser adaptado para outros domínios.
 
AVERTISSEMENT - Regarde ce document est soumise à votre acceptation des conditions d'utilisation suivantes:
Ce document est uniquement à des fins privées pour la recherche et l'enseignement. Reproduction à des fins commerciales est interdite. Cette droits couvrent l'ensemble des données sur ce document ainsi que son contenu. Toute utilisation ou de copie de ce document, en totalité ou en partie, doit inclure le nom de l'auteur.
Date de Publication
2021-08-16
 
AVERTISSEMENT: Apprenez ce que sont des œvres dérivées cliquant ici.
Tous droits de la thèse/dissertation appartiennent aux auteurs
CeTI-SC/STI
Bibliothèque Numérique de Thèses et Mémoires de l'USP. Copyright © 2001-2024. Tous droits réservés.