Please use this identifier to cite or link to this item: http://dspace.unipampa.edu.br:8080/jspui/handle/riu/1602
metadata.dc.type: Trabalho de Conclusão de Curso
Title: Análise de sentimentos para o português usando redes neurais recursivas
metadata.dc.creator: Brum, Henrico Bertini
metadata.dc.contributor.advisor1: Kepler, Fábio Natanael
metadata.dc.description.resumo: Neste trabalho apresentamos um modelo de treinamento para análise de sentimentos em sentenças para o idioma português brasileiro. Utilizamos uma implementação de Rede Neural Recursiva com Tensor desenvolvida pela Universidade de Stanford que consegue resultados do estado da arte na análise de sentenças para o idioma inglês. Criamos um treebank de sentimentos com sentenças em português para o treinamento de um modelo de análise de sentimentos, usando como base um conjunto já existente de resenhas de livros marcadas quanto à polaridade. Esse treebank possui 12.512 sentanças em formato Penn Treebank, com marcações de polaridades associadas para cada sentença em três classes - Positiva, Neutra e Negativa. Para a geração do treebank, extraímos árvores sintáticas das sentenças do córpus utilizando os parsers sintáticos da Universidade de Stanford e da Universidade de Berkeley treinados com córpus sintáticos em português brasileiro. Nosso trabalho documenta toda a construção do córpus e o uso do mesmo para o treinamento de um modelo de análise de sentimentos para as três classes. O modelo desenvolvido no trabalho foi submetido a análises seguindo a metodologia de 10-Fold Cross-Validation e obteve 51, 18% de acurácia levando em consideração somente sentenças positivas e negativas e 69, 08% de acurácia sobre a marcação completa de todas as sentenças.
Abstract: In this work we present a trained model for sentiment analysis in Brazilian Portuguese sentences. We used a recursive neural tensor network implementation developed by the University of Stanford team that achieved state-of-the-art results on sentiment analysis on English sentences. A sentiment Treebank for sentiment analysis in Portuguese was formed based on a previous data set of book reviews. The Treebank is formed by 12.512 sentences in Penn Treebank format containing associated polarities for each sentence distributed in three classes - Positive, Neutral and Negative. In order to generate the Treebank, syntactic trees were extracted from the corpus sentences using parsers developed by the University of Stanford and the University of Berkeley trained with a Portuguese data set. Our work describes the construction of the corpus and the use of it on the training of a sentiment analysis model. This model was tested following 10-fold cross-validation method and obtained 51, 18% of accuracy on positive and negative prediction and 69, 08% of accuracy on the prediction of all the sentences.
Keywords: Computer science
Artificial intelligence
Neural networks
Sentiment
Portuguese language
Publisher: Universidade Federal do Pampa
metadata.dc.rights: Attribution-NonCommercial-NoDerivs 3.0 Brazil
metadata.dc.rights.uri: http://creativecommons.org/licenses/by-nc-nd/3.0/br/
URI: http://hdl.handle.net/riu/1602
Issue Date: 10-Jul-2015
Appears in Collections:Ciência da Computação

Files in This Item:
File Description SizeFormat 
Análise de sentimentos para o português usando redes neurais recursivas.pdf7,09 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons