Use este identificador para citar ou linkar para este item: https://repositorio.unipampa.edu.br/jspui/handle/riu/1602
Tipo: Trabalho de Conclusão de Curso
Título: Análise de sentimentos para o português usando redes neurais recursivas
Autor(es): Brum, Henrico Bertini
Primeiro Orientador: Kepler, Fábio Natanael
Resumo: Neste trabalho apresentamos um modelo de treinamento para análise de sentimentos em sentenças para o idioma português brasileiro. Utilizamos uma implementação de Rede Neural Recursiva com Tensor desenvolvida pela Universidade de Stanford que consegue resultados do estado da arte na análise de sentenças para o idioma inglês. Criamos um treebank de sentimentos com sentenças em português para o treinamento de um modelo de análise de sentimentos, usando como base um conjunto já existente de resenhas de livros marcadas quanto à polaridade. Esse treebank possui 12.512 sentanças em formato Penn Treebank, com marcações de polaridades associadas para cada sentença em três classes - Positiva, Neutra e Negativa. Para a geração do treebank, extraímos árvores sintáticas das sentenças do córpus utilizando os parsers sintáticos da Universidade de Stanford e da Universidade de Berkeley treinados com córpus sintáticos em português brasileiro. Nosso trabalho documenta toda a construção do córpus e o uso do mesmo para o treinamento de um modelo de análise de sentimentos para as três classes. O modelo desenvolvido no trabalho foi submetido a análises seguindo a metodologia de 10-Fold Cross-Validation e obteve 51, 18% de acurácia levando em consideração somente sentenças positivas e negativas e 69, 08% de acurácia sobre a marcação completa de todas as sentenças.
Abstract: In this work we present a trained model for sentiment analysis in Brazilian Portuguese sentences. We used a recursive neural tensor network implementation developed by the University of Stanford team that achieved state-of-the-art results on sentiment analysis on English sentences. A sentiment Treebank for sentiment analysis in Portuguese was formed based on a previous data set of book reviews. The Treebank is formed by 12.512 sentences in Penn Treebank format containing associated polarities for each sentence distributed in three classes - Positive, Neutral and Negative. In order to generate the Treebank, syntactic trees were extracted from the corpus sentences using parsers developed by the University of Stanford and the University of Berkeley trained with a Portuguese data set. Our work describes the construction of the corpus and the use of it on the training of a sentiment analysis model. This model was tested following 10-fold cross-validation method and obtained 51, 18% of accuracy on positive and negative prediction and 69, 08% of accuracy on the prediction of all the sentences.
Palavras-chave: Computer science
Artificial intelligence
Neural networks
Sentiment
Portuguese language
Editor: Universidade Federal do Pampa
Citação: teste
Tipo de Acesso: Attribution-NonCommercial-NoDerivs 3.0 Brazil
Licença: http://creativecommons.org/licenses/by-nc-nd/3.0/br/
URI: http://dspace.unipampa.edu.br/jspui/handle/riu/1602
Data do documento: 10-Jul-2015
Aparece nas coleções:Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Análise de sentimentos para o português usando redes neurais recursivas.pdf7.09 MBAdobe PDFVisualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons