Tesis:
Modelo de detección automática de ironía en textos en español

Cargando...
Miniatura
Fecha
2017
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad del Bío-Bío. Departamento de Sistemas de Información
Resumen
Actualmente, la detección automática de ironía en textos es un tema abierto de trabajo, el cual está siendo abordado por distintos grupos de investigación. La ironía es definida de distintas formas y la mayoría de los trabajos converge en definirla como el uso de palabras para expresar algo distinto y opuesto al sentido literal. Además, dado que las personas a menudo usan la ironía para expresar sus opiniones, la detección de esta es de interés para investigadores del área de análisis de sentimientos, debido a que permite evitar interpretaciones erróneas de opiniones y decidir cuándo una de ellas es o no irónica o literal. Este trabajo propone un nuevo modelo de detección de ironía en textos en español a partir de los enfoques estudiados en una revisión sistemática de literatura, en la cual se revisaron artículos relacionados con la detección de ironía, sarcasmo y minería de opinión. Para evaluar el modelo se construyó un corpus de evaluación compuesto de tweets en español recopilados de acuerdo a distintos dominios temáticos, los cuales fueron etiquetados como irónicos y no irónicos por evaluadores humanos. Junto con lo anterior, se desarrolló una aplicación que permite realizar tareas de pre-procesado y procesado de cada característica que compone nuestro modelo para finalmente generar el dataset para evaluación. Este nuevo modelo tomó como base las características de ironía más utilizadas en los modelos revisados y además introduce 2 nuevas características. Finalmente, el modelo quedó conformado por los atributos: Uso de emoticonos, Uso de Mayúsculas, Uso de Signos de Puntuación, Uso de Palabras típicas de ironía, Uso de Adverbios temporales y no temporales, Análisis de Contradicción Texto-Emoticón, Análisis de ngramas y Análisis de skipgramas. Se obtuvieron rendimientos generales de hasta un 78 %, valor considerado aceptable en comparación a los modelos existentes y prometedor considerando la prácticamente nula existencia de trabajos de detección automática de ironía en textos en español.
Descripción
Tesis (Magíster en Ciencias de la Computación)
Palabras clave
Procesamiento de lenguaje natural, Algoritmos de búsqueda-investigaciones, Ironía en literatura-investigaciones, Detección automática de ironía, Minería de opinión
Citación
Colecciones