Tesis: Modelo de detección automática de ironía en textos en español
dc.contributor.advisor | Segura-Navarrete, Alejandra Andrea | es |
dc.contributor.advisor | Vidal-Castro, Christian Lautaro | es |
dc.contributor.author | Pinto-Cruces, Marcelo Francisco José | es |
dc.date.accessioned | 2017-08-09T13:38:20Z | |
dc.date.available | 2017-08-09T13:38:20Z | |
dc.date.issued | 2017 | |
dc.description | Tesis (Magíster en Ciencias de la Computación) | es |
dc.description.abstract | Actualmente, la detección automática de ironía en textos es un tema abierto de trabajo, el cual está siendo abordado por distintos grupos de investigación. La ironía es definida de distintas formas y la mayoría de los trabajos converge en definirla como el uso de palabras para expresar algo distinto y opuesto al sentido literal. Además, dado que las personas a menudo usan la ironía para expresar sus opiniones, la detección de esta es de interés para investigadores del área de análisis de sentimientos, debido a que permite evitar interpretaciones erróneas de opiniones y decidir cuándo una de ellas es o no irónica o literal. Este trabajo propone un nuevo modelo de detección de ironía en textos en español a partir de los enfoques estudiados en una revisión sistemática de literatura, en la cual se revisaron artículos relacionados con la detección de ironía, sarcasmo y minería de opinión. Para evaluar el modelo se construyó un corpus de evaluación compuesto de tweets en español recopilados de acuerdo a distintos dominios temáticos, los cuales fueron etiquetados como irónicos y no irónicos por evaluadores humanos. Junto con lo anterior, se desarrolló una aplicación que permite realizar tareas de pre-procesado y procesado de cada característica que compone nuestro modelo para finalmente generar el dataset para evaluación. Este nuevo modelo tomó como base las características de ironía más utilizadas en los modelos revisados y además introduce 2 nuevas características. Finalmente, el modelo quedó conformado por los atributos: Uso de emoticonos, Uso de Mayúsculas, Uso de Signos de Puntuación, Uso de Palabras típicas de ironía, Uso de Adverbios temporales y no temporales, Análisis de Contradicción Texto-Emoticón, Análisis de ngramas y Análisis de skipgramas. Se obtuvieron rendimientos generales de hasta un 78 %, valor considerado aceptable en comparación a los modelos existentes y prometedor considerando la prácticamente nula existencia de trabajos de detección automática de ironía en textos en español. | es |
dc.description.call-number | T(DC) 003 P658 2017 | es |
dc.format | application/pdf | |
dc.identifier.uri | https://repositorio.ubiobio.cl/handle/123456789/1771 | |
dc.language | spa | es |
dc.publisher | Universidad del Bío-Bío. Departamento de Sistemas de Información | es |
dc.rights | info:eu-repo/semantics/acceso abierto | |
dc.subject | Procesamiento de lenguaje natural | es |
dc.subject | Algoritmos de búsqueda-investigaciones | es |
dc.subject | Ironía en literatura-investigaciones | es |
dc.subject | Detección automática de ironía | es |
dc.subject | Minería de opinión | es |
dc.title | Modelo de detección automática de ironía en textos en español | es |
dc.type | tesis | es |
dspace.entity.type | tesis | |
ubb.Departamento | Departamento de Sistemas de Información | |
ubb.Facultad | Facultad de Ciencias Empresariales | |
ubb.Programa | Magíster en Ciencias de la Computación | |
ubb.Sede | Concepción |