Memoria:
Predicción de genero de los autores de artículos científicos con técnicas de minería de datos para determinar la participación en la creación de conocimiento científico por genero

Cargando...
Miniatura
Fecha
2023
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad del Bío-Bío. Departamento de Ingeniería Industrial
Resumen
En este estudio, se documenta la creación de un algoritmo el cual es capaz de determinar la participación femenina y masculina en una base de datos extraída desde Web of Science para ayudar en la creación de herramientas que apoyen los estudios de cienciometría de las áreas de dirección de la universidad, algoritmo el cual fue programado en Rstudio. Se contempla el uso de la metodología Knowledge Discovery in Databases (KDD) para realizar minería de datos con métodos estadísticos tradicionales (uso de un diccionario de nombres) y algoritmos de edición de cadenas de texto (distancia de Levenshtein) sobre el primer y segundo nombre de los autores. La metodología se aplica sobre una base de datos de 12.000 artículos científicos filtrados por tema “género” en Sudamérica, identificando 50.300 autores. Al utilizar un diccionario de nombres considerado en otras investigaciones se dejan 7.975 autores sin clasificar (16%), sin embargo, incorporando un algoritmo de edición de cadenas de texto se puede disminuir ese número a 3.092 (6%), número el cual coincide con la cantidad de autores que no se les puede identificar su nombre, por lo que en realidad la metodología clasifica el 100% de los autores potenciales a ser clasificados con un porcentaje de acierto del 88,18%. El algoritmo entrega como resultado que la participación femenina corresponde a un 57% (26.825) y la participación masculina a un 43% (20.383) al omitir aquellos autores que no les identifica ni primer ni segundo nombre.
Descripción
Memoria (Ingeniero Civil Industrial)
Palabras clave
Minería de datos, Publicaciones científicas-mediciones, Metodología KDD, Distancia de Levenshtein, Creación de conocimiento científico por genero, Desigualdad de genero
Citación
Colecciones