Ingeniería Estadística
URI permanente para esta colección
Examinar
Envíos recientes
- ÍtemTres tópicos claves en estadísticas(2023)
;Osorio Baeza, María FlorenciaChillán : Universidad del Bío-Bío. Facultad de Ciencias de la Salud y de los Alimentos, [2023].Desde el año 2000 los autores han tenido la oportunidad de impartir docencia de Estadística en diferentes Carreras de la Universidad, distribuidas en ambas Sedes y en los distintos Campus, cubriendo las seis Facultades, tanto en programas diurnos como vespertinos. En este periodo han observado que independiente que el/la estudiante tenga mayor o menor formación matemática se le presentan tres dificultades que a continuación se abordarán: a) clasificar adecuadamente si una variable es cualitativa o cuantitativa, b) caracterizar correctamente los elementos de un conjunto, c) aplicar apropiadamente las herramientas del cálculo diferencial e integral. Entre ellas existe un efecto dominó pues clasificar erróneamente una variable repercute en el análisis exploratorio de los datos y caracterizar inadecuadamente los conjuntos incide en la construcción de los eventos (elemento base en probabilidad) y esto, a su vez, dificulta el cálculo de probabilidades. El objetivo del presente apuntes es entregar definiciones rigurosas de los conceptos involucrados en las tres dificultades mencionadas, apoyado con una variedad significativa de ejemplos resueltos. Además, se entregan las herramientas precisas y esenciales para que el/la estudiante aborde con éxito la problemática estadística que esté estudiando. Cada tópico tendrá ejercicios: i) propuestos, y ii) de autoevaluación con sus respectivas respuestas. Las ilustraciones empleadas fueron especialmente seleccionadas para mostrar técnicas que permiten clasificar adecuadamente la/s variable/s involucrada/s. Además, se exhiben estrategias para caracterizar correctamente los eventos y aplicar apropiadamente las herramientas del cálculo. Una parte de los ejemplos y ejercicios presentada en este apuntes es creación de los autores y la otra parte, como también las definiciones y teoremas, fueron extraídos de diferentes libros clásicos de Estadística, los cuales están debidamente descritos en la bibliografía. - ÍtemElaboración de un modelo de predicción de demanda de gasolina a nivel país(2014)
;Jiménez Morales, Rodrigo Hernán ;Contreras Espinoza, Sergio Eduardo ;Acevedo W., CarlosUniversidad del Bío-Bío. Departamento de Estadística (Chile)El objetivo de este Proyecto de Título es realizar un Modelo de Predicción de Demanda de Gasolina en Chile, para esto fijaremos nuestro interés en la obtención de modelos con distintas herramientas estadísticas: la Regresión Lineal Múltiple (RLM) y los Modelos ARIMA para series de tiempo mediante la metodología de Box y Jenkins más algunas simulaciones con Redes Neuronales Artificiales (RNA) a través de una herramienta dispuesta en el software Matlab. Una revisión general con las nociones básicas de la Regresión Lineal se expuso brevemente en el proyecto de título I que antecede a este informe, así como también se señanalaron los conceptos fundamentales de la metodología de Box y Jenkins y de Redes Neuronales para poder diseñar RNA que sirvan para la predicción. En el ajuste por mínimos cuadrados que utiliza la RLM se usarán las variables pib per cápita, precio de la gasolina, parque automotriz y rezagos como predictoras de la variable dependiente: Demanda de Gasolina. Nos detendremos un instante en realizar un estudio de la variable parque de vehículos a gasolina dividida en parque de vehículos de pasajeros y comerciales ya que de ésta, a diferencia de las otras, no se dispone de una serie larga con valores precisos. Dada la serie mensualizada de demanda de gasolina, primero se obtendrá un modelo ARIMA para la predicción de valores futuros y luego se obtendrá otro modelo para este objetivo a través de redes neuronales. El informe constará de tres partes, primero se hace una introducción al tema, se proponen los objetivos y justificación del tema. En el capítulo dos estudiamos el modelo lineal de regresión múltiple, finalmente se proponen los modelos de series de tiempo, ARIMA y de redes neuronales. - ÍtemLegitimación y deslegitimización del conflicto mapuche dentro de la red social Twitter(2020)
;Avilez Bozo, José Miguel -- joseavilezbozo@gmail.com ;Faouzi Nadim, Tarik ;Díaz Acosta, ElizabetUniversidad del Bío-Bío. Escuela de Ingeniería Estadística (Chile)Chile es un país sudamericano multicultural, en ´el conviven la nación chilena junto con diferentes naciones, correspondientes a distintos pueblos originarios. Dentro de estas naciones el pueblo mapuche ha tenido históricamente una mayor visibilizarían. Esto se ha debido a la confrontación de sus derechos indígenas, actualmente ante el Estado chileno, y previamente, ante sus colonizadores españoles (Bengoa, 2002). Dentro de este contexto, se ubica en su historia reciente el caso del comunero mapuche Camilo Catrillanca, quien fue muerto de un disparo en su cabeza por integrantes de un grupo militar de la policía chilena . Este caso fue muy bullado en el país y alcanzó incluso repercusión internacional, producto de que la policía realizó un montaje con las evidencias sobre su muerte, con el fin de desligar sus responsabilidades ante el asesinato, situación fuera de todo protocolo policial y uso racional de la fuerza (El Mostrador, 2019). Dada la importancia de este caso en relación al conflicto entre el Estado chileno y el pueblo mapuche, se evidencia en la literatura que las investigaciones abordan esta temática, pero escasamente se han analizado las opiniones de las redes sociales como Twitter sobre este tópico, e incluso no existen investigaciones que utilicen el Análisis de Sentimientos en esta red social y que se asocien a este tipo de problemática, sin embargo existen otras investigaciones sobre la misma problemática que recogen análisis de videos en Youtube (Maldonado, 2011). De este modo, surge el objetivo de la investigación que busca caracterizar los grupos de influencia en esta red y sus posibles interrelaciones, por medio del análisis de sentimientos. El estudio de Análisis de Sentimientos, enmarcado en el procesamiento del Lenguaje Natural es entendido como: ’Range of computational techniques for analyzing and representing naturally occurring texts at one or more levels of linguistic analysis for the purpose of achieving human-like language processing for a range of tasks or applications’ (Liddy, 2001, p.1). As´ı, el objetivo del tratamiento computacional de opiniones, sentimientos y la subjetividad textual (Wiebe, 1994), considera para nuestro caso el análisis de las opiniones referidas a la causa mapuche. Situación que se releva dado que permite entender las demandas del ejercicio del poder, mediante la legitimación y deslegitimación de determinadas posiciones, puesto que dichas posturas influyen en la construcción de opiniones que luego se reproducen, en la misma red social Twiiter, o bien dichas opiniones funcionan como caja de resonancia en otras redes sociales, tales como Facebook, Instagram o Whatsapp, entre otras. Así, el activismo cibernético se caracteriza por un proceso de comunicación horizontal, sin liderazgo e incontrolable (Tascón y Quintana,2012). Igualmente, las producciones de Twitter se reproducen posteriormente en canales de televisión de señal abierta, construyendo la realidad por medio de la alineación o desalineación con dichas posiciones (Martin & White, 2005). La aplicabilidad de los resultados del estudio refieren a la apertura de un nuevo campo poco abordado en nuestro medio, creando distintas posibilidades de construcción de corpus lingüísticos sobre la materia, favoreciendo el análisis de las audiencias para entender las dinámicas de opinión frente a la construcción y/o modificación de leyes sobre la relación entre el Estado y las naciones originarias. Igualmente, analizando las redes de relaciones entre los grupos de influencia, al analizar sus posibles argumentos y la red de argumentos expuestos y considerando su dialogicidad, como también al orientar acciones desde el reconocimiento del Estado hacia las naciones originarias y de qué modo pudieran articularse sus relaciones con este y otros pueblos originarios; o bien posibilitando, la creación de mejoras en las políticas públicas que dialoguen con la realidad social del pueblo mapuche y de otros pueblos. Sobre investigaciones que utilizan el Análisis de Sentimientos puede observarse en la literatura el estudio de Sidorov, Galicia y Camacho (2016) que analiza un corpus emocional en español basado en tweets. Dicha investigación plantea que no ha surgido el m´etodo m´as apropiado para clasificar tweets en español en el ámbito de Análisis de Sentimientos y que faltarían aún más estudios de este tipo para solucionar el problema. No obstante, se recomienda abordar la metodología Knowledge Discovery in Databases (KDD) o minería de datos (MD). La que se utiliza para la extracción de información en gran cantidad de datos para su conocimiento y comprensión (Rodríguez & García, 2016). Su procedimiento utiliza distintas etapas: selección, exploración, limpieza, transformación, técnicas estadísticas, evaluaciones e interpretación de resultados (Landa, 2016). Este tipo de metodología ha favorecido el análisis de la gran cantidad de datos disponibles en las redes sociales, permitiendo revelar estructuras interconectadas, estableciendo relaciones de términos o frases claves, para descubrir temas, subtemas y entidades semánticas relevantes (Kuz & amp, Falco & amp; Giandini, 2016). Antecedentes de investigaciones sobre la aplicacio´n de este tipo de metodología se observa en redes sociales como Facebook, Youtube y Twitter. En el ámbito de la temática de la salud a través de twitter, se observa lo planteado por Islam (2019) quien descubrió la relación entre yoga y veganismo mediante el modelado de temas. En adelante abordaremos el Marco Teórico inscrito en las ciencias de la computación, ligado a la Minería de Datos y el Análisis de Sentimientos. Luego, presentaremos la Metodología KDD, la que permite seguir el análisis de datos correspondiente. Finalmente, mostraremos los resultados y conclusiones desarrolladas en este trabajo. - ÍtemMétodos predictivos aplicados al impacto de la investigación educativa sobre la práctica docente(2017)
;Friz San Martin, Cristian Alejandro -- cfriz@egresados.ubiobio.cl ;Novoa Muñoz, Francisco Eduardo ;Faouzi Nadim, TarikUniversidad del Bío-Bío. Departamento de Estadística (Chile)En el presente proyecto se realizó un análisis y aplicación de tres técnicas predictivas fundamentales en minería de datos: árboles de decisión, redes neuronales y support vector machine (SVM). En el estudio se consideró una muestra de 179 individuos, 62 docentes universitarios y 117 no universitarios de Granada (España), que fue el resultado de una publicación realizada por el profesor Tarik Faouzi quien gentilmente facilitó los datos de dicha investigación (\impacto de la investigación educativa") y propuso el tema del proyecto de título. A la muestra de datos se les aplicaron las tres técnicas de minería de datos con el objetivo de elegir el mejor modelo. El estudio muestra la potencialidad de la técnica de Support Vector Machine con respecto a las otras dos técnicas mencionadas anteriormente. - ÍtemOptimización del proceso de simulación para un test de bondad de ajuste usando las técnicas computacionales de paralelización disponibles en el lenguaje de programación R(2022-06-24)
;Deneken Guevara, Katherine Deniss -- kdeneken7@gmail.com ;Novoa Muñoz, Francisco EduardoUniversidad del Bío-Bío. Departamento de Estadística (Chile)Los datos de conteo bivariados surgen en varias disciplinas diferentes y la distribución Poisson Bivariada (DPB), siendo una generalización de la Distribución de Poisson (DP), juega un rol importante al momento de modelarlos, siempre que dichos datos presenten una correlación no negativa. Un aspecto crucial de cualquier análisis de datos es contrastar la bondad de ajuste del modelo supuesto. Novoa-Muñoz & Jim enez-Gamero,2014 [33] propusieron tests de bondad de ajuste consistente para la DPB que para aproximar la distribución nula de los estadísticos involucrados emplea el método bootstrap paramétrico el cual requiere mucho tiempo de simulación. En este trabajo se experimenta el uso de técnicas de programación en paralelo mediante el lenguaje de programación R aplicados a la simulación del error tipo I del test Rn;w ( ^n) propuesto por los autores ya mencionados, utilizando el clúster Leftraru de NLHPC [19].









