TESIS
TÉCNICAS BAYESIANAS DE APOYO A LA TOMA DE DECISIONES Y SUS APLICACIONES
2014-05-26
Doctorado En Matemáticas 1393/07 (Código P034)
Simulacion; Tecnicas De Inferencia Estadistica; Tecnicas De Prediccion Estadistica; Teoria Y Procesos De Decision
DIRECTORES

Carlos Javier Pérez Sánchez (Codirector)

José Pablo Arias Nicolás (Codirector)
TRIBUNAL

Martín Jiménez, Jacinto (Vocal)

Mateos Caballero, Alfonso (Vocal)

Rojano Martin, Jose Carlos (Presidente)

Rufo Bazaga, María Jesús (Secretario)

Suarez Llorens, Alfonso (Vocal)
DESCRIPCIÓN
INTRODUCCIÓNEl proceso de toma de decisiones consiste, básicamente, en la elección dentro de un conjunto posible de alternativas con el objetivo de resolver problemas reales que surgen en distintas situaciones de la vida. Los algoritmos para los distintos problemas de toma de decisiones buscan la obtención de la alternativa óptima o, en su caso, de una alternativa subóptima. Las técnicas de estadística y teoría de la decisión buscan formalizar el proceso desde el punto de vista matemático y encontrar la decisión óptima o subóptima de manera rigurosa. Con la realización de esta tesis, se han desarrollado nuevas técnicas que permitan analizar diferentes perspectivas de la toma de decisiones. Concretamente, se han tratado: la agregación de preferencias para la obtención de decisiones colaborativas; los modelos de clasificación; los sistemas de ayuda al diagnóstico automático de enfermedades; la medición del grado de acuerdo que se ha alcanzado entre varios decisores y modelos de redes Bayesianas para el estudio de relaciones entre variables y evaluación de escenarios de riesgo. La motivación fundamental para realizar esta tesis viene dada por la gran cantidad de problemas de distintos ámbitos de conocimiento en los que se pueden aplicar las técnicas que se han desarrollado y el déficit de modelos Bayesianos existentes para abordarlos. Las técnicas basadas en la metodología Bayesiana tienen la ventaja de permitir la incorporación de información inicial proveniente de expertos o de experimentos anteriores, lo que hace que sean especialmente atractivas para la toma de decisiones. La gran aplicabilidad de estas técnicas en situaciones reales ha sido un valor añadido para esta investigación.MEMORIAA continuación se presentan en tres bloques, los modelos propuestos en la tesis. Bloque 1. Modelo de agregación de preferencias para la toma de decisiones en grupo y método de clasificación como ayuda a la toma de decisiones.En el proceso de la toma de decisiones, el decisor debe establecer unas preferencias entre diferentes alternativas. El problema consiste en encontrar las mejores alternativas (o una ordenación de las mismas), teniendo en cuenta los diferentes criterios de los miembros del grupo de decisión. En esta tesis se propone un método de agregación de preferencias basado en el propuesto por Arias et al (2007). Además se propone un nuevo método de clasificación, a partir de un modelo de reconocimiento de patrones adaptado. Este modelo se puede extender para utilizarlo como ayuda a la toma de decisiones (véase Theodoridis y Koutroumbas (2008)). Se ha planteado la innovación de la adaptación de un sistema híbrido que conjuga la comparación por pares, la regresión Bayesiana y el algoritmo del vecino más próximo. Una de las aplicaciones con más repercusión del método propuesto puede ser el diagnóstico asistido por ordenador de imágenes médicas (véase Handels y Ehrhardt (2009)). Además, el método propuesto tiene la ventaja de incluir un proceso de aprendizaje que consigue ser casi autónomo y requiere poca supervisión por parte del médico.Bloque 2. Modelos de medición de acuerdo para datos cualitativos.Desde el punto de vista de las medidas de acuerdo, en los procesos de toma de decisiones se diferencian dos casos según el tipo de datos que se manejen en el problema: numéricos o categóricos. Los problemas con datos categóricos son los más habituales. En este caso se dispone de una amplia variedad de medidas de acuerdo dependiendo de las características del problema a abordar. Algunas de estas medidas han sido revisadas recientemente, buscando sobre todo la orientación hacia el campo biomédico y en concreto las medidas para dos decisores (véase Shoukri (2004) o Von Eye y Mun (2005)). Pero resulta poco habitual encontrar en la literatura científica la descripción o el uso de medidas de acuerdo para más de dos decisores. Además, estas medidas se han estudiado tradicionalmente desde un punto de vista clásico. Hasta la fecha, únicamente Broemeling (2009) ha planteado una descripción Bayesiana de algunas de las medidas de acuerdo más conocidas. En esta tesis se ha realizado una revisión de las principales medidas para dos y para más decisores, haciendo especial énfasis en la propuesta de la necesaria metodología Bayesiana. Como aplicación completamente original, se ha propuesto una nueva metodología aplicable en los tests de diferenciación utilizados en el campo del análisis sensorial, como por ejemplo: la prueba triangular (norma ISO 4120:2004), prueba pareada (norma ISO 5495:2005) o duo-trío (norma ISO 10399:2004). La metodología propuesta se aparta de la clásica basada en contrastes sobre la proporción de acierto, y analiza los resultados midiendo el grado de acuerdo entre panelistas para poder evaluar la diferencias. Además, también se ha definido el método como solución a la calificación de nuevos panelistas. Bloque 3. Modelos de redes Bayesianas como ayuda a la toma de decisiones.La redes Bayesianas están siendo muy utilizadas en la actualidad (véase Daly et al. (2011)). Proporcionan una herramienta idónea como ayuda a la toma de decisiones, ya que muestran las dependencias condicionales de las variables del problema a través de un gráfico acíclico dirigido (DAG). Con el gráfico DAG y las distribuciones de probabilidad condicionada se pueden plantear escenarios que resultan de gran ayuda a los decisores en el proceso de la toma de decisiones. Esta metodología se ha aplicado por una parte en un problema de seguridad aérea, como es la salida de pista en el aterrizaje y, por otra parte, en dos estudios relacionados con las ciencias veterinarias que son el estudio de los factores que afectan en el síndrome respiratorio ovino, y la caracterización del semen de tenca.Según Boeing (2012), aproximadamente el 37% de los accidentes de vuelos comerciales del mundo ocurrieron durante la aproximación final o el aterrizaje. Es por ello que actualmente las salidas de pista durante el aterrizaje constituyen un aspecto principal de seguridad a mejorar por las agencias reguladoras y la industria de la aviación (véase Jenkins y Aaron (2012)). Con las propuestas que se realizan en esta tesis se proporciona información novedosa sobre las relaciones entre las diferentes variables involucradas en las salidas de pista, y plantea diferentes escenarios que permiten comprender los factores de riesgo presentes en los accidentes. La gran ventaja de esta investigación es que ya se cuenta con datos experimentales reales (extremadamente difíciles de obtener en la práctica). Finalmente, para el análisis de datos sobre salud animal, el objetivo es diferenciar las variables que están directamente relacionadas con ciertos aspectos de interés. De este modo se proporciona información sobre qué hay que tratar concretamente y qué aspectos sólo afectan de forma indirecta. Normalmente, desde el punto de vista estadístico, se buscan variables que estén significativamente relacionadas con una variable respuesta que indique el estado de una enfermedad. Los métodos estadísticos clásicos no pueden diferenciar entre relaciones directas o indirectas, y para ello lo ideal es utilizar redes Bayesianas (véase Korb y Nicholson (2004)). Con estos métodos se ha conseguido descubrir la estructura de relaciones en ambos problemas analizados y aportar información sobre los escenarios de interés para cada problema. Además, completando los resultados con diferentes análisis como el método de clasificación por clusters y regresión logística, se ha proporcionado información a los responsables de las explotaciones ganaderas y de los viveros de tencas para que puedan decidir en cada momento lo mejor para sus animales. RESULTADOS DE LA TESIS DOCTORALLos modelos de agregación de preferencias, se han basado en el modelo propuesto por Arias-Nicolás et al. (2007) y se ha propuesto otro basado en regresión Bayesiana, combinada con el algoritmo del vecino más cercano. Haciendo uso de este nuevo método, se han resuelto problemas de clasificación en un esquema de ayuda a la toma de decisiones.Este nuevo método se ha validado de forma comparativa con los métodos más utilizados en la actualidad, para resolver un problema de clasificación de pacientes para el cáncer de mama y también para la clasificación de pacientes con patologías de la espalda, mejorando en todos los casos los resultados precedentes.Se ha realizado un amplio análisis del grado de acuerdo en la toma de decisiones. La metodología clásica propuesta por Shoukri (2004) y Von Eye y Mun (2005) ha servido como punto de partida. Se ha propuesto una metodología basada en la estadística Bayesiana para poder hacer uso de la información a priori (con un modelo Dirichlet-Multinomial). Utilizando la nueva metodología, se ha realizado una aplicación real y original, que propone una nueva metodología de resolución para las pruebas de diferenciación del área de análisis sensorial. En último lugar se han evaluado las redes Bayesianas como metodología de ayuda para la toma de decisiones. Para ello se ha realizado una revisión de las mismas y se han analizado tres problemas de gran interés en los que se puede aplicar esta metodología. Por una parte se han desarrollado las redes Bayesianas para un problema de seguridad aérea en los accidentes con salidas de pista. Por otra parte se han abordado dos problemas de ámbito veterinario, como son la evaluación del síndrome respiratorio ovino, y la caracterización del semen de tencas. Se han implementado modelos basados en redes Bayesianas que permiten descubrir las relaciones entre las variables de interés y analizar diferentes escenarios de gran utilidad. BIBLIOGRAFIA BÁSICA- Arias-Nicolás, J. P., Pérez, C. J., and Martín, J. R. A logistic regression-based pairwise comparison method to aggregate preferences. Group Decision and Negotiation 17 (3): 237¿247, 2007.- Boeing. Statistical summary of commercial jet airplane accidents: Worldwide operations 1959-2011. Aviation Safety, Boeing Commercial Airlines, Seattle, Washington, 2012.- Broemeling, L. D., Bayesian methods for measure agreement. Chapman and Hall, 2009.- Daly R., Shen Q. and Aitken S. Review: learning Bayesian networks: Approaches and issues. The Knowledge Engineering Review 26 (2): 99-157, 2011.- Handels, H. and Ehrhardt, J. Medical image computing for computer-supported diagnostics and therapy. Advances and perspectives. Methods of Information in Medicine 48: 11-17, 2009.- International Organization for Standarization. ISO 10399:2004. Sensory analysis. Methodology. Duo-Trio test., 2004.- International Organization for Standarization. ISO 4120:2004. Sensory analysis. Methodology. Triangular test., 2004.- International Organization for Standarization. ISO 5495:2005. Sensory analysis. Methodology. Paired comparison test., 2005.- Jenkins, M. and Aaron, R. F. Reducing runway landing overruns. Aero Magazine, Boeing Commercial Airlines, 47:15-19, 2012.- Shoukri, M. Measures of interobserver agreement. Chapman and Hall, 2004.- Theodoridis, S., and Koutroumbas, K. Pattern Recognition, 4th ed. Elsevier Academia, 2003.- Von Eye, A., and Mun, E. Analyzing rater agreement, manifest variable methods. Lawrence Erlbaum Associates, 2005.