asignatura master 2025
MODELOS BAYESIANOS JERÁRQUICOS
Curso 2024/2025 Código Asignatura: 31110094
-
Guía de la Asignatura Curso 2024/2025
- Primeros Pasos
- Presentación y contextualización
- Requisitos y/o recomendaciones para cursar esta asignatura
- Equipo docente
- Horario de atención al estudiante
- Competencias que adquiere el estudiante
- Resultados de aprendizaje
- Contenidos
- Metodología
- Sistema de evaluación
- Bibliografía básica
- Bibliografía complementaria
- Recursos de apoyo y webgrafía
MODELOS BAYESIANOS JERÁRQUICOS
Código Asignatura: 31110094
PRESENTACIÓN Y CONTEXTUALIZACIÓN
La guía de la asignatura ha sido actualizada con los cambios que aquí se mencionan.
NOMBRE DE LA ASIGNATURA | MODELOS BAYESIANOS JERÁRQUICOS |
CÓDIGO | 31110094 |
CURSO ACADÉMICO | 2024/2025 |
TÍTULOS DE MASTER EN QUE SE IMPARTE |
MÁSTER UNIVERSITARIO EN INGENIERÍA Y CIENCIA DE DATOS
|
TIPO | CONTENIDOS |
Nº ECTS | 4 |
HORAS | 100 |
PERIODO | SEMESTRE 2 |
IDIOMAS EN QUE SE IMPARTE | CASTELLANO |
Bienvenidos a la guía de la asignatura de Modelos Bayesianos Jerárquicos.
La asignatura es una extensión natural de Modelado Estadístico de Datos (obligatoria, primer cuatrimestre) que añade a todas las técnicas estudiadas allí los modelos jerárquicos multinivel.
El objetivo fundamental de la asignatura es que los estudiantes que la cursen adquieran las destrezas necesarias para concebir (y realizar inferencia con) modelos probabilísticos de datos en los que las diferentes variables aleatorias puedan estar estructuradas en varios niveles. Los modelos multinivel o jerárquicos (introducidos en el tema 2) permiten, entre otras cosas, inferir las probabilidades a priori a partir de los datos mediante hiperpriors y tratar de manera diferente a grupos distintos de observaciones o parámetros. Dadas las complejidades inherentes a los modelos multinivel y, en particular, la dificultad de obtener soluciones analíticas en espacios de alta dimensionalidad, se le presta una especial atención a las técnicas aproximadas de simulación de probabilidades a posteriori (tema 4). Finalmente, se dedica el último tema a la implementación práctica de este tipo de modelos, a su evaluación y crítica (introducida en el tema 3) y a su utilización en inferencia en el entorno proporcionado por al menos una librería. La librería elegida puede estar sujeta a evolución a medida que aparezcan en la bibliografía nuevas técnicas y entornos de prototipado más comprensivos.
El modelado probabilístico de datos mediante técnicas bayesianas jerárquicas es un requisito fundamental para cualquier profesional de la Ciencia de Datos (ya sea en el mundo de la empresa o en el de la investigación académica) en la medida en que permite realizar todas las tareas centrales del área (predicción, evaluación, selección, estimación de parámetros, etc) desde una perspectiva esencialmente teórica. A diferencia de otro tipo de modelos, éstos (los modelos jerárquicos bayesianos) proporcionan explicabilidad y justificación completas, y sus aplicaciones son incontables en áreas que van desde el análisis de mercados financieros hasta la toma de decisiones en medicina.
Esta asignatura tiene un contenido teórico exigente en materias de estadística multivariante e inferencia Bayesiana. Parte de la formación previa necesaria se imparte en la asignatura de Modelado Estadístico de Datos. En cualquier caso, es recomendable que el estudiante se asegure de que posee las destrezas asociadas al razonamiento probabilístico y que conoce las propiedades de las diferentes distribuciones de probabilidad, maneja con soltura el Álgebra matricial y conoce los fundamentos del Cálculo Infinitesimal.
Por otra parte, se asume que el/la estudiante conoce el lenguaje de programación python y está acostumbrado a usar las librerías disponibles en dicho lenguaje.
Nombre y apellidos | LUIS MANUEL SARRO BARO (Coordinador de Asignatura) |
Correo electrónico | lsb@dia.uned.es |
Teléfono | 91398-8715 |
Facultad | ESCUELA TÉCN.SUP INGENIERÍA INFORMÁTICA |
Departamento | INTELIGENCIA ARTIFICIAL |
Nombre y apellidos | JAVIER OLIVARES ROMERO |
Correo electrónico | jolivares@dia.uned.es |
Teléfono | 91398-8715 |
Facultad | ESCUELA TÉCN.SUP INGENIERÍA INFORMÁTICA |
Departamento | INTELIGENCIA ARTIFICIAL |
El equipo docente atenderá preferentemente a los/las estudiantes a través de los foros del curso virtual. De esta manera, las respuestas a un/una estudiante particular serán de utilidad al resto de compañeros. Por supuesto, también atenderá dudas a través del correo electrónico lsb@dia.uned.es siempre que sea requerido por un/una estudiante.
El horario de atención presencial (Despacho 3.12, c/ Juan del Rosal, 16 - 28040 Madrid) será los lunes de 10 a 14 horas, pero recomendamos a los estudiantes que notifiquen con antelación su visita porque puede ocurrir que los profesores tengan compromisos académicos que de manera ocasional ocurran dentro de este horario y cuya agenda escape a su control. Dentro de este horario también se puede optar por la llamada telefónica (Teléfono 913988715).
La atención inmediata durante el horario mencionado en el párrafo anterior está garantizada (salvo imponderables o compromisos académicos). Ello no significa que ese horario sea exclusivo: lxs estudiantes podrán contactar con el equipo docente en cualquier momento por las vías antes citadas (foros, correo electrónico o postal y teléfono).
Los estudiantes pueden proponer videoconferencias en grupo para aclarar aspectos particulares del temario, pero dichas videoconferencias deberán prepararse con anterioridad a través de los foros. La interacción habitual consiste en que unx o varixs estudiantes proponen una videoconferencia sobre un tema particular, entre todos definimos el problema y las cuestiones sobre las que queremos debatir o que pretendemos aclarar y finalmente se fija un dia y una hora que sea lo más compatible con las restricciones temporales de equipo docente y estudiantes.
COMPETENCIAS BÁSICAS
CB6 - Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
CB7 - Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
CB8 - Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades. sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
CB9 - Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
CB10 - Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.
COMPETENCIAS GENERALES
CG1 - Identificar los métodos apropiados para la solución de problemas asociados a la ciencia de datos y la analítica de información
CG2 - Ser capaz de aplicar diferentes técnicas de aprendizaje máquina, seleccionando el algoritmo óptimo que genere modelos precisos y permita el desarrollo de soluciones predictivas en diferentes ámbitos de uso
COMPETENCIAS TRANSVERSALES
CT1 - Ser capaz de abordar y desarrollar proyectos innovadores en entornos científicos, tecnológicos y multidisciplinares.
CT2 - Ser capaz de tomar decisiones y formular juicios basados en criterios objetivos (datos experimentales, científicos o de simulación disponibles).
COMPETENCIAS ESPECÍFICAS
CE1 - Conocer los fundamentos de la inferencia estadística y el análisis probabilístico y desarrollar diferentes tipos de modelos probabilísticos
CE6 - Diseñar mecanismos de evaluación de modelos de aprendizaje y comprender las métricas usadas para dicha evaluación
Los resultados más relevantes que se pretenden alcanzar con el estudio de esta asignatura son los siguientes:
-
Comprender la importancia y utilidad de un modelado multi-nivel para datos con dependencias probabilísticas complejas y diferentes grupos de parámetros u observaciones.
-
Discriminar los diferentes escenarios en los que el modelado jerárquico ofrece ventajas respecto a los modelos planos.
-
Construir descripciones en forma de grafo de las relaciones de dependencia condicional entre observaciones, parámetros e hiperparámetros de un modelo.
-
Traducir dichos grafos a formulaciones matemáticas analíticas en términos de verosimilitudes y distribuciones a priori.
-
Seleccionar las técnicas de muestreo más apropiadas para un modelo dado.
- Evaluar la bondad de un modelo dado (incluyendo su capacidad de predicción y las propiedades de convergencia de su muestreo de la probabilidad a posteriori en caso de ser necesario) y ser capaz de comparar y seleccionar modelos.
Introducción a la Inferencia Bayesiana
(Todos los enlaces de esta sección de Contenidos están accesibles en la versión online de esta guía. Recomendamos su consulta si están leyendo su conversión a PDF.)
En este tema se repasarán los conceptos básicos de Inferencia Bayesiana vistos con anterioridad en la asignatura de Modelado Estadístico de Datos y se profundizará en algunos de ellos con ejemplos tomados del primer tema del texto base.
- Probabilidad e Inferencia
- Notación general de la inferencia estadística
- Inferencia Bayesiana
- La probabilidad como una medida de la incertidumbre
- Resultados útiles de Teoría de la Probabilidad
Este tema debe seguirse mediante el estudio del capítulo 1 del texto base, en particular de las secciones 1.1, 1.2, 1.3, 1.5 y 1.8.
Una correspondencia parcial se puede encontrar en el texto Bayes Rules! capítulos 1 y 2.
La sección 1.1 adelanta algunas de las ventajas de la inferencia Bayesiana en relación con su interpretación por parte de los científicos de datos. El autor no entra en cuestiones relativas a los fundamentos o en conflicto entre las prácticas fecuentistas y Bayesianas (con las que el estudiante probablemente no esté familiarizado) pero apunta a algunos de estos aspectos.
La sección 1.2 presenta la notación y nomenclatura que se utilizará durante el curso. El estudiante deberá prestar especial atención a los siguientes puntos:
- Distinción entre muestra y población.
- Distinción entre parámetros y variables observables.
- La notación matemática empleada para denotar escalares, vectores y matrices (incluyendo la elección de asumir que los vectores son vectores columna).
- El concepto de intercambiabilidad de las variables.
- La definición de variables explicativas
- Modelos jerárquicos
La seccción 1.3 introduce la notación utilizada en el texto para conceptos probabilísticos. El estudiante debe asegurarse de que entiende los siguientes conceptos:
- distribución o densidad de probabilidad
- probabilidad condicionada y probabilidad marginal
- la regla de Bayes (a veces incorrectamente denominada Teorema) y las probabilidades involucradas
- el concepto de probabilidad predictiva a priori y a posteriori
- el concepto de verosimilitud y el principio de verosimilitud
- cocientes de verosimilitud y probabilidad en general
La sección 1.5 plnatea cuestiones fundamentales alrededor del concepto de probabilidad y de las posibles interpretaciones que le se dan en contextos puramente Bayesianos y frecuentistas. Explicita las asunciones implícitas en el texto base y expone ejemplos en los que las interpretaciones frecuentistas presentan problemas de aplicación. En particular, expone por qué la probabilidad se puede entender como una medida de la incertidumbre acerca del resultado de un suceso aleatorio.
La sección 1.8 resume algunos resultados clásicos de teoría de la probabilidad que resultarán de utilidad en capítulos posteriores de la asignatura. En particular, se repasa
- el cálculo de valores esperados y varianzas de una distribución de probabilidad
- el concepto de probabilidad condicionada y el cálculo de valores esperados y varianzas en ese contexto
- el cálculo de las nuevas expresiones analíticas de las distribuciones de probabilidad cuando se realizan cambios de variable.
Modelos Jerárquicos
Ésta será nuestra primera toma de contacto con los modelos jerárquicos Bayesianos. En este tema veremos cómo gracias a los modelos jerárquicos podremos, entre otras cosas, disminuir la dependencia de los resultados de nuestra inferencia de la elección de los priors haciendo a estos últimos sujetos de la propia inferencia.
- La construcción de una distribución a priori paramétrica
- La intercambiabilidad y los modelos jerárquicos
- El análisis Bayesiano de los modelos jerárquicos conjugados
- El ejemplo de las 8 escuelas.
- Modelado jerárquico aplicado al meta-análisis
- Priors débilmente informativos para las matrices de covarianza
Del capítulo 1 del texto base saltamos al capítulo 5 (secciones 5.1, 5.2, 5.3, 5.4, 5.5, 5.6 y 5.7). No todas las secciones son de igual importancia. Las más importantes son las secciones 5.1, 5.2, 5.4 y 5.5.
La sección 5.1 plantea un ejemplo paradigmático (incidencia de tumores en ratas) que se utilizará más adelante para ilustrar las ventajas del modelado jerárquico. En él se propone utilizar resultados de experimentos históricos para definir una distribución a priori para los parámetros del experimento que constituye el objeto de la inferencia. Se discuten también las ventajas e inconvenientes del análisis y se da una indicación de cómo se modelarán el proceso de generación de los datos de manera jerárquica en la sección 5.3.
La sección 5.2 se vuelve sobre un concepto que ya se introdujo en el primer tema: el de intercambiabilidad. La intercambiabilidad es un requisito no sólo de los modelos jerárquicos pero especialmente de ellos cuando las observaciones están agrupadas. Se estudia de nuevo su significado, su relación con la independencia e identidad de distribuciones y el teorema de de Finetti. También se explican casos en los que la intercambiabilidad es condicional al valor de variables complementarias (intercambiabilidad parcial o condicional). En estos casos se puede añadir un nuevo nivel en el modelo jerárquico que agrupe experimentos que sí són intercambiables o, alternativamente, se pueden modelar conjuntamente las observaciones y las variables complementarias.
Una vez que se ha aclarado el concepto de intercambiabilidad, se procede a formular la definición de un modelo jerárquico simple (de dos niveles) y se discute brevemente la definición del hiperprior y las dos distribuciones a posteriori de interés en este tipo de problemas como el de los tumores en ratas.
La sección 5.3 trata sobre modelos jerárquicos conjugados. Aunque son muy importantes porque facilitan enormemente la inferencia, no son aplicables en la mayoría de casos prácticos. Cuando no es adecuado o posible construir un modelo conjugado, se debe recurrir a técnicas computacionales como las descritas en el tema 4 de esta asignatura (capítulos 11 y 12 del texto base). La complejidad matemática de la sección es algo más elevada que la de secciones anteriores y no se espera de los/las estudiantes que sean capaces de crear este tipo de modelos; sólo que sean capaces de describir qué es un modelo conjugado. Por lo tanto, se recomienda una lectura superficial y sin entrar en los detalles más matemáticos de los ejemplos. El contenido de esta sección no será materia de evaluación en la prueba presencial salvo la definición de lo que es un modelo conjugado y los tres pasos que conducen a la solución analítica. En particular, no es necesario seguir en detalle el desarrollo matemático del modelo conjugado jerárquico para el problema de la incidencia de tumores en ratas.
La secciones 5.4 y 5.5 están íntimamente relacionadas. En la primera se realiza un desarrollo completo de un modelo bayesiano jerárquico normal en el las observaciones están distribuidas según distribuciones gaussianas (de varianza conocida) por grupos y los parámetros de dichas gaussianas también se asumen distribuidos según una normal. Se discuten las alternativas de no pooling, complete pooling y el caso intermedio que representa el modelado jerárquico.
A continuación se desarrollan las expresiones para la distribución a posteriori (conjunta) de parámetros e hiperparámetros, la distribución a posteriori condicional de las medias de cada grupo dados los hiperpárametros, y la distribución a posteriori marginal de los hiperparámetros. Esta última distribución se puede factorizar como el producto de dos distribuciones. Los siguientes apartados proceden a calcular analíticamente ambos factores.
En el caso del modelo normal discutido en esta sección se puede calcular analíticamente la distribución a posteriori del hiperparámetro media dado el hiperparámetro varianza (el primero de los dos factores mencionados al final del párrafo anterior), y eso es precisamente lo que se hace en el epígrafe Posterior distribution of µ (letra griega mu que puede no aparecer en la conversión a PDF ) given τ (letra griega tau que puede no aparecer en la conversión a PDF). Finalmente sólo resta por calcular la distribución a posteriori del hiperparámetro varianza.
La sección 5.4 finaliza con la discusión de (i) la definición del prior para el hiperparámetro varianza y (ii) el cálculo de las distribuciones predictivas a posteriori.
La sección 5.5 consiste en la aplicación del modelo jerárquico normal a un problema que se ha convertido en un clásico: el problema de las 8 escuelas.
La sección 5.6 trata sobre la utilización de los modelos bayesianos jerárquicos para realizar tareas de meta-análisis entendidas como un análisis que estudia la posibilidad de comparar o integrar diferentes fuentes de datos (experimentos, estudios...) en un proceso de inferencia unificada. Aunque representa una de las aplicaciones más útiles de los modelos jerárquicos Bayesianos, la limitada extensión de esta asignatura impide un estudio más en profundidad de las tareas de meta-análisis y esta sección no será materia de evaluación en la prueba presencial.
Finalmente, la sección 5.7 describe y discute varias elecciones posibles para las distribuciones a priori de varianzas en modelos jerárquicos. Cuando los/las estudiantes se enfrenten a la construcción de modelos jerárquicos se encontrarán frecuentemente en la situación de elegir este tipo de priors porque las distribuciones normales son ubicuas en la Naturaleza bien por derecho propio, bien como aproximación asintótica en situaciones con gran cantidad de datos. En este caso, recomendamos que el/la estudiante conozca al menos el concepto de calibración, las propuestas de la sección y sus propiedades generales.
Una aproximación más práctica al contenido de este capítulo se puede encontrar en los capítulos 5, 15 y 16 del texto complementario Bayes rules!
Evaluación y comparación de modelos
En este tema abordaremos la cuestión fundamental de cómo comprobar que la inferencia que hemos realizado es confiable y que el modelo sobre el que hemos realizado la inferencia describe correctamente los datos. Por otra parte, estudiaremos como comparar modelos alternativos para un mismo conjunto de observaciones.
- Medidas de la exactitud de las predicciones
- Criterios basados en la Teoría de la Información y validación cruzada
- Comparación de modelos basada en el rendimiento predictivo
- Comparación de modelos mediante el factor de Bayes.
Para el estudio de este tema el/la estudiante debe leer las secciones 7.1 a 7.4 del tema 7 del texto base. Todas ellas son relevantes y constituyen materia de evaluación en la prueba presencial.
En la sección 7.1 se comienza explicando por qué son útiles las medidas de exactitud predictiva (para qué sirven) y cómo se pueden definir (algunas definiciones comunes). Se definen los conceptos de
- exactitud predictiva para un punto
- valor esperado del logaritmo de la densidad predictiva
A continuación se aborda el problema de la evaluación de la exactitud predictiva de un modelo ajustado (fitted). Se presenta el problema/sesgo de optimismo cuando se utilizan los mismos datos que se usaron para obtener la distribución a posteriori en la evaluación de la exactitud predictiva.
En la sección 7.2 se discuten diferentes aproximaciones para disminuir el impacto de los sesgos asociados a la evaluación de la exactitud predictiva sobre los mismos datos que se emplearon en el ajuste del modelo (within-sample). Estas medidas son útiles por sí mismas (para estimar la bondad del modelo) pero también para comparar/seleccionar entre modelos alternativos. En particular, se discuten correcciones a la estimación optimista (within-sample) como AIC, WAIC o DIC y alternativas parcialmente externas basadas en lo que se conoce como validación cruzada.
La sección 7.3 se aplican las técnicas descritas previamente al caso de las 8 escuelas y se discute el sesgo de selección que se traduce en expectativas optimistas del error predictivo cuando se selecciona entre un número elevado de modelos. Es espacialmente interesante el apartado final en el que se reconocen las limitaciones de las técnicas presentadas.
La sección 7.4 presenta una alternativa a la evaluación/comparación de modelos basada en la exactitud predictiva: los factores de Bayes. Los factores de Bayes constituyen una metodología estrictamente Bayesiana pero que presenta sus propias lmitaciones. En primer lugar se presenta la metodología para, a continuación, describir dos ejemplos en los que la aplicación proporciona resultados adecuados (el primero) o con propiedades no deseadas (el segundo).
Los contenidos de este tema no están agrupados en ningún capítulo del libro Bayes Rules! sino que se extienden a lo largo de varias subsecciones denominadas Model evaluation (& selection).
Aspectos computacionales de la Inferencia Bayesiana
Los modelos multiparamétricos y especialmente los jerárquicos presentan desafíos y dificultades que habitualmente obligan a la estimación aproximada (no analítica) de las distribuciones a posteriori de los parámetros involucrados. Para ello se han desarrollado en los últimos años técnicas muy sofisticadas que quedan fuera del alcance de esta asignatura, pero cuyos fundamentos se hayan en una serie de técnicas más sencillas que exploremos aquí.
- Principios básicos de las cadenas de Markov
- El muestreador de Gibbs
- Los algoritmos de Metropolis y Metropolis-Hastings
- Los muestreadores de Gibbs y Metropolis como bloques básicos de la inferencia
- Cómo evaluar la convergencia
- El número efectivo de muestras
- [Hamiltonian Monte Carlo] (recomendado pero fuera de temario)
- [Inferencia Variacional] (recomendado pero fuera de temario)
Es importante enfatizar que el texto base contiene material más avanzado que el que constituye este tema y que, por muy interesante que sea, debemos dejar fuera por razones de carga de trabajo.
Para el estudio de este tema el/la estudiante debe leer las secciones 11.1 a 11.5. Las secciones 12.4 y 13.7 representan ejemplos avanzados (y extraordinariamente útiles en muchos casos de interés) pero quedan fuera de las materias de examen. Recomendamos a aquellas/aquellos estudiantes que puedan y estén interesados que lean aunque sea superficialmente los fundamentos de ambas técnicas (Hamiltonian MonteCarlo e Inferencia Variacional), pero el equipo docente es consciente de que no es posible su estudio (ni siquiera la lectura de las secciones correspondientes) sin exceder los créditos de la asignatura. Por lo tanto, no se espera dicha lectura ni, obviamente serán objeto de examen.
Una aproximación más práctica al contenido de este capítulo se puede encontrar en los capítulos 6,7 y 8 del texto complementario Bayes rules!
Librerías de modelado probabilístico
En este último tema se estudiará una implementación del ejemplo de las ocho escuelas (descrito en el texto base) con la librería TensorFlow Probability entendida como entorno de especificación de modelos para inferencia probabilística.
Para la realización de la práctica de evaluación continua (PEC) será necesario implementar un modelo jerárquico bayesiano para el problema descrito en el enunciado que se puede encontrar en la carpeta de Documentos públicos. La implementación podrá realizarse utilizando cualquier librería de programación probabilística. En particular, si se elige la librería TensorFlow Probability se puede seguir el modelo descrito en el repositorio de github
y descargado en la carpeta de la PEC. El notebook contiene una implementación del ejemplo de las ocho escuelas, utilizado en repetidas ocasiones en el texto base. Se puede adaptar directamente el notebook para resolver el problema propuesto en el enunciado. Si una/un estudiante necesita un texto introductorio, podemos sugerir Probabilistic Programming and Bayesian Methods for Hackers
cuyo repositorio github se puede encontrar aquí. En él podréis encontrar también ejemplos escritos con PyMC.
El equipo docente de la asignatura ha desarrollado sus contenidos teniendo en mente un estudiante promedio de esta Universidad que compatibiliza sus estudios con otro tipo de actividades de tipo laboral o profesional y que tiene restricciones variables en cuanto a su disponibilidad de tiempo. Por ello, asume que el/la estudiante seguirá los contenidos teóricos a través del texto base e intentará responder a una serie de preguntas de autoevaluación propuestas por dicho equipo docente en el curso virtual y ligadas a los contenidos de cada tema. Tanto para el estudio de los contenidos como para la realización de los ejercicios de autoevaluación, el estudiante contará con el apoyo del profesorado a través de la plataforma virtual o mediante otro tipo de canales de comunicación (correo electrónico o postal, teléfono, visitas al despacho o videoconferencias).
Finalmente, el estudiante realizará una práctica cuya memoria debe demostrar que ha adquirido los conocimientos y las destrezas descritas en los contenidos de la asignatura. Dicha práctica incluirá el desarrollo de software en el entorno de programación elegido para la asignatura.
Las actividades formativas de la asignatura son las que se listan a continuación:
- Estudios de contenidos (55 horas)
- Actividades en la plataforma virtual (5 horas)
- Prácticas Informáticas (40 horas)
- Total: 100 horas.
TIPO DE PRUEBA PRESENCIAL |
|
---|---|
Tipo de examen | |
Tipo de examen | Examen tipo test |
Preguntas test | |
Preguntas test | |
Duración | |
Duración | 120 (minutos) |
Material permitido en el examen | |
Material permitido en el examen | Se permite la consulta de cualquier libro sin anotaciones ni hojas sueltas. |
Criterios de evaluación | |
Criterios de evaluación | Corrección en las respuestas |
% del examen sobre la nota final | |
% del examen sobre la nota final | 30 |
Nota mínima del examen para aprobar sin PEC | |
Nota mínima del examen para aprobar sin PEC | |
Nota máxima que aporta el examen a la calificación final sin PEC | |
Nota máxima que aporta el examen a la calificación final sin PEC | |
Nota mínima en el examen para sumar la PEC | |
Nota mínima en el examen para sumar la PEC | 0 |
Comentarios y observaciones | |
Comentarios y observaciones |
CARACTERÍSTICAS DE LA PRUEBA PRESENCIAL Y/O LOS TRABAJOS | |
---|---|
CARACTERÍSTICAS DE LA PRUEBA PRESENCIAL Y/O LOS TRABAJOS |
|
Requiere Presencialidad | |
Requiere Presencialidad | Si |
Descripción | |
Descripción | Prueba presencial descrita en el apartado anterior. |
Criterios de evaluación | |
Criterios de evaluación | |
Ponderación de la prueba presencial y/o los trabajos en la nota final | |
Ponderación de la prueba presencial y/o los trabajos en la nota final | |
Fecha aproximada de entrega | |
Fecha aproximada de entrega | |
Comentarios y observaciones | |
Comentarios y observaciones |
PRUEBAS DE EVALUACIÓN CONTINUA (PEC) | |
---|---|
PRUEBAS DE EVALUACIÓN CONTINUA (PEC) |
|
¿Hay PEC? | |
¿Hay PEC? | Si,PEC no presencial |
Descripción | |
Descripción | La PEC consistirá en una implementación de un modelo de datos y en la inferencia de sus parámetros mediante una librería de programación probabilista como TensorFlow Probability, PyMC, o Stan. El equipo docente proporcionará los datos y en enunciado en el curso virtual. El entregable debe incluir:
|
Criterios de evaluación | |
Criterios de evaluación | La corrección de la PEC tendrá en cuenta los siguientes criterios:
Un ejemplo de presentación pobre, poco clara y falta de rigurosidad es la inclusión de ecuaciones que utilicen nombres de variables no descritos verbalmente en el texto, con tipografía no explicada o generadas sin un editor de ecuaciones que permita símbolos matemáticos. El equipo docente está a disposición de lxs estudiantes durante todo el curso para aclarar qué tipo de presentaciones son aceptables. Las gráficas deben ser legibles e interpretables. Esto implica una elección adecuada de los tamaños de las fuentes, del tamaño de los elementos representados (puntos, líneas, símbolos, etc), de los colores y de los rangos de los ejes, por citar sólo algunos de los elementos de mayor impacto en la interpretabilidad de una gráfica. Además, deben ir acompañadas de una descripción verbal en un pie de figura y en el texto de la memoria.
|
Ponderación de la PEC en la nota final | |
Ponderación de la PEC en la nota final | 70% |
Fecha aproximada de entrega | |
Fecha aproximada de entrega | Hacia el final del cuatrimestre. |
Comentarios y observaciones | |
Comentarios y observaciones |
OTRAS ACTIVIDADES EVALUABLES |
|
---|---|
¿Hay otra/s actividad/es evaluable/s? | |
¿Hay otra/s actividad/es evaluable/s? | No |
Descripción | |
Descripción | |
Criterios de evaluación | |
Criterios de evaluación | |
Ponderación en la nota final | |
Ponderación en la nota final | |
Fecha aproximada de entrega | |
Fecha aproximada de entrega | |
Comentarios y observaciones | |
Comentarios y observaciones |
¿Cómo se obtiene la nota final? |
|
---|---|
Tanto la prueba presencial (PP) como la PEC serán evaluadas de 0 a 10. En caso de que ambas evaluaciones sean iguales o superiores a 4, la nota final (NF) será la media ponderada (MP) de ambas de acuerdo a la siguiente fórmula: NF = MP = 0,30 * PP + 0,70 * PEC. Si alguna de las dos calificaciones es inferior a 4 la nota final será el mínimo del par (4.9, MP) de manera que siempre figurará como suspenso y, en caso de que la media ponderada supere el 4.9, su nota numérica final será 4.9. Si cualquiera de las dos calificaciones fuese No Presentado, la nota final sería asimismo No Presentado. La calificación obtenida en la PEC en la convocatoria ordinaria se mantendrá en la convocatoria extraordinaria de septiembre. |
LIBRO ACTUALMENTE NO PUBLICADO
ISBN(13): Título: BAYESIAN DATA ANALYSIS Third Edition Autor/es: Gelman, A., Carlin, J. B., Stern, H. S., Dunson, D. B., Vehtari, A. Y Rubin, D. B.; Editorial: Chapman & Hall/CRC Texts in Statistical Science. |
El texto base de la asignatura se encuentra disponible de forma gratuita en http://www.stat.columbia.edu/~gelman/book/ junto con diverso material complementario.
Para el seguimiento de la asignatura mediante el texto base, conviene seguir estas indicaciones:
- El tema 1 del contenido de esta asignatura se corresponde con el capítulo 1 del texto base.
- El tema 2 se corresponde con el capítulo 5 del texto base.
- El tema 3 se corresponde con el capítulo 7 del texto base.
- El tema 4 se corresponde con el capítulo 11 del texto base más las secciones 12.4, 12.5 y 13.7.
Por otra parte, si el estudiante encuentra dificultad en seguir el nivel de dicho texto base, puede encontrar un texto más pedagógico y asequible en la bibliografía complementaria (Bayes Rules!). En el momento de escribir esta guía el libro Bayes Rules! es gratuito en su versión online. De seguir así después de su publicación en papel es posible que en el futuro el equipo docente sustituya el actual texto base. Por el momento, se puede utilizar este texto complementario como ayuda para seguir el texto base Bayesian Data Analysis.
ISBN(13): 9780123814852
Título: DOING BAYESIAN DATA ANALYSIS: A TUTORIAL WITH R AND BUGS Autor/es: John K. Kruschke; Editorial: ACADEMIC PRESS |
Los/as estudiantes dispondrán de los siguientes recursos de apoyo al estudio:
-
Guía de la asignatura. Incluye el plan de trabajo y orientaciones para su desarrollo. Esta guía será accesible desde el curso virtual.
-
Curso virtual. A través de esta plataforma los/as estudiantes tienen la posibilidad de consultar información de la asignatura, realizar consultas al Equipo Docente a través de los foros correspondientes, consultar e intercambiar información con el resto de los compañeros/as.
-
Biblioteca. El estudiante tendrá acceso tanto a las bibliotecas de los Centros Asociados como a la biblioteca de la Sede Central, en ellas podrá encontrar un entorno adecuado para el estudio, así como de distinta bibliografía que podrá serle de utilidad durante el proceso de aprendizaje. Además, desde la biblioteca digital de la UNED, el estudiante tendrá acceso a Safari Books Online, una biblioteca digital con más de 30.000 libros técnicos en constante actualización.
Los recursos de apoyo, especialmente aquellos asociados al rápidamente cambiante mundo de los entornos de desarrollo y los lenguajes de programación, se harán disponibles a través del curso virtual para poder actualizarlos de manera ágil y frecuente.