asignatura master 2025
MODELADO ESTADÍSTICO DE DATOS
Curso 2024/2025 Código Asignatura: 31110018
-
Guía de la Asignatura Curso 2024/2025
- Primeros Pasos
- Presentación y contextualización
- Requisitos y/o recomendaciones para cursar esta asignatura
- Equipo docente
- Horario de atención al estudiante
- Competencias que adquiere el estudiante
- Resultados de aprendizaje
- Contenidos
- Metodología
- Sistema de evaluación
- Bibliografía básica
- Bibliografía complementaria
- Recursos de apoyo y webgrafía
MODELADO ESTADÍSTICO DE DATOS
Código Asignatura: 31110018
PRESENTACIÓN Y CONTEXTUALIZACIÓN
La guía de la asignatura ha sido actualizada con los cambios que aquí se mencionan.
NOMBRE DE LA ASIGNATURA | MODELADO ESTADÍSTICO DE DATOS |
CÓDIGO | 31110018 |
CURSO ACADÉMICO | 2024/2025 |
TÍTULOS DE MASTER EN QUE SE IMPARTE |
MÁSTER UNIVERSITARIO EN INGENIERÍA Y CIENCIA DE DATOS
|
TIPO | CONTENIDOS |
Nº ECTS | 6 |
HORAS | 150 |
PERIODO | SEMESTRE 1 |
IDIOMAS EN QUE SE IMPARTE | CASTELLANO |
Los modelos estadísticos son técnicas fundamentales que permiten extraer información de los datos, determinando si ciertas variables explicativas (predictores o variables independientes) influyen en una variable respuesta (variable resultado o dependiente).
Esta asignatura se enmarca, por tanto, dentro, del aprendizaje supervisado, donde se modeliza una variable respuesta cuantitativa (modelos lineales de regresión) o una variable respuesta cualitativa (modelos lineales de clasificación).
La asignatura pretende hacer asequible los contenidos matemáticos mínimos necesarios para entender el funcionamiento interno de los modelos. Y, por supuesto, sin olvidar la parte práctica de utilización de los modelos mediante software estadístico libre.
Esta asignatura forma parte del Máster Universitario en Ingeniería y Ciencia de Datos. Consta de 6 ECTS, es de carácter obligatorio y su perfil profesional se centra en el análisis de los datos y la creación de modelos predictivos. En ella se estudian los elementos estadísticos básicos necesarios en Aprendizaje Automático I, Aprendizaje Automático II y Modelos Bayesianos Jerárquicos.
La presente guía contiene información de carácter general sobre la asignatura: requisitos y recomendaciones, equipo docente, horario de atención, resultados de aprendizaje, contenidos, metodología, plan de trabajo, sistema de evaluación, bibliografía básica, bibliografía complementaria, recursos de apoyo y glosario.
Es de destacar que en esta asignatura, la interacción con los alumnos es constante en la plataforma virtual y que se envían noticias sobre dicha interacción al correo de la UNED del alumno, por lo que conviene acceder a la plataforma y a dicho correo de forma regular (al menos una vez por semana). Esta interacción con los alumnos es muy bien valorada en las encuestas anónimas que realizan los estudiantes. A este respecto, conviene señalar que en dichas encuestas (en una escala de 0 a 100), en el curso 2023-2024 esta asignatura fue numéricamente la mejor valorada con precisión alta de todas las asignaturas del primer cuatrimestre de este Máster, con una puntuación de 75 siendo ligeramente superior a la media de la titulación en dicho cuatrimestre que fue de 70. Además, en esta asignatura se obtuvieron las siguientes puntuaciones (en un total de 34 encuestas de 71 alumnos matriculados):
- Atención que el equipo docente presta a los foros: 88.
- Utilidad de las "Preguntas más Frecuentes" (FAQ) para la preparación de la asignatura: 86.
- Satisfacción global con el Equipo Docente: 82.
- Utilidad de la información proporcionada sobre los criterios de evaluación: 79.
- Utilidad del curso virtual: 78.
A este respecto se puede consultar la información pública de los principales indicadores de rendimiento de esta asignatura (y del resto de asignaturas del Máster) en el:
- Enlace de Indicadores de rendimiento del Máster Universitario en Ingeniería y Ciencia de Datos. Seleccionar el curso que se desee (a partir de la primera edición de esta asignatura, curso 19/20), estudios (Máster Oficial) y titulación (Máster Universitario en Ingeniería y Ciencia de Datos).
Es necesario haber estudiado previamente una asignatura básica de Estadística a nivel de grado y manejar con soltura el cálculo matricial. No obstante, se repasarán conceptos básicos estadísticos en los primeros temas y se darán ayudas sobre cálculo matricial cuando se necesite. Por otra parte, es recomendable conocer (leer y escribir) el inglés técnico.
Como recomendación general para esta asignatura conviene tener en cuenta lo siguiente:
- El foro de la plataforma virtual es un espacio vivo en el que el equipo docente está presente de forma continua para ayudar a los estudiantes a progresar en su estudio.
- En el foro de la plataforma virtual, se va marcando un ritmo de estudio semanal para poder llevar al día la asignatura (para aquéllos que puedan y/o deseen).
- En todo momento es factible reengancharse a la asignatura gracias a los resúmenes que se van poniendo en la plataforma virtual dentro de las FAQ.
- Existen en la plataforma virtual exámenes resueltos de otros años. La forma de utilizarlos es intentar primero resolver los ejercicios sin mirar la solución. Está desaconsejado mirar la solución sin antes haber intentado resolver el ejercicio al menos durante 10 minutos.
- Es muy importante asistir en directo o en diferido a la sesión telemática de bienvenida en la primera quincena de Octubre.
Así mismo, conviene remarcar que es importante que el estudiante rellene las encuestas de satisfacción de esta asignatura (y de todas) dando sugerencias sobre el desarrollo de la asignatura porque éstas nos ayudan a ir mejorando la docencia en ella.
Por último, el equipo docente de esta asignatura hace un énfasis especial en que es necesario tener frescos los conceptos que se estudian en una asignatura básica de Estadística a nivel de grado. En este sentido el equipo docente ha preparado el siguiente test. Las soluciones se encuentran más abajo en esta misma página. El equipo docente de esta asignatura recomienda encarecidamente que si se obtienen 7 o menos respuestas acertadas en el test, se repasen, antes de que empiece el Máster, los temas 1, 2 y 4 del libro de Ramos et al. (2019) y/o realizar el Curso OCW UPCT con licencia CC (Creative Commons) referenciados en el apartado de Bibliografía complementaria de esta guía".
- Preg #varianzamuestral: Sea {xi} un conjunto de datos. Si se define yi=xi+b, entonces se verifica que los dos conjuntos de datos tienen la misma varianza muestral.
- a) Verdadero.
- b) Falso.
- Preg #covarianzamuestral: La covarianza muestral de dos conjuntos de datos {xi} e {yi} es adimensional.
- a) Verdadero.
- b) Falso.
- Preg #bernoulli: La varianza poblacional de una variable aleatoria Bernoulli de parámetro p es p(1-p).
- a) Verdadero.
- b) Falso.
- Preg #binomial: La varianza poblacional de una variable aleatoria Binomial de parámetros n y p coincide con su media poblacional si p=1/2.
- a) Verdadero.
- b) Falso.
- Preg #funciondensidad: La función de densidad de una variable aleatoria siempre es menor o igual que 1.
- a) Verdadero.
- b) Falso.
- Preg #funciondistribucion: La función de distribución de una variable aleatoria discreta siempre es escalonada.
- a) Verdadero.
- b) Falso.
- Preg #covarianzapoblacional: Si Y es una variable aleatoria, entonces la covarianza poblacional de Y con Y es la varianza de Y.
- a) Verdadero.
- b) Falso.
- Preg #varianzapoblacional: Si Y1 e Y2 son dos variables aleatorias independientes, entonces la varianza poblacional verifica que V[Y1-Y2]=V[Y1]+V[Y2].
- a) Verdadero.
- b) Falso.
- Preg #intervaloconfianza: Un intervalo de confianza de un parámetro poblacional siempre es simétrico alrededor de la estimación de dicho parámetro.
- a) Verdadero.
- b) Falso.
- Preg #tstudent: El test de la t de Student sirve para comparar varianzas.
- a) Verdadero.
- b) Falso.
Respuestas
- Resp #varianzamuestral: Verdadero. Si {xi} es un conjunto de datos y se define yi=xi+b, entonces sí se verifica que {xi} e {yi} tienen la misma varianza muestral, ya que yi-media(y)=xi+b-(media(x)+b)=xi-media(x).
- Resp #covarianzamuestral: Falso. La covarianza muestral de dos conjuntos de datos {xi} e {yi} no es adimensional. Sus unidades son el producto de las unidades de {xi} e e {yi}. La correlación muestral sí es adimensional.
- Resp #bernoulli: Verdadero. La varianza poblacional de una variable aleatoria Bernoulli de parámetro p sí es p(1-p), ya que V[X]=E[X^2]-E^2[X]=1^2p+0^2p-(1p+0(1-p))^2=p-p^2=p(1-p).
- Resp #binomial: Falso. La varianza poblacional de una variable aleatoria Binomial de parámetros n y p no coincide con su media poblacional si p=1/2, ya que es E[X]=np=n/2 y V[X]=np(1-p)=n/4.
- Resp #funciondensidad: Falso. La función de densidad de una variable aleatoria no siempre es menor o igual que 1. Por ejemplo, la uniforme en (0,1/2) tiene función de densidad constante igual a 2 en dicho intervalo.
- Resp #funciondistribucion: Verdadero. La función de distribución de una variable aleatoria discreta siempre es escalonada, siendo el salto en cada punto del soporte igual a la función de masa en dicho punto.
- Resp #covarianzapoblacional: Verdadero. Si Y es una variable aleatoria, entonces la covarianza poblacional de Y con Y es la varianza de Y, ya que Cov(Y,Y)=E[(Y-E[Y])(Y-E[Y])]=E[(Y-E[Y])^2]=V[Y].
- Resp #varianzapoblacional: Verdadero. Si Y1 e Y2 son dos variables aleatorias independientes, entonces sí se verifica que V[Y1-Y2]=V[Y1]+V[Y2], ya que V[Y1-Y2]=V[Y1]+V[Y2]-2Cov(Y1,Y2), y al ser indepen., son incorreladas y tienen covarianza 0.
- Resp #intervaloconfianza: Falso. Un intervalo de confianza de un parámetro poblacional no siempre es simétrico alrededor de la estimación de dicho parámetro. Por ejemplo el de una varianza poblacional.
- Resp #tstudent: Falso. El test de la t de Student no sirve para comparar varianzas, ya que sirve para comparar dos medias.
Nombre y apellidos | EMILIO LETON MOLINA (Coordinador de Asignatura) |
Correo electrónico | emilio.leton@dia.uned.es |
Teléfono | 91398-9473 |
Facultad | ESCUELA TÉCN.SUP INGENIERÍA INFORMÁTICA |
Departamento | INTELIGENCIA ARTIFICIAL |
Nombre y apellidos | OLGA C. SANTOS MARTÍN-MORENO |
Correo electrónico | ocsantos@dia.uned.es |
Teléfono | 91398-9388 |
Facultad | ESCUELA TÉCN.SUP INGENIERÍA INFORMÁTICA |
Departamento | INTELIGENCIA ARTIFICIAL |
- Emilio Letón
- Tfno: 91 398 9473 (martes lectivos, de 14:30 a 18:30 h.)
- C/ Juan del Rosal, 16 Despacho 3.04. ETSI Informática - UNED 28040 Madrid
- Email: emilio.leton@dia.uned.es
- Curso Virtual
- Olga C. Santos
- Tfno: 91 398 9388 (miércoles lectivos, de 10:00 a 14:00 h.)
- C/ Juan del Rosal, 16 Despacho 3.02. ETSI Informática - UNED 28040 Madrid
- Email: ocsantos@dia.uned.es
- Curso Virtual
COMPETENCIAS BÁSICAS
CB6 - Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
CB7 - Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
CB8 - Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades. sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
CB9 - Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
CB10 - Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.
COMPETENCIAS GENERALES
CG1 - Identificar los métodos apropiados para la solución de problemas asociados a la ciencia de datos y la analítica de información
CG2 - Ser capaz de aplicar diferentes técnicas de aprendizaje máquina, seleccionando el algoritmo óptimo que genere modelos precisos y permita el desarrollo de soluciones predictivas en diferentes ámbitos de uso
CG5 - Utilizar las habilidades de científico de datos y/o ingeniero de datos en entornos de trabajo multidisciplinares y ser capaz de distinguir/organizar las diferentes actividades de los roles en dicho entorno
COMPETENCIAS TRANSVERSALES
CT1 - Ser capaz de abordar y desarrollar proyectos innovadores en entornos científicos, tecnológicos y multidisciplinares.
CT2 - Ser capaz de tomar decisiones y formular juicios basados en criterios objetivos (datos experimentales, científicos o de simulación disponibles).
COMPETENCIAS ESPECÍFICAS
CE1 - Conocer los fundamentos de la inferencia estadística y el análisis probabilístico y desarrollar diferentes tipos de modelos probabilísticos
CE2 - Desarrollar aplicaciones/servicios/scripts orientados a la analítica de datos y analizar el uso de diferentes librerías para el desarrollo e implementación de métodos numéricos, algoritmos y modelos asociados a los datos
CE6 - Diseñar mecanismos de evaluación de modelos de aprendizaje y comprender las métricas usadas para dicha evaluación
Los resultados más relevantes que se pretenden alcanzar con el estudio de esta asignatura son los siguientes:
- Explicar los conceptos principales de los modelos estadísticos.
- Distinguir las diferencias y las relaciones entre los modelos lineales de regresión y clasificación.
- Explicar los fundamentos matemáticos de los modelos.
- Aplicar los modelos a datos reales.
- Interpretar los resultados obtenidos de los modelos.
- Evaluar la calidad de ajuste de los modelos.
- Contrastar el cumplimiento de los requisitos de aplicación de los modelos.
Tema 1: Principales técnicas estadísticas
Este tema tiene como objetivo introducir las técnicas estadísticas principales. Se contemplan aquellas en las que hay una variable respuesta y una variable explicativa (t-Student, ANOVA 1 factor, Ji-Cuadrado, Fisher, Mann-Whitney y Kruskal-Wallis).
El material de estudio de este tema se detalla en el Manual Didáctico de esta asignatura, que se encuentra en el espacio correspondiente, en la plataforma de cursos virtuales de la UNED.
Antes de comenzar dicho material de estudio es conveniente, repasar algunos conceptos estadísticos básicos propios de una asignatura de grado de Estadística (ver, por ejemplo la referencia de Ramos et al. (2019) de la bibliografía complementaria, capítulos 1, 2 y 4 y/o realizar el Curso OCW UPCT con licencia CC (Creative Commons) referenciados en el apartado de Bibliografía complementaria de esta guía) y que básicamente son los siguientes:
- En Estadística (frecuentista) a menudo se está interesado en parámetros poblacionales que son constantes desconocidas y que se pretenden conocer.
- Dicho conocimiento se realiza a través de estimadores que son estadísticos muestrales y que tienen una naturaleza de variables aleatorias ya que varían de muestra a muestra.
- Si se conoce la distribución (el modelo teórico de probabilidad) de dichos estimadores se pueden calcular intervalos de confianza para el parámetro desconocido y estadísticos de contraste que permitan decidir sobre afirmaciones acerca de él.
- Para lograr los objetivos anteriores hay que recoger datos experimentales que se disponen en filas (individuos) y columnas (variables).
Tema 2: Índices de riesgo
Este tema explica las medidas básicas de riesgo en una tabla de contingencia (diferencia de riesgos, riesgo relativo y odds ratio). Los conceptos de este tema son básicos para poder interpretar la regresión logística del tema 8.
El material de estudio de este tema se detalla en el Manual Didáctico de esta asignatura, que se encuentra en el espacio correspondiente, en la plataforma de cursos virtuales de la UNED.
Antes de comenzar dicho material de estudio se recomienda refrescar los conceptos básicos de intervalos de confianza y contraste de hipótesis propios de una asignatura de grado de Estadística. Se puede consultar además de las referencias dadas en el tema 1, el glosario disponible en el curso virtual.
Tema 3: Técnicas diagnósticas
En el caso de que una variable explicativa se utilice para diagnosticar aparecen nuevos conceptos estadísticos como: sensibilidad y especificidad, valores predictivos, likelihood ratios y curvas ROC. Este tema es fundamental para entender el comportamiento del análisis discriminante lineal y de la regresión logística.
El material de estudio de este tema se detalla en el Manual Didáctico de esta asignatura, que se encuentra en el espacio correspondiente, en la plataforma de cursos virtuales de la UNED.
Tema 4: Introducción al aprendizaje supervisado
Se introducen los conceptos básicos del aprendizaje estadístico en general y del aprendizaje supervisado en particular.
El material de estudio de este tema se detalla en el Manual Didáctico de esta asignatura, que se encuentra en el espacio correspondiente, en la plataforma de cursos virtuales de la UNED.
Antes de comenzar dicho material de estudio se recomienda refrescar los conceptos básicos de esperanza y varianza propios de una asignatura de grado de Estadística. Se puede consultar además de las referencias dadas en el tema 1, el glosario disponible en el curso virtual.
Tema 5: Regresión lineal
En este tema se estudia el modelo básico de regresión lineal que modeliza una respuesta cuantitativa. Directamente se estudia el caso de varias variables explicativas, por lo que este tema requiere una especial concentración. Este tema es muy importante en el desarrollo del curso.
El material de estudio de este tema se detalla en el Manual Didáctico de esta asignatura, que se encuentra en el espacio correspondiente, en la plataforma de cursos virtuales de la UNED.
En este tema se utiliza álgebra matricial que se repasa en el curso virtual a través de pequeños ejercicios que se plantean en el foro.
Tema 6: Variantes del modelo de regresión lineal + Práctica 1
En este tema se tratan algunas variantes de modelos de regresión lineal como: ridge regression, LASSO, PCR o PLS. Para entender este tema es fundamental haber entendido perfectamente el tema anterior.
El material de estudio de este tema se detalla en el Manual Didáctico de esta asignatura, que se encuentra en el espacio correspondiente, en la plataforma de cursos virtuales de la UNED.
Tema 7: Análisis discriminante lineal
En este tema se estudia el primero de los modelos básicos de clasificación que modeliza una respuesta cualitativa. Este tema es importante desde un punto de vista histórico para entender los modelos de clasificación.
El material de estudio de este tema se detalla en el Manual Didáctico de esta asignatura, que se encuentra en el espacio correspondiente, en la plataforma de cursos virtuales de la UNED.
Tema 8: Regresión logística
En este tema se estudia el segundo de los modelos básicos de clasificación que modeliza una respuesta cualitativa. Este tema presenta uno de los modelos estadísticos más usados en la práctica. Además, se ponen en práctica todos los conceptos trabajados en temas anteriores que han servido de preparación a éste.
El material de estudio de este tema se detalla en el Manual Didáctico de esta asignatura, que se encuentra en el espacio correspondiente, en la plataforma de cursos virtuales de la UNED.
Tema 9: Evaluación y selección de modelos + Práctica 2
En este tema se describen los métodos principales de evaluación de modelos y cómo usar dichos métodos para elegir entre varios modelos.
El material de estudio de este tema se detalla en el Manual Didáctico de esta asignatura, que se encuentra en el espacio correspondiente, en la plataforma de cursos virtuales de la UNED.
Tema 10: Fundamentos de la inferencia bayesiana
En la estadística llamada clásica o frecuentista, los parámetros son constantes desconocidas que hay que estimar. Sin embargo, en la llamada estadística bayesiana, a los parámetros se les considera variables aleatorias. En este tema se dan los conceptos básicos de la inferencia bayesiana. Este tema es fundamental para los alumnos que cursen la asignatura optativa de modelos bayesianos jerárquicos.
El material de estudio de este tema se detalla en el Manual Didáctico de esta asignatura, que se encuentra en el espacio correspondiente, en la plataforma de cursos virtuales de la UNED.
Esta asignatura ha sido diseñada para la enseñanza a distancia. Por tanto, el sistema de enseñanza-aprendizaje estará basado en gran parte en el estudio independiente o autónomo del estudiante. Para ello, el estudiante contará con un Manual Didáctico que permitirá su trabajo autónomo. Asimismo, mediante la plataforma virtual de la UNED existirá un contacto continuo entre el equipo docente y los estudiantes, así como una interrelación entre los propios estudiantes a través de los foros, importantísimo en la enseñanza no presencial.
Las actividades formativas para el estudio de la asignatura son las siguientes:
- Estudios de contenidos: 54 horas.
- Tutorías: 6 horas.
- Actividades en la plataforma virtual: 15 horas.
- Prácticas informáticas: 60 horas.
- Trabajos: 15 horas.
Además, en esta asignatura la evaluación continua se hace a través de la participación en el foro y de dos prácticas. Estas dos formas de evaluación continua se detallan a continuación:
1. Participación en el foro
La puntuación de la participación en el foro será de 0 a 10.
Por cada participación relevante, el equipo docente dará un punto al alumno. Se entiende por participación relevante cuando se contesta de manera acertada la pregunta de otro alumno o cuando se comunica un aspecto interesante relacionado con la asignatura. No se considera relevante preguntar simplemente una pregunta con una duda en el foro.
El equipo docente para favorecer que cualquier estudiante pueda participar en el foro irá también haciendo preguntas cada semana, por lo que todo el mundo podrá optar a puntuar en este apartado, incluso aunque se incorpore tarde al estudio de la asignatura. No se tendrán en cuenta contestaciones repetidas de otros alumnos. Señalar, por último, que la experiencia demuestra que no es difícil conseguir la máxima puntuación y que no hay que agobiarse por conseguirla en las primeras semanas: ¡¡hay tiempo suficiente!!
El último día que se considera para poder puntuar en la participación en el foro es el 13 de Enero. En la plataforma virtual estará publicada una tarea desde finales de Octubre para que el estudiante rellene la fecha de su última aportación relevante. Esto permite que el equipo docente pueda decirle su nota con anterioridad a examinarse y en caso de que hubiera tiempo, incluso podría mejorarla. Para aquellos estudiantes que no puedan seguir el ritmo participativo del foro (a pesar de los beneficios que ello conlleva para el aprendizaje) se les ofrecerá una tarea de forma alternativa para sustituir dicha participación. Esta opción se publicará a finales de Octubre con fecha de entrega también el 13 de Enero.
Conviene remarcar que el equipo docente sólo evaluará la participación en el foro durante el semestre que se imparte la asignatura, aunque la nota se mantendrá para Septiembre. No obstante, en la convocatoria de Septiembre habrá también una tarea equivalente a la participación en el foro para aquellos que no hubieran participado durante el periodo lectivo (primer cuatrimestre), que se publicará a finales de Abril.
2. Prácticas
La puntuación de cada práctica será de 0 a 10. Es obligatorio aprobar las prácticas para aprobar la asignatura.
La primera práctica se publica a mediados de Noviembre y su fecha de entrega es en los primeros días de Diciembre. La segunda práctica se publica a mediados de Diciembre y su fecha de entrega es en los primeros días de Enero. No obstante, se dará una semana de prórroga en cada práctica aunque en ese caso sólo se podrá optar a un 9. Adicionalmente, para aquellos que no llegen a esa prórroga o que no aprueben las prácticas, se establecerán otras prácticas con fecha aproximada de entrega a finales de Enero. Esas nuevas prácticas se puntúan sobre 10 y no tendrán posibilidad de prórroga.
Las prácticas para la convocatoria de Septiembre se publicarán a finales de Abril y tendrán como fecha de entrega los primeros días de Septiembre, puntuándose sobre 10 y sin posibilidad de prórroga.
TIPO DE PRUEBA PRESENCIAL |
|
---|---|
Tipo de examen | |
Tipo de examen | Examen de desarrollo |
Preguntas desarrollo | |
Preguntas desarrollo | 6 |
Duración | |
Duración | 120 (minutos) |
Material permitido en el examen | |
Material permitido en el examen | Todo tipo de material escrito y calculadora programable. |
Criterios de evaluación | |
Criterios de evaluación | El examen consta de 6 preguntas de desarrollo similares a las que componen las prácicas. |
% del examen sobre la nota final | |
% del examen sobre la nota final | 50 |
Nota mínima del examen para aprobar sin PEC | |
Nota mínima del examen para aprobar sin PEC | |
Nota máxima que aporta el examen a la calificación final sin PEC | |
Nota máxima que aporta el examen a la calificación final sin PEC | |
Nota mínima en el examen para sumar la PEC | |
Nota mínima en el examen para sumar la PEC | 0 |
Comentarios y observaciones | |
Comentarios y observaciones | El examen podrá contener preguntas extraidas del texto base y del material alojado en el curso virtual: mini-libros, pácticas y exámenes de años anteriores y las preguntas más frecuentes (P+F) que el equipo docente extrae de las interacciones en los foros. |
CARACTERÍSTICAS DE LA PRUEBA PRESENCIAL Y/O LOS TRABAJOS | |
---|---|
CARACTERÍSTICAS DE LA PRUEBA PRESENCIAL Y/O LOS TRABAJOS |
|
Requiere Presencialidad | |
Requiere Presencialidad | Si |
Descripción | |
Descripción | La prueba presencial se describe en el apartado anterior. Los únicos trabajos evaluables en esta asignatura se describen en el apartado “PRUEBAS DE EVALUACIÓN CONTINUA (PEC)” y son no presenciales. |
Criterios de evaluación | |
Criterios de evaluación | |
Ponderación de la prueba presencial y/o los trabajos en la nota final | |
Ponderación de la prueba presencial y/o los trabajos en la nota final | |
Fecha aproximada de entrega | |
Fecha aproximada de entrega | |
Comentarios y observaciones | |
Comentarios y observaciones |
PRUEBAS DE EVALUACIÓN CONTINUA (PEC) | |
---|---|
PRUEBAS DE EVALUACIÓN CONTINUA (PEC) |
|
¿Hay PEC? | |
¿Hay PEC? | Si,PEC no presencial |
Descripción | |
Descripción | La evaluación continua en esta asignatura se hace a través de la participación en el foro y de dos prácticas. La información detallada se encuentra en el apartado de "Metodología" |
Criterios de evaluación | |
Criterios de evaluación | La participación en el foro y de cada práctica se evalúan de 0 a 10. Los criterios detallados se encuentran en el apartado de "Metodología". |
Ponderación de la PEC en la nota final | |
Ponderación de la PEC en la nota final | La ponderación de la participación en el foro es de un 10% y la de cada práctica de un 20%. |
Fecha aproximada de entrega | |
Fecha aproximada de entrega | Última participación Foro: 13-Ene; Práctica 1: primeros días Dic. Práctica 2: primeros días Ene. Septiembre: Práctica 1 y 2: primeros días Sep. |
Comentarios y observaciones | |
Comentarios y observaciones | Es obligatorio aprobar las prácticas para aprobar la asignatura. Por otra parte, en la convocatoria de Septiembre habrá una tarea equivalente a la participación en el foro y prácticas de Septiembre. Estas tareas se describirán en el curso virtual a finales de Abril. |
OTRAS ACTIVIDADES EVALUABLES |
|
---|---|
¿Hay otra/s actividad/es evaluable/s? | |
¿Hay otra/s actividad/es evaluable/s? | No |
Descripción | |
Descripción | |
Criterios de evaluación | |
Criterios de evaluación | |
Ponderación en la nota final | |
Ponderación en la nota final | |
Fecha aproximada de entrega | |
Fecha aproximada de entrega | |
Comentarios y observaciones | |
Comentarios y observaciones |
¿Cómo se obtiene la nota final? |
|
---|---|
Nota examen (Ex): 0-10. Nota práctica 1 (P1): 0-10. Nota práctica 2 (P2): 0-10. Nota participación curso virtual (F): 0-10. Nota final NF=0,5*Ex+0,2*P1+0,2*P2+0,1*F |
En el espacio de esta asignatura, en la plataforma de cursos virtuales de la UNED, se encuentra un Manual Didáctico específico donde se detalla todo el material de estudio. En algunos temas también se utilizará el siguiente libro:
-
James, G., Witten, D., Hastie, T., & Tibshirani, R. (2021). An introduction to statistical learning with Applications in R. New York: Springer. El libro está disponible en abierto desde el enlace https://www.statlearning.com/.
Existe una versión en Python, pero se utiliza la versión en R. En concreto, las páginas del libro ISLR que se van a trabajar son: 15-41, 71-104, 110-121, 133-152, 164-179, 185-189, 197-219 y 224-274.
La bibliografía complementaria de esta asignatura es:
-
Hosmer Jr, D. W., Lemeshow, S., & Sturdivant, R. X. (2013). Applied logistic regression. John Wiley & Sons.
-
Letón, E., & Pedromingo, A. (2001). Introducción al análisis de datos en meta-análisis. Díaz de Santos, Madrid.
-
Peña, D. (2013). Análisis de datos multivariantes. McGraw-Hill España.
-
Peña, D. (2014). Fundamentos de estadística. Alianza Editorial, Madrid.
-
Pepe, M. S. (2003). The statistical evaluation of medical tests for classification and prediction. Oxford University Press.
-
Ramos, E., Vélez, R. & Hernández, V. (2019). Modelos probabilísticos y optimización. Sanz y Torres, Madrid. Este libro es el que se recomienda para repasar los contenidos previos que se deben haber adquirido en el Grado.
-
Curso OCW UPCT con licencia CC (Creative Commons) en el enlace https://ocw.bib.upct.es/course/view.php?id=81&topic=8. Este curso es el que se recomienda para repasar los contenidos previos que se deben haber adquirido en el Grado.
En esta asignatura se utiliza el programa estadístico R, disponible en la página web de R.