Asignatura grado 2027
- Guía de la Asignatura Curso 2026/2027
- Primeros Pasos
- Presentación y contextualización
- Requisitos y/o recomendaciones para cursar esta asignatura
- Equipo docente
- Horario de atención al estudiante
- Competencias que adquiere el estudiante
- Resultados de aprendizaje
- Contenidos
- Metodología
- Sistema de evaluación
- Bibliografía básica
- Bibliografía complementaria
- Recursos de apoyo y webgrafía
Código Asignatura: 71031056
La guía de la asignatura ha sido actualizada con los cambios que aquí se mencionan.
| Nombre y apellidos | RUBEN HERADIO GIL (Coordinador/a de asignatura) |
| Correo electrónico | rheradio@issi.uned.es |
| Teléfono | 91398-8242 |
| Facultad | ESCUELA TÉCN.SUP INGENIERÍA INFORMÁTICA |
| Departamento |
| Nombre y apellidos | ERNESTO ARANDA ESCOLASTICO |
| Correo electrónico | earandae@issi.uned.es |
| Teléfono | 91398-8257 |
| Facultad | ESCUELA TÉCN.SUP INGENIERÍA INFORMÁTICA |
| Departamento |
| Nombre y apellidos | DAVID JOSE FERNANDEZ AMOROS |
| Correo electrónico | david@issi.uned.es |
| Teléfono | 91398-8241 |
| Facultad | ESCUELA TÉCN.SUP INGENIERÍA INFORMÁTICA |
| Departamento |
| NOMBRE DE LA ASIGNATURA | |
|---|---|
| NOMBRE DE LA ASIGNATURA | FUNDAMENTOS DE ESTADÍSTICA PARA LA IA |
| CÓDIGO | |
| CÓDIGO | 71031056 |
| CURSO ACADÉMICO | |
| CURSO ACADÉMICO | 2026/2027 |
| DEPARTAMENTO | |
| DEPARTAMENTO | INGENIERÍA DEL SOFTW. Y SIST. INFORMÁTICOS |
| TÍTULO EN QUE SE IMPARTE | |
| TÍTULO EN QUE SE IMPARTE | |
| GRADO EN INGENIERÍA EN INTELIGENCIA ARTIFICIAL | |
| CURSO | |
| CURSO | PRIMER CURSO |
| PERIODO | SEMESTRE 2 |
| TIPO | FORMACIÓN BÁSICA |
| Nº ECTS | |
| Nº ECTS | 6 |
| HORAS | |
| HORAS | 150 |
| IDIOMAS EN QUE SE IMPARTE | |
| IDIOMAS EN QUE SE IMPARTE | CASTELLANO |
El objetivo de esta asignatura es abordar los fundamentos de la estadística e introducir, de manera progresiva y sistemática, los conceptos necesarios para un análisis adecuado de datos mediante el lenguaje de programación R.
La asignatura se imparte en el segundo cuatrimestre del primer curso; cuenta con una carga docente de 6 créditos y forma parte de la materia de Matemáticas y Estadística, con carácter de formación básica para el Grado en Ingeniería en Inteligencia Artificial.
Como asignatura introductoria de los fundamentos estadísticos, prepara para los contenidos de otras asignaturas del grado, tales como "Fundamentos de modelado estadístico de datos", "Modelos probabilistas y análisis de decisiones" y "Aprendizaje automático I, II y III".
Esta asignatura contribuye al perfil profesional del graduado en Ingeniería en Inteligencia Artificial, quien debe ser capaz de analizar, interpretar y comunicar datos con rigor estadístico. Los conocimientos y habilidades adquiridos son directamente aplicables al diseño, la evaluación y la interpretación de sistemas de IA que aprenden a partir de datos.
Esta asignatura, de carácter introductorio, no exige requisitos previos más allá de los conocimientos generales propios de este nivel educativo y de la competencia básica en el uso de un computador personal. Se recomienda haber cursado la asignatura "Fundamentos de cálculo para la IA" (impartida en el primer cuatrimestre del mismo curso), así como poseer nociones básicas de programación adquiridas en "Fundamentos de programación".
La tutorización presencial de la asignatura se impartirá en los Centros Asociados correspondientes. La tutorización virtual o el seguimiento de los aprendizajes se realiza a través del Curso Virtual de la asignatura, implementado en la plataforma oficial de la UNED para las enseñanzas oficiales. A dicha plataforma se accede desde la página principal de la web de la UNED, utilizando las claves facilitadas al formalizar la matrícula.
Para cualquier consulta adicional, el lugar y horario de atención al alumno son los indicados a continuación:
Lugar: locales de la ETSI de Informática de la UNED. Edificio Interfacultativo. C/ Juan del Rosal, 16. Departamento de Ingeniería de Software y Sistemas Informáticos.
Teléfonos:
- 913988242 (Martes de 10 a 14 h.)
- 913988257 (Martes de 10 a 14 h.)
- 913988241 (Miércoles de 9:30 a 13:30 h.)
Correos electrónicos:
- rheradio@issi.uned.es: Rubén Heradio Gil
- earandae@issi.uned.es: Ernesto Aranda Escolástico
- david@issi.uned.es: David José Fernández Amorós
El equipo docente también atiende consultas a través del Curso Virtual de la asignatura.
En el enlace que aparece a continuación se muestran los centros asociados y extensiones en las que se imparten tutorías de la asignatura. Estas pueden ser:
Tutorías de centro o presenciales: se puede asistir físicamente en un aula o despacho del centro asociado.
Tutorías campus/intercampus: se puede acceder vía internet.
Horarios de FUNDAMENTOS DE ESTADÍSTICA PARA LA IA
Cargando, esto puede tardar un poco...
Las competencias se definen en función de los resultados de aprendizaje RA01 y RA13.
La asignatura persigue los siguientes resultados de aprendizaje genéricos:
RA01 - Al finalizar el aprendizaje, el o la estudiante será capaz de aplicar los conocimientos necesarios de álgebra, cálculo, análisis, matemática discreta, lógica y estadística para resolver los problemas generales planteados en ingeniería informática.
RA13 - Al finalizar el aprendizaje, el o la estudiante será capaz de demostrar conocimiento básico de las diferentes subdisciplinas de la ingeniería informática y de las técnicas básicas y conocimientos de las mismas para la integración en equipos multidisciplinares como profesional en ingeniería informática.
Más específicamente, la asignatura proporciona los siguientes resultados de aprendizaje:
- Resolver problemas estadísticos sencillos a partir de un conjunto de datos.
- Diseñar análisis exploratorios y visualizaciones que respondan a preguntas bien planteadas.
- Seleccionar el contraste de hipótesis, la distribución o el modelo más adecuados para cada situación.
- Realizar pruebas de validación e interpretar críticamente los resultados de un análisis.
- Abordar metodológicamente proyectos sencillos de análisis de datos.
- Dominar un lenguaje y un entorno de programación estadística (R/RStudio) acordes con el contenido de la materia.
Tema 1: Entorno de trabajo
El objetivo de este tema es introducir el entorno de trabajo basado en R y RStudio, así como los elementos básicos del lenguaje necesarios para manejar datos. Se cubren la instalación del entorno, la importación de conjuntos de datos y los tipos de datos más frecuentes en el análisis estadístico.
Palabras clave: R, RStudio, tibble, vector, factor, importación de datos, función, paquete.
Contenido de mayor dificultad: programación básica en R (estructuras de control e iteración) y la escritura de funciones propias.
Tema 2: Estadística descriptiva: visualización y resumen de datos
En este tema se presenta el conjunto mínimo de técnicas para visualizar y resumir datos, distinguiendo entre el tratamiento de variables numéricas y categóricas, así como entre la correlación entre variables. Se hace especial énfasis en la selección de la visualización adecuada en función del tipo de variable y de la pregunta analítica que se desea responder.
Palabras clave: histograma, diagrama de densidad, media, mediana, desviación típica, cuartil, diagrama de caja, correlación de Pearson, correlación de Spearman.
Contenido de mayor dificultad: interpretación conjunta de medidas de tendencia central y de dispersión; elección entre correlación lineal y no lineal según las características de los datos.
Tema 3: Limpieza, organización y transformación de datos
Este tema complementa el anterior con las herramientas necesarias para preparar conjuntos de datos reales para su análisis estadístico. Se trabaja con el ecosistema tidyverse de R e introduce el concepto de tidy data como fundamento para la producción de análisis reproducibles.
Palabras clave: filter, mutate, group_by, summarize, pivot_longer, pivot_wider, datos tidy.
Contenido de mayor dificultad: comprensión del concepto de datos tidy y de la transformación entre formatos largo y ancho (pivot_longer/pivot_wider).
Tema 4: Modelando el azar. Principios de la probabilidad
En este tema se abordan los primeros conceptos formales del cálculo de probabilidades, tanto en el caso discreto como en el continuo. El tema sienta las bases probabilísticas necesarias para la inferencia estadística y el modelado.
Palabras clave: probabilidad, distribución de probabilidad, probabilidad marginal, probabilidad condicional, probabilidad conjunta, teorema de Bayes, función de densidad.
Contenido de mayor dificultad: probabilidad condicional y conjunta en el caso continuo; aplicación del teorema de Bayes.
Tema 5: Modelando el azar. Distribuciones
En este tema se presentan los conceptos de variable aleatoria, esperanza matemática, varianza y las distribuciones de uso más frecuente en el modelado, junto con la transformada integral de probabilidad. El conocimiento de estas distribuciones resulta fundamental para seleccionar modelos apropiados en la práctica estadística.
Palabras clave: variable aleatoria, esperanza, varianza, distribución uniforme, distribución Bernouilli, distribución binomial, distribución normal, distribución de Poisson, distribución exponencial, transformada integral de probabilidad.
Contenido de mayor dificultad: la transformada integral de probabilidad y la comprensión de cuándo aplicar cada distribución.
Tema 6: Correlación no implica causalidad
En este tema se introducen los diagramas causales y los principales sesgos que pueden llevar a conclusiones causales erróneas a partir de correlaciones observadas. Se analiza la diferencia entre estudios observacionales y experimentales, y se discuten los fundamentos del diseño cuasiexperimental.
Palabras clave: causalidad, correlación, diagrama causal, factor de confusión, colisión, sesgo, diseño experimental, estudio observacional, diseño cuasiexperimental.
Contenido de mayor dificultad: distinción entre factores de confusión y de colisión; análisis de estudios cuasiexperimentales.
Tema 7: Propiedades de las muestras y su relación con las poblaciones
En este tema se introducen los conceptos centrales de la inferencia estadística clásica: el teorema central del límite, los intervalos de confianza y el contraste de hipótesis. Se presenta también el bootstrapping como una técnica de simulación alternativa a los métodos paramétricos.
Palabras clave: tamaño muestral, teorema central del límite, distribución t, intervalo de confianza, contraste de hipótesis, valor p, bootstrapping.
Contenido de mayor dificultad: interpretación correcta del intervalo de confianza y del valor p; comprensión del teorema central del límite.
Tema 8: Comparación de dos grupos de datos continuos
Este tema se dedica a la comparación de dos grupos de datos continuos mediante contrastes paramétricos y no paramétricos. Se estudian tanto el caso de datos apareados como el de datos independientes, e incorpora el concepto de tamaño del efecto como complemento necesario del p-valor.
Palabras clave: datos apareados, datos independientes, t-test, significancia estadística, tamaño del efecto, test de equivalencia, TOST, test no paramétrico.
Contenido de mayor dificultad: distinción entre significancia estadística y relevancia práctica (tamaño del efecto); test de equivalencia (TOST).
Tema 9: Comparación de más de dos grupos de datos continuos
En este tema se generaliza el contraste de dos grupos al caso de más de dos grupos mediante el análisis de la varianza (ANOVA). Se estudian tanto el ANOVA de un factor como el ANOVA de medidas repetidas, junto con los errores de inferencia y su relación con el tamaño muestral.
Palabras clave: ANOVA, error de tipo I, error de tipo II, one-way ANOVA, repeated measures ANOVA, test post-hoc, tamaño del efecto.
Contenido de mayor dificultad: ANOVA de medidas repetidas y tests post-hoc; relación entre errores de tipo I y II y tamaño muestral.
Tema 10: El motor predictivo básico de la estadística: la regresión lineal
En este tema se introduce el modelo de regresión lineal como herramienta fundamental para el modelado predictivo y como generalización de los contrastes vistos hasta el momento. Se analizan tanto el caso simple como el múltiple, con énfasis en la interpretación de los coeficientes y en el diagnóstico del modelo.
Palabras clave: regresión lineal, mínimos cuadrados, coeficiente de determinación (R²), intercept, p-valor, error estándar, multicolinealidad, interacción de variables.
Contenido de mayor dificultad: interpretación de coeficientes en presencia de interacciones y multicolinealidad; regresión con múltiples variables independientes.
Tema 11: Predicción de una variable discreta
En este tema se completa el repertorio de técnicas predictivas básicas con los métodos para predecir variables discretas. Se introduce la regresión logística y se estudian los contrastes de independencia para variables categóricas.
Palabras clave: variable discreta, test χ², test de Fisher, regresión logística, función sigmoide, máxima verosimilitud, odds ratio.
Contenido de mayor dificultad: el estimador de máxima verosimilitud; la interpretación del odds ratio en la regresión logística.
Tema 12: De la estadística a la IA: redes neuronales y LLMs
Este tema sirve de puente entre la estadística clásica y las técnicas modernas de la Inteligencia Artificial, mostrando cómo los modelos estudiados se generalizan a las redes neuronales y a los modelos de lenguaje (LLMs). Se introduce el perceptrón y se discuten las limitaciones de los LLMs, así como las estrategias para superarlas.
Palabras clave: perceptrón, red neuronal, LLM, embedding, aprendizaje supervisado, aprendizaje no supervisado, aprendizaje por refuerzo, fine tuning, RAG.
Contenido de mayor dificultad: arquitectura global de un LLM; estrategias para superar las limitaciones de los LLMs (fine-tuning y RAG).
La metodología seguida para el aprendizaje de esta asignatura es la propia de una universidad a distancia, caracterizada por el empleo conjunto de medios impresos, audiovisuales y de las nuevas tecnologías. Los materiales docentes específicos, las comunidades virtuales de aprendizaje, la asistencia presencial a los estudiantes a través de los profesores tutores de los Centros Asociados y el uso de diversos sistemas de comunicación (teléfono, videoconferencia, correo electrónico, etc.) son los medios con los que cuenta la UNED para la enseñanza a distancia, y todos ellos se emplean en esta asignatura.
Entre las estrategias de aprendizaje recomendadas para esta asignatura se encuentran las siguientes:
- Leer cada tema del libro de texto.
- Reproducir activamente los análisis en R durante el estudio de cada tema, utilizando los conjuntos de datos proporcionados.
- Realizar los ejercicios de autoevaluación al final de cada tema antes de continuar con el siguiente. Los enunciados y soluciones de estos ejercicios están disponibles en el libro de texto base de la asignatura. Se recomienda resolverlos de forma autónoma antes de consultar las soluciones, prestando especial atención a los contenidos de mayor dificultad de cada tema.
- Participar en los foros del Curso Virtual para contrastar interpretaciones y resolver dudas con el equipo docente y con los compañeros.
TIPO DE PRUEBA PRESENCIAL |
|
|---|---|
| Tipo de examen | |
| Tipo de examen | Examen tipo test |
| Preguntas test | |
| Preguntas test | 20 |
| Duración | |
| Duración | 120 (minutos) |
| Material permitido en el examen | |
| Material permitido en el examen |
|
| Criterios de evaluación | |
| Criterios de evaluación | El examen será de tipo test y constará de:
Los contenidos evaluados abarcan todos los temas del programa. Cada pregunta evalúa una o varias de las dimensiones siguientes:
|
| % del examen sobre la nota final | |
| % del examen sobre la nota final | 70 |
| Nota mínima del examen para aprobar sin PEC | |
| Nota mínima del examen para aprobar sin PEC | 5 |
| Nota máxima que aporta el examen a la calificación final sin PEC | |
| Nota máxima que aporta el examen a la calificación final sin PEC | 4 |
| Nota mínima en el examen para sumar la PEC | |
| Nota mínima en el examen para sumar la PEC | 5 |
| Comentarios y observaciones | |
| Comentarios y observaciones | |
PRUEBAS DE EVALUACIÓN CONTINUA (PEC) |
|
|---|---|
| ¿Hay PEC? | |
| ¿Hay PEC? | Si |
| Descripción | |
| Descripción | La PEC consiste en una práctica obligatoria en la que los estudiantes aplican conceptos estadísticos fundamentales a un conjunto de datos reales, utilizando R para el análisis exploratorio, la visualización y contrastes de hipótesis básicos. |
| Criterios de evaluación | |
| Criterios de evaluación |
La práctica se evaluará atendiendo a los criterios siguientes:
|
| Ponderación de la PEC en la nota final | |
| Ponderación de la PEC en la nota final | 30% |
| Fecha aproximada de entrega | |
| Fecha aproximada de entrega | |
| Comentarios y observaciones | |
| Comentarios y observaciones | |
OTRAS ACTIVIDADES EVALUABLES |
|
|---|---|
| ¿Hay otra/s actividad/es evaluable/s? | |
| ¿Hay otra/s actividad/es evaluable/s? | No |
| Descripción | |
| Descripción | |
| Criterios de evaluación | |
| Criterios de evaluación | |
| Ponderación en la nota final | |
| Ponderación en la nota final | |
| Fecha aproximada de entrega | |
| Fecha aproximada de entrega | |
| Comentarios y observaciones | |
| Comentarios y observaciones | |
¿Cómo se obtiene la nota final? |
|
|---|---|
La calificación final de la asignatura:
|
|
ISBN(13): 9781446200469
Título: DISCOVERING STATISTICS USING R 1 Autor/es: Andy Field;Jeremy Miles;Zoe Field; Editorial: SAGE PUBLICATIONS LTD |
|
ISBN(13): 9781492097402
Título: R FOR DATA SCIENCE: IMPORT, TIDY, TRANSFORM, VISUALIZE, AND MODEL DATA 2 Autor/es: Hadley Wickham;Mine Cetinkaya-Rundel;Garrett Grolemund; Editorial: O'REILLY |
Los recursos de apoyo de la asignatura se organizan en cinco categorías: entorno de programación, tutoriales y libros en línea, estadística, visualización de datos, y recursos audiovisuales y comunidades.
Entorno de programación
- Documentación oficial de R: https://www.r-project.org/
Portal principal del proyecto R. Incluye los manuales de referencia (An Introduction to R, R Data Import/Export, Writing R Extensions) y los archivos de instalación para todos los sistemas operativos. - Documentación oficial de RStudio (Posit): https://posit.co/
Sitio del IDE recomendado para la asignatura. Contiene la documentación de RStudio, guías de inicio rápido y los cheat sheets (resúmenes visuales de una página) de los principales paquetes, disponibles en: https://posit.co/resources/cheatsheets/ - CRAN Task Views: https://cran.r-project.org/web/views/
Índice curado de paquetes de R, organizado por área temática. Los Task Views de Statistics y Machine Learning agrupan los paquetes más relevantes para los contenidos de la asignatura.
Tutoriales y libros de R en línea
- R for Data Science (2.ª ed., acceso libre): https://r4ds.hadley.nz/
Manual de referencia sobre el ecosistema Tidyverse (Hadley Wickham y colaboradores). Cubre la importación, transformación, visualización y comunicación de datos con R. - Hands-On Programming with R (acceso libre): https://rstudio-education.github.io/hopr/
Introducción a la programación en R para quienes no tienen experiencia previa. Especialmente útil para los temas 1-3 de la asignatura. - Documentación del Tidyverse: https://www.tidyverse.org/
Portal de la colección de paquetes del Tidyverse (dplyr, ggplot2, tidyr, purrr, etc.) con tutoriales, referencias de funciones y artículos técnicos.
Estadística
- OpenIntro Statistics (4.ª ed., acceso libre: https://www.openintro.org/book/os/
Manual de estadística introductoria con enfoque aplicado. Ofrece una versión en PDF de acceso libre, ejercicios resueltos y laboratorios en R. - Introduction to Statistical Learning with Applications in R (2.ª ed., acceso libre): https://www.statlearning.com/
Texto de referencia en estadística aplicada al aprendizaje automático. Cubre regresión, clasificación, remuestreo y métodos no supervisados con implementaciones en R, lo que facilita la conexión entre los contenidos estadísticos del curso y su proyección hacia la IA. - Khan Academy — Estadística y probabilidad (en español):https://es.khanacademy.org/math/statistics-probability
Recurso en español con lecciones interactivas, ejercicios y vídeos sobre conceptos estadísticos fundamentales. Útil para repasar o afianzar los contenidos teóricos de los temas 4 y 5.
Visualización de datos
- The R Graph Gallery: https://r-graph-gallery.com/
Galería de visualizaciones reproducibles en R con el código fuente de cada gráfico. Cubre desde representaciones básicas hasta visualizaciones avanzadas con ggplot2. - From Data to Viz: https://www.data-to-viz.com/
Guía interactiva para seleccionar el tipo de gráfico más adecuado según la naturaleza de los datos (categóricos, numéricos, temporales, geoespaciales, etc.).
Recursos audiovisuales y comunidades
- Podcasts de la asignatura (Curso Virtual, plataforma Ágora)
Para cada uno de los doce temas del programa, existe un episodio de pódcast en el que el equipo docente presenta los conceptos clave, comenta los errores de interpretación más frecuentes y propone orientaciones de estudio. Los episodios estarán disponibles en el Curso Virtual y podrán escucharse sin necesidad de conexión a internet una vez descargados. - Canal StatQuest with Josh Starmer (YouTube): https://www.youtube.com/@statquest
Canal en inglés con explicaciones visuales de conceptos estadísticos y de aprendizaje automático. Especialmente recomendado para los temas de probabilidad (4-5), regresión (10-11) y redes neuronales (12). - Posit Community — https://forum.posit.co/
Foro oficial de la comunidad de Posit/RStudio, especialmente útil para cuestiones relacionadas con el entorno de desarrollo y los paquetes del Tidyverse.