
ANÁLISIS ROBUSTO DE LA REGRESIÓN
El Modelo Lineal es, sin duda, una de las técnicas estadísticas más utilizadas desde un punto de vista práctico. No obstante, el método de mínimos cuadrados, utilizado en la estimación de los parámetros b0, ... , bk que relacionan las k covariables X1 , ... , Xk , con la variable de respuesta Y mediante el modelo de regresión lineal de la forma
es un método simple pero que proporciona unos estimadores muy sensibles a la posible presencia de datos anómalos y a la no normalidad y homocedasticidad del error aleatorio e.
En este capítulo estudiaremos las soluciones propuestas para resolver esta falta de robustez, analizando, en la sección segunda, el estimador de regresión de Huber y, en la sección tercera, el propuesto por Maronna y Yohai.
En la sección cuarta se estudiarán otros métodos en la determinación de la Recta de Regresión Robusta.
Finalmente, en la sección quinta, se analizará el Análisis de la Covarianza Robusto.
Como ejemplo de las situaciones que vamos a resolver en este capítulo, consideremos los siguientes 13 pares de datos
|
27.1 |
20.9 |
33.4 |
77.6 |
37 |
21.6 |
17.6 |
35.1 |
32.6 |
26 |
27.6 |
38.7 |
27.8 |
|
19.7 |
18 |
26.1 |
15.7 |
26.1 |
19.9 |
15.7 |
27.6 |
24.9 |
23.4 |
23.1 |
31.3 |
23.8 |
La recta de mínimos cuadrados sería la de ecuación
y = 23.165 - 0.0138 x
aunque su representación gráfica (la recta verde del siguiente dibujo) demuestra que, debido al dato anómalo (77.6, 15.7), ésta no explica a la variable dependiente Y en función de la independiente X
En este capítulo veremos que la M-recta de regresión robusta óptima, de ecuación
y = 8.748 + 0.5117 x
(recta azul del mismo dibujo), calculada con los trece datos, sí es más explicativa para la variable dependiente Y que la de mínimos cuadrados.