Análisis Robusto de la Regresión

El Modelo Lineal es, sin duda, una de las técnicas estadísticas más utilizadas desde un punto de vista práctico. No obstante, el método de mínimos cuadrados, utilizado en la estimación de los parámetros  b0, ... , bk  que relacionan las  k   covariables   X1 , ... , Xk  , con la variable de respuesta  Y  mediante el modelo de regresión lineal de la forma

                       

es un método simple pero que proporciona  unos estimadores muy sensibles a la posible presencia de datos anómalos y a la no normalidad y homocedasticidad del error aleatorio  e.

En este capítulo estudiaremos las soluciones propuestas para resolver esta falta de robustez, analizando, en la sección segunda, el estimador de regresión de Huber y, en la sección tercera, el propuesto por Maronna y Yohai.

En la sección  cuarta se estudiarán otros métodos en la determinación de la Recta de Regresión Robusta.

Finalmente, en la sección quinta, se analizará el Análisis de la Covarianza Robusto.

Como ejemplo de las situaciones que vamos a resolver en este capítulo, consideremos los siguientes 13 pares de datos

 

 

27.1

20.9

33.4

77.6

37

21.6

17.6

35.1

32.6

26

27.6

38.7

27.8

 

19.7

18

26.1

15.7

26.1

19.9

15.7

27.6

24.9

23.4

23.1

31.3

23.8

La recta de mínimos cuadrados sería la de ecuación

                                           y = 23.165 - 0.0138 x

aunque su representación gráfica (la recta verde del siguiente dibujo) demuestra que, debido al dato anómalo (77.6, 15.7),  ésta no explica a la variable dependiente  Y  en función de la independiente  X

En este capítulo veremos que la M-recta de regresión robusta óptima, de ecuación

                             y = 8.748 + 0.5117 x

(recta azul del mismo dibujo), calculada con los trece datos, sí es más explicativa para la variable dependiente  Y  que la de mínimos cuadrados.