Análisis de la Varianza clásico

En el capítulo de tests de hipótesis estudiamos técnicas con las que comparar dos poblaciones independientes. El Análisis de la varianza es la técnica diseñada para comparar más de dos poblaciones.

Mediante esta técnica se divide la variación total, existente en un conjunto de datos, en diversas fuentes de variación, y se valora, mediante un contraste de hipótesis, si la aportación relativa de cada una de estas fuentes de variación a la variación total, es significativa o no.

La técnica del Análisis de la Varianza, introducida en los años cincuenta por Sir Ronald Fisher, es utilizada, fundamentalmente, en el análisis de datos procedentes de experimentos, los cuales, por otra parte, son diseñados teniendo en cuenta el futuro análisis de la varianza que se hará de sus resultados: El investigador, antes de realizar su experimento, identifica aquellas fuentes de variación que considera importantes y elige un diseño que le permita medir la
importancia de la contribución de cada una de estas fuentes a la variación total.

Del análisis de los datos se perseguirán, fundamentalmente, dos propósitos: La comparación de las medias de r > 2 poblaciones, generalizando así los resultados del capítulo anterior, y la estimación de la varianza -común- de las r poblaciones.

Además, determinados diseños permiten realizar la comparación de poblaciones eliminando de la variación total aquellas otras fuentes de variación debidas a causas perturbadoras y sin interés en dicha comparación.

Apuntamos, no obstante, que estas técnicas requieren, para ser válidos sus resultados, que las poblaciones tengan distribución normal (normalidad) con igual varianza (homocedasticidad), suposiciones ambas de difícil cumplimiento, siguiendo habitualmente necesario, por tanto, realizar un Análisis de la Varianza robusto.