Análisis de la Varianza clásico
En el capítulo de tests de hipótesis estudiamos técnicas con las que comparar dos poblaciones independientes. El Análisis de la varianza es la técnica diseñada para comparar más de dos poblaciones.
Mediante esta técnica se divide
la variación total, existente en un conjunto de datos, en diversas fuentes de
variación, y se valora, mediante un contraste de hipótesis, si la aportación
relativa de cada una de estas fuentes de variación a la variación total, es
significativa o no.
La técnica del Análisis de la Varianza, introducida en los años cincuenta por
Sir Ronald Fisher, es utilizada, fundamentalmente, en el análisis de datos
procedentes de experimentos, los cuales, por otra parte, son diseñados teniendo
en cuenta el futuro análisis de la varianza que se hará de sus resultados: El
investigador, antes de realizar su experimento, identifica aquellas fuentes de
variación que considera importantes y elige un diseño que le permita medir la
importancia de la contribución de cada una de estas fuentes a la variación
total.
Del análisis de los datos se perseguirán, fundamentalmente, dos propósitos: La
comparación de las medias de r > 2 poblaciones, generalizando así los resultados
del capítulo anterior, y la estimación de la varianza -común- de las r
poblaciones.
Además, determinados diseños permiten realizar la comparación de poblaciones
eliminando de la variación total aquellas otras fuentes de variación debidas a
causas perturbadoras y sin interés en dicha comparación.
Apuntamos, no obstante, que estas técnicas requieren, para ser válidos sus resultados, que las poblaciones tengan distribución normal (normalidad) con igual varianza (homocedasticidad), suposiciones ambas de difícil cumplimiento, siguiendo habitualmente necesario, por tanto, realizar un Análisis de la Varianza robusto.