domingo, 21 de junio de 2009

ANOVA

ANOVA



Análisis de la varianza se utiliza para comparar entre sí, las medias de los resultados derivados por diversos laboratorios, analistas, métodos de análisis, etc.

Es una herramienta para la Estadística, de gran provecho tanto en la industria, para el control de procesos, como en el laboratorio de análisis, para el control de métodos analíticos. Los ejemplos de uso son múltiples, pudiéndose agrupar, según el objetivo que persiguen, en dos principalmente: la comparación de múltiples columnas de datos y la estimación de los componentes de variación de un proceso.


Para utilizar el ANOVA de forma satisfactoria deben cumplirse tres tipos de
hipótesis, aunque se aceptan ligeras desviaciones de las condiciones ideales:


1. Cada conjunto de datos debe ser independiente del resto.

2. Los resultados obtenidos para cada conjunto deben seguir una distribución
normal.

3. Las varianzas de cada conjunto de datos no deben diferir de forma
significativa.


La distribución F también se usa para probar la igualdad de más de dos medias con la técnica llamada análisis de variancia (ANOVA).

Procedimiento de análisis de varianza:

Hipótesis nula:

Las medias de las poblaciones son iguales. Hipótesis alterna: al menos una de las medias es diferente.

Estadístico de prueba:

F = (variancia entre muestras) / (variancia dentro de muestras).

Regla de decisión:

Para un nivel de significancia a, la hipótesis nula se rechaza si F (calculada) es mayor que F (en tablas) con grados de libertad en el numerador y en el denominador.

Formulas:

Prueba de hipótesis de la diferencia de dos medias muestrales

Prueba de hipótesis de la diferencia de dos medias muestrales

Se utiliza para decidir si las medias de dos poblaciones son iguales. Con frecuencia se aplican estas pruebas en la comparación de dos métodos de enseñanza.

Procedimiento

1.- Planteamiento de la hipótesis 2.- Determinar el estadístico de prueba

De acuerdo a su tamaño muestral y si se conoce la δ se derivan dos métodos:

a) Cuando δ2 es conocida:


b) Cuando δ2 es desconocida y además n1 y n2 son > 30.


c) Cuando δ2 es desconocida y además n1 y n2 son <>



Donde S2p es el estimador ponderado de la varianza.

3.- Fijar el nivel de significación de la prueba


4.- Establecer la regla de decisión


5.- Realizar los cálculos


6.- Tomar la decisión




Prueba de Hipótesis

Estadísticamente una prueba de hipótesis es cualquier afirmación acerca de una población y/o sus parámetros.

Una prueba de hipótesis consiste en contrastar dos hipótesis estadísticas. Tal contraste involucra la toma de decisión acerca de las hipótesis. La decisión consiste en rechazar o no una hipótesis en favor de la otra. Una hipótesis estadística se denota por “H” y son dos:

- Ho: hipótesis nula
- H1: hipótesis alternativa

Partes de una hipótesis

1-La hipótesis nula “Ho”
2-La hipótesis alternativa “H1”
3-El estadístico de prueba
4-Errores tipo I y II
5-La región de rechazo (crítica)
6-La toma de decisión

Hipótesis nula H0:

Afirmación acerca del valor de un parámetro poblacional.


Hipótesis alterna H1:

Afirmación que se aceptará si los datos muestrales proporcionan evidencia de que la hipótesis nula es falsa.


Región Crítica o de Rechazo:

Una región crítica o de rechazo es una parte de la curva de z o de la curva t donde se rechaza H0.


Nivel de significancia:

Probabilidad de rechazar la hipótesis nula cuando es verdadera.


La región puede ser de una cola o de dos dependiendo de la hipótesis alterna.


Error Tipo I:

Rechazar la hipótesis nula cuando en realidad es verdadera.


Error Tipo II:

Aceptar la hipótesis nula cuando en realidad es falsa.


Estadístico de prueba:

Valor obtenido a partir de la información muestral, se utiliza para determinar si se rechaza o no la hipótesis.


Valor crítico:

El punto que divide la región de aceptación y la región de rechazo de la hipótesis nula.

Cuando se realiza una prueba para la media poblacional de una muestra grande y se conoce la desviación estándar:

Aquí σ es desconocida y el tamaño de muestra n sea mayor a 30:

En la prueba para una media poblacional con muestra pequeña (menor o igual a 30) y desviación estándar poblacional desconocida se utiliza el valor estadístico t.