martes, 6 de febrero de 2018

Chi cuadrada como prueba de independencia de variables

CHI-CUADRADA COMO PRUEBA DE INDEPENDENCIA DE VARIABLES APLICADA A EVALUAR UNA POSIBLE ASOCIACIÓN ENTRE 2 ESPECIES.

La prueba de independencia Chi-cuadrada, nos permite determinar si existe una relación entre dos variables categóricas.

Cuando la probabilidad de que ocurra un evento aleatorio no esta afectada por la ocurrencia de otro evento entonces son variables independientes entre si, si por el contrario, la ocurrencia del evento aleatorio se ve afectada por la ocurrencia de otra, entonces se trata de variables  dependientes una de otra.

Es necesario resaltar que esta prueba nos indica si existe o no una relación entre las variables. pero no indica el grado o el tipo de relación; es decir, no indica el porcentaje de influencia de una variable sobre la otra o la variable que causa la influencia.

Por ejemplo si  en un colegio se quiere saber si el darle prioridad a tener buenas calificaciones o a ser popular o a participar en deportes es independiente de que el alumno sea niño o niña, esta seria la prueba que podría dar una respuesta, pero no nos va a decir cuales son las preferencias de las niñas y de los niños, eso lo sabremos al ver que opción es más frecuente en los niño o en las niñas.

Hoy vamos a trabajar con Chi cuadrada como prueba de independencia de variables y la vamos a aplicar  para ver si en un ecosistema dos especies se distribuyen independientemente o en función de algún tipo de asociación entre ellas.

En decir, las poblaciones  están distribuidas de forma desigual dentro del ecosistema debido a que algunas partes del hábitat son más adecuadas para algunas especies que para otras. Si dos especies se encuentran en las mismas partes de un hábitat, tenderán a ser encontradas juntas en las mismas zonas. Esto se conoce como asociación positiva. También puede haber asociaciones negativas (no se encuentran juntas), o la distribución de las dos especies puede ser independiente y aleatoriamente pueden encontrarse juntas o separadas. 

En esta prueba los datos experimentales se obtienen a partir de cuadrantes, que se aplican de la siguiente manera:

Primero se traza un cuadrante de ciertas dimensiones, por ejemplo de 10 por 10 metros y 
se ponen marcas a cada metro a lo largo ya lo ancho, después se asignan letras a cada metro a lo ancho y números a cada metro a lo largo y al azar se eligen combinaciones,por ejemplo D 8 en la intersección de ambos dentro del cuadrante grande se marca un cuadrado pequeño de 1 por 1 metro y ahi se ve si la especie 1 y/o la especie 2 se encuentran dentro de esa área.
Se contabiliza el numero de cuadrantes que presentan una de las 4 posibilidades:

Especie A ausente, B ausente, 
Especie A presente B ausente, 
Especie A ausente B presente o 
Especie A presente y B presente

Por Ejemplo

Especie A presente
Especie A ausente
Especie B presente
 54
 6

Especie B ausente
 10
 19






Hay dos posibles hipótesis:
Ho: Las dos especies se distribuyen de forma independiente.
Ha: Dos especies se asocian (positiva o negativamente)

La prueba de Chi-cuadrado es válida sólo si todas las frecuencias esperadas son mayores a 5, y la muestra fue tomada al azar dentro de la población.

1.       Elaborar una tabla de contingencia de frecuencias observadas, que son el número de cuadrantes que contienen o no cada una de las especies.

Especie A presente
Especie A ausente
Total en la fila
Especie B presente



Especie B ausente



Total en columna



En la celda amarilla se obtiene el gran total.
2.       Calcular las frecuencias esperadas: Asumiendo una distribución independiente para cada una de las 4 combinaciones, se calcula cada frecuencia esperada usando la ecuación siguiente:
  
3.       Calcular los grados de libertad usando la ecuación:   grados de libertad =  (m-1)(n-1)  donde m y n son el número de filas (m) y de columnas (n).
4.       Calcular la chi-cuadrada con la ecuación:
               
               donde Σ es sumatoria, ƒo la frecuencia observada y ƒe la frecuencia esperada.
5.       Para este cálculo se construye la siguiente tabla con las frecuencias observadas y esperadas para las 4 posibilidades
Cuadrantes con Especie
Frecuencia observada
 Frecuencia
Esperada (obtenida en el punto 2)
Solo A



Solo B



A y B



Ni A ni B



Σ



En el cuadro resalado en amarillo se obtendrá la sumatoria de esa columna que es el valor de X2 calculado y que se compara con el de tablas.
6.       Encuentre el valor crítico en la tabla de Chi-cuadrada de acuerdo a los grados de libertad obtenidos y a un nivel de significancia (p) de 0.05 (5%). (La región crítica es todo valor mayor que el encontrado en la tabla).

7.       Comparar el valor obtenido en la ecuación, con el de la tabla. Si el valor obtenido está en la región crítica (mayor que el encontrado en la tabla) se rechaza la Ho, se acepta entonces la Ha, indicando entonces con un nivel de confianza del 95%,  que hay asociación entre las 2 especies.