miércoles, 30 de noviembre de 2016

TAREA 3 SEGUNDO PERIODO

Hola chicos les mando la última tarea de este periodo, la idea es que les sirva de repaso, ya que así va a ser el examen con estos tipos de ejercicios, es decir 1 de T de Student, uno de correlación y 1 de Ji cuadrada como bondad de ajuste. Además aprovechen para subir su calificación de tareas, teniendo en cuenta que los ejercicios anteriores se resolvieron en clase para que corrigieran sus errores, espero que en esta saquen excelentes calificaciones.

Ya saben que poner en el nombre del archivo y en el asunto del correo, también saben a que correo enviarlo, NO SE EQUIVOQUEN.

Tienen hasta el lunes 5 de diciembre a las 10 de la noche para enviarlo.


Saludos y suerte.

NOTA LA COLUMNA DONDE VAN A PONER EL CÁLCULO DE LA JI CUADRADA TIENE FORMATO PARA PONER NÚMEROS ENTEROS, CAMBIENLO PARA QU APAREZCA CON 4 DECIMALES. Y NO LE HAGAN CASO A LA PALABRA ALPINA, BORRENLA.

lunes, 21 de noviembre de 2016

TAREA CHI CUADRADA

Chicos
Les pongo el ejercicio de tarea para Chi cuadrada, todos los grupos sean de miércoles o viernes tienen que enviar la tarea a más tardar el jueves 24 de noviembre antes de las 12:00 PM, ya conocen el correo y las condiciones en nombre del archivo y asunto del correo que deben cumplir para que su tarea se califique sobre 10.

Les pongo aqui el enlace para que puedan bajar la tabla de valores críticos de Chi cuadrada recuerden que como es española tiene comas para separar decimales, pero para nosotros debieran ser puntos.

TABLA DE VALORES CRÏTICOS DE CHI CUADRADA

Ahora les pongo el enlace para que accedan y puedan descargar el ejercicio de tarea.

TAREA CHI CUADRADA COMO BONDAD DE AJUSTE

Suerte a todos y que tengan un bonito lunes.

miércoles, 9 de noviembre de 2016

CHI CUADRADA COMO BONDAD DE AJUSTE

Hola chicos, 

En la clase de hoy iniciamos con otra prueba estadística,  se conoce como Ji cuadrada, Chi cuadrada o X2
Esta prueba puede emplearse para diferentes fines, la que empezamaos a ver hoy es como una prueba de bondad de ajuste.

Prueba de Ji Cuadrada como prueba de bondad de ajuste.
La prueba de X2 es, en este caso, una herramienta estadística que indica cuan cercano está un grupo de resultados obtenidos, con los resultados teóricos o esperados de acuerdo al estado del arte o sea lo que se sabe del fenómeno que se este evaluando. Esta prueba se utiliza solamente cuando se necesita analizar variables discretas esto es cuando los datos están categorizados y basados en conteos, no en mediciones.

Algunos ejemplos podrían ser :
*                   Clasificación de palmas en compactas, supercompactas, normales.
*                   Clasificación de individuos en muertas, enfermas, sanas.
*                   Clasificación de individuos por colores.
*                   Clasificación de individuos en hembras y machos.

Esta prueba trata de probar si los resultados a partir de una muestra tienen concordancia con los esperados, y la formula que se aplica es la siguiente.


donde "o" es el valor observado para cada una de dos o mas clases, y "e" es el valor esperado correspondiente.

La forma de proceder es la siguiente: 


  • Se establece la Ho (hipótesis nula) que establece que no hay diferencias significativas entre las categorías de la variable estudiada.
  • Se establece la HA (hipótesis alternativa) que establece que si hay diferencias significativas entre las categorías de la variable estudiada. 
  • Arreglar las categorías y las frecuencias observadas en una tabla.
  • Calcular los valores teóricos esperados para el modelo experimental.
  • Se calcula las x2 para cada categoría, se suman para obtener X2.
  • Se obtienen los grados de libertad que resultan de restar 1 al numero de categorías. 


  • Se compara el valor en las tablas de contingencia a un valor de probabilidad de 0.05, que es el valor internacionalmente empleado en biología. 
  • Si x2c < x2t (el valor de x2 calculado es menor que el de la tabla)  entonces se acepta la Ho en caso contrario se acepta la HA

Ejemplo:
Se sabe que en un cruce T x T de palma, la descendencia de duras, teneras y pisiferas esta en una proporción de 1:2:1. En una muestra de 104 palmas se obtuvieron 28 duras, 49 teneras y 27 pisiferas. Se ajustan estos datos a la proporción esperada?
Para ello calculo el numero de las esperadas de acuerdo a la proporción 1:2:1 la cual me esta indicando que lo esperado es que del total (104), ¼ correspondan a duras, ½ a teneras y ¼ a pisiferas.
Calculo :
Duras=104*1=26
                  4
Tenerase=104*1=52
                    2
Pisiferase=104*1=26
                       4
Categoría
Esperado
Observado
(o-e)2/e (ver formula)
Duras
26
28
0.1538
Teneras
52
49
0.1731
Pisiferas
26
27
0.0385
Total
104
104
0.3654 (X2c)

X2c = 0.365 y  Gl = 2
Los grados de libertad (Gl) se obtienen restándole 1 al número de categorías.
Haciendo uso de la tabla de probabilidades de x2 y con los grados de libertad obtenidos, se determina el valor crítico al nivel de significancia deseado. En este caso para Gl = 2 y para un nivel de 0.05 P se obtiene x2 = 5.991.

Como x2c < x2t entonces se acepta la hipótesis nula (Ho) planteada; y se concluye que no hay diferencias significativas entre lo esperado y lo observado, y que los datos corresponden a una proporción de 1:2:1.



lunes, 7 de noviembre de 2016

TAREA DE CORRELACIÓN

Hola Chicos, les mando la tarea del tema de  correlación, solo abran y descarguen el archivo.


Recuerden mandar la tarea con su grupo, apellidos, nombre y correlación a bioticsbab@gmail.com, para los grupos del viernes enviarlo como límite el jueves 10 de noviembre, los del miércoles enviarlo el viernes 11 de noviembre.

jueves, 3 de noviembre de 2016

COEFICIENTES DE CORRELACIÓN Y DE DETERMINACIÓN


En esta clase vamos a revisar lo que es el coeficiente de correlación y el de determinación, de hecho ustedes lo han usado cuando en su gráfica ponen una línea de tendencia y ponen lo que hasta ahora conocen como R2, ese es el coeficiente de determinación en tanto que su raíz cuadrada, o sea R (más correctamente r) es el coeficiente de correlación.

Una correlación, es simplemente la relación o dependencia que existe entre las dos variables que intervienen en una distribución bidimensional.

Es decir, la correlación nos indica si los cambios en una de las variables (la independiente) influyen en los cambios de la otra (dependiente). En caso de que suceda, diremos que las variables están correlacionadas o que hay correlación entre ellas.

Si bien la correlación puede ser exponencial o potencial o lineal, en este curso solo veremos la correlación lineal o de Pearson.

 

TIPOS DE CORRELACIÓN LINEAL.

 

Correlación directa o positiva
La correlación directa se da cuando al aumentar una de las variables la otra aumenta.
La recta correspondiente a la nube de puntos de la distribución es una recta creciente.



Correlación inversa o negativa
La correlación inversa se da cuando al aumentar una de las variables la otra disminuye.
La recta correspondiente a la nube de puntos de la distribución es una recta decreciente.


Correlación nula
La correlación nula se da cuando no hay dependencia de ningún tipo entre las variables.
En este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma redondeada.

 

Grado de correlación

Sin embargo para que esta herramienta de juicio resulte útil en estadística, tenemos que cuantificarla, es decir, contestar a la pregunta ¿Qué tan grande (o pequeña) es la correlación entre esas 2 variables?, esto se responde con el coeficiente de correlación, que indica que tan próximos están los puntos a la línea de tendencia que define su comportamiento.


La formula para calcular este índice es: 

El resultado de esta ecuación toma valores que van de -1 a + 1, por supuesto pasando por el cero.

Mientras más cercano sea el valor al -1 o al +1 nos indica que los puntos están muy cercanos a la línea de tendencia y que la correlación es fuerte, por el contrario mientras más se aleja de estos valores y se acerca al 0, indica que la correlación es cada vez más débil hasta que es prácticamente nula (no hay correlación entre las 2 variables)

Pero en esta ocasión no nos vamos a detener en ella sino que nos limitamos a ver las formas de calcularla e interpretarla a través de Excel.


COEFICIENTE DE DETERMINACION
El cuadrado del coeficiente de correlación es el coeficiente de determinación (R2), tiene las siguientes características:
1.    -Está acotado entre 0 y 1.
2.    -Se interpreta como el porcentaje de la variabilidad de la variable dependiente explicado por la variabilidad de la independiente.
3.    -Mide, por tanto, el cambio (porcentual) producido en la variable Y al realizarse un cambio de una unidad en la variable X.
4.    -Acompaña siempre a modelos de tipo lineal. No tiene potencia para medir relaciones de otro tipo.



Para verlo de manera gráfica vamos a partir de un ejemplo:

 

Problema ejemplo:

Suponga que sus empleados toman una prueba para medir la agilidad manual. Usted tiene la impresión de que la edad de los empleados está relacionada con las calificaciones de las pruebas. Diez empleados reportaron sus calificaciones de la prueba de agilidad manual. ¿Existe alguna correlación entre la edad de los empleados y las calificaciones de la prueba.

Empleado
Edad
Prueba
1
35
93
2
25
96
3
52
87
4
40
90
5
26
94
6
55
86
7
61
84
8
30
93
9
47
91
10
66
84

 Aqui puedes descargar la tabla en una hoja de Excel


GRAFICANDO

Primero veamos como contestar a esta pregunta por medio de una gráfica de dispersión con línea de tendencia lineal y pidiendo que se muestre la ecuación y la R2:

 

Dado el problema pueden inferir que el cálculo de la media y la desviación estándar en este contexto NO APLICA, lo que se hace es:

Seleccionar las dos columnas completas (edad y prueba) pedir la gráfica de dispersión, agregar la linea de tendencia de tipo lineal y que se muestre la ecuación y la R2 como ya saben.

El valor dado por la R2 es el coeficiente de determinación nos indica el grado en que la habilidad manual de los empleados responde a la variable edad.

Para calcular la correlación y dado que sabemos que el coeficiente de determinación es el cuadrado del de correlación, solo calculamos la raíz cuadrada del coeficiente de determinación, el signo lo indica la pendiente positiva o negativa de la línea de tendencia.

 

CALCULANDO EL INDICE DE PEARSON DIRECTAMENTE

 

Observaciones:

La función de PEARSON devuelve el coeficiente de correlación producto o momento r de Pearson.  Como ya dijimos ‘r’ es un índice que está entre –1.0 y 1.0 que refleja el grado de dependencia lineal entre dos conjuntos de datos.
La función le pide lo siguiente: PEARSON(Array1, Array2) [PEARSON(matriz1, matriz2)]:

Array 1 es un conjunto de valores independientes.
Array 2 es un de conjunto valores dependientes.

Como resultado, la función para el problema ejemplo es la siguiente: PEARSON(B2:B11, C2:C11). El coeficiente de correlación producto o momento r en este caso es r= 0.971591.

En otras palabras, sí existe una alta correlación fuerte entre la edad de los empleados y la calificación de la prueba de agilidad manual.


En tanto que el coeficiente de determinación R2 nos indica el porcentaje en el que las variaciones de la variable independiente (edad) determinan a la dependiente (habilidad manual).