Hola chicos les mando la última tarea de este periodo, la idea es que les sirva de repaso, ya que así va a ser el examen con estos tipos de ejercicios, es decir 1 de T de Student, uno de correlación y 1 de Ji cuadrada como bondad de ajuste. Además aprovechen para subir su calificación de tareas, teniendo en cuenta que los ejercicios anteriores se resolvieron en clase para que corrigieran sus errores, espero que en esta saquen excelentes calificaciones.
Ya saben que poner en el nombre del archivo y en el asunto del correo, también saben a que correo enviarlo, NO SE EQUIVOQUEN.
Tienen hasta el lunes 5 de diciembre a las 10 de la noche para enviarlo.
Saludos y suerte.
NOTA LA COLUMNA DONDE VAN A PONER EL CÁLCULO DE LA JI CUADRADA TIENE FORMATO PARA PONER NÚMEROS ENTEROS, CAMBIENLO PARA QU APAREZCA CON 4 DECIMALES. Y NO LE HAGAN CASO A LA PALABRA ALPINA, BORRENLA.
miércoles, 30 de noviembre de 2016
lunes, 21 de noviembre de 2016
TAREA CHI CUADRADA
Chicos
Les pongo el ejercicio de tarea para Chi cuadrada, todos los grupos sean de miércoles o viernes tienen que enviar la tarea a más tardar el jueves 24 de noviembre antes de las 12:00 PM, ya conocen el correo y las condiciones en nombre del archivo y asunto del correo que deben cumplir para que su tarea se califique sobre 10.
Les pongo aqui el enlace para que puedan bajar la tabla de valores críticos de Chi cuadrada recuerden que como es española tiene comas para separar decimales, pero para nosotros debieran ser puntos.
TABLA DE VALORES CRÏTICOS DE CHI CUADRADA
Ahora les pongo el enlace para que accedan y puedan descargar el ejercicio de tarea.
TAREA CHI CUADRADA COMO BONDAD DE AJUSTE
Suerte a todos y que tengan un bonito lunes.
Les pongo el ejercicio de tarea para Chi cuadrada, todos los grupos sean de miércoles o viernes tienen que enviar la tarea a más tardar el jueves 24 de noviembre antes de las 12:00 PM, ya conocen el correo y las condiciones en nombre del archivo y asunto del correo que deben cumplir para que su tarea se califique sobre 10.
Les pongo aqui el enlace para que puedan bajar la tabla de valores críticos de Chi cuadrada recuerden que como es española tiene comas para separar decimales, pero para nosotros debieran ser puntos.
TABLA DE VALORES CRÏTICOS DE CHI CUADRADA
Ahora les pongo el enlace para que accedan y puedan descargar el ejercicio de tarea.
TAREA CHI CUADRADA COMO BONDAD DE AJUSTE
Suerte a todos y que tengan un bonito lunes.
miércoles, 9 de noviembre de 2016
CHI CUADRADA COMO BONDAD DE AJUSTE
Hola chicos,
En la clase de hoy iniciamos con otra prueba estadística, se conoce como Ji cuadrada, Chi cuadrada o X2
Esta prueba puede emplearse para diferentes fines, la que empezamaos a ver hoy es como una prueba de bondad de ajuste.
La prueba de X2 es, en este caso, una herramienta estadística que
indica cuan cercano está un grupo de resultados obtenidos, con los resultados teóricos o esperados de acuerdo al estado del arte o sea lo que se sabe del fenómeno que se este evaluando. Esta prueba se utiliza solamente cuando se necesita
analizar variables discretas esto es cuando los datos están categorizados
y basados en conteos, no en mediciones.
Algunos ejemplos
podrían ser :
Esta prueba trata de
probar si los resultados a partir de una muestra tienen concordancia con los
esperados, y la formula que se aplica es la siguiente.
donde "o" es el valor observado para cada una de dos o mas clases, y "e" es el valor esperado correspondiente.
La forma de proceder es la siguiente:
- Se establece la Ho (hipótesis nula) que establece que no hay diferencias significativas entre las categorías de la variable estudiada.
- Se establece la HA (hipótesis alternativa) que establece que si hay diferencias significativas entre las categorías de la variable estudiada.
- Arreglar las categorías y las frecuencias observadas en una tabla.
- Calcular los valores teóricos esperados para el modelo experimental.
- Se calcula las x2 para cada categoría, se suman para obtener X2.
- Se obtienen los grados de libertad que resultan de restar 1 al numero de categorías.
- Se compara el valor en las tablas de contingencia a un valor de probabilidad de 0.05, que es el valor internacionalmente empleado en biología.
- Si x2c < x2t (el valor de x2 calculado es menor que el de la tabla) entonces se acepta la Ho en caso contrario se acepta la HA
Ejemplo:
Se sabe que en un
cruce T x T de palma, la descendencia de duras, teneras y pisiferas esta en una
proporción de 1:2:1. En una muestra de 104 palmas se obtuvieron 28 duras, 49
teneras y 27 pisiferas. Se ajustan estos datos a la proporción esperada?
Para ello calculo el
numero de las esperadas de acuerdo a la proporción 1:2:1 la cual me esta
indicando que lo esperado es que del total (104), ¼ correspondan a duras, ½ a
teneras y ¼ a pisiferas.
Calculo :
Duras=104*1=26
4
4
Tenerase=104*1=52
2
2
Pisiferase=104*1=26
4
4
Categoría
|
Esperado
|
Observado
|
(o-e)2/e (ver
formula)
|
Duras
|
26
|
28
|
0.1538
|
Teneras
|
52
|
49
|
0.1731
|
Pisiferas
|
26
|
27
|
0.0385
|
Total
|
104
|
104
|
0.3654
(X2c)
|
X2c =
0.365 y Gl = 2
Los grados de
libertad (Gl) se obtienen restándole 1 al número de categorías.
Haciendo uso de la
tabla de probabilidades de x2 y
con los grados de libertad obtenidos, se determina el valor crítico al nivel de
significancia deseado. En este caso para Gl = 2 y para un nivel de 0.05 P se
obtiene x2 = 5.991.
Como x2c
< x2t entonces se acepta la hipótesis nula (Ho) planteada; y se
concluye que no hay diferencias significativas entre lo esperado y lo
observado, y que los datos corresponden a una proporción de 1:2:1.
lunes, 7 de noviembre de 2016
TAREA DE CORRELACIÓN
Hola Chicos, les mando la tarea del tema de correlación, solo abran y descarguen el archivo.
Recuerden mandar la tarea con su grupo, apellidos, nombre y correlación a bioticsbab@gmail.com, para los grupos del viernes enviarlo como límite el jueves 10 de noviembre, los del miércoles enviarlo el viernes 11 de noviembre.
jueves, 3 de noviembre de 2016
COEFICIENTES DE CORRELACIÓN Y DE DETERMINACIÓN
En esta clase vamos a
revisar lo que es el coeficiente de correlación y el de determinación, de hecho
ustedes lo han usado cuando en su gráfica ponen una línea de tendencia y ponen
lo que hasta ahora conocen como R2, ese es el coeficiente de determinación en
tanto que su raíz cuadrada, o sea R (más correctamente r) es el coeficiente de correlación.
Una correlación, es
simplemente la
relación o dependencia que existe entre las dos variables que intervienen en
una distribución
bidimensional.
Es decir, la correlación
nos indica si los cambios en una de las variables (la independiente) influyen
en los cambios de la otra (dependiente). En caso de que suceda, diremos que las
variables están correlacionadas o que hay correlación entre ellas.
Si bien la correlación
puede ser exponencial o potencial o lineal, en este curso solo veremos la
correlación lineal o de Pearson.
TIPOS DE
CORRELACIÓN LINEAL.
1º Correlación directa o positiva
La correlación directa
se da cuando al aumentar una de las variables la otra aumenta.
La recta correspondiente
a la nube de puntos de la distribución es una recta creciente.
2º Correlación inversa o negativa
La correlación inversa
se da cuando al aumentar una de las variables la otra disminuye.
La recta correspondiente
a la nube de puntos de la distribución es una recta decreciente.
3º Correlación nula
La correlación nula se
da cuando no hay dependencia de ningún tipo entre las variables.
En este caso se dice que
las variables son incorreladas y la nube de puntos tiene una forma redondeada.
Grado de
correlación
Sin embargo para que esta herramienta de juicio resulte útil en estadística, tenemos que cuantificarla, es decir, contestar a la pregunta ¿Qué tan grande (o pequeña) es la correlación entre esas 2 variables?, esto se responde con el coeficiente de correlación, que indica que tan próximos están los puntos a la línea de tendencia que define su comportamiento.
La formula para calcular este índice es:
El resultado
de esta ecuación toma valores que van de -1 a + 1, por supuesto pasando por el
cero.
Mientras más
cercano sea el valor al -1 o al +1 nos indica que los puntos están muy cercanos
a la línea de tendencia y que la correlación es fuerte, por el contrario
mientras más se aleja de estos valores y se acerca al 0, indica que la
correlación es cada vez más débil hasta que es prácticamente nula (no hay
correlación entre las 2 variables)
Pero en esta
ocasión no nos vamos a detener en ella sino que nos limitamos a ver las formas
de calcularla e interpretarla a través de Excel.
COEFICIENTE
DE DETERMINACION
El cuadrado del coeficiente de correlación es el coeficiente de
determinación (R2), tiene las siguientes características:
1. -Está acotado entre 0 y
1.
2. -Se interpreta como el porcentaje
de la variabilidad de la variable dependiente explicado por la variabilidad de
la independiente.
3. -Mide, por tanto, el
cambio (porcentual) producido en la variable Y al realizarse un cambio de una
unidad en la variable X.
4. -Acompaña siempre a
modelos de tipo lineal. No tiene potencia para medir relaciones de otro tipo.
Para verlo de manera gráfica vamos a partir de un ejemplo:
Problema ejemplo:
Suponga que sus empleados toman una prueba para
medir la agilidad manual. Usted tiene la impresión de que la edad de los
empleados está relacionada con las calificaciones de las pruebas. Diez
empleados reportaron sus calificaciones de la prueba de agilidad manual.
¿Existe alguna correlación entre la edad de los empleados y las calificaciones
de la prueba.
Empleado
|
Edad
|
Prueba
|
1
|
35
|
93
|
2
|
25
|
96
|
3
|
52
|
87
|
4
|
40
|
90
|
5
|
26
|
94
|
6
|
55
|
86
|
7
|
61
|
84
|
8
|
30
|
93
|
9
|
47
|
91
|
10
|
66
|
84
|
Aqui puedes descargar la tabla en una hoja de Excel
GRAFICANDO
Primero
veamos como contestar a esta pregunta por medio de una gráfica de dispersión
con línea de tendencia lineal y pidiendo que se muestre la ecuación y la R2:
Dado el problema pueden inferir que el cálculo de
la media y la desviación estándar en este contexto NO APLICA, lo que se hace
es:
Seleccionar
las dos columnas completas (edad y prueba) pedir la gráfica de dispersión,
agregar la linea de tendencia de tipo lineal y que se muestre la ecuación y la
R2 como ya saben.
El
valor dado por la R2 es el coeficiente de determinación nos indica el grado en
que la habilidad manual de los empleados responde a la variable edad.
Para calcular
la correlación y dado que sabemos que el coeficiente de determinación es el
cuadrado del de correlación, solo calculamos la raíz cuadrada del coeficiente
de determinación, el signo lo indica la pendiente positiva o negativa de la línea
de tendencia.
CALCULANDO EL INDICE DE PEARSON
DIRECTAMENTE
Observaciones:
La función de PEARSON devuelve el coeficiente de
correlación producto o momento r de Pearson.
Como ya dijimos ‘r’ es un índice que está entre –1.0 y 1.0 que refleja
el grado de dependencia lineal entre dos conjuntos de datos.
La función le pide lo siguiente: PEARSON(Array1,
Array2) [PEARSON(matriz1, matriz2)]:
Como resultado, la función para el problema ejemplo
es la siguiente: PEARSON(B2:B11, C2:C11). El coeficiente de correlación
producto o momento r en este caso es r= 0.971591.
En otras palabras, sí existe una alta correlación
fuerte entre la edad de los empleados y la calificación de la prueba de
agilidad manual.
En tanto que el coeficiente de determinación R2 nos indica el porcentaje en el que
las variaciones de la variable independiente (edad) determinan a la dependiente
(habilidad manual).
jueves, 13 de octubre de 2016
Tarea T de Student
Esta tarea debe mandarse al correo de bioticsbab@gmail.com el dia anterior a su examen, esto es:
Para el 3010 y 3040 la fecha y hora límite es el próximo martes 18 de octubre hasta las 9:00PM,
Para el 3020 y 3030 la fecha y hora límite es el próximo jueves 20 de octubre hasta las 9:00PM.
La tarea está en el siguiente enlace, den click sobre el enlace y cuando abra descarguen el archivo, como ya saben.
TAREA T DE STUDENT
Recuerden que solo son 2 tareas, por lo que no les conviene cometer errores como copiarse o mandarlo a un correo equivocado o con un nombre de archivo o de asunto diferente al que se les pide y ya conocen.
Si tienen dudas preguntenos a Miss Irma o a mi.
Suerte a todos.
Para el 3010 y 3040 la fecha y hora límite es el próximo martes 18 de octubre hasta las 9:00PM,
Para el 3020 y 3030 la fecha y hora límite es el próximo jueves 20 de octubre hasta las 9:00PM.
La tarea está en el siguiente enlace, den click sobre el enlace y cuando abra descarguen el archivo, como ya saben.
TAREA T DE STUDENT
Recuerden que solo son 2 tareas, por lo que no les conviene cometer errores como copiarse o mandarlo a un correo equivocado o con un nombre de archivo o de asunto diferente al que se les pide y ya conocen.
Si tienen dudas preguntenos a Miss Irma o a mi.
Suerte a todos.
miércoles, 21 de septiembre de 2016
Prueba T de Student.
Prueba T de
Student.
Esta prueba estadística es una de las más
empleadas para determinar si dos poblaciones o grupos muestrales son
significativamente diferentes o no.
Esta prueba compara muestras pequeñas
(menores de 30 idealmente), e involucra las medias y las desviaciones estándar
de dos grupos de datos. El resultado que de obtiene de la aplicación de la formula se compara con los de una tabla de
valores críticos, y dependiendo de si el valor calculado es menor o mayor al de la tabla, se puede concluir si las diferencias observadas en las medias de las poblaciones que se comparan son o no significativamente diferentes.
La formula es:
La formula es:
Donde X y Y
(con la línea arriba), son las medias de los dos grupos de muestras;
S1 y S2 son sus desviaciones
estándar y
n y m el numero
de datos correspondiente a cada uno de los grupos muestrales (tamaño de la muestra)
Como primer paso se establecen la hipótesis
nula (H0 ) y la alternativa (Ha). La primera (Ho) establece que No hay diferencias
significativas entre las muestras, lo cual estaría indicando que las diferencias observadas de deberían al azar y la
hipótesis alternativa (Ha) establece que Si hay diferencias significativas, esto es, que las diferencias se deben
al tratamiento aplicado o en el caso de poblaciones, que estas son diferentes
entre si.
Ejemplo:
En un experimento se midieron las hojas de
brotes de trigo de tres días de germinados. El grupo A eran de semillas
normales, en tanto que el B era de semillas que habían sido radiadas.
La siguiente tabla muestra las medias,
Desviaciones estándar y tamaño de la muestra de los dos grupos.
Semillas normales (grupo A)
|
Semillas radiadas (grupo B)
|
|
Media del largo de las hojas mm±1mm
|
10.91
|
2.30
|
Desviación estándar mm
|
3.97
|
1.52
|
Tamaño de la muestra
|
15
|
15
|
Después de aplicar la formula el resultado dio
7.89.
Ahora hay que calcular los grados de
libertad que son (15-1) + (15-1) = 28
Buscando en la tabla de valores críticos (enlace Tabla valores T Student ) los grados de libertad se ven en la columna de la izquierda y arriba la probabilidad de que la
diferencia se deba solo al azar o a la variabilidad propia del organismo. Por convención, para Biología siempre se trabaja con una probabilidad de 0.05 o bien 5%.
Al ver la tabla se ve un valor crítico de 2.048, que es menor que el número calculado y en este caso se rechaza la hipótesis nula y se acepta la alternativa, esto es que las diferencias son significativas, y por tanto se concluye que la radiación si causo un efecto en el desarrollo de las plántulas. Comparando las medias, se puede ver que el efecto fue una reducción en el tamaño de las hojas.
Al ver la tabla se ve un valor crítico de 2.048, que es menor que el número calculado y en este caso se rechaza la hipótesis nula y se acepta la alternativa, esto es que las diferencias son significativas, y por tanto se concluye que la radiación si causo un efecto en el desarrollo de las plántulas. Comparando las medias, se puede ver que el efecto fue una reducción en el tamaño de las hojas.
Lo que hace esta prueba es calcular la probabilidad muestras procedan de dos poblaciones subyacentes y el grado en que estas se sobreponen.
PARA
CALCULARLA EN EXCEL
En Excel la prueba no da como resultado el resultado de la formula, sino que arroja directamente
la probabilidad, por lo que si este resultado es mayor de 0.05 se acepta la hipótesis nula, y si es
menor se rechaza la nula y se acepta la alternativa.
La función que se usa es:
TTEST (Prueba T de Student)
Problema ejemplo:
La empresa X, a mandado a algunos de sus empleados nuevos a un seminario de entrenamiento en Boston durante los pasados seis meses, en tanto que otros lo tomaron en New York. Al final del seminario, todos los empleados tomaron un
examen para obtener el certificado. El seminario en Boston es más caro, pero en se piensa que el entrenamiento que se ofrece en Boston es mejor que
el que se ofrece en New York. Los resultados de las
calificaciones de 15 empleados que estudiaron en Boston y de 15 empleados que estudiaron
en New York son los que se presentan en la siguiente tabla. Basadas en es estas
calificaciones, ¿Se puede comprobar que el programa de Boston es mejor que
el programa de New York?
Persona
|
Boston
|
New York
|
1
|
99
|
98
|
2
|
99
|
96
|
3
|
98
|
96
|
4
|
97
|
95
|
5
|
90
|
85
|
6
|
85
|
80
|
7
|
84
|
79
|
8
|
82
|
78
|
9
|
81
|
75
|
10
|
79
|
73
|
11
|
79
|
72
|
12
|
68
|
69
|
13
|
61
|
67
|
14
|
60
|
62
|
15
|
56
|
60
|
Promedio
|
81.2
|
79
|
Desv. Est.
|
14.4973
|
12.6152
|
Observaciones:
La función de TTEST calcula la probabilidad asociada
con la prueba t de Student para determinar la probabilidad de que dos muestras
procedan de dos poblaciones subyacentes. La función pide lo siguiente: TTEST(Array1,
Array 2, tails, type) [PRUEBA.T(matriz1, matriz2, colas, tipo)]:
Array 1 es el primer conjunto de datos, el cual en este
ejemplo son las calificaciones de Boston.
Array 2 es el segundo conjunto de datos, el cual en este
ejemplo son las calificaciones de New York.
Tails especifica el número de colas de distribución. Si el
argumento colas = 1, TTEST utiliza la distribución de una cola. Si colas = 2,
TTEST utiliza la distribución de dos colas.
En este ejemplo se supone 2 colas ya que la diferencia puede ser
positiva o negativa.
Type es el tipo de prueba t que se realiza: 1 =
Observaciones por pares; 2 = Observaciones de dos muestras con varianzas
iguales; y 3 = Observaciones de dos muestras con varianzas diferentes. En este ejemplo se supone dos muestras con
varianzas iguales.
Como resultado, la función de este ejemplo es la
siguiente: TTEST(B2:B16, C2:C16, 2, 2). La probabilidad asociada con el valor t
es de 0.6609. Ya que el valor no es
menor de.05, no podemos decir que el entrenamiento en Boston es
significativamente mejor que el entrenamiento de New York. Además, basada en
esta información sería difícil justificar el entrenamiento más caro de Boston.”
Ustedes una ves que tienen sus datos en Excel calculan
media y desviación estándar. Luego abren el cuadro de funciones, seleccionan
las estadísticas y buscan la de PRUEBA.T o TTEST y les aparece el cuadro del ejemplo de arriba, seleccionan
los datos de la primera columna en matriz 1, los de la 2ª en matriz 2 en colas
ponen 2 y en el tipo generalmente es el 3.
BIBLIOGRAFIA;
APUNTES DE TALLERES BI
Suscribirse a:
Entradas (Atom)





