Prueba T de
Student.
Esta prueba estadística es una de las más
empleadas para determinar si dos poblaciones o grupos muestrales son
significativamente diferentes o no.
Esta prueba compara muestras pequeñas
(menores de 30 idealmente), e involucra las medias y las desviaciones estándar
de dos grupos de datos. El resultado que de obtiene de la aplicación de la formula se compara con los de una tabla de
valores críticos, y dependiendo de si el valor calculado es menor o mayor al de la tabla, se puede concluir si las diferencias observadas en las medias de las poblaciones que se comparan son o no significativamente diferentes.
La formula es:
La formula es:
Donde X y Y
(con la línea arriba), son las medias de los dos grupos de muestras;
S1 y S2 son sus desviaciones
estándar y
n y m el numero
de datos correspondiente a cada uno de los grupos muestrales (tamaño de la muestra)
Como primer paso se establecen la hipótesis
nula (H0 ) y la alternativa (Ha). La primera (Ho) establece que No hay diferencias
significativas entre las muestras, lo cual estaría indicando que las diferencias observadas de deberían al azar y la
hipótesis alternativa (Ha) establece que Si hay diferencias significativas, esto es, que las diferencias se deben
al tratamiento aplicado o en el caso de poblaciones, que estas son diferentes
entre si.
Ejemplo:
En un experimento se midieron las hojas de
brotes de trigo de tres días de germinados. El grupo A eran de semillas
normales, en tanto que el B era de semillas que habían sido radiadas.
La siguiente tabla muestra las medias,
Desviaciones estándar y tamaño de la muestra de los dos grupos.
Semillas normales (grupo A)
|
Semillas radiadas (grupo B)
|
|
Media del largo de las hojas mm±1mm
|
10.91
|
2.30
|
Desviación estándar mm
|
3.97
|
1.52
|
Tamaño de la muestra
|
15
|
15
|
Después de aplicar la formula el resultado dio
7.89.
Ahora hay que calcular los grados de
libertad que son (15-1) + (15-1) = 28
Buscando en la tabla de valores críticos (enlace Tabla valores T Student ) los grados de libertad se ven en la columna de la izquierda y arriba la probabilidad de que la
diferencia se deba solo al azar o a la variabilidad propia del organismo. Por convención, para Biología siempre se trabaja con una probabilidad de 0.05 o bien 5%.
Al ver la tabla se ve un valor crítico de 2.048, que es menor que el número calculado y en este caso se rechaza la hipótesis nula y se acepta la alternativa, esto es que las diferencias son significativas, y por tanto se concluye que la radiación si causo un efecto en el desarrollo de las plántulas. Comparando las medias, se puede ver que el efecto fue una reducción en el tamaño de las hojas.
Al ver la tabla se ve un valor crítico de 2.048, que es menor que el número calculado y en este caso se rechaza la hipótesis nula y se acepta la alternativa, esto es que las diferencias son significativas, y por tanto se concluye que la radiación si causo un efecto en el desarrollo de las plántulas. Comparando las medias, se puede ver que el efecto fue una reducción en el tamaño de las hojas.
Lo que hace esta prueba es calcular la probabilidad muestras procedan de dos poblaciones subyacentes y el grado en que estas se sobreponen.
PARA
CALCULARLA EN EXCEL
En Excel la prueba no da como resultado el resultado de la formula, sino que arroja directamente
la probabilidad, por lo que si este resultado es mayor de 0.05 se acepta la hipótesis nula, y si es
menor se rechaza la nula y se acepta la alternativa.
La función que se usa es:
TTEST (Prueba T de Student)
Problema ejemplo:
La empresa X, a mandado a algunos de sus empleados nuevos a un seminario de entrenamiento en Boston durante los pasados seis meses, en tanto que otros lo tomaron en New York. Al final del seminario, todos los empleados tomaron un
examen para obtener el certificado. El seminario en Boston es más caro, pero en se piensa que el entrenamiento que se ofrece en Boston es mejor que
el que se ofrece en New York. Los resultados de las
calificaciones de 15 empleados que estudiaron en Boston y de 15 empleados que estudiaron
en New York son los que se presentan en la siguiente tabla. Basadas en es estas
calificaciones, ¿Se puede comprobar que el programa de Boston es mejor que
el programa de New York?
Persona
|
Boston
|
New York
|
1
|
99
|
98
|
2
|
99
|
96
|
3
|
98
|
96
|
4
|
97
|
95
|
5
|
90
|
85
|
6
|
85
|
80
|
7
|
84
|
79
|
8
|
82
|
78
|
9
|
81
|
75
|
10
|
79
|
73
|
11
|
79
|
72
|
12
|
68
|
69
|
13
|
61
|
67
|
14
|
60
|
62
|
15
|
56
|
60
|
Promedio
|
81.2
|
79
|
Desv. Est.
|
14.4973
|
12.6152
|
Observaciones:
La función de TTEST calcula la probabilidad asociada
con la prueba t de Student para determinar la probabilidad de que dos muestras
procedan de dos poblaciones subyacentes. La función pide lo siguiente: TTEST(Array1,
Array 2, tails, type) [PRUEBA.T(matriz1, matriz2, colas, tipo)]:
Array 1 es el primer conjunto de datos, el cual en este
ejemplo son las calificaciones de Boston.
Array 2 es el segundo conjunto de datos, el cual en este
ejemplo son las calificaciones de New York.
Tails especifica el número de colas de distribución. Si el
argumento colas = 1, TTEST utiliza la distribución de una cola. Si colas = 2,
TTEST utiliza la distribución de dos colas.
En este ejemplo se supone 2 colas ya que la diferencia puede ser
positiva o negativa.
Type es el tipo de prueba t que se realiza: 1 =
Observaciones por pares; 2 = Observaciones de dos muestras con varianzas
iguales; y 3 = Observaciones de dos muestras con varianzas diferentes. En este ejemplo se supone dos muestras con
varianzas iguales.
Como resultado, la función de este ejemplo es la
siguiente: TTEST(B2:B16, C2:C16, 2, 2). La probabilidad asociada con el valor t
es de 0.6609. Ya que el valor no es
menor de.05, no podemos decir que el entrenamiento en Boston es
significativamente mejor que el entrenamiento de New York. Además, basada en
esta información sería difícil justificar el entrenamiento más caro de Boston.”
Ustedes una ves que tienen sus datos en Excel calculan
media y desviación estándar. Luego abren el cuadro de funciones, seleccionan
las estadísticas y buscan la de PRUEBA.T o TTEST y les aparece el cuadro del ejemplo de arriba, seleccionan
los datos de la primera columna en matriz 1, los de la 2ª en matriz 2 en colas
ponen 2 y en el tipo generalmente es el 3.
BIBLIOGRAFIA;
APUNTES DE TALLERES BI
