martes, 24 de octubre de 2017

T de Student

Prueba T de Student.

Esta prueba estadística es una de las más empleadas para determinar si dos poblaciones o grupos muestrales son significativamente diferentes entre si o no.

Esta prueba compara muestras pequeñas (menores de 30 idealmente), e involucra las medias y las desviaciones estándar de dos grupos de datos. Para esta prueba se emplea la siguiente formula: 

                   

Donde X y Y (con la línea arriba), son las medias de los dos grupos de muestras;
S1 y S2 son sus desviaciones estándar y
n y m el numero de datos correspondiente a cada uno de los grupos muestrales (tamaño de la muestra).
El resultado que se obtiene de la aplicación de la formula se compara con los de una tabla de valores críticos, y dependiendo de si el valor calculado es menor o mayor al de la tabla, se puede concluir si las diferencias observadas en las medias de las poblaciones que se comparan son o no significativamente diferentes.  

Para aplicar esta prueba con el rigor estadístico que se requiere, el primer paso consiste en establecer  la hipótesis nula (H0 ) y la alternativa (Ha). La primera (Ho) establece que No hay diferencias significativas entre las muestras,  que plantea la posibilidad de in que las diferencias observadas entre las dos medias de deben al azar, en tanto que la hipótesis alternativa (Ha establece que Si hay diferencias significativas, esto es, que las diferencias se deben al tratamiento aplicado o en el caso de poblaciones, que estas son diferentes entre si para la característica evaluada. 

Ejemplo: 
En un experimento se midieron las hojas de brotes de trigo de tres días de germinados. El grupo A eran de semillas normales, en tanto que el B era de semillas que habían sido radiadas.
La siguiente tabla muestra las medias, Desviaciones estándar y tamaño de la muestra de los dos grupos.

Semillas normales (grupo A)
Semillas radiadas (grupo B)
Media del largo de las hojas mm±1mm
10.91
2.30
Desviación estándar mm
3.97
1.52
Tamaño de la muestra
15
15

Después de aplicar la formula el resultado dio 7.89.
Ahora hay que calcular los grados de libertad que son (15-1) + (15-1) = 28
Buscando en la tabla de valores críticos (enlace Tabla valores T Student ) los grados de libertad se ven en la columna de la izquierda y arriba  la probabilidad de que la diferencia se deba solo al azar.  Por convención, para Biología siempre  se trabaja con una probabilidad de  0.05 o lo que es lo mismo, de 5%.
Al ver la tabla se ve un valor crítico de 2.048, que es menor que el número calculado y en este caso se rechaza la hipótesis nula y se acepta la alternativa, esto es que las diferencias son significativas, y por tanto se concluye que la radiación si causo un efecto en el desarrollo de las plántulas. Comparando las medias, se puede ver que el efecto fue una reducción en el tamaño de las hojas.

PARA CALCULARLA EN EXCEL
En Excel la prueba no da como resultado el resultado de la formula, sino que arroja directamente la probabilidad, por lo que si este resultado es mayor de 0.05 se acepta la hipótesis nula, y si es menor  se acepta la alternativa.

La función que se usa es:
TTEST (Prueba T de Student)

Problema ejemplo:
La empresa X,  a mandado a algunos de sus empleados nuevos a un seminario de entrenamiento en Boston  durante los pasados seis meses, en tanto que  otros lo tomaron en New York. Al final del seminario, todos los empleados tomaron un examen para obtener el certificado. El seminario en Boston es más caro, pero en se piensa que el entrenamiento que se ofrece en Boston es mejor que el que se ofrece en New York.  Los resultados de las calificaciones de 15 empleados que estudiaron en Boston y de 15 empleados que estudiaron en New York son los que se presentan en la siguiente tabla.  Basadas en es estas calificaciones, ¿Se puede comprobar que el programa de Boston es mejor que el programa de New York?
Persona
Boston
New York
1
99
98
2
99
96
3
98
96
4
97
95
5
90
85
6
85
80
7
84
79
8
82
78
9
81
75
10
79
73
11
79
72
12
68
69
13
61
67
14
60
62
15
56
60
Promedio
81.2
79
Desv. Est.
14.4973
12.6152

Observaciones:
La función de TTEST calcula la probabilidad asociada con la prueba t de Student para determinar la probabilidad de que dos muestras procedan de dos poblaciones subyacentes. La función pide lo siguiente: TTEST(Array1, Array 2, tails, type) [PRUEBA.T(matriz1, matriz2, colas, tipo)]:
Array 1 es el primer conjunto de datos, el cual en este ejemplo son las calificaciones de Boston.
Array 2 es el segundo conjunto de datos, el cual en este ejemplo son las calificaciones de New York.
Tails especifica el número de colas de distribución. Si el argumento colas = 1, TTEST utiliza la distribución de una cola. Si colas = 2, TTEST utiliza la distribución de dos colas.  En este ejemplo se supone 2 colas ya que la diferencia puede ser positiva o negativa.
Type es el tipo de prueba t que se realiza: 1 = Observaciones por pares; 2 = Observaciones de dos muestras con varianzas iguales; y 3 = Observaciones de dos muestras con varianzas diferentes.  En este ejemplo se supone dos muestras con varianzas iguales.
Como resultado, la función de este ejemplo es la siguiente: TTEST(B2:B16, C2:C16, 2, 2). La probabilidad asociada con el valor t es de 0.6609.  Ya que el valor no es menor de.05, no podemos decir que el entrenamiento en Boston es significativamente mejor que el entrenamiento de New York. Además, basada en esta información sería difícil justificar el entrenamiento más caro de Boston.”
Ustedes una ves que tienen sus datos en Excel calculan media y desviación estándar. Luego abren el cuadro de funciones, seleccionan las estadísticas y buscan la de PRUEBA.T o TTEST y les aparece el cuadro del ejemplo de arriba, seleccionan los datos de la primera columna en matriz 1, los de la 2ª en matriz 2 en colas ponen 2 y en el tipo generalmente es el 3.

BIBLIOGRAFIA;
APUNTES DE TALLERES BI

jueves, 7 de septiembre de 2017

Media y Desviación Estándar

MEDIDAS DE TENDENCIA CENTRAL

Son aquellas que indican alrededor de qué valores se agrupan los datos observados. Distinguimos:

 1. La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos.    
2. Mediana: es el punto medio de una serie ordenada de datos.
3. Moda: es el valor más frecuente de la serie de datos.


MEDIDAS DE DISPERSION.


Cuando ustedes muestren por ejemplo la estatura de todos los alumnos del colegio que tienen entre 16 y 19 años, tendremos estaturas que van desde 1.55 hasta 1.85, dentro de este rango veremos que por lo general los que son más bajitos o más altos son pocos comparados con los que están más cercanos a la media, si hacemos una gráfica de frecuencias y ponemos una linea que una los puntos, tendremos una gráfica de tipo campana llamada campana de Gauss.
Esta me esta mostrando que tan dispersos están los datos con respecto a la media de todos, por ejemplo:
                   



En estas gráficas vemos que en el caso de la curva color mostaza los datos están muy "dispersos" o sea muy alejados de la media, por el contrario en la curva color azul, los datos están muy agrupados alrededor de la media.
Para poner esta dispersión de manera cuantificada, se usan varias "medidas de dispersión".
 Para saber como se distribuyen los datos y cuanto se alejan de las medidas centrales, existen diferentes medidas, como por ejemplo:
  • Rango: que es la diferencia entre el valor mínimo y el máximo.
  • Varianza: que muestra la dispersión de los valores alrededor de la media.
S_X^2 = \frac{\sum_{i=1}^n (X_i - \bar{X})^2}{n-1}
  • Desviación estándar: que es la raíz cuadrada de la varianza y a partir de ella se desarrollan diversos métodos de análisis estadísticos,
S = \sqrt{\frac{\sum_{i=1}^n (x_i - \bar{x})^2}{n-1}}


Esta formula nos da un número que cuando comparamos entre diferentes poblaciones nos dice cual está más dispersa (mostaza) y cual menos (azul).

Esto es importante porque cuando hacemos un experimento y medimos las desviaciones estándar de nuestros resultados, esperamos que estén en cierta medida agrupados alrededor de la media pues eso nos da confianza de que el experimento es reproducible y de que hemos controlado bien nuestras variables, en caso contrario lo ideal seria aumentar el tamaño de la muestra (mas repeticiones) para disminuir esa dispersión y adicionalmente mejorar el control de las variables.
La interpretación que se da de esta medida parte del hecho de que, al sumar y restar el valor de una desviación estándar al valor de la media, se establece una rango que comprende al 68% de la población, es decir, que si por ejemplo, la media de la estatura de los adultos de una población es 1.75 m, y la desviación estándar es de 12 cm, el 68% de la población mide entre 1.63 y 1.87.
Mientras más grande sea la desviación estándar, más dispersos estarán los datos con respecto a la media y por tanto la media será menos representativa de la población.


A continuación está un vínculo, lo que harán ahora es abrirlo y descargarlo, calcular media (promedio) Desviación estándar y van a graficar como se les indique en clase

Ejercicio de desviación estándar

Abajo encontrarán un enlace más, la diferencia es que vienen dos ejercicios en los que también calcularán la media y desviación estándar pero que graficarán de manera distinta pues los datos de la variable independiente son de naturaleza diferente (continuos en una y cualitativos o categorizados en la otra, los trabajaremos también porque les servirá para el reporte de su practica de Osmosis.

Ejercicios con gráficas


jueves, 17 de agosto de 2017

REGLAMENTO


REGLAMENTO BIOTICS III

 

1.-SOBRE LA PUNTUALIDAD:
1.1.- La hora de entrada debe ser respetada, la tolerancia será de 5 minutos, después de ese tiempo el alumno podrá entrar pero con falta.

2.- SOBRE PRESENTACIÓN PERSONAL
2.1.- No se permite el uso de gorras.
2.2.- No se permite traer piercings, tatuajes visibles, pantalones rotos, blusas escotadas ni transparentes.

3.- SOBRE EL COMPORTAMIENTO.
3.1.- No se permite correr ni aventarse dentro del laboratorio.
3.2.- No se permite el uso de lenguaje ofensivo.
3.3.- Bajo ningún motivo se permite entrar con alimentos ni bebidas al laboratorio.
3.4.- No se permite mascar chicle en clase.
3.5.- No se permite utilizar el equipo de laboratorio con aplicaciones diferentes a las utilizadas para la clase (juegos, videos, Facebook, etc).
3.6.- No se permiten cambios en la configuración del equipo (fondo de pantalla, protectores, alarmas, etc.)

4.- SOBRE EL MOBILIARIO Y EQUIPO DE LABORATORIO
4.1.- Cualquier daño que se produzca al equipo o mobiliario del laboratorio, ya sea por descuido o por uso indebido del mismo, deberá ser pagado o restituido.

5.- SOBRE LAS EVALUACIONES Y LA ENTREGA DE TAREAS.
5.1.- La evaluación del curso se hará en base a los siguientes elementos: tareas, bitácora y exámenes.
5.2.- Los ejercicios de tareas deberán ser enviados al correo bioticsbab@gmail.com  antes de la fecha y hora límite, de lo contrario la calificación será cero.
5.3.- Las tareas solamente se considerarán siempre y cuando la calificación del examen sea aprobatoria.
5.4.- Si se descubre copia en alguna tarea, ésta se calificará con cero (tanto para la persona que copie como para la que permite la copia). Si esta situación se repite, el 50% de las tareas se calificará con cero. Las reincidencias recibirán un reporte con falta grave.
5.5.- La bitácora tendrá un peso del 5% en la calificación. En el entendido de que ES OBLIGATORIO LLEVAR LA BITACORA Y 1 USB personal a todas las clases para que se tome en cuenta este porcentaje. El día del examen es obligatoria la USB para tener derecho a presentarlo.
5.6.- La calificación obtenida en las tareas se promedia de la misma manera tanto para el examen final de primera vuelta como para la segunda.
5.7.- No hay reposición de tareas no entregadas ni reprobadas.

6.- SOBRE EL USO DE ADITAMENTOS ELECTRÓNICOS.
6.1.- Bajo ningún motivo se permite el uso de audífonos ni celulares dentro del laboratorio.

Faltas a los puntos 3 y 6,  serán motivo de un reporte.

He leído el reglamento y me comprometo a seguir las reglas.


___________________________________
Nombre y Firma del alumno.



Dar click en el enlace para abrir, descargar, imprimir, firmar y pegar el reglamento en tu Bitácora.

sábado, 28 de enero de 2017

TAREA X2 INDEPENDENCIA DE VARIABLES

Hola chicos

Les mando la tarea de X2 como prueba de independencia de variables.

Tengan en cuenta que el orden en la tabla de valores puede no ser el que se puso en clase, y que ustedes van a construir la tabla de contingencia.

Como otras veces, para acceder al archivo solo den click sobre el enlace de abajo y luego descarguenlo para poder trabajar en él.

La fecha de entrega para los 2 grupos de viernes es el jueves 2 de febrero a las 10:00 PM; para los del miércoles es el martes 7 de febrero  a las 10:00 PM.

Ya conocen la forma en que lo deben enviar (tanto el correo como el nombre del archivo y del asunto).    Cuiden de no cometer errores, para que se aseguren de que su tarea sea tomada en cuenta.



Saludos a todos 

miércoles, 18 de enero de 2017

LA PRUEBA DE CHI-CUADRADA COMO PRUEBA DE INDEPENDENCIA DE VARIABLES

CHI-CUADRADA COMO PRUEBA DE INDEPENDENCIA DE VARIABLES APLICADA A EVALUAR UNA POSIBLE ASOCIACIÓN ENTRE 2 ESPECIES.

Ya conocen la prueba de Chi cuadrada aplicada como prueba de bondad de ajuste, ahora la vamos a emplear como prueba de independencia de variables y la vamos a aplicar en Biología para ver si en un ecosistema dos especies se distribuyen independientemente o en función a algún tipo de asociación entre ellas.

Las poblaciones están distribuidas de forma desigual debido a que algunas partes del hábitat son más adecuadas para una especie que para otras. Si dos especies se encuentran en las mismas partes de un hábitat, tenderán a ser encontrado en las mismas zonas. Esto se conoce como asociación positiva. También puede haber asociaciones negativas (no se encuentran juntas), o la distribución de las dos especies puede ser independiente.

En esta prueba los datos experimentales se obtienen a partir de cuadrantes, que se aplican de la siguiente manera:

Primero se traza un cuadrante de ciertas dimensiones, por ejemplo de 10 por 10 metros y 
se ponen marcas a cada metro a lo largo ya lo ancho, después se asignan letras a cada metro a lo ancho y números a cada metro a lo largo y al azar se eligen combinaciones,por ejemplo D 8 en la intersección de ambos dentro del cuadrante grande se marca un cuadrado pequeño de 1 por 1 metro y ahi se ve si la especie 1 y/o la especie 2 se encuentran dentro de esa área.
Se contabiliza el numero de cuadrantes que presentan una de las 4 posibilidades:

Especie A ausente, B ausente, 
Especie A presente B ausente, 
Especie A ausente B presente o 
Especie A presente y B presente

Por Ejemplo

Especie A presente
Especie A ausente
Especie B presente
 54
 6

Especie B ausente
 10
 19






Hay dos posibles hipótesis:
Ho: Las dos especies se distribuyen de forma independiente.
Ha: Dos especies se asocian (positiva o negativamente)

La prueba de Chi-cuadrado es válida sólo si todas las frecuencias esperadas son mayores a 5, y la muestra fue tomada al azar dentro de la población.

1.       Elaborar una tabla de contingencia de frecuencias observadas, que son el número de cuadrantes que contienen o no cada una de las especies.

Especie A presente
Especie A ausente
Total en la fila
Especie B presente



Especie B ausente



Total en columna



En la celda amarilla se obtiene el gran total.
2.       Calcular las frecuencias esperadas: Asumiendo una distribución independiente para cada una de las 4 combinaciones, se calcula cada frecuencia esperada usando la ecuación siguiente:
  
3.       Calcular los grados de libertad usando la ecuación:   grados de libertad =  (m-1)(n-1)  donde m y n son el número de filas (m) y de columnas (n).
4.       Calcular la chi-cuadrada con la ecuación: 
                 
               donde Σ es sumatoria, ƒo la frecuencia observada y ƒe la frecuencia esperada.
5.       Para este cálculo se construye la siguiente tabla con las frecuencias observadas y esperadas para las 4 posibilidades
Cuadrantes con Especie
Frecuencia observada
 Frecuencia
Esperada (obtenida en el punto 2)
Solo A



Solo B



A y B



Ni A ni B



Σ



En el cuadro resalado en amarillo se obtendrá la sumatoria de esa columna que es el valor de X2 calculado y que se compara con el de tablas.
6.       Encuentre el valor crítico en la tabla de Chi-cuadrada de acuerdo a los grados de libertad obtenidos y a un nivel de significancia (p) de 0.05 (5%). (La región crítica es todo valor mayor que el encontrado en la tabla).

7.       Comparar el valor obtenido en la ecuación, con el de la tabla. Si el valor obtenido está en la región crítica (mayor que el encontrado en la tabla) se rechaza la Ho, se acepta entonces la Ha, indicando entonces con un nivel de confianza del 95%,  que hay asociación entre las 2 especies.