miércoles, 16 de mayo de 2018

otros ejemplos de subrutinas

Les subo otros ejemplos de subrutinas para que los analicen y prueben en sus computadoras, las 2 últimas son más compleja para que vean algo un poco más avanzado, pero la opción no se incluirá en el examen.

Estos ejemplos declaran o dimensionan las variables dentro de la subrutina, hasta ahora lo han hecho antes, pueden hacerlo de las dos formas, la ventaja de hacerlo dentro de la subrutina es que pueden poner varias en una misma hoja, si las declaran antes, deben ponerlas en hojas separadas para que funcionen.

También recuerden que se les va a pedir que asocien cada macro a una figuta.


Sub compradolares()
  Dim cantidad As Integer, tipo As Double, pesos As Double
  cantidad = InputBox("cuantos dolares quieres comprar")
  tipo = InputBox("a cuanto esta el dolar hoy")
  pesos = cantidad * tipo
  MsgBox ("debes pagar en pesos ") & pesos
End Sub

Sub tienda()
  Dim cantidad As Integer, precio As Double, pago As Double, coniva As Double
  cantidad = InputBox("cuantos articulos vas a comprar")
  precio = InputBox("cual es el precio marcado en la etiqueta")
  pago = cantidad * precio
  MsgBox ("el precio sin IVA es ") & pago
  coniva = pago * 1.16
  MsgBox ("el total a pagar con IVA es ") & coniva
End Sub


Sub celciusafarenheit()
  Dim nombre As String
nombre = InputBox("Cual es tu nombre")
MsgBox ("Hola ") & nombre
  Dim farenheit As Double
  Dim resultado As Double
  farenheit = InputBox("¿cuantos grados celsius quieres convertir?")
  resultado = 32 + (farenheit * 1.8)
  MsgBox "El resultado en Fahrenheit es " & resultado


Sub promediogeneracion()
Dim nombre As String
Dim promedio As Double
Dim grupo4010 As Double
Dim grupo4020 As Double
Dim grupo4030 As Double
Dim grupo4040 As Double
nombre = InputBox("¿Cual es tu nombre?")
MsgBox ("Hola ") & nombre & " para saber el pomedio de la generación en matemáticas pulsa OK"
grupo4010 = InputBox("¿cual es el promedio del grupo 4010?")
grupo4020 = InputBox("¿cual es el promedio del grupo 4020?")
grupo4030 = InputBox("¿cual es el promedio del grupo 4030?")
grupo4040 = InputBox("¿cual es el promedio del grupo 4040?")
promedio = (grupo4010 + grupo4020 + grupo4030 + grupo4040) / 4
MsgBox ("El promedio de la generación en Matemáticas es ") & promedio

End Sub


Sub tipografica()
Dim nombre As String
Dim independiente As Integer
nombre = InputBox("¿Cual es tu nombre?")
MsgBox ("Hola ") & nombre & " las opciones a elegir son 1. cuantitativa 2. cualitativa pulsa OK para elegir"
independiente = InputBox("Elige el numero que corresponde a la naturaleza de tu variable independiente")
If independiente = 1 Then
MsgBox ("Debe ser grafica de dispersión con linea de tendencia ecuación y R2")
Else
If independiente = 2 Then
MsgBox ("Debe ser grafica de columnas con barras de error representando desv. est.")
End If
End If

End Sub

Sub conversion()
     Dim grados As Integer, fahrenheit As Integer, kelvin As Integer, celsius As Integer, rankin As Integer
     MsgBox "Las opciones a elegir son:         1. De Fahrenheit a Kelvin.  2. De Fahrenheit a Celcius.  3. De Fahrenheit a Rankine"
     grados = InputBox("¿Que opcion Quieres?")
    If grados = 1 Then
     fahrenheit = InputBox("¿Cuantos grados Fahrenheit quieres convertir?")
     kelvin = ((fahrenheit - 32) / 1.8) + 273.15
  MsgBox "El resultado en grados Kelvin es " & kelvin
    Else
    If grados = 2 Then
      fahrenheit = InputBox("¿Cuantos grados Fahrenheit quieres convertir?")
      celsius = (fahrenheit - 32) / 1.8
      MsgBox "El resultado en grados Celcius es " & celsius
    Else
    If grados = 3 Then
      fahrenheit = InputBox("¿Cuantos grados Fahrenheit quieres convertir?")
      rankin = (fahrenheit - 32) + 491.67
      MsgBox "El resultado en grados Rankin es " & rankin
   
    End If
    End If
    End If
   
End Sub

jueves, 3 de mayo de 2018

Visual Basic

Hola chicos

Les pongo una sub rutina, primero revisen como esta desarrollada, luego cópienla en el editor de visual basic de una hoja de Excel. Agreguen una figura en la hoja de Excel y asignenle la Macro para que al pulsar sobre ella se corra la sub rutina.

Dim nombre As String
Dim base As Double
Dim altura As Double, Area As Double

Sub trianguloarea()
nombre = InputBox("¿Cual es tu nombre?")
MsgBox ("Hola ") & nombre & " Si quieres el area del triangulo pulsa aceptar"
base = InputBox("Anota la base del triangulo")
altura = InputBox("Ahora la altura")
Area = (base * altura) / 2
MsgBox ("el area del triangulo es ") & Area & " cm"

End Sub


Tengan en cuenta que:
  • Para declarar las variables pueden usar Private o Dim.
  • Pueden manejar 3 tipos de variables, Integer cuando la variable es un número entero, Double cuando es un número con decimales y String cuando la variable es texto como en el caso del nombre en la sub rutina que copiaron.
  • Estan manejando dos tipos de "cajas" InputBox es para ingresar el dato de una variable y MsgBox es para que se vea un comentario o un dato (salida).
  • Cuando ingresan un texto en el MsgBox, este debe ir entrecomillado y cuando alternan diferentes mensajes en un mismo MsgBox deben poner & entre ellos.
Ahora inventen al menos 3 sub rutinas para calcular IMC, o área de un cuadrado o transformar dolares a Pesos mexicanos o grados Celsius a grados Fahrenheit (o viceversa)

martes, 6 de febrero de 2018

Chi cuadrada como prueba de independencia de variables

CHI-CUADRADA COMO PRUEBA DE INDEPENDENCIA DE VARIABLES APLICADA A EVALUAR UNA POSIBLE ASOCIACIÓN ENTRE 2 ESPECIES.

La prueba de independencia Chi-cuadrada, nos permite determinar si existe una relación entre dos variables categóricas.

Cuando la probabilidad de que ocurra un evento aleatorio no esta afectada por la ocurrencia de otro evento entonces son variables independientes entre si, si por el contrario, la ocurrencia del evento aleatorio se ve afectada por la ocurrencia de otra, entonces se trata de variables  dependientes una de otra.

Es necesario resaltar que esta prueba nos indica si existe o no una relación entre las variables. pero no indica el grado o el tipo de relación; es decir, no indica el porcentaje de influencia de una variable sobre la otra o la variable que causa la influencia.

Por ejemplo si  en un colegio se quiere saber si el darle prioridad a tener buenas calificaciones o a ser popular o a participar en deportes es independiente de que el alumno sea niño o niña, esta seria la prueba que podría dar una respuesta, pero no nos va a decir cuales son las preferencias de las niñas y de los niños, eso lo sabremos al ver que opción es más frecuente en los niño o en las niñas.

Hoy vamos a trabajar con Chi cuadrada como prueba de independencia de variables y la vamos a aplicar  para ver si en un ecosistema dos especies se distribuyen independientemente o en función de algún tipo de asociación entre ellas.

En decir, las poblaciones  están distribuidas de forma desigual dentro del ecosistema debido a que algunas partes del hábitat son más adecuadas para algunas especies que para otras. Si dos especies se encuentran en las mismas partes de un hábitat, tenderán a ser encontradas juntas en las mismas zonas. Esto se conoce como asociación positiva. También puede haber asociaciones negativas (no se encuentran juntas), o la distribución de las dos especies puede ser independiente y aleatoriamente pueden encontrarse juntas o separadas. 

En esta prueba los datos experimentales se obtienen a partir de cuadrantes, que se aplican de la siguiente manera:

Primero se traza un cuadrante de ciertas dimensiones, por ejemplo de 10 por 10 metros y 
se ponen marcas a cada metro a lo largo ya lo ancho, después se asignan letras a cada metro a lo ancho y números a cada metro a lo largo y al azar se eligen combinaciones,por ejemplo D 8 en la intersección de ambos dentro del cuadrante grande se marca un cuadrado pequeño de 1 por 1 metro y ahi se ve si la especie 1 y/o la especie 2 se encuentran dentro de esa área.
Se contabiliza el numero de cuadrantes que presentan una de las 4 posibilidades:

Especie A ausente, B ausente, 
Especie A presente B ausente, 
Especie A ausente B presente o 
Especie A presente y B presente

Por Ejemplo

Especie A presente
Especie A ausente
Especie B presente
 54
 6

Especie B ausente
 10
 19






Hay dos posibles hipótesis:
Ho: Las dos especies se distribuyen de forma independiente.
Ha: Dos especies se asocian (positiva o negativamente)

La prueba de Chi-cuadrado es válida sólo si todas las frecuencias esperadas son mayores a 5, y la muestra fue tomada al azar dentro de la población.

1.       Elaborar una tabla de contingencia de frecuencias observadas, que son el número de cuadrantes que contienen o no cada una de las especies.

Especie A presente
Especie A ausente
Total en la fila
Especie B presente



Especie B ausente



Total en columna



En la celda amarilla se obtiene el gran total.
2.       Calcular las frecuencias esperadas: Asumiendo una distribución independiente para cada una de las 4 combinaciones, se calcula cada frecuencia esperada usando la ecuación siguiente:
  
3.       Calcular los grados de libertad usando la ecuación:   grados de libertad =  (m-1)(n-1)  donde m y n son el número de filas (m) y de columnas (n).
4.       Calcular la chi-cuadrada con la ecuación:
               
               donde Σ es sumatoria, ƒo la frecuencia observada y ƒe la frecuencia esperada.
5.       Para este cálculo se construye la siguiente tabla con las frecuencias observadas y esperadas para las 4 posibilidades
Cuadrantes con Especie
Frecuencia observada
 Frecuencia
Esperada (obtenida en el punto 2)
Solo A



Solo B



A y B



Ni A ni B



Σ



En el cuadro resalado en amarillo se obtendrá la sumatoria de esa columna que es el valor de X2 calculado y que se compara con el de tablas.
6.       Encuentre el valor crítico en la tabla de Chi-cuadrada de acuerdo a los grados de libertad obtenidos y a un nivel de significancia (p) de 0.05 (5%). (La región crítica es todo valor mayor que el encontrado en la tabla).

7.       Comparar el valor obtenido en la ecuación, con el de la tabla. Si el valor obtenido está en la región crítica (mayor que el encontrado en la tabla) se rechaza la Ho, se acepta entonces la Ha, indicando entonces con un nivel de confianza del 95%,  que hay asociación entre las 2 especies.

martes, 23 de enero de 2018

Ejercicio Chi cuadrada

Da click en el enlace para descargar el ejercicio que se trabajará en clase.

                Ejercicio Ji cuadrada Bondad de ajuste 1

Cuando acabes envíalo al correo bioticsbab@gmail.com

martes, 16 de enero de 2018

X2 COMO PRUEBA DE BONDAD DE AJUSTE

En la clase de hoy iniciamos con otra prueba estadística,  se conoce como Ji cuadrada, Chi cuadrada o X2
Esta prueba puede emplearse para diferentes fines, hoy iniciamos a usarla como una prueba de bondad de ajuste.

En este sentido resulta ser una herramienta estadística que indica cuan cercano está un grupo de resultados obtenidos (de un experimento, observación o encuesta)  con los resultados teóricos o esperados de acuerdo al estado del arte o sea lo que se sabe del fenómeno que se este evaluando. Hay que tener en cuenta que esta prueba se utiliza solamente cuando se necesita analizar variables que están categorizados y resultados basados en conteos, no en mediciones.

Algunos ejemplos podrían ser :
*    Clasificación de palmas en compactas, supercompactas, normales.
*    Clasificación de individuos en muertas, enfermas, sanas.
*    Clasificación de individuos por colores.
*    Clasificación de individuos en hembras y machos.

Esta prueba trata de probar si los resultados a partir de una muestra tienen concordancia con los esperados, y la formula que se aplica es la siguiente.


donde "o" es el valor observado para cada una de dos o mas clases, y "e" es el valor esperado correspondiente.

La forma de proceder es la siguiente: 



  • Se establece la Ho (hipótesis nula) que establece que no hay diferencias significativas entre las categorías de la variable estudiada.
  • Se establece la HA (hipótesis alternativa) que establece que si hay diferencias significativas entre las categorías de la variable estudiada. 
  • Arreglar las categorías y las frecuencias observadas en una tabla.
  • Calcular los valores teóricos esperados para el modelo experimental.
  • Se calcula las x2 para cada categoría, se suman para obtener X2.
  • Se obtienen los grados de libertad que resultan de restar 1 al numero de categorías. 



  • Se compara el valor en las tablas de contingencia a un valor de probabilidad de 0.05, que es el valor internacionalmente empleado en biología. 
  • Si x2c < x2t (el valor de x2 calculado es menor que el de la tabla)  entonces se acepta la Ho en caso contrario se acepta la HA

Ejemplo:

Se sabe que en un cruce T x T de palma, la descendencia de duras, teneras y pisiferas esta en una proporción de 1:2:1
En una muestra de 104 palmas se obtuvieron 28 duras, 49 teneras y 27 pisiferas. ¿Se ajustan estos datos a la proporción esperada?
Para comprobarlo calculo el número de las esperadas de acuerdo a la proporción 1:2:1 la cual me esta indicando que lo esperado es que del total (104), ¼ correspondan a duras, ½ a teneras y ¼ a pisiferas.

Cálculo :

Duras=104*1=26
                  4
Tenerase=104*1=52
                    2
Pisiferase=104*1=26
                       4
Categoría
Esperado
Observado
(o-e)2/e (ver formula)
Duras
26
28
0.1538
Teneras
52
49
0.1731
Pisiferas
26
27
0.0385
Total
104
104
0.3654 (X2c)

X2c = 0.365 y  Gl = 2
Los grados de libertad (Gl) se obtienen restándole 1 al número de categorías.

Haciendo uso de la tabla de probabilidades de x2 y con los grados de libertad obtenidos, se determina el valor crítico al nivel de significancia deseado. En este caso para Gl = 2 y para un nivel de 0.05 P se obtiene x2 = 5.991.

Como x2c < x2t entonces se acepta la hipótesis nula (Ho) planteada; y se concluye que no hay diferencias significativas entre lo esperado y lo observado, y que los datos corresponden a una proporción de 1:2:1.



martes, 24 de octubre de 2017

T de Student

Prueba T de Student.

Esta prueba estadística es una de las más empleadas para determinar si dos poblaciones o grupos muestrales son significativamente diferentes entre si o no.

Esta prueba compara muestras pequeñas (menores de 30 idealmente), e involucra las medias y las desviaciones estándar de dos grupos de datos. Para esta prueba se emplea la siguiente formula: 

                   

Donde X y Y (con la línea arriba), son las medias de los dos grupos de muestras;
S1 y S2 son sus desviaciones estándar y
n y m el numero de datos correspondiente a cada uno de los grupos muestrales (tamaño de la muestra).
El resultado que se obtiene de la aplicación de la formula se compara con los de una tabla de valores críticos, y dependiendo de si el valor calculado es menor o mayor al de la tabla, se puede concluir si las diferencias observadas en las medias de las poblaciones que se comparan son o no significativamente diferentes.  

Para aplicar esta prueba con el rigor estadístico que se requiere, el primer paso consiste en establecer  la hipótesis nula (H0 ) y la alternativa (Ha). La primera (Ho) establece que No hay diferencias significativas entre las muestras,  que plantea la posibilidad de in que las diferencias observadas entre las dos medias de deben al azar, en tanto que la hipótesis alternativa (Ha establece que Si hay diferencias significativas, esto es, que las diferencias se deben al tratamiento aplicado o en el caso de poblaciones, que estas son diferentes entre si para la característica evaluada. 

Ejemplo: 
En un experimento se midieron las hojas de brotes de trigo de tres días de germinados. El grupo A eran de semillas normales, en tanto que el B era de semillas que habían sido radiadas.
La siguiente tabla muestra las medias, Desviaciones estándar y tamaño de la muestra de los dos grupos.

Semillas normales (grupo A)
Semillas radiadas (grupo B)
Media del largo de las hojas mm±1mm
10.91
2.30
Desviación estándar mm
3.97
1.52
Tamaño de la muestra
15
15

Después de aplicar la formula el resultado dio 7.89.
Ahora hay que calcular los grados de libertad que son (15-1) + (15-1) = 28
Buscando en la tabla de valores críticos (enlace Tabla valores T Student ) los grados de libertad se ven en la columna de la izquierda y arriba  la probabilidad de que la diferencia se deba solo al azar.  Por convención, para Biología siempre  se trabaja con una probabilidad de  0.05 o lo que es lo mismo, de 5%.
Al ver la tabla se ve un valor crítico de 2.048, que es menor que el número calculado y en este caso se rechaza la hipótesis nula y se acepta la alternativa, esto es que las diferencias son significativas, y por tanto se concluye que la radiación si causo un efecto en el desarrollo de las plántulas. Comparando las medias, se puede ver que el efecto fue una reducción en el tamaño de las hojas.

PARA CALCULARLA EN EXCEL
En Excel la prueba no da como resultado el resultado de la formula, sino que arroja directamente la probabilidad, por lo que si este resultado es mayor de 0.05 se acepta la hipótesis nula, y si es menor  se acepta la alternativa.

La función que se usa es:
TTEST (Prueba T de Student)

Problema ejemplo:
La empresa X,  a mandado a algunos de sus empleados nuevos a un seminario de entrenamiento en Boston  durante los pasados seis meses, en tanto que  otros lo tomaron en New York. Al final del seminario, todos los empleados tomaron un examen para obtener el certificado. El seminario en Boston es más caro, pero en se piensa que el entrenamiento que se ofrece en Boston es mejor que el que se ofrece en New York.  Los resultados de las calificaciones de 15 empleados que estudiaron en Boston y de 15 empleados que estudiaron en New York son los que se presentan en la siguiente tabla.  Basadas en es estas calificaciones, ¿Se puede comprobar que el programa de Boston es mejor que el programa de New York?
Persona
Boston
New York
1
99
98
2
99
96
3
98
96
4
97
95
5
90
85
6
85
80
7
84
79
8
82
78
9
81
75
10
79
73
11
79
72
12
68
69
13
61
67
14
60
62
15
56
60
Promedio
81.2
79
Desv. Est.
14.4973
12.6152

Observaciones:
La función de TTEST calcula la probabilidad asociada con la prueba t de Student para determinar la probabilidad de que dos muestras procedan de dos poblaciones subyacentes. La función pide lo siguiente: TTEST(Array1, Array 2, tails, type) [PRUEBA.T(matriz1, matriz2, colas, tipo)]:
Array 1 es el primer conjunto de datos, el cual en este ejemplo son las calificaciones de Boston.
Array 2 es el segundo conjunto de datos, el cual en este ejemplo son las calificaciones de New York.
Tails especifica el número de colas de distribución. Si el argumento colas = 1, TTEST utiliza la distribución de una cola. Si colas = 2, TTEST utiliza la distribución de dos colas.  En este ejemplo se supone 2 colas ya que la diferencia puede ser positiva o negativa.
Type es el tipo de prueba t que se realiza: 1 = Observaciones por pares; 2 = Observaciones de dos muestras con varianzas iguales; y 3 = Observaciones de dos muestras con varianzas diferentes.  En este ejemplo se supone dos muestras con varianzas iguales.
Como resultado, la función de este ejemplo es la siguiente: TTEST(B2:B16, C2:C16, 2, 2). La probabilidad asociada con el valor t es de 0.6609.  Ya que el valor no es menor de.05, no podemos decir que el entrenamiento en Boston es significativamente mejor que el entrenamiento de New York. Además, basada en esta información sería difícil justificar el entrenamiento más caro de Boston.”
Ustedes una ves que tienen sus datos en Excel calculan media y desviación estándar. Luego abren el cuadro de funciones, seleccionan las estadísticas y buscan la de PRUEBA.T o TTEST y les aparece el cuadro del ejemplo de arriba, seleccionan los datos de la primera columna en matriz 1, los de la 2ª en matriz 2 en colas ponen 2 y en el tipo generalmente es el 3.

BIBLIOGRAFIA;
APUNTES DE TALLERES BI

jueves, 7 de septiembre de 2017

Media y Desviación Estándar

MEDIDAS DE TENDENCIA CENTRAL

Son aquellas que indican alrededor de qué valores se agrupan los datos observados. Distinguimos:

 1. La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos.    
2. Mediana: es el punto medio de una serie ordenada de datos.
3. Moda: es el valor más frecuente de la serie de datos.


MEDIDAS DE DISPERSION.


Cuando ustedes muestren por ejemplo la estatura de todos los alumnos del colegio que tienen entre 16 y 19 años, tendremos estaturas que van desde 1.55 hasta 1.85, dentro de este rango veremos que por lo general los que son más bajitos o más altos son pocos comparados con los que están más cercanos a la media, si hacemos una gráfica de frecuencias y ponemos una linea que una los puntos, tendremos una gráfica de tipo campana llamada campana de Gauss.
Esta me esta mostrando que tan dispersos están los datos con respecto a la media de todos, por ejemplo:
                   



En estas gráficas vemos que en el caso de la curva color mostaza los datos están muy "dispersos" o sea muy alejados de la media, por el contrario en la curva color azul, los datos están muy agrupados alrededor de la media.
Para poner esta dispersión de manera cuantificada, se usan varias "medidas de dispersión".
 Para saber como se distribuyen los datos y cuanto se alejan de las medidas centrales, existen diferentes medidas, como por ejemplo:
  • Rango: que es la diferencia entre el valor mínimo y el máximo.
  • Varianza: que muestra la dispersión de los valores alrededor de la media.
S_X^2 = \frac{\sum_{i=1}^n (X_i - \bar{X})^2}{n-1}
  • Desviación estándar: que es la raíz cuadrada de la varianza y a partir de ella se desarrollan diversos métodos de análisis estadísticos,
S = \sqrt{\frac{\sum_{i=1}^n (x_i - \bar{x})^2}{n-1}}


Esta formula nos da un número que cuando comparamos entre diferentes poblaciones nos dice cual está más dispersa (mostaza) y cual menos (azul).

Esto es importante porque cuando hacemos un experimento y medimos las desviaciones estándar de nuestros resultados, esperamos que estén en cierta medida agrupados alrededor de la media pues eso nos da confianza de que el experimento es reproducible y de que hemos controlado bien nuestras variables, en caso contrario lo ideal seria aumentar el tamaño de la muestra (mas repeticiones) para disminuir esa dispersión y adicionalmente mejorar el control de las variables.
La interpretación que se da de esta medida parte del hecho de que, al sumar y restar el valor de una desviación estándar al valor de la media, se establece una rango que comprende al 68% de la población, es decir, que si por ejemplo, la media de la estatura de los adultos de una población es 1.75 m, y la desviación estándar es de 12 cm, el 68% de la población mide entre 1.63 y 1.87.
Mientras más grande sea la desviación estándar, más dispersos estarán los datos con respecto a la media y por tanto la media será menos representativa de la población.


A continuación está un vínculo, lo que harán ahora es abrirlo y descargarlo, calcular media (promedio) Desviación estándar y van a graficar como se les indique en clase

Ejercicio de desviación estándar

Abajo encontrarán un enlace más, la diferencia es que vienen dos ejercicios en los que también calcularán la media y desviación estándar pero que graficarán de manera distinta pues los datos de la variable independiente son de naturaleza diferente (continuos en una y cualitativos o categorizados en la otra, los trabajaremos también porque les servirá para el reporte de su practica de Osmosis.

Ejercicios con gráficas