DISTRIBUCION NORMAL, NORMAL ESTANDARIZADA, DISTRIBUCION BONOMIAL Y VALORES DE LA CURVA Z DENTRO DE LA CURVANORMAL
La distribución normal (en ocasiones llamada distribución gaussiana) es la distribución continua que se utiliza más comúnmente en estadística. La distribución normal es de vital importancia en estadística por tres razones principales:
-
Muchas variables continuas comunes en el mundo de los negocios tienen distribuciones que se asemejan estrechamente a la distribución normal.
-
La distribución normal sirve para acercarse a diversas distribuciones de probabilidad discreta, como la distribución binomial y la distribución de Poisson.
-
La distribución normal proporciona la base para la estadística inferencial clásica por su relación con el teorema de límite central.
En la distribución normal, uno puede calcular la probabilidad de que varios valores ocurran dentro de ciertos rangos o intervalos. Sin embargo, la probabilidad exacta de un valor particular dentro de una distribución continua, como la distribución normal, es cero. Esta propiedad distingue alas variables continuas, que son medidas, de las variables discretas, las cuales son contadas. Como ejemplo, el tiempo (en segundos) se mide y no se cuenta. Por lo tanto, es factible determinar la probabilidad de que el tiempo de descarga para una página principal en un navegador de la Web esté entre 7 y 10 segundos o que la probabilidad de que el tiempo de descarga esté entre 8 y 9 segundos, o la probabilidad de que el tiempo de descarga esté entre 7.99 y 8.01 segundos. Sin embargo, la probabilidad de que el tiempo de descarga sea exactamente de 8 segundos es cero.
FORMULA:
EJEMPLO:
DISTRIBUCION NORMAL ESTANDARIZADA:
La distribución normal estándar, o tipificada o reducida, es aquella que tiene por media el valor cero, µ =0, y por desviación típica la unidad, σ =1.
La probabilidad de la variable X dependerá del área del recinto sombreado en la figura. Y para calcularla utilizaremos una tabla.
Tipificación de la variable:
Es posible expresar cualquier distribución normal como una de la forma unitaria (N(0,1)), la cual se denomina distribución normal tipificada. Para ello se utiliza la expresión:
Una de las ventajas de tipificar una distribución es que se puede medir la desviación de los datos respecto a la media, lo cual permite comparar la posición relativa de los datos.
La distribución tipificada se aplica en estadística inferencial para determinar intervalos de confianza para la media de una población, usualmente se utiliza un nivel de confianza del 95% para el cual Z = 1.96.
EJEMPLO:
La temperatura durante setiembre está distribuida normalmente con media 18,7ºC y desviación standard 5ºC. Calcule la probabilidad de que la temperatura durante setiembre esté por debajo de 21ºC.
Ahora vamos a la tabla y para el valor de Z = 0,46 tenemos que la probabilidad es de 0,6772.
EJEMPLO 2:
Un conjunto de personas con edad promedio 25 años y desviación estándar 3,86. Nuestro valor de interés (x) es 30 años. El valor de Z correspondiente será:
Este valor de Z nos dice que la edad de 30 años está a 1,29 desviaciones estándar sobre el promedio.
Ahora bien, la tabla de la distribución normal, entrega valores de probabilidad para los distintos valores de Z.
DISTRIBUCION BINOMIAL:
Llamamos experiencia aleatoria dicotómica a aquella que sólo puede tener dos posibles resultados A y A'. Usualmente A recibe el nombre de éxito, además representaremos como p = p(A) y q = 1-p=p(A').
A la función de probabilidad de una variable aleatoria X resultado de contar el número de éxitos al repetir n veces una experiencia aleatoria dicotómica con probabilidad de éxito p la llamamos distribución binomial y la representamos por
B (n, p)
Para esta distribución se verifica que, la variable X puede tomar los valores:
0, 1, 2, ... , n
y que la variable toma cada uno de estos valores con probabilidad:
EJEMPLO 3:
Supongamos que se lanza un dado (con 6 caras) 51 veces y queremos conocer la probabilidad de que el número 3 salga 20 veces. En este caso tenemos una X ~ B(51, 1/6) y la probabilidad sería P(X=20):
VALORES DE LA CURVA Z DENTRO DE LA CURVA NORMAL
Un concepto asociado a cualquier distribución de probabilidad es el de Función de Distribución. La función de distribución en un punto se define como la probabilidad de que la variable tome valores menores o iguales a él. Así, la función de distribución en el punto "a", que representaremos por F(a), será :
F(a) = P [ X ≤ a].
La siguiente escena muestra la función de distribución de la variable Z → N( 0 , 1 ) para valores positivo de Z. Desplazando el punto rojo obtienes el valor del área bajo la curva que representa la probabilidad P [ Z ≤ a ].
Lo averiguaremos con un valor concreto: ¿cuál es la probabilidad de encontrar un valor de Z menor o igual a 1,96?
Vamos a la tabla y familiaricémonos con algunas de sus características.
▪ En la primera columna de la tabla aparece el entero y primer decimal del valor de Z, vemos que los valores van desde -3,4 a 3,3. En la primera fila (arriba), aparece el segundo decimal del valor de Z y, como es lógico, hay 10 números (0,00 a 0,09).
▪ Entonces, para nuestro valor de Z = 1,96 buscaremos 1,9 en la primera columna de la tabla y 0,06 en la primera fila de la tabla. Trazaremos líneas perpendiculares desde esos valores y llegaremos a un número en el cuerpo de la tabla (véase la tabla más abajo, que tiene marcadas las dos perpendiculares de las que hablamos. El número que encontramos y que está destacado es: 0,9750.
▪ Por lo tanto, la probabilidad asociada a Z=1,96 es 0,9750, es decir, la probabilidad de encontrar un valor de Z menor o igual a 1,96 es 0,9750.
En nuestro ejemplo anterior, con la edad 30 años, vemos que el valor Z = 1,29 tiene una probabilidad asociada de 0,9014. Entonces, la probabilidad de encontrar una persona con edad de 30 años o menos, en este grupo humano, es 0,9014.