MEDIDAS DE POSICION
MEDIDAS DE POSICION
Son indicadores usados para señalar que porcentaje de datos dentro de una distribución de frecuencias superan estas expresiones, cuyo valor representa el valor del dato que se encuentra en el centro de la distribución de frecuencia, por lo que también se les llama " Medidas de Tendencia Central ".
Pero estas medidas de posición de una distribución de frecuencias han de cumplir determinadas condiciones para que lean verdaderamente representativas de la variable a la que resumen. Toda síntesis de una distribución se considerara como operativa si intervienen en su determinación todos y cada uno de los valores de la distribución, siendo única para cada distribución de frecuencias y siendo siempre calculable y de fácil obtención.
CUARTILES:
Dividen a la población de datos en cuatro partes iguales, correspondiendo cada uno de ellos al 25% de los datos. Tenemos por tanto tres cuartiles que denotamos como Q1, Q2, Q3, y se les llama primer, segundo y tercer cuartil.
El segundo cuartil coincide con la mediana.
Toma nota que cuando el número de datos es impar. Se le sumará 1 al número de datos. Quedaría así QX=(K*(N+1))/4
Datos agrupados:
DECILES:
Dividen la distribución de datos en 10 partes iguales, correspondiendo cada uno al 10% de los datos. Tendríamos, por tanto, nueve deciles que denotamos por D1, D2, D3, ..., D9
El quinto decil coincide con la mediana.
Toma nota que cuando el número de datos es impar. Se le sumará 1 al número de datos. Quedaría así QX=(K*(N+1))/10
Datos agrupados:
PERCENTILES:
Tenemos 99 percentiles que dividirían a la población en 100 partes iguales, denotados por P1, P2, ..., P98, P99.
Los percentiles 25, 50 y 75 coinciden con los cuartiles.
Toma nota que cuando el número de datos es impar. Se le sumará 1 al número de datos. Quedaría así QX=(K*(N+1))/100
MEDIDAS DE DISPERSION
Las medias de tendencia central o posición nos indican donde se sitúa un dato dentro de una distribución de datos. Las medidas de dispersión, variabilidad o variación nos indican si esos datos están próximos entre sí o sí están dispersos, es decir, nos indican cuán esparcidos se encuentran los datos. Estas medidas de dispersión nos permiten apreciar la distancia que existe entre los datos a un cierto valor central e identificar la concentración de los mismos en un cierto sector de la distribución, es decir, permiten estimar cuán dispersas están dos o más distribuciones de datos.
DESVIACION MEDIA:
La desviación media es la media de la distancia de los valores de los datos (en valor absoluto) a la media.
El uso del valor absoluto es para evitar que se anulen distancias negativas con distancias positivas, lo que daría como resultado que la desviación media sea cero para cualquier distribución de datos.
PARA DATOS NO AGRUPADOS:
PARA DATOS AGRUPADOS:
DESVIACION ESTANDAR:
La desviación estándar mide el grado de disersión de los datos con respecto a la media, se denota como s para una muestra o como σ para la población. Se define como la raiz cuadrada de la varianza según la expresión
Obsérvese que el denominador es n - 1, a diferencia de la desviación media donde se divide entre n; también existe la formula de desviación típica donde el denominador es n pero se prefiere n-1.
Mientras menor sea la desviación estándar, los datos son más homogéneos, es decir existe menor dispersión, el incremento de los valores de la desviación estándar indica ina mayor variabilidad de los datos.