1.
MEDIDAS DE
TENDENCIA CENTRAL
- Media aritm茅tica: Se calcula para variables cuantitativas y se trata del centro
geom茅trico o de gravedad de nuestros datos. Es la suma de todos los valores de
la variable observada entre el total de observaciones. La f贸rmula es:
x= 譬x/n
- Mediana: medida de posici贸n y central.Es el valor de la
observaci贸n tal que deja a un 50% de los datos
menor y otro 50% de los datos mayor.
-
Si
el n煤mero de observaciones es impar el
valor de la observaci贸n ser谩 justamente la observaci贸n que ocupa la posici贸n (n+1/2)
Ejemplo: si son 75, pues 76 entre 2 = 38, la mediana seria la edad que tiene el
sujeto 38.
-
Si
el n煤mero de observaciones es par,
el valor de la mediana corresponde a la media entre los dos valores centrales,
es decir, la media entre la observaci贸n n/2 y la observaci贸n (n/2)+1. Ejemplo:
cuatro sujetos de edades, 10, 15, 20, 25, cogemos los dos sujetos centrales y
hacemos la media aritm茅tica entre ambos.
- Propiedad: robustez. S贸lo tiene en cuenta la posici贸n de los valores en la muestra y por tanto tiene mucho mejor comportamiento que la media cuando hay observaciones extremas.
- Moda: Es el valor con mayor frecuencia (que m谩s veces se repite). Si hay m谩s de una se dice que la muestra es bimodal (dos modas) o multimodal (m谩s de dos modas). Se puede calcular para cualquier tipo de variable tanto la cualitativa como la cuantitativa. La moda no es el n煤mero m谩s frecuente si no la categor铆a.
Si los datos est谩n agrupados, se habla de clase modal y corresponde al intervalo
en el que el cociente entre la frecuencia relativa y la amplitud (se resta el
intervalo mayor menos el menor) es mayor (hi/ci). Donde
la frecuencia absoluta sea mayor.
2.
MEDIDAS DE POSICI脫N O CUANTILES
Se calculan para
variables cuantitativas y, al igual
que la mediana, s贸lo tienen en cuenta la posici贸n
ordenado de mayor o menor de los valores en la muestra.
Los cuantiles m谩s
usuales son los percentiles, los deciles y los cuartiles, seg煤n dividan la muestra ordenada en 100 (perciles), 10
(deciles) 贸 4 partes (cuartiles), respectivamente.
-
Percentiles:
o
Dividen
la muestra ordenada en 100 partes.
o
El
percentil “i” (Pi), es aqu茅l valor que, ordenadas las observaciones
en forma creciente, el i% de ellas son menores que 茅l y el (100-i)% restante
son mayores.
o
Para
buscar la posici贸n de un percentil en una serie de datos agrupados, buscamos el
intervalo en el que la frecuencia relativa acumulada (Hi) sea
superior al valor del percentil.
o
El
valor del P50 corresponde al valor de la mediana.
-
Deciles:
o
Dividen
la muestra ordenada en 10 partes.
o
El
decil “i” (Di), es aqu茅l valor que, ordenadas las observaciones en
forma creciente, el i/10% de ellas son menores que 茅l y el (100-i)/10% restante
son mayores.
o
El
valor del D5 corresponde al valor de la mediana y, por tanto, al del
P50.
-
Cuartil:
o
Dividen
la muestra ordenada en 4 partes.
o
El
Q1, primer cuartil indica el valor que ocupa una posici贸n en la
serie num茅rica de forma que el 25% de las observaciones son menores y que el
75% son mayores.
o
El
Q2, segundo cuartil indica el valor que ocupa una posici贸n en la
serie num茅rica de forma que el 50% de las observaciones son menores y que el
50% son mayores. Por tanto, el Q2 coincide con el valor del D5,
con el valor de la mediana P50.
o
El
Q3, tercer cuartil indica el valor que ocupa una posici贸n en la
serie num茅rica de forma que el 75% de las observaciones son menores y que el
25% son mayores.
o
El
Q4, cuarto cuartil indica el valor mayor que se alcanza en la serie
num茅rica.
3. MEDIDAS DE DISPERSI脫N.
- Rango o recorrido: Diferencia entre el mayor y el menor valor de
la muestra lXn-X1l (valor absoluto).
-
Desviaci贸n media: Media aritm茅tica de las distancias de cada observaci贸n con respecto a la
media de la muestra:
Para datos agrupados:
-
Desviaci贸n t铆pica o est谩ndar: Cuantifica el error que ometemos si
representamos una muestra 煤nicamente por su media. Esta es la que m谩s se emplea debido a que esta
nos da un mayor rango de error.
Para datos agrupados:
- Varianza: Expresa la misma informaci贸n en valores cuadr谩ticos:
Para agrupados:
- Recorrido intercuart铆lico: Diferencia entre el tercer y el primer
cuartil = lQ3-Q1l
- Coeficiente de variaci贸n: Es una medida de dispersi贸n relativa
(adimensional) ya que todas las dem谩s se expresan en la unidad de medida de la
variable. Nos sirve para comparar la heterogeneidad de dos series num茅ricas con
independencia de las unidades de medidas. Se expresa sin unidades. Siempre va de 0 a 1.
- c.v.=s/x
4. DISTRIBUCIONES NORMALES
En estad铆stica se llama distribuci贸n normal, distribuci贸n de
Gauss o distribuci贸n gaussiana, a una de las distribuciones de probabilidad de
variable continua que con m谩s frecuencia aparece en fen贸menos reales. Es
Distribuci贸n de probabilidad m谩s frecuente con variables continuas, por
ejemplo, altura, peso, niveles de colesterol…
Las distribuciones normales en un histograma aparece una
especie de Campana, por eso la campana de Gauss. Y es sim茅trica respecto de los
valores de posici贸n central, es decir que la moda va a coincidir con la media y
la mediana.
Media, moda, mediana.
|

Una distribuci贸n normal sigue estos principios
b谩sicos: si al valor de la media le restamos y le sumamos una desviaci贸n
t铆pica, si la serie num茅rica siguiera una distribuci贸n normal (como el
colesterol). Dice que el 68.25% de las observaciones se va a sumar entre los
valores de la suma y la resta de la media a una desviaci贸n t铆pica. Estas datos
var铆an si sumamos una, dos o tres desviaciones t铆picas.
-
S
68,26% de las observaciones.
-
2xS95,45% de las observaciones.
-
3xS 99,73% de las observaciones.
5.
ASIMETR脥AS Y CURTOSIS
La asimetr铆a
es al lado contrario al que vemos el pico (la moda), es decir si vemos el pico
hacia la derecha la asimetr铆a es a la izquierda, y si la moda esta a la
izquierda la asimetr铆a esta hacia la derecha.
Coeficiente de asimetr铆a de una
variable: Grado de asimetr铆a de la distribuci贸n de sus datos en
torno a su media, cuanto m谩s asim茅trica sea, valores m谩s diferentes
encontraremos.
- Asimetr铆as:
Los
resultados pueden ser los siguientes:
-
g1=0 (distribuci贸n sim茅trica; existe la
misma concentraci贸n de valores a la derecha y a la izquierda de la media).
-
g1>0 (distribuci贸n asim茅trica positiva;
existe mayor concentraci贸n de valores a
la derecha de la media que a su izquierda).
-
g1<0 (distribuci贸n asim茅trica negativa;
existe mayor concentraci贸n de valores a la izquierda de la media que a su
derecha).
- Curtosis o
apuntamiento de la curva:
No tiene
relaci贸n con la simetr铆a. Coeficiente de apuntamiento o curtosis de una
variable, sirve para medir el grado de concentraci贸n de los valores que toma en
torno a su media. Los datos se acumulan mucho, mientras m谩s se acumulen, mas
apuntada esta la curva.
Los
resultados pueden ser los siguientes:
-
g2=0
(distribuci贸n mesoc煤rtica o normal). Presenta un grado de concentraci贸n medio
alrededor de los valores centrales de la variable (el mismo que presenta una
distribuci贸n normal).
-
g2>0
(distribuci贸n leptoc煤rtica). Presenta un elevado grado de concentraci贸n
alrededor de los valores centrales de la variable.
-
g2<0
(distribuci贸n platic煤rtica). Presenta un reducido grado de concentraci贸n
alrededor de los valores centrales de la variable.
6.
TIPICACION DE LOS VALORES Y SU
RELACION CON LA CAMPANA DE GAUSS.
Trabajamos
con una variable continua que:
-
Sigue
una distribuci贸n normal (TLC)
-
Tiene
mas de 100 unidades (LGN)
La tipificaci贸n nos permite conocer si valor
corresponde o no a esa distribuci贸n con frecuencia
No hay comentarios:
Publicar un comentario