.Stats .counter-wrapper { background-image: url(http://bit.ly/23BUKkb); height: 55px; font-family: Pacifico; color: white; font-size: 32px; font-weight: 500; display: block; text-align: center; margin-left: 50px; padding-top: 2px; } .

mi茅rcoles, 31 de mayo de 2017

Resumen del tema 8 de ETICs: Medidas de tendencia central, posici贸n y dispersi贸n.

1.       MEDIDAS DE TENDENCIA CENTRAL

  •         Media aritm茅tica: Se calcula para variables cuantitativas y se trata del centro geom茅trico o de gravedad de nuestros datos. Es la suma de todos los valores de la variable observada entre el total de observaciones. La f贸rmula es:

x= x/n
Cuando los datos est谩n agrupados (dos intervalos), para calcular la media utilizamos como valor de referencia de cada intervalo su marca de clase: se calcula una media aritm茅tica ponderada que se calcula sumando la marca de clase por la frecuencia absoluta, entre N

  •         Mediana: medida de posici贸n y central.Es el valor de la observaci贸n tal que deja a un 50% de los datos  menor y otro 50% de los datos mayor.

-          Si el n煤mero de observaciones es impar el valor de la observaci贸n ser谩 justamente la observaci贸n que ocupa la posici贸n (n+1/2) Ejemplo: si son 75, pues 76 entre 2 = 38, la mediana seria la edad que tiene el sujeto 38.
-          Si el n煤mero de observaciones es par, el valor de la mediana corresponde a la media entre los dos valores centrales, es decir, la media entre la observaci贸n n/2 y la observaci贸n (n/2)+1. Ejemplo: cuatro sujetos de edades, 10, 15, 20, 25, cogemos los dos sujetos centrales y hacemos la media aritm茅tica entre ambos.

  •          Propiedad: robustez. S贸lo tiene en cuenta la posici贸n de los valores en la muestra y por tanto tiene mucho mejor comportamiento que la media cuando hay observaciones extremas.
  •          Moda: Es el valor con mayor frecuencia (que m谩s veces se repite). Si hay m谩s de una se dice que la muestra es bimodal (dos modas) o multimodal (m谩s de dos modas). Se puede calcular para cualquier tipo de variable tanto la cualitativa como la cuantitativa. La moda no es el n煤mero m谩s frecuente si no la categor铆a.

Si los datos est谩n agrupados, se habla de clase modal y corresponde al intervalo en el que el cociente entre la frecuencia relativa y la amplitud (se resta el intervalo mayor menos el menor) es mayor (hi/ci). Donde la frecuencia absoluta sea mayor.

2.       MEDIDAS DE POSICI脫N O CUANTILES

Se calculan para variables cuantitativas y, al igual que la mediana, s贸lo tienen en cuenta la posici贸n ordenado de mayor o menor de los valores en la muestra.
Los cuantiles m谩s usuales son los percentiles, los deciles y los cuartiles, seg煤n dividan la muestra ordenada en 100 (perciles), 10 (deciles) 贸 4 partes (cuartiles), respectivamente.

-          Percentiles:
o   Dividen la muestra ordenada en 100 partes.
o   El percentil “i” (Pi), es aqu茅l valor que, ordenadas las observaciones en forma creciente, el i% de ellas son menores que 茅l y el (100-i)% restante son mayores.
o   Para buscar la posici贸n de un percentil en una serie de datos agrupados, buscamos el intervalo en el que la frecuencia relativa acumulada (Hi) sea superior al valor del percentil.
o   El valor del P50 corresponde al valor de la mediana.

-          Deciles:
o   Dividen la muestra ordenada en 10 partes.
o   El decil “i” (Di), es aqu茅l valor que, ordenadas las observaciones en forma creciente, el i/10% de ellas son menores que 茅l y el (100-i)/10% restante son mayores.
o   El valor del D5 corresponde al valor de la mediana y, por tanto, al del P50.
-          Cuartil:
o   Dividen la muestra ordenada en 4 partes.
o   El Q1, primer cuartil indica el valor que ocupa una posici贸n en la serie num茅rica de forma que el 25% de las observaciones son menores y que el 75% son mayores.
o   El Q2, segundo cuartil indica el valor que ocupa una posici贸n en la serie num茅rica de forma que el 50% de las observaciones son menores y que el 50% son mayores. Por tanto, el Q2 coincide con el valor del D5, con el valor de la mediana P50.
o   El Q3, tercer cuartil indica el valor que ocupa una posici贸n en la serie num茅rica de forma que el 75% de las observaciones son menores y que el 25% son mayores.
o   El Q4, cuarto cuartil indica el valor mayor que se alcanza en la serie num茅rica.

3.       MEDIDAS DE DISPERSI脫N.

  •          Rango o recorrido: Diferencia entre el mayor y el menor valor de la muestra lXn-X1l (valor absoluto).
  •         Desviaci贸n media: Media aritm茅tica de las distancias de cada observaci贸n con respecto a la media de la muestra: 



Resultado de imagen de desviacion media formula







Para datos agrupados:

Resultado de imagen de desviacion media formula

  •          Desviaci贸n t铆pica o est谩ndar: Cuantifica el error que ometemos si representamos una muestra 煤nicamente por su media.  Esta es la que m谩s se emplea debido a que esta nos da un mayor rango de error. 

Resultado de imagen de desviaci贸n tipica

Para datos agrupados:  
                                             Resultado de imagen de desviaci贸n tipica para datos agrupados

  •       Varianza: Expresa la misma informaci贸n en valores cuadr谩ticos:         

Resultado de imagen de varianza
                                               

Para agrupados:


  •          Recorrido intercuart铆lico: Diferencia entre el tercer y el primer cuartil = lQ3-Q1l
  •          Coeficiente de variaci贸n: Es una medida de dispersi贸n relativa (adimensional) ya que todas las dem谩s se expresan en la unidad de medida de la variable. Nos sirve para comparar la heterogeneidad de dos series num茅ricas con independencia de las unidades de medidas. Se expresa sin unidades. Siempre va de 0 a 1.

-          c.v.=s/x 



4.      DISTRIBUCIONES NORMALES


En estad铆stica se llama distribuci贸n normal, distribuci贸n de Gauss o distribuci贸n gaussiana, a una de las distribuciones de probabilidad de variable continua que con m谩s frecuencia aparece en fen贸menos reales. Es Distribuci贸n de probabilidad m谩s frecuente con variables continuas, por ejemplo, altura, peso, niveles de colesterol…

Las distribuciones normales en un histograma aparece una especie de Campana, por eso la campana de Gauss. Y es sim茅trica respecto de los valores de posici贸n central, es decir que la moda va a coincidir con la media y la mediana.

Media, moda, mediana.

La gr谩fica de su funci贸n de densidad tiene una forma acampanada y es sim茅trica respecto de los valores posici贸n central (media, mediana y moda, que coinciden en estas distribuciones). Es simetrica dejando la mitad de los valores por debajo del punto maximo y la mitad de los valores por encima. 

 

Resultado de imagen de campana de gauss en blanco

Resultado de imagen de campana de gauss

     
Una distribuci贸n normal sigue estos principios b谩sicos: si al valor de la media le restamos y le sumamos una desviaci贸n t铆pica, si la serie num茅rica siguiera una distribuci贸n normal (como el colesterol). Dice que el 68.25% de las observaciones se va a sumar entre los valores de la suma y la resta de la media a una desviaci贸n t铆pica. Estas datos var铆an si sumamos una, dos o tres desviaciones t铆picas.
-       S 68,26% de las observaciones.
-        2xS95,45% de las observaciones.        
-        3xS 99,73% de las observaciones.


                                                                                                       





5.       ASIMETR脥AS Y CURTOSIS

Imagen relacionada

La asimetr铆a es al lado contrario al que vemos el pico (la moda), es decir si vemos el pico hacia la derecha la asimetr铆a es a la izquierda, y si la moda esta a la izquierda la asimetr铆a esta hacia la derecha.
Coeficiente de asimetr铆a de una variable: Grado de asimetr铆a de la distribuci贸n de sus datos en torno a su media, cuanto m谩s asim茅trica sea, valores m谩s diferentes encontraremos.

  •          Asimetr铆as:

Los resultados pueden ser los siguientes:
-          g1=0 (distribuci贸n sim茅trica; existe la misma concentraci贸n de valores a la derecha y a la izquierda de la media).
-          g1>0 (distribuci贸n asim茅trica positiva; existe mayor concentraci贸n de valores  a la derecha de la media que a su izquierda).
-          g1<0 (distribuci贸n asim茅trica negativa; existe mayor concentraci贸n de valores a la izquierda de la media que a su derecha).

  •           Curtosis o apuntamiento de la curva:

No tiene relaci贸n con la simetr铆a. Coeficiente de apuntamiento o curtosis de una variable, sirve para medir el grado de concentraci贸n de los valores que toma en torno a su media. Los datos se acumulan mucho, mientras m谩s se acumulen, mas apuntada esta la curva.

Los resultados pueden ser los siguientes:
-          g2=0 (distribuci贸n mesoc煤rtica o normal). Presenta un grado de concentraci贸n medio alrededor de los valores centrales de la variable (el mismo que presenta una distribuci贸n normal).
-          g2>0 (distribuci贸n leptoc煤rtica). Presenta un elevado grado de concentraci贸n alrededor de los valores centrales de la variable.
-          g2<0 (distribuci贸n platic煤rtica). Presenta un reducido grado de concentraci贸n alrededor de los valores centrales de la variable.

Resultado de imagen de asimetria y curtosis
6.       TIPICACION DE LOS VALORES Y SU RELACION CON LA CAMPANA DE GAUSS. 

Trabajamos con una variable continua que:
-          Sigue una distribuci贸n normal (TLC)
-          Tiene mas de 100 unidades (LGN)
La tipificaci贸n nos permite conocer si valor corresponde o no a esa distribuci贸n con frecuencia

No hay comentarios:

Publicar un comentario

Ambulance