Medidas de tendencia central



Parámetros que muestran el comportamiento de una variable en una distribución. Se clasifican en tres:

La Media

Es el promedio, es el método de tendencia central más importante, se calcula cuando los datos son razonablemente homogéneos, la medida es sensible a los cambios en los valores de la distribución. Se comporta como un dato algebraico, no se puede calcular si falta un extremo de una distribución de una variable continua, no se debe calcular si los datos están presentados como índice o como porcentajes y tampoco si están muy dispersos, (X = media).
Fórmula:     X: ∑xi / n  

Ej: Calcular la media de los siguientes datos: 12- 16-17-21              
12-16-17-21/ 4

Media Aritmética Ponderada

Se calcula cuando los datos tienen pesos específicos diferentes entre sí.
Fórmula: X: ∑Xi. Wi / ∑ Wi



Ej: Calcular la media de los siguientes datos.


X: 2-2-2-2-1-1-3-3-3-4-4-9-9-9-10
2(4)+1(2)+3(3)+4(2)+9(3)+10(1) / 15 = 4,26

Ej: Al finalizar el semestre una alumna obtuvo las siguientes notas, hallar la media aritmética de los siguientes datos:

Inglés:
4,8
0
0
Gestión administrativa:
3,5
2
7
Estadística:
3,2
3
9,6
Calculo:
1,6
3
4,8
Física:
0,2
3
0,6
Total

11
22

X: 22 / 11 = 2
Variable Discreta
El número de materias elegidas por 12 estudiantes, son las siguientes. Calcular la media aritmética de manera agrupada y no agrupada.
Discreta- agrupados:

Yi
ni
Yini
1
1
1
2
1
2
3
3
9
4
3
12
5
0
0
6
1
6
7
3
21
TOTAL
12
51

X = ∑Yini/n = 51/12 = 4,25 → El número de materias promedio tomada por los estudiantes es de 4.
Datos no agrupados:
3-1-4-2-6-7-4-3-3-4-7-7
X= 3+1+4+2+6+7+4+3+3+4+7+7 / 12
X= 4,25 → El número de materias promedio tomada por los estudiantes es de 4.
NOTA IMPORTANTE: Cuando la variable sea discreta la media para los datos agrupados o no agrupados da el mismo valor.
Variable Continua
El peso de 13 estudiantes corresponde:
71-82-50-55-55-62-70-99-64-50-78-72-60
Datos no agrupados:
71-82-50-55-55-62-70-99-64-50-78-72-60
X = 71+82+50+55+55+62+70+99+64+50+78+72+60/ 13
X= 66.8 → El peso promedio de 13 estudiantes es de 66.8 Kg
Datos agrupados:
X máx= 99
X min = 50
Rango= 99-50 = 49
K = 1 + 3.3log(13) = 4.7
a = 49 / 4.7 = 10.4


Yi-1 → Yi
ni
fi
Fi
Ni
Yi
Yini
50
60,4
5
0,384615385
0,38461538
5
55,2
276
60,4
70,8
3
0,230769231
0,61538462
8
65,6
196,8
70,8
81,2
3
0,230769231
0,84615385
11
76
228
81,2
91,6
1
0,076923077
0,92307692
12
86,4
86,4
91,6
102
1
0,076923077
1
13
96,8
96,8
TOTAL
13
1



884

X = ∑Yini/n = 884/13 = 68
NOTA IMPORTANTE: Si la variable es continua la media para los datos agrupados o no agrupados no es igual, la diferencia radica en la construcción de los intervalos. 
Mediana
Centro de la distribución. Parámetro que reúne el comportamiento de la mitad de la muestra o la población. No es sensible a los cambios en los valores de la distribución mientras estos no se hagan en un valor central. Se puede calcular aún si los datos son muy dispersos y aún si falta un dato en el extremo de la distribución de una variable continua. La mediana es el valor central si el número de observaciones es impar, pero si es par, es la semisuma de los valores centrales. SIEMPRE HAY QUE ORGANIZAR LOS DATOS PARA SU CÁLCULO.
Discreta: Pasos a seguir cuando la variable es discreta y los datos son no agrupados.
Impar:
Ej.1: Número de manzanas semanales que consumen 7 personas.
2-0-1-3-80.000-8-7 (se deben organizar para determinar la mediana) 
0-1-2-3-7-8-80.000 (como son 7 datos, es decir, el número es impar, se elige el valor central, que en este caso sería 3)
Mediana: 3 → El 50% de las personas consumen 3 manzanas semanales.
Me: n+1 / 2  posición
Me= 7+1 / 2 = 4 posición
Par:
Ej.2: Número de litros de agua que toman 6 personas diariamente 
1-4-9-5-2-6 (se deben organizar para determinar la mediana) 
1-2-4-5-6-9 (como son 6 datos, es decir, el número es par, se debe realizar la semisuma entre los dos valores centrales, en este caso 4 y 5)
Mediana: 4-5 
Me= n+1 / 2             
Me= 6+1 / 2 = 3.5 posición
Me = 4+5 /2 = 4.5 → El 50% de las personas consumen 4,5 litros de agua al día.
Discreta: Pasos a seguir cuando la variable es discreta y los datos son agrupados.
A. Si n/2 está en Ni.
Acumular las frecuencias absolutas.
Calcular n/2
Buscar n/2 en Ni, si está se le llama Ni-1 y al siguiente Ni
Frente a Ni se localiza Yi
Frente a Ni-1 se localiza Yi-1
Se aplica mediana: Yi-1+ Yi / 2
Ejemplo: se visitaron 30 fincas y se tomaron los siguientes datos respecto a la cantidad de vacas. Hallar la mediana (Me).
n/2 = 30/2 = 15


Yi
ni
Ni


2
3
3


4
8
11

Yi-1
6
4
15
Ni-1
Yi
7
15
30
Ni

TOTAL
30


Me = Yi-1+ Yi / 2
Me = 6 + 7/2 
Me = 6,5 → el 50% de las fincas tienen 7 vacas.
NOTA IMPORTANTE: Se redondean ya que la variable es discreta.
B. n/2 no está en Ni
Acumular las frecuencias absolutas
Calcular n/2 
Buscar n/2 en Ni, si no está, al inmediatamente menor se le llama Ni-1 y al siguiente Ni 
Frente a Ni-1 localiza Yi-1, frente  Ni localiza Yi
Aplica Me= yi
Ejemplo: Se registraron el número de carros que hay en 27 parqueaderos.
N/2 =  27/2 =  13.5
Me= 9 → El 50% de los parqueaderos tienen 9 vehículos.


yi
ni
Ni


6
2
2

Yi-1
7
11
13
Ni-1
Yi
9
13
26
Ni

11
1
27



27


Continua: si la variable es continua y los datos son agrupados, se aplica que:
A. Si n/2 está en Ni
Acumular las frecuencias absolutas
Calcular n/2
Buscar n/2 en Ni, si está, se llama Ni-1 y al siguiente Ni
Frente a Ni localiza yi-1 y frente a Ni-1 localizar Yi 
Se aplica Me= Yi-1
Ejemplo: 




Yi-1-yi
ni
Ni

Yi
3-9
15
15
Ni-1
Yi-1
9-12
2
17
Ni

12-18
8
25


18-mas
5
30


total
30


n/2= 30/2 = 15
Me= 9 → la mitad de las personas pesan 9 kilos.

NOTA IMPORTANTE: siempre se debe elegir el intervalo mediano y se elige el límite inferior, el cual seria Yi-1.

B. Si n/2 no está en Ni
Acumular frecuencia absoluta
Calcular n/2
Buscar n/2 en Ni, si no está, entonces al inmediatamente al menor se le llama Ni-1 y al siguiente Ni.
Frente al Ni-1 localiza Yi y frente a Ni localizar Yi-1
Se aplica Me= Yi-1 + (a *(n/2 – Ni-1))/ ni

Ejemplo:
n/2 = 20/2 =10




Yi-1 - yi
ni
Ni

Yi
3-5
2
2
Ni-1
Yi-1
5-7
13
15
Ni

7-9
4
19


9-11
1
20


total
20




Me = Yi-1 + (a (n/2 – Ni-1)/ni)
Me= 5 + (2 (10-2) /13) = 6.23 → la mitad de los animales pesan 6.23 kg.
Moda
También se llama promedio industrial, es aquel valor de la variable que tiene la mayor frecuencia de repetición, una distribución puede tener más de una o no tener, si no tiene moda se llama amodal.
Discreta y Continua
Datos no agrupados.
  • No tiene moda = amodal 2-9-1-6
  • Una moda = unimodal 2-9-1-1-6
  • Dos modal = bimodal 2-2-9-1-1-6
  • Más de 2 moda = multimodal
Discreta – Datos agrupados – Ejemplos
  1.  
     

Unimodal
Yi
ni
6
6
7
9
9
1
        Md = lo más usual es que las familias tengan 7 hijos.


Amodal
ni
3
3
3
Yi
6
7
8


Continua
  1. Si la amplitud es constante.
  1. Buscar la mayor frecuencia y se le llama ni y al intervalo se le llama intervalo modal.
  2. Encontrar la amplitud del intervalo modal (a = Ls – Li)
  3. Calcular ∆1 = frecuencia modal menos la premodal
2= frecuencia modal menos la posmodal
  1. Se aplica Md = Yi-1 +(a (∆1/∆1+∆2))
Ejemplo: kilómetros recorridos por un auto en 19 vueltas.

Yi-1 - Yi
Ni
3 - 6
6
6 - 9
9
9 - 12
1
12 - 15
3
TOTAL
19


1= 9-6= 3
2=9-1= 8
Moda= 6+ (3(3/3+8))= 6,81 → los kilómetros recorridos por el auto están alrededor de 6,81

  1. Si la amplitud no es constante.
  1. Calcular la densidad de cada intervalo (di= ni/a) siendo a la amplitud.
  2. Buscar el mayor di y al intervalo correspondiente a él se le llama intervalo modal.
  3. Calcular la amplitud del intervalo modal.
  4. Se aplica Md = Yi-1+ (a(di+1/di-1+di+1)).
Ejemplo:

Yi-1 → Yi
ni
di
a

3
9
4
0,66666667
6

9
10
1
1
1
di-1
10
12
5
2,5
2
di
12
15
3
1
3
di+1
total
13



Md = 10 + (2*(1/1+1))
Md = 11 → el salario más usual es de 11 pesos.
El cálculo de las tres medidas de tendencia central en una misma distribución permite determinar la simetría o asimetría de la distribución. Si el valor de las tres medidas es igual, la distribución es simétrica o normal, si es más pequeña la moda que las otras dos medidas, la distribución es asimétrica positiva o de cola derecha, los datos están más hacia la izquierda; pero si es la medida más pequeña que las otras dos, entonces la distribución es asimétrica negativa o de cola izquierda, los datos están más hacia la derecha.
NOTA IMPORTANTE: la mediana debería estar en el centro, si no es así se debe calcular un coeficiente de asimetría.
Las Medidas De Dispersión

Se calcula con respecto a una medida de tendencia central. Sirven para mirar la variación de los datos con respecto a una medida de tendencia central. Una sola no dice mucho, toma sentido cuando se comparan dos o más distribuciones. Es más estable aquella que es menos variable.

S^2 = varianza
S= desviación típica o estándar (es la más importante, nace de la varianza).
D = coeficiente de variación

Varianza o Variabilidad Absoluta

Cuánto se aleja un valor de la media.
S^2= la variabilidad con respecto a todos es la media.
Fórmula para variable discreta
S^2 = ∑(Xi-X)^2/n

Fórmula para variable continua

S^2 = ∑(Yi-X)^2/n
S^2 > 0 (la varianza siempre tiene un valor positivo)
S^2k= 0 (la varianza de una constante es 0) ∑

La varianza de una variable más o menos de una constante es igual a la varianza de la variable.

S^2 (k ± x) = S^2 (x)
S^2(k) ± S^2(x) = S^2(x)
0 ± S^2(x) = S^2(x)
S^2(x)= S^2(x)



DISTRIBUCION 1
DISTRIBUCION 2
2-6-9-11-3
10-10-9-1-1
X = ∑Xi/n
X = ∑Xi/n
X = 31/5
X = 31/5
X = 6,2
X = 6,2
S^2 = ((2-6,2)^2 + (6+6,2)^2)/5
S^2 = ((10-6,2)^2 + (10-6,2)^2)/5
S^2 = 11,76
S^2 = 18,6
S = 3,42
S = 4,26
d = S/X
d = S/X
d = 3,42/6,2
d = 55%
d = 4,26/6,2
d = 68%

En la distribución 1 S^2 y d son más pequeños que en la distribución 2, lo que indica que la distribución 1 es menos regular, es decir, más estable que la 2.

Desviacion tipica o estandar

La desviación típica estándar es la medida de dispersión que sirve para establecer los límites de confiabilidad en la distribución. Establece el patrón hasta el cual se deben admitir las variaciones, se calcula como la raíz de la varianza.

S=√11,10
S= 3,33

Regla empirica

65% - x ± s
95% - x ± 2s
99, 73 - x ± 3s

Límites de confianza

Los estándares permiten establecer los límites de confiabilidad por encima y por debajo de la media, mediante la regla empírica. Se llaman también límites de tolerancia.

6,66 + - 3,33 = (3,33 --- 9,99)
6,66 + - 2 (3,33) = (0--- 13,32)
6,66 + - 3(3,33)= (-3,33 --- 16,65)

Cuartiles

Divide en partes iguales la distribución y aparecen 3 medidas.

Tres cuartiles:
Q1: valor que supera el 25% de la observación.
Q2: valor que supera el 50% de la observación…
Q3: valor que supera el 75% de la observación.

Diez deciles:
D1: valor que supera el 10% de la observación.
D2: valor que supera el 20% de la observación…
D9: valor que supera el 90% de la observación.

Cien  percentiles:
P1: valor que supera el 1% de la observación.
P2: valor que supera el 2% de la observación.
P3: valor que supera el 3% de la observación…
P99: valor que supera el 99% de la observación.

NOTA IMPORTANTE: Q1 = P25, Q2 = P60 = D5 =Me, Q3 = P75.

Datos no agrupados: 

1. Ordenar los datos
2. Calcular índice ( n/4, n/10, n/100)
3. Si i no es entero, se aproxima al entero siguiente y esa será la posición del Q, D, P que se busca.
4. Si i es entero entonces el Q, D, P, será el promedio de los valores en las posiciones i e i+1.

Ejemplo:

Q3:
14,17,19,23,21,20,15,19,20,14,18,16 → (Los datos se deben organizar)
14,14,15,16,17,18,19,19,20,20,21,23.
Q3 = (3) (n) /4
Q3 = (3) (12) /4 = 9ª = i
                          = 10ª = i + 1
Q3= 20+20 /2 = 20 → el 75% de los niños pesan 20 libras.
P32 = (32)(n)/100
P32 = (32)(12)/100 = 3,84 = 4ª
P32 = 16 → el 32 % de los niños pesan 16 libras.
D8 = (8)(n)/10
D8 = (8)(12)/10 = 9,6 = 10ª
D8 = 20 → el 80% de los niños pesan 20 libras.

Datos agrupados:

Discreta:
1. Acumular las frecuencias absoluta
2. Calcular el índice (n/4,n/10,n/100)
3. Buscar i en Ni, si está, se llama Ni-1 y al siguiente Ni
4. Frente a Ni localizado Yi, frente a Ni-1 localizo a Yi-1.
5. Q, D, P = Yi-1 + Yi / 2
6. Si i no está en Ni, entonces al inmediatamente menor se le llama Ni-1 y al siguiente Ni
7. Q, P, D=  Yi




Yi-1

Yi
ni
Ni
P25
D1
Q3

Yi

17
6
6

Ni



Yi-1
19
3
9
Ni-1


Yi-1

Yi
26
15
24
Ni

Ni-1
Yi


27
12
36


Ni




36





P25= (25) (36) / 100 = 9
P25= 19+26/2 = 22,5 → El 25% de las parejas tienen 23 hijos.

D1= (1) (36) /10 = 3,6 = 4
D1= 17 → el 10% de las parejas tienen 17 hijos.

Q3= (3) (36) / 4 = 27
Q3= 27→ el 75% de las parejas tienen 12 hijos.

Continua:

1. Acumular las frecuencias absolutas.
2. Calcular el índice (n/4, n/10, n/100)
3. Buscar i en Ni, si está, se llama Ni-1 y al siguiente Ni
4. Frente a Ni localiza Yi-1 y frente a Ni-1 localiza Yi
5. Q,D, P = Yi-1
6. Si i no está en Ni entonces al inmediatamente menor se le llama Ni-1 y al siguiente Ni.
7. Q, D, P = Yi-1 +( a ( i-Ni-1/ ni))






yi-1—yi
ni
Ni
Q2
P77
D1
Yi-1



20-22
4
4


Ni



22-26
2
6




Yi
Yi
26-30
2
8
Ni-1
Ni-1


Yi-1
Yi-1
30-32
8
16
Ni
Ni





16






Q2 = (2)(16) / 4 = 18
Q2 = 30 → el 50% de las personas pesan 30 kg
P77= (77)(16) / 100= 12,32
P77= 30+ (2(12,32-8 / 8))
P77= 321,08 → el 77% de los niños pesan 31,08 kg
D1= (1)(16) / 10 = 1.6
D1= 20+ (2(1.6-0)/4) = 20,8 → el 10% de los niños pesan 20,8 kg.











1 comentario :

Con la tecnología de Blogger.