Medidas de tendencia central
Parámetros que muestran el comportamiento de una variable en una distribución. Se clasifican en tres:
La Media
Es el promedio, es el método de tendencia central más importante, se calcula cuando los datos son razonablemente homogéneos, la medida es sensible a los cambios en los valores de la distribución. Se comporta como un dato algebraico, no se puede calcular si falta un extremo de una distribución de una variable continua, no se debe calcular si los datos están presentados como índice o como porcentajes y tampoco si están muy dispersos, (X = media).
Fórmula: X: ∑xi / n
Ej: Calcular la media de los siguientes datos: 12- 16-17-21
12-16-17-21/ 4
Media Aritmética Ponderada
Se calcula cuando los datos tienen pesos específicos diferentes entre sí.
Fórmula: X: ∑Xi. Wi / ∑ Wi
Ej: Calcular la media de los siguientes datos.
X: 2-2-2-2-1-1-3-3-3-4-4-9-9-9-10
2(4)+1(2)+3(3)+4(2)+9(3)+10(1) / 15 = 4,26
Ej: Al finalizar el semestre una alumna obtuvo las siguientes notas, hallar la media aritmética de los siguientes datos:
Inglés:
|
4,8
|
0
|
0
|
Gestión
administrativa:
|
3,5
|
2
|
7
|
Estadística:
|
3,2
|
3
|
9,6
|
Calculo:
|
1,6
|
3
|
4,8
|
Física:
|
0,2
|
3
|
0,6
|
Total
|
11
|
22
|
X:
22 / 11 = 2
Variable Discreta
El
número de materias elegidas por 12 estudiantes, son las siguientes.
Calcular la media aritmética de manera agrupada y no agrupada.
Discreta-
agrupados:
Yi
|
ni
|
Yini
|
1
|
1
|
1
|
2
|
1
|
2
|
3
|
3
|
9
|
4
|
3
|
12
|
5
|
0
|
0
|
6
|
1
|
6
|
7
|
3
|
21
|
TOTAL
|
12
|
51
|
X
= ∑Yini/n = 51/12 = 4,25
→
El número de materias promedio tomada por los estudiantes es de 4.
Datos
no agrupados:
3-1-4-2-6-7-4-3-3-4-7-7
X=
3+1+4+2+6+7+4+3+3+4+7+7 / 12
X=
4,25 →
El número de materias promedio tomada por los estudiantes es de 4.
NOTA
IMPORTANTE: Cuando la variable sea discreta la media para los datos
agrupados o no agrupados da el mismo valor.
Variable Continua
El
peso de 13 estudiantes corresponde:
71-82-50-55-55-62-70-99-64-50-78-72-60
Datos
no agrupados:
71-82-50-55-55-62-70-99-64-50-78-72-60
X
= 71+82+50+55+55+62+70+99+64+50+78+72+60/ 13
X=
66.8 → El peso promedio de 13 estudiantes es de 66.8 Kg
Datos
agrupados:
X
máx= 99
X
min = 50
Rango=
99-50 = 49
K
= 1 + 3.3log(13) = 4.7
a
= 49 / 4.7 = 10.4
Yi-1
→ Yi
|
ni
|
fi
|
Fi
|
Ni
|
Yi
|
Yini
|
|
50
|
60,4
|
5
|
0,384615385
|
0,38461538
|
5
|
55,2
|
276
|
60,4
|
70,8
|
3
|
0,230769231
|
0,61538462
|
8
|
65,6
|
196,8
|
70,8
|
81,2
|
3
|
0,230769231
|
0,84615385
|
11
|
76
|
228
|
81,2
|
91,6
|
1
|
0,076923077
|
0,92307692
|
12
|
86,4
|
86,4
|
91,6
|
102
|
1
|
0,076923077
|
1
|
13
|
96,8
|
96,8
|
TOTAL
|
13
|
1
|
884
|
X
= ∑Yini/n = 884/13 = 68
NOTA
IMPORTANTE: Si la variable es continua la media para los datos
agrupados o no agrupados no es igual, la diferencia radica en la
construcción de los intervalos.
Mediana
Centro de la distribución. Parámetro que reúne el comportamiento de la mitad de la muestra o la población. No es sensible a los cambios en los valores de la distribución mientras estos no se hagan en un valor central. Se puede calcular aún si los datos son muy dispersos y aún si falta un dato en el extremo de la distribución de una variable continua. La mediana es el valor central si el número de observaciones es impar, pero si es par, es la semisuma de los valores centrales. SIEMPRE HAY QUE ORGANIZAR LOS DATOS PARA SU CÁLCULO.
Discreta: Pasos a seguir cuando la variable es discreta y los datos son no agrupados.
Impar:
Ej.1: Número de manzanas semanales que consumen 7 personas.
2-0-1-3-80.000-8-7 (se deben organizar para determinar la mediana)
0-1-2-3-7-8-80.000 (como son 7 datos, es decir, el número es impar, se elige el valor central, que en este caso sería 3)
Mediana: 3 → El 50% de las personas consumen 3 manzanas semanales.
Me: n+1 / 2 posición
Me= 7+1 / 2 = 4 posición
Par:
Ej.2: Número de litros de agua que toman 6 personas diariamente
1-4-9-5-2-6 (se deben organizar para determinar la mediana)
1-2-4-5-6-9 (como son 6 datos, es decir, el número es par, se debe realizar la semisuma entre los dos valores centrales, en este caso 4 y 5)
Mediana: 4-5
Me= n+1 / 2
Me= 6+1 / 2 = 3.5 posición
Me = 4+5 /2 = 4.5 → El 50% de las personas consumen 4,5 litros de agua al día.
Discreta: Pasos a seguir cuando la variable es discreta y los datos son agrupados.
A. Si n/2 está en Ni.
Acumular las frecuencias absolutas.
Calcular n/2
Buscar n/2 en Ni, si está se le llama Ni-1 y al siguiente Ni
Frente a Ni se localiza Yi
Frente a Ni-1 se localiza Yi-1
Se aplica mediana: Yi-1+ Yi / 2
Ejemplo: se visitaron 30 fincas y se tomaron los siguientes datos respecto a la cantidad de vacas. Hallar la mediana (Me).
n/2 = 30/2 = 15
-
YiniNi2334811Yi-16415Ni-1Yi71530NiTOTAL30
Me = Yi-1+ Yi / 2
Me = 6 + 7/2
Me = 6,5 → el 50% de las fincas tienen 7 vacas.
NOTA IMPORTANTE: Se redondean ya que la variable es discreta.
B. n/2 no está en Ni
Acumular las frecuencias absolutas
Calcular n/2
Buscar n/2 en Ni, si no está, al inmediatamente menor se le llama Ni-1 y al siguiente Ni
Frente a Ni-1 localiza Yi-1, frente Ni localiza Yi
Aplica Me= yi
Ejemplo: Se registraron el número de carros que hay en 27 parqueaderos.
N/2 = 27/2 = 13.5
Me= 9 → El 50% de los parqueaderos tienen 9 vehículos.
-
yiniNi622Yi-171113Ni-1Yi91326Ni1112727
Continua: si la variable es continua y los datos son agrupados, se aplica que:
A. Si n/2 está en Ni
Acumular las frecuencias absolutas
Calcular n/2
Buscar n/2 en Ni, si está, se llama Ni-1 y al siguiente Ni
Frente a Ni localiza yi-1 y frente a Ni-1 localizar Yi
Se aplica Me= Yi-1
Ejemplo:
-
Yi-1-yiniNiYi3-91515Ni-1Yi-19-122 17Ni12-1882518-mas530total30
n/2= 30/2 = 15
Me= 9 → la mitad de las personas pesan 9 kilos.
NOTA IMPORTANTE: siempre se debe elegir el intervalo mediano y se elige el límite inferior, el cual seria Yi-1.
B. Si n/2 no está en Ni
Acumular frecuencia absoluta
Calcular n/2
Buscar n/2 en Ni, si no está, entonces al inmediatamente al menor se le llama Ni-1 y al siguiente Ni.
Frente al Ni-1 localiza Yi y frente a Ni localizar Yi-1
Se aplica Me= Yi-1 + (a *(n/2 – Ni-1))/ ni
Ejemplo:
n/2 = 20/2 =10
Me= 9 → la mitad de las personas pesan 9 kilos.
NOTA IMPORTANTE: siempre se debe elegir el intervalo mediano y se elige el límite inferior, el cual seria Yi-1.
B. Si n/2 no está en Ni
Acumular frecuencia absoluta
Calcular n/2
Buscar n/2 en Ni, si no está, entonces al inmediatamente al menor se le llama Ni-1 y al siguiente Ni.
Frente al Ni-1 localiza Yi y frente a Ni localizar Yi-1
Se aplica Me= Yi-1 + (a *(n/2 – Ni-1))/ ni
Ejemplo:
n/2 = 20/2 =10
-
Yi-1 - yiniNiYi3-522Ni-1Yi-15-71315Ni7-94199-11120total20 - Me = Yi-1 + (a (n/2 – Ni-1)/ni)Me= 5 + (2 (10-2) /13) = 6.23 → la mitad de los animales pesan 6.23 kg.ModaTambién se llama promedio industrial, es aquel valor de la variable que tiene la mayor frecuencia de repetición, una distribución puede tener más de una o no tener, si no tiene moda se llama amodal.Discreta y ContinuaDatos no agrupados.
-
No tiene moda = amodal 2-9-1-6
-
Una moda = unimodal 2-9-1-1-6
-
Dos modal = bimodal 2-2-9-1-1-6
-
Más de 2 moda = multimodal
Discreta – Datos agrupados – Ejemplos
UnimodalYini667991Md = lo más usual es que las familias tengan 7 hijos.
Amodalni333Yi678
Continua-
Si la amplitud es constante.
-
Buscar la mayor frecuencia y se le llama ni y al intervalo se le llama intervalo modal.
-
Encontrar la amplitud del intervalo modal (a = Ls – Li)
-
Calcular ∆1 = frecuencia modal menos la premodal
∆2= frecuencia modal menos la posmodal-
Se aplica Md = Yi-1 +(a (∆1/∆1+∆2))
Ejemplo: kilómetros recorridos por un auto en 19 vueltas.-
Yi-1 - YiNi3 - 666 - 999 - 12112 - 153TOTAL19
∆1= 9-6= 3∆2=9-1= 8Moda= 6+ (3(3/3+8))= 6,81 → los kilómetros recorridos por el auto están alrededor de 6,81-
Si la amplitud no es constante.
-
Calcular la densidad de cada intervalo (di= ni/a) siendo a la amplitud.
-
Buscar el mayor di y al intervalo correspondiente a él se le llama intervalo modal.
-
Calcular la amplitud del intervalo modal.
-
Se aplica Md = Yi-1+ (a(di+1/di-1+di+1)).
Ejemplo:
Yi-1 → Yinidia3940,666666676910111di-1101252,52di1215313di+1total13Md = 10 + (2*(1/1+1))Md = 11 → el salario más usual es de 11 pesos.El cálculo de las tres medidas de tendencia central en una misma distribución permite determinar la simetría o asimetría de la distribución. Si el valor de las tres medidas es igual, la distribución es simétrica o normal, si es más pequeña la moda que las otras dos medidas, la distribución es asimétrica positiva o de cola derecha, los datos están más hacia la izquierda; pero si es la medida más pequeña que las otras dos, entonces la distribución es asimétrica negativa o de cola izquierda, los datos están más hacia la derecha.NOTA IMPORTANTE: la mediana debería estar en el centro, si no es así se debe calcular un coeficiente de asimetría. -
- Las Medidas De Dispersión
- Se calcula con respecto a una medida de tendencia central. Sirven para mirar la variación de los datos con respecto a una medida de tendencia central. Una sola no dice mucho, toma sentido cuando se comparan dos o más distribuciones. Es más estable aquella que es menos variable.
S^2 = varianza
S= desviación típica o estándar (es la más importante, nace de la varianza).
D = coeficiente de variación
Varianza o Variabilidad Absoluta
Cuánto se aleja un valor de la media.
S^2= la variabilidad con respecto a todos es la media.
Fórmula para variable discreta
S^2 = ∑(Xi-X)^2/n
Fórmula para variable continua
S^2 = ∑(Yi-X)^2/n
S^2 > 0 (la varianza siempre tiene un valor positivo)
S^2k= 0 (la varianza de una constante es 0) ∑
La varianza de una variable más o menos de una constante es igual a la varianza de la variable.
S^2 (k ± x) = S^2 (x)
S^2(k) ± S^2(x) = S^2(x)
0 ± S^2(x) = S^2(x)
S^2(x)= S^2(x)
DISTRIBUCION 1DISTRIBUCION 22-6-9-11-310-10-9-1-1X = ∑Xi/nX = ∑Xi/nX = 31/5X = 31/5X = 6,2X = 6,2S^2 = ((2-6,2)^2 + (6+6,2)^2)/5S^2 = ((10-6,2)^2 + (10-6,2)^2)/5 S^2 = 11,76S^2 = 18,6S = 3,42S = 4,26d = S/Xd = S/Xd = 3,42/6,2d = 55%d = 4,26/6,2d = 68%- En la distribución 1 S^2 y d son más pequeños que en la distribución 2, lo que indica que la distribución 1 es menos regular, es decir, más estable que la 2.
Desviacion tipica o estandar
La desviación típica estándar es la medida de dispersión que sirve para establecer los límites de confiabilidad en la distribución. Establece el patrón hasta el cual se deben admitir las variaciones, se calcula como la raíz de la varianza.
S=√11,10
S= 3,33
Regla empirica
65% - x ± s
95% - x ± 2s
99, 73 - x ± 3s
Límites de confianza
Los estándares permiten establecer los límites de confiabilidad por encima y por debajo de la media, mediante la regla empírica. Se llaman también límites de tolerancia.
6,66 + - 3,33 = (3,33 --- 9,99)
6,66 + - 2 (3,33) = (0--- 13,32)
6,66 + - 3(3,33)= (-3,33 --- 16,65)
Cuartiles
Divide en partes iguales la distribución y aparecen 3 medidas.
Tres cuartiles:
Q1: valor que supera el 25% de la observación.
Q2: valor que supera el 50% de la observación…
Q3: valor que supera el 75% de la observación.
Diez deciles:
D1: valor que supera el 10% de la observación.
D2: valor que supera el 20% de la observación…
D9: valor que supera el 90% de la observación.
Cien percentiles:
P1: valor que supera el 1% de la observación.
P2: valor que supera el 2% de la observación.
P3: valor que supera el 3% de la observación…
P99: valor que supera el 99% de la observación.
NOTA IMPORTANTE: Q1 = P25, Q2 = P60 = D5 =Me, Q3 = P75.
Datos no agrupados:
1. Ordenar los datos
2. Calcular índice ( n/4, n/10, n/100)
3. Si i no es entero, se aproxima al entero siguiente y esa será la posición del Q, D, P que se busca.
4. Si i es entero entonces el Q, D, P, será el promedio de los valores en las posiciones i e i+1.
Ejemplo:
Q3:
14,17,19,23,21,20,15,19,20,14,18,16 → (Los datos se deben organizar)
14,14,15,16,17,18,19,19,20,20,21,23.
Q3 = (3) (n) /4
Q3 = (3) (12) /4 = 9ª = i
= 10ª = i + 1
Q3= 20+20 /2 = 20 → el 75% de los niños pesan 20 libras.
P32 = (32)(n)/100
P32 = (32)(12)/100 = 3,84 = 4ª
P32 = 16 → el 32 % de los niños pesan 16 libras.
D8 = (8)(n)/10
D8 = (8)(12)/10 = 9,6 = 10ª
D8 = 20 → el 80% de los niños pesan 20 libras.
Datos agrupados:
Discreta:
1. Acumular las frecuencias absoluta
2. Calcular el índice (n/4,n/10,n/100)
3. Buscar i en Ni, si está, se llama Ni-1 y al siguiente Ni
4. Frente a Ni localizado Yi, frente a Ni-1 localizo a Yi-1.
5. Q, D, P = Yi-1 + Yi / 2
6. Si i no está en Ni, entonces al inmediatamente menor se le llama Ni-1 y al siguiente Ni
7. Q, P, D= Yi -
-
Yi-1YiniNiP25D1Q3Yi1766NiYi-11939Ni-1Yi-1Yi261524NiNi-1Yi271236Ni36
-
- P25= (25) (36) / 100 = 9
P25= 19+26/2 = 22,5 → El 25% de las parejas tienen 23 hijos.
D1= (1) (36) /10 = 3,6 = 4
D1= 17 → el 10% de las parejas tienen 17 hijos.
Q3= (3) (36) / 4 = 27
Q3= 27→ el 75% de las parejas tienen 12 hijos.
Continua:
1. Acumular las frecuencias absolutas.
2. Calcular el índice (n/4, n/10, n/100)
3. Buscar i en Ni, si está, se llama Ni-1 y al siguiente Ni
4. Frente a Ni localiza Yi-1 y frente a Ni-1 localiza Yi
5. Q,D, P = Yi-1
6. Si i no está en Ni entonces al inmediatamente menor se le llama Ni-1 y al siguiente Ni.
7. Q, D, P = Yi-1 +( a ( i-Ni-1/ ni))
-
yi-1—yiniNiQ2P77D1Yi-1
20-2244Ni22-2626YiYi26-3028Ni-1Ni-1Yi-1Yi-130-32816NiNi16
-
-
Q2 = (2)(16) / 4 = 18Q2 = 30 → el 50% de las personas pesan 30 kgP77= (77)(16) / 100= 12,32P77= 30+ (2(12,32-8 / 8))P77= 321,08 → el 77% de los niños pesan 31,08 kgD1= (1)(16) / 10 = 1.6D1= 20+ (2(1.6-0)/4) = 20,8 → el 10% de los niños pesan 20,8 kg.
hola muy interesante el blog
ResponderEliminar