Medidas de tendencia central

Parámetros que muestran el comportamiento de una variable en una distribución. Se clasifican en tres:

La Media

Es el promedio, es el método de tendencia central más importante, se calcula cuando los datos son razonablemente homogéneos, la medida es sensible a los cambios en los valores de la distribución. Se comporta como un dato algebraico, no se puede calcular si falta un extremo de una distribución de una variable continua, no se debe calcular si los datos están presentados como índice o como porcentajes y tampoco si están muy dispersos, (X = media).

Fórmula: X: ∑xi / n

Ej: Calcular la media de los siguientes datos: 12- 16-17-21

12-16-17-21/ 4

Media Aritmética Ponderada

Se calcula cuando los datos tienen pesos específicos diferentes entre sí.

Fórmula: X: ∑Xi. Wi / ∑ Wi

Ej: Calcular la media de los siguientes datos.

X: 2-2-2-2-1-1-3-3-3-4-4-9-9-9-10

2(4)+1(2)+3(3)+4(2)+9(3)+10(1) / 15 = 4,26

Ej: Al finalizar el semestre una alumna obtuvo las siguientes notas, hallar la media aritmética de los siguientes datos:

Inglés:	4,8	0	0
Gestión administrativa:	3,5	2	7
Estadística:	3,2	3	9,6
Calculo:	1,6	3	4,8
Física:	0,2	3	0,6
Total		11	22

X: 22 / 11 = 2

Variable Discreta

El número de materias elegidas por 12 estudiantes, son las siguientes. Calcular la media aritmética de manera agrupada y no agrupada.

Discreta- agrupados:

Yi	ni	Yini
1	1	1
2	1	2
3	3	9
4	3	12
5	0	0
6	1	6
7	3	21
TOTAL	12	51

X = ∑Yini/n = 51/12 = 4,25 → El número de materias promedio tomada por los estudiantes es de 4.

Datos no agrupados:

3-1-4-2-6-7-4-3-3-4-7-7

X= 3+1+4+2+6+7+4+3+3+4+7+7 / 12

X= 4,25 → El número de materias promedio tomada por los estudiantes es de 4.

NOTA IMPORTANTE: Cuando la variable sea discreta la media para los datos agrupados o no agrupados da el mismo valor.

Variable Continua

El peso de 13 estudiantes corresponde:

71-82-50-55-55-62-70-99-64-50-78-72-60

Datos no agrupados:

71-82-50-55-55-62-70-99-64-50-78-72-60

X = 71+82+50+55+55+62+70+99+64+50+78+72+60/ 13

X= 66.8 → El peso promedio de 13 estudiantes es de 66.8 Kg

Datos agrupados:

X máx= 99

X min = 50

Rango= 99-50 = 49

K = 1 + 3.3log(13) = 4.7

a = 49 / 4.7 = 10.4

Yi-1 → Yi		ni	fi	Fi	Ni	Yi	Yini
50	60,4	5	0,384615385	0,38461538	5	55,2	276
60,4	70,8	3	0,230769231	0,61538462	8	65,6	196,8
70,8	81,2	3	0,230769231	0,84615385	11	76	228
81,2	91,6	1	0,076923077	0,92307692	12	86,4	86,4
91,6	102	1	0,076923077	1	13	96,8	96,8
TOTAL		13	1				884

X = ∑Yini/n = 884/13 = 68

NOTA IMPORTANTE: Si la variable es continua la media para los datos agrupados o no agrupados no es igual, la diferencia radica en la construcción de los intervalos.

Mediana

Centro de la distribución. Parámetro que reúne el comportamiento de la mitad de la muestra o la población. No es sensible a los cambios en los valores de la distribución mientras estos no se hagan en un valor central. Se puede calcular aún si los datos son muy dispersos y aún si falta un dato en el extremo de la distribución de una variable continua. La mediana es el valor central si el número de observaciones es impar, pero si es par, es la semisuma de los valores centrales. SIEMPRE HAY QUE ORGANIZAR LOS DATOS PARA SU CÁLCULO.

Discreta: Pasos a seguir cuando la variable es discreta y los datos son no agrupados.

Impar:

Ej.1: Número de manzanas semanales que consumen 7 personas.

2-0-1-3-80.000-8-7 (se deben organizar para determinar la mediana)

0-1-2-3-7-8-80.000 (como son 7 datos, es decir, el número es impar, se elige el valor central, que en este caso sería 3)

Mediana: 3 → El 50% de las personas consumen 3 manzanas semanales.

Me: n+1 / 2 posición

Me= 7+1 / 2 = 4 posición

Par:

Ej.2: Número de litros de agua que toman 6 personas diariamente

1-4-9-5-2-6 (se deben organizar para determinar la mediana)

1-2-4-5-6-9 (como son 6 datos, es decir, el número es par, se debe realizar la semisuma entre los dos valores centrales, en este caso 4 y 5)

Mediana: 4-5

Me= n+1 / 2

Me= 6+1 / 2 = 3.5 posición

Me = 4+5 /2 = 4.5 → El 50% de las personas consumen 4,5 litros de agua al día.

Discreta: Pasos a seguir cuando la variable es discreta y los datos son agrupados.

A. Si n/2 está en Ni.

Acumular las frecuencias absolutas.

Calcular n/2

Buscar n/2 en Ni, si está se le llama Ni-1 y al siguiente Ni

Frente a Ni se localiza Yi

Frente a Ni-1 se localiza Yi-1

Se aplica mediana: Yi-1+ Yi / 2

Ejemplo: se visitaron 30 fincas y se tomaron los siguientes datos respecto a la cantidad de vacas. Hallar la mediana (Me).

n/2 = 30/2 = 15

	Yi	ni	Ni
	2	3	3
	4	8	11
Yi-1	6	4	15	Ni-1
Yi	7	15	30	Ni
	TOTAL	30

Me = Yi-1+ Yi / 2

Me = 6 + 7/2

Me = 6,5 → el 50% de las fincas tienen 7 vacas.

NOTA IMPORTANTE: Se redondean ya que la variable es discreta.

B. n/2 no está en Ni

Acumular las frecuencias absolutas

Calcular n/2

Buscar n/2 en Ni, si no está, al inmediatamente menor se le llama Ni-1 y al siguiente Ni

Frente a Ni-1 localiza Yi-1, frente Ni localiza Yi

Aplica Me= yi

Ejemplo: Se registraron el número de carros que hay en 27 parqueaderos.

N/2 = 27/2 = 13.5

Me= 9 → El 50% de los parqueaderos tienen 9 vehículos.

	yi	ni	Ni
	6	2	2
Yi-1	7	11	13	Ni-1
Yi	9	13	26	Ni
	11	1	27
		27

Continua: si la variable es continua y los datos son agrupados, se aplica que:

A. Si n/2 está en Ni

Acumular las frecuencias absolutas

Calcular n/2

Buscar n/2 en Ni, si está, se llama Ni-1 y al siguiente Ni

Frente a Ni localiza yi-1 y frente a Ni-1 localizar Yi

Se aplica Me= Yi-1

Ejemplo:

	Yi-1-yi	ni	Ni
Yi	3-9	15	15	Ni-1
Yi-1	9-12	2	17	Ni
	12-18	8	25
	18-mas	5	30
	total	30

n/2= 30/2 = 15
Me= 9 → la mitad de las personas pesan 9 kilos.

NOTA IMPORTANTE: siempre se debe elegir el intervalo mediano y se elige el límite inferior, el cual seria Yi-1.

B. Si n/2 no está en Ni
Acumular frecuencia absoluta
Calcular n/2
Buscar n/2 en Ni, si no está, entonces al inmediatamente al menor se le llama Ni-1 y al siguiente Ni.
Frente al Ni-1 localiza Yi y frente a Ni localizar Yi-1
Se aplica Me= Yi-1 + (a *(n/2 – Ni-1))/ ni

Ejemplo:
n/2 = 20/2 =10

	Yi-1 - yi	ni	Ni
Yi	3-5	2	2	Ni-1
Yi-1	5-7	13	15	Ni
	7-9	4	19
	9-11	1	20
	total	20

Me = Yi-1 + (a (n/2 – Ni-1)/ni)

Me= 5 + (2 (10-2) /13) = 6.23 → la mitad de los animales pesan 6.23 kg.

Moda

También se llama promedio industrial, es aquel valor de la variable que tiene la mayor frecuencia de repetición, una distribución puede tener más de una o no tener, si no tiene moda se llama amodal.

Discreta y Continua

Datos no agrupados.

No tiene moda = amodal 2-9-1-6
Una moda = unimodal 2-9-1-1-6
Dos modal = bimodal 2-2-9-1-1-6
Más de 2 moda = multimodal

Discreta – Datos agrupados – Ejemplos

Unimodal
Yi	ni
6	6
7	9
9	1

Md = lo más usual es que las familias tengan 7 hijos.

Amodal
ni	3	3	3
Yi	6	7	8

Continua

Si la amplitud es constante.

Buscar la mayor frecuencia y se le llama ni y al intervalo se le llama intervalo modal.
Encontrar la amplitud del intervalo modal (a = Ls – Li)
Calcular ∆1 = frecuencia modal menos la premodal

∆2= frecuencia modal menos la posmodal

Se aplica Md = Yi-1 +(a (∆1/∆1+∆2))

Ejemplo: kilómetros recorridos por un auto en 19 vueltas.

Yi-1 - Yi	Ni
3 - 6	6
6 - 9	9
9 - 12	1
12 - 15	3
TOTAL	19

∆1= 9-6= 3

∆2=9-1= 8

Moda= 6+ (3(3/3+8))= 6,81 → los kilómetros recorridos por el auto están alrededor de 6,81

Si la amplitud no es constante.

Calcular la densidad de cada intervalo (di= ni/a) siendo a la amplitud.
Buscar el mayor di y al intervalo correspondiente a él se le llama intervalo modal.
Calcular la amplitud del intervalo modal.
Se aplica Md = Yi-1+ (a(di+1/di-1+di+1)).

Ejemplo:

Yi-1 → Yi		ni	di	a
3	9	4	0,66666667	6
9	10	1	1	1	di-1
10	12	5	2,5	2	di
12	15	3	1	3	di+1
total		13

Md = 10 + (2*(1/1+1))

Md = 11 → el salario más usual es de 11 pesos.

El cálculo de las tres medidas de tendencia central en una misma distribución permite determinar la simetría o asimetría de la distribución. Si el valor de las tres medidas es igual, la distribución es simétrica o normal, si es más pequeña la moda que las otras dos medidas, la distribución es asimétrica positiva o de cola derecha, los datos están más hacia la izquierda; pero si es la medida más pequeña que las otras dos, entonces la distribución es asimétrica negativa o de cola izquierda, los datos están más hacia la derecha.

NOTA IMPORTANTE: la mediana debería estar en el centro, si no es así se debe calcular un coeficiente de asimetría.

Las Medidas De Dispersión

Se calcula con respecto a una medida de tendencia central. Sirven para mirar la variación de los datos con respecto a una medida de tendencia central. Una sola no dice mucho, toma sentido cuando se comparan dos o más distribuciones. Es más estable aquella que es menos variable.

S^2 = varianza
S= desviación típica o estándar (es la más importante, nace de la varianza).
D = coeficiente de variación

Varianza o Variabilidad Absoluta

Cuánto se aleja un valor de la media.
S^2= la variabilidad con respecto a todos es la media.
Fórmula para variable discreta
S^2 = ∑(Xi-X)^2/n

Fórmula para variable continua

S^2 = ∑(Yi-X)^2/n
S^2 > 0 (la varianza siempre tiene un valor positivo)
S^2k= 0 (la varianza de una constante es 0) ∑

La varianza de una variable más o menos de una constante es igual a la varianza de la variable.

S^2 (k ± x) = S^2 (x)
S^2(k) ± S^2(x) = S^2(x)
0 ± S^2(x) = S^2(x)
S^2(x)= S^2(x)

DISTRIBUCION 1	DISTRIBUCION 2
2-6-9-11-3	10-10-9-1-1
X = ∑Xi/n	X = ∑Xi/n
X = 31/5	X = 31/5
X = 6,2	X = 6,2
S^2 = ((2-6,2)^2 + (6+6,2)^2)/5	S^2 = ((10-6,2)^2 + (10-6,2)^2)/5
S^2 = 11,76	S^2 = 18,6
S = 3,42	S = 4,26
d = S/X	d = S/X
d = 3,42/6,2 d = 55%	d = 4,26/6,2 d = 68%

En la distribución 1 S^2 y d son más pequeños que en la distribución 2, lo que indica que la distribución 1 es menos regular, es decir, más estable que la 2.

Desviacion tipica o estandar

La desviación típica estándar es la medida de dispersión que sirve para establecer los límites de confiabilidad en la distribución. Establece el patrón hasta el cual se deben admitir las variaciones, se calcula como la raíz de la varianza.

S=√11,10
S= 3,33

Regla empirica

65% - x ± s
95% - x ± 2s
99, 73 - x ± 3s

Límites de confianza

Los estándares permiten establecer los límites de confiabilidad por encima y por debajo de la media, mediante la regla empírica. Se llaman también límites de tolerancia.

6,66 + - 3,33 = (3,33 --- 9,99)
6,66 + - 2 (3,33) = (0--- 13,32)
6,66 + - 3(3,33)= (-3,33 --- 16,65)

Cuartiles

Divide en partes iguales la distribución y aparecen 3 medidas.

Tres cuartiles:
Q1: valor que supera el 25% de la observación.
Q2: valor que supera el 50% de la observación…
Q3: valor que supera el 75% de la observación.

Diez deciles:
D1: valor que supera el 10% de la observación.
D2: valor que supera el 20% de la observación…
D9: valor que supera el 90% de la observación.

Cien percentiles:
P1: valor que supera el 1% de la observación.
P2: valor que supera el 2% de la observación.
P3: valor que supera el 3% de la observación…
P99: valor que supera el 99% de la observación.

NOTA IMPORTANTE: Q1 = P25, Q2 = P60 = D5 =Me, Q3 = P75.

Datos no agrupados:

1. Ordenar los datos
2. Calcular índice ( n/4, n/10, n/100)
3. Si i no es entero, se aproxima al entero siguiente y esa será la posición del Q, D, P que se busca.
4. Si i es entero entonces el Q, D, P, será el promedio de los valores en las posiciones i e i+1.

Ejemplo:

Q3:
14,17,19,23,21,20,15,19,20,14,18,16 → (Los datos se deben organizar)
14,14,15,16,17,18,19,19,20,20,21,23.
Q3 = (3) (n) /4
Q3 = (3) (12) /4 = 9ª = i
= 10ª = i + 1
Q3= 20+20 /2 = 20 → el 75% de los niños pesan 20 libras.
P32 = (32)(n)/100
P32 = (32)(12)/100 = 3,84 = 4ª
P32 = 16 → el 32 % de los niños pesan 16 libras.
D8 = (8)(n)/10
D8 = (8)(12)/10 = 9,6 = 10ª
D8 = 20 → el 80% de los niños pesan 20 libras.

Datos agrupados:

Discreta:
1. Acumular las frecuencias absoluta
2. Calcular el índice (n/4,n/10,n/100)
3. Buscar i en Ni, si está, se llama Ni-1 y al siguiente Ni
4. Frente a Ni localizado Yi, frente a Ni-1 localizo a Yi-1.
5. Q, D, P = Yi-1 + Yi / 2
6. Si i no está en Ni, entonces al inmediatamente menor se le llama Ni-1 y al siguiente Ni
7. Q, P, D= Yi

	Yi-1		Yi	ni	Ni	P25	D1	Q3
	Yi		17	6	6		Ni
		Yi-1	19	3	9	Ni-1
Yi-1		Yi	26	15	24	Ni		Ni-1
Yi			27	12	36			Ni
				36

P25= (25) (36) / 100 = 9
P25= 19+26/2 = 22,5 → El 25% de las parejas tienen 23 hijos.

D1= (1) (36) /10 = 3,6 = 4
D1= 17 → el 10% de las parejas tienen 17 hijos.

Q3= (3) (36) / 4 = 27
Q3= 27→ el 75% de las parejas tienen 12 hijos.

Continua:

1. Acumular las frecuencias absolutas.
2. Calcular el índice (n/4, n/10, n/100)
3. Buscar i en Ni, si está, se llama Ni-1 y al siguiente Ni
4. Frente a Ni localiza Yi-1 y frente a Ni-1 localiza Yi
5. Q,D, P = Yi-1
6. Si i no está en Ni entonces al inmediatamente menor se le llama Ni-1 y al siguiente Ni.
7. Q, D, P = Yi-1 +( a ( i-Ni-1/ ni))

			yi-1—yi	ni	Ni	Q2	P77	D1
Yi-1			20-22	4	4			Ni
			22-26	2	6
	Yi	Yi	26-30	2	8	Ni-1	Ni-1
	Yi-1	Yi-1	30-32	8	16	Ni	Ni
				16

Q2 = (2)(16) / 4 = 18

Q2 = 30 → el 50% de las personas pesan 30 kg

P77= (77)(16) / 100= 12,32

P77= 30+ (2(12,32-8 / 8))

P77= 321,08 → el 77% de los niños pesan 31,08 kg

D1= (1)(16) / 10 = 1.6

D1= 20+ (2(1.6-0)/4) = 20,8 → el 10% de los niños pesan 20,8 kg.

Medidas de tendencia central

Comentarios

1 comentario :

Mapa de navegación

Contenido destacado

Historia de la estadística

Contenidos populares

Categorías

Videos

Contáctenos

Enlaces de interés

Medidas de tendencia central

Contenido relacionado

Comentarios

1 comentario :

Mapa de navegación

Contenido destacado

Historia de la estadística

Contenidos populares

Categorías

Videos

Contáctenos

Enlaces de interés