INTRODUCCION.
La representación grafica presenta dos
limitaciones:
1.- No podemos describir la parte
fundamental que se esta describiendo, solo nos podemos limitar a dibujar un
grafico.
2.- Es muy complicado comparar
los resultados de dos o más grupos de datos y ver si existen diferencias
importantes entre ellos.
Es así
que surge la necesidad de además de representar los datos gráficamente poder
resumir los mismos en unos pocos números. Para lograr esto se utilizan dos
importantes medidas: las de centralización y las de dispersión.
Una
libera incursión a la notación.
El
símbolo sumatoria nos indica que debemos sumar los números desde un rangoinferior 1=1 hasta un rango superior N.
I-1: Es el rango inferior y nos indica que
debemos empezar a sumar desde el primer elemento del conjunto de datos.
N: Es el rango superior y nos indica hasta que
elemento del conjunto de datos debemos sumar.
Xi: se refiere a cada elemento del conjunto de
datos.
Medidas
de centralización para datos intervalicos y proporcionales.
Medidas
de centralización es un valor central que se encuentra al medio de los datos y
que representa de manera significativa a un conjunto de datos. Utilizamos la
media aritmética o media. La media se representa por el símbolo: X.
Medidas
de centralización para datos ordinales.
Este
tipo de datos trabaja con categorías ordenadas las cuales no pueden ser sumadas
ni divididas, para esto utilizamos la mediana. La mediana es el que deja la
mitad de los datos por debajo de él y la otra mitad por encima.
Medida
de centralización para datos nominales.
Los
datos de tipo nominal, tienen la característica de que no existe ningún orden
entre ellos. La medida de centralización para este tipo de datos es la moda. La
moda es la categoría con mayor frecuencia. Pueden existir casos de bimodal o
multimodal.
BIOESTADISTICA MEDIDAS DE DISPERSION
Una
ligera incursión a la notación.
a.-
Función valor absoluto.
La
función valor absoluto se refiere al valor que tiene un numero, sin tomar en
cuenta el signo del mismo y se denota encerrando a un numero entre dos barras:
Ø El valor absoluto de un número positivo, es el mismo número.
Ø El valor absoluto de un número negativo, es el mismo número pero
positivo.
b.-
Cuadrado de la desviación.
La
formula del cuadrado de la desviación es la siguiente: cabe recalcar que
cualquier numero elevado al cuadrado (positivo o negativo) devuelve el valor
positivo del mismo.
Medidas
de dispersión.
La
medida de dispersión hace referencia a como quedan agrupados los datos
alrededor de la medida de centralización.
Medidas
de dispersión para datos nominales.
Ø La moda, es la categoría con mayor frecuencia.
Ø Como la moda muchas veces no es cuantificable es decir no se puede
medir en números los datos nominales son los únicos que no tienen medida de
dispersión.
Ø Los datos nominales solo tienen medida de centralización y no de
dispersión.
Medidas
de dispersión para datos ordinales.
Si
los datos ordinales son numéricos se puede utilizar el recorrido, como medida
de dispersión y la mediana como medida de centralización.
Ø El recorrido es la diferencia entre los valores extremos.
Ø Otra medida de dispersión utilizada es el recorrido intercuartil.
Ø El recorrido intercuartil esta es otra medida de dispersión utilizada
en datos ordinales, la idea básica es la siguiente:
o Calcular la mediana
o Calculo el cuartil inferior
o Calcular el cuartil superior
Ahora que ya se
tienen los cuartiles superior e inferior, se procede a hacer la resta entre
ambos y el valor resultante será nuestra nueva medida de dispersión.
Medidas
de dispersión para datos internados y proporcionales.
En
la mayoría de los problemas de la vida real que este va a manejar estos van a
ser de tipo intervalico, se avocará solamente a ser como medida de dispersión de
los mismos a la desviación tipo DT.
Asimetría
y curtosis.
Ø Se dice que una distribución es simétrica si es al trazar una línea
vertical por la mitad de la misma, la curva se divide en dos mitades idénticas.
Ø Se dice que una distribución es asimétrica si que al trazar una línea
vertical por la mitad de la misma, la curva se divide en dos mitades, pero
ambas mitades no son idénticas sino distintas.
Ø El sesgo: se refiere a la asimetría de la curva, es decir: se refiere a
la dirección de la cola mas larga de la curva, no a la parte superior de los
datos se puede dar dos tipos de asimetría.
Ø En la referente a la curtosis, las curvas son simétricas, pero se
diferencian porque unas son más planas que otras.
No hay comentarios:
Publicar un comentario