Ojiva frecuencias acumuladas

POBLACIÓN: conjunto sobre el que estamos interesados en obtener conclusiones.
INDIVIDUOS: cada una de las unidades que forman la población.

CARACTERES: rasgos que poseen los elementos de la población y que son objeto de estudio en la investigación
MUESTRA: subconjunto de la población al que tenemos acceso y sobre el que realmente hacemos las observaciones

VARIABLE: carácterística observable que varía entre los diferentes individuos de una población. TIPOS: 

   Cualitativas: Si sus valores no se pueden asociar naturalmente a un número.
      Nominales: Si sus valores no se pueden ordenar.
      Ordinales: Si sus valores se pueden ordenar.

  Cuantitativas: Si sus valores son numéricos.
      Discretas: Si toma un número finito de valores en un intervalo
      Continuas: Si entre dos valores, son posibles infinitos valores intermedios.

TABLA DE FRECUENCIAS

Exponen la información recogida en la muestra, de forma que no se pierda nada de información.
Frecuencias absolutas (ni): Contabilizan el número de individuos de cada modalidad o clase

Frecuencias relativas (fi) (porcentajes 100fi%): proporción (porcentaje) de individuos de cada modalidad o clase

Frecuencias acumuladas (Ni, Fi): Sólo tienen sentido para variables ordinales y numéricas Muy útiles para calcular cuantiles.

GRÁFICOS PARA VARIABLES CUALITATIVAS

    Diagramas de barras 
Diagramas de sectores
Pictogramas

GRÁFICOS DIFERENCIALES PARA VARIABLES CUANTITATIVAS

Son diferentes en función de que las variables sean discretas o continuas. Valen con frecuencias absolutas o relativas.

 Diagramas barras para variables discretas
 Histogramas para variables continuas

DIAGRAMAS INTEGRALES PARA VARIABLES CUANTITATIVAS

 Se realizan a partir de las frecuencias acumuladas. Indican, para cada valor de la variable,  la cantidad (frecuencia)
De individuos que poseen un valor inferior o igual al mismo.

PARÁMETROS Y ESTADÍSTICOS

    Parámetro: cantidad numérica calculada sobre una población
Estadístico: cantidad numérica calculada sobre una muestra

ESTADÍSTICO

Posición (“no central”) Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos.

Se define el cuantilde orden (0<) como un valor de la variablepor debajo del cual se encuentra una frecuencia relativa acumulada. Percentilde orden k = cuantil de orden k/100 La mediana es el percentil 50 El percentil de orden 15 deja por debajo al 15% de las observaciones. Por encima queda el 85%
Cuartiles: Dividen las observaciones en 4 grupos con frecuencias similares. Primer cuartil = Percentil 25 = Cuantil 0,25 Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana Tercer cuartil = Percentil 75 = cuantil 0,75
Diagrama de Tukey.
La zona central, ‘caja’, contiene al 50% central de las observaciones.
Es costumbre que ‘los bigotes’, no lleguen hasta los extremos, sino hasta las observaciones que se separan de la caja en no más de 1,5 R.I. Más allá de esa distancia se consideran anómalas.

Centralización (posición central) Indican valores con respecto a los que los datos parecen agruparse. Media, mediana y moda

Añaden unos cuantos casos particulares a las medidas de posición. En este caso son medidas que buscan posiciones (valores) con respecto a los cuales los datos muestran tendencia a agruparse.
Media:) Es la media aritmética (promedio) de los valores de una variable. Suma de los valores dividido por el tamaño muestral. 

Mediana


Es un valor que divide a las observaciones en dos grupos con el mismo número de individuos (percentil 50). Si el número de datos es par, se elige la media de los dos datos centrales.
Moda. Es el/los valor/es donde la distribución de frecuencia alcanza un máximo

Dispersión Indican la mayor o menor concentración de los datos con respecto a las medidas de centralización. Rango, varianza, desviación típica, coeficiente de variación

Miden el grado de dispersión (variabilidad) de los datos, independientemente de su causa.
Amplitud, Recorrido o Rango: Diferencia entre observaciones extremas.
Rango intercuartílico: Es la distancia entre primer y tercer cuartil. Rango intercuartílico = P75-P25 .

Varianza S2: Mide el promedio de las desviaciones (al cuadrado) de las observaciones con respecto a la media.


Desviación típica(‘standard deviation’) Es la raíz cuadrada de la varianza

Coeficiente de variación
Es la razón entre la desviación típica y la media. Mide la desviación típica en forma de “qué tamaño tiene con respecto a la media”
También se la denomina variabilidad relativa.
Es frecuente mostrarla en porcentajes. Es una cantidad adimensional. Interesante para comparar la variabilidad de diferentes variables.
No debe usarse cuando la variable presenta valores negativos o donde el valor 0 sea una cantidad fijada arbitrariamente


Forma Asimetría Apuntamiento o curtosis

Una distribución es simétrica si la mitad izquierda de su distribución es la imagen especular de su mitad derecha.
En las distribuciones simétricas media y mediana coinciden. Si sólo hay una moda también coincide
La asimetría es positiva o negativa en función de a qué lado se encuentra la cola de la distribución.
La media tiende a desplazarse hacia las valores extremos (colas).
Las discrepancias entre las medidas de centralización son indicación de asimetría.





Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.