Ojiva frecuencias acumuladas

POBLACIÓN: conjunto sobre el que estamos interesados en obtener conclusiones.
INDIVIDUOS: cada una de las unidades que forman la población.

CARACTERES: rasgos que poseen los elementos de la población y que son objeto de estudio en la investigación
MUESTRA: subconjunto de la población al que tenemos acceso y sobre el que realmente hacemos las observaciones

VARIABLE: carácterística observable que varía entre los diferentes individuos de una población. TIPOS: 

   Cualitativas: Si sus valores no se pueden asociar naturalmente a un número.
      Nominales: Si sus valores no se pueden ordenar.
      Ordinales: Si sus valores se pueden ordenar.

  Cuantitativas: Si sus valores son numéricos.
      Discretas: Si toma un número finito de valores en un intervalo
      Continuas: Si entre dos valores, son posibles infinitos valores intermedios.

TABLA DE FRECUENCIAS

Exponen la información recogida en la muestra, de forma que no se pierda nada de información.
Frecuencias absolutas (ni): Contabilizan el número de individuos de cada modalidad o clase

Frecuencias relativas (fi) (porcentajes 100fi%): proporción (porcentaje) de individuos de cada modalidad o clase

Frecuencias acumuladas (Ni, Fi): Sólo tienen sentido para variables ordinales y numéricas Muy útiles para calcular cuantiles.

GRÁFICOS PARA VARIABLES CUALITATIVAS

    Diagramas de barras 
Diagramas de sectores
Pictogramas

GRÁFICOS DIFERENCIALES PARA VARIABLES CUANTITATIVAS

Son diferentes en función de que las variables sean discretas o continuas. Valen con frecuencias absolutas o relativas.

 Diagramas barras para variables discretas
 Histogramas para variables continuas

DIAGRAMAS INTEGRALES PARA VARIABLES CUANTITATIVAS

 Se realizan a partir de las frecuencias acumuladas. Indican, para cada valor de la variable,  la cantidad (frecuencia)
De individuos que poseen un valor inferior o igual al mismo.

PARÁMETROS Y ESTADÍSTICOS

    Parámetro: cantidad numérica calculada sobre una población
Estadístico: cantidad numérica calculada sobre una muestra

ESTADÍSTICO

Posición (“no central”) Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos.

Se define el cuantilde orden (0<) como un valor de la variablepor debajo del cual se encuentra una frecuencia relativa acumulada. Percentilde orden k = cuantil de orden k/100 La mediana es el percentil 50 El percentil de orden 15 deja por debajo al 15% de las observaciones. Por encima queda el 85%
Cuartiles: Dividen las observaciones en 4 grupos con frecuencias similares. Primer cuartil = Percentil 25 = Cuantil 0,25 Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana Tercer cuartil = Percentil 75 = cuantil 0,75
Diagrama de Tukey.
La zona central, ‘caja’, contiene al 50% central de las observaciones.
Es costumbre que ‘los bigotes’, no lleguen hasta los extremos, sino hasta las observaciones que se separan de la caja en no más de 1,5 R.I. Más allá de esa distancia se consideran anómalas.

Centralización (posición central) Indican valores con respecto a los que los datos parecen agruparse. Media, mediana y moda

Añaden unos cuantos casos particulares a las medidas de posición. En este caso son medidas que buscan posiciones (valores) con respecto a los cuales los datos muestran tendencia a agruparse.
Media:) Es la media aritmética (promedio) de los valores de una variable. Suma de los valores dividido por el tamaño muestral. 

Mediana


Es un valor que divide a las observaciones en dos grupos con el mismo número de individuos (percentil 50). Si el número de datos es par, se elige la media de los dos datos centrales.
Moda. Es el/los valor/es donde la distribución de frecuencia alcanza un máximo

Dispersión Indican la mayor o menor concentración de los datos con respecto a las medidas de centralización. Rango, varianza, desviación típica, coeficiente de variación

Miden el grado de dispersión (variabilidad) de los datos, independientemente de su causa.
Amplitud, Recorrido o Rango: Diferencia entre observaciones extremas.
Rango intercuartílico: Es la distancia entre primer y tercer cuartil. Rango intercuartílico = P75-P25 .

Varianza S2: Mide el promedio de las desviaciones (al cuadrado) de las observaciones con respecto a la media.


Desviación típica(‘standard deviation’) Es la raíz cuadrada de la varianza

Coeficiente de variación
Es la razón entre la desviación típica y la media. Mide la desviación típica en forma de “qué tamaño tiene con respecto a la media”
También se la denomina variabilidad relativa.
Es frecuente mostrarla en porcentajes. Es una cantidad adimensional. Interesante para comparar la variabilidad de diferentes variables.
No debe usarse cuando la variable presenta valores negativos o donde el valor 0 sea una cantidad fijada arbitrariamente


Forma Asimetría Apuntamiento o curtosis

Una distribución es simétrica si la mitad izquierda de su distribución es la imagen especular de su mitad derecha.
En las distribuciones simétricas media y mediana coinciden. Si sólo hay una moda también coincide
La asimetría es positiva o negativa en función de a qué lado se encuentra la cola de la distribución.
La media tiende a desplazarse hacia las valores extremos (colas).
Las discrepancias entre las medidas de centralización son indicación de asimetría.





Deja una respuesta

Tu dirección de correo electrónico no será publicada.

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.