POBLACIÓN: conjunto sobre el que estamos interesados en obtener conclusiones.
INDIVIDUOS: cada una de las unidades que forman la población.
CARACTERES: rasgos que poseen los elementos de la población y que son objeto de estudio en la investigación
MUESTRA: subconjunto de la población al que tenemos acceso y sobre el que realmente hacemos las observaciones
VARIABLE: carácterística observable que varía entre los diferentes individuos de una población. TIPOS:
Cualitativas: Si sus valores no se pueden asociar naturalmente a un número.
Nominales: Si sus valores no se pueden ordenar.
Ordinales: Si sus valores se pueden ordenar.
Cuantitativas: Si sus valores son numéricos.
Discretas: Si toma un número finito de valores en un intervalo
Continuas: Si entre dos valores, son posibles infinitos valores intermedios.
TABLA DE FRECUENCIAS
Exponen la información recogida en la muestra, de forma que no se pierda nada de información.
Frecuencias absolutas (ni): Contabilizan el número de individuos de cada modalidad o clase
Frecuencias relativas (fi) (porcentajes 100fi%): proporción (porcentaje) de individuos de cada modalidad o clase
Frecuencias acumuladas (Ni, Fi): Sólo tienen sentido para variables ordinales y numéricas Muy útiles para calcular cuantiles.
GRÁFICOS PARA VARIABLES CUALITATIVAS
Diagramas de barras
Diagramas de sectores
Pictogramas
GRÁFICOS DIFERENCIALES PARA VARIABLES CUANTITATIVAS
Son diferentes en función de que las variables sean discretas o continuas. Valen con frecuencias absolutas o relativas.
Diagramas barras para variables discretas
Histogramas para variables continuas
DIAGRAMAS INTEGRALES PARA VARIABLES CUANTITATIVAS
Se realizan a partir de las frecuencias acumuladas. Indican, para cada valor de la variable, la cantidad (frecuencia)
De individuos que poseen un valor inferior o igual al mismo.
PARÁMETROS Y ESTADÍSTICOS
Parámetro: cantidad numérica calculada sobre una población
Estadístico: cantidad numérica calculada sobre una muestra
ESTADÍSTICO
Posición (“no central”) Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos.
Se define el cuantilde orden (0<) como un valor de la variablepor debajo del cual se encuentra una frecuencia relativa acumulada. Percentilde orden k = cuantil de orden k/100 La mediana es el percentil 50 El percentil de orden 15 deja por debajo al 15% de las observaciones. Por encima queda el 85%
Cuartiles: Dividen las observaciones en 4 grupos con frecuencias similares. Primer cuartil = Percentil 25 = Cuantil 0,25 Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana Tercer cuartil = Percentil 75 = cuantil 0,75
Diagrama de Tukey.
La zona central, ‘caja’, contiene al 50% central de las observaciones.
Es costumbre que ‘los bigotes’, no lleguen hasta los extremos, sino hasta las observaciones que se separan de la caja en no más de 1,5 R.I. Más allá de esa distancia se consideran anómalas.
Centralización (posición central) Indican valores con respecto a los que los datos parecen agruparse. Media, mediana y moda
Añaden unos cuantos casos particulares a las medidas de posición. En este caso son medidas que buscan posiciones (valores) con respecto a los cuales los datos muestran tendencia a agruparse.
Media:) Es la media aritmética (promedio) de los valores de una variable. Suma de los valores dividido por el tamaño muestral.
Mediana
Es un valor que divide a las observaciones en dos grupos con el mismo número de individuos (percentil 50). Si el número de datos es par, se elige la media de los dos datos centrales.
Moda. Es el/los valor/es donde la distribución de frecuencia alcanza un máximo
Dispersión Indican la mayor o menor concentración de los datos con respecto a las medidas de centralización. Rango, varianza, desviación típica, coeficiente de variación
Miden el grado de dispersión (variabilidad) de los datos, independientemente de su causa.
Amplitud, Recorrido o Rango: Diferencia entre observaciones extremas.
Rango intercuartílico: Es la distancia entre primer y tercer cuartil. Rango intercuartílico = P75-P25 .
Varianza S2: Mide el promedio de las desviaciones (al cuadrado) de las observaciones con respecto a la media.
Desviación típica(‘standard deviation’) Es la raíz cuadrada de la varianza
Coeficiente de variación
Es la razón entre la desviación típica y la media. Mide la desviación típica en forma de “qué tamaño tiene con respecto a la media”
También se la denomina variabilidad relativa.
Es frecuente mostrarla en porcentajes. Es una cantidad adimensional. Interesante para comparar la variabilidad de diferentes variables.
No debe usarse cuando la variable presenta valores negativos o donde el valor 0 sea una cantidad fijada arbitrariamente
Forma Asimetría Apuntamiento o curtosis
Una distribución es simétrica si la mitad izquierda de su distribución es la imagen especular de su mitad derecha.
En las distribuciones simétricas media y mediana coinciden. Si sólo hay una moda también coincide
La asimetría es positiva o negativa en función de a qué lado se encuentra la cola de la distribución.
La media tiende a desplazarse hacia las valores extremos (colas).
Las discrepancias entre las medidas de centralización son indicación de asimetría.