Fundamentos de Estadística Descriptiva e Inferencial

Conceptos generales de la estadística

La estadística es una ciencia matemática que recoge el conjunto de procesos y procedimientos que permiten el registro, la organización, la síntesis y el análisis de datos procedentes de la observación de diferentes hechos.

En términos estadísticos, una población se define como el conjunto de todos los individuos que tienen en común alguna característica observable y en los que se desea estudiar un fenómeno. Pero, de forma habitual, una población está constituida por un número muy grande de individuos, por lo que se trabaja con una muestra representativa de ella.

Estadística descriptiva

Del estudio de las características de la muestra se ocupa la estadística descriptiva. Esta estadística se lleva a cabo en una primera etapa de la realización de cualquier estudio estadístico que tiene como objetivos:

  • Ordenar, tabular y graficar los datos recogidos en el estudio.
  • Describir mediante índices estadísticos las observaciones recogidas de la muestra (parámetros de tendencia central y parámetros de dispersión).

Estadística analítica (inferencial o inductiva)

Si la muestra empleada es representativa de la población, los datos obtenidos pueden servir para sacar conclusiones de manera general. De la obtención de esas conclusiones se ocupa la estadística analítica (inferencial o inductiva). Esta estadística se realiza en una segunda etapa que tiene los siguientes objetivos:

  • Analizar los datos para obtener información que va más allá de la muestra de estudio de la que proviene la información y podrá ser aplicada a la población general.
  • Generar modelos matemáticos que permitan predecir lo que sucederá en situaciones similares.

La curva normal

La distribución de frecuencias de variables continuas puede tomar distintas formas, siendo una de las más frecuentes la curva normal o curva de Gauss.

Una de las gráficas utilizadas en la representación de estos datos es el histograma o polígono de frecuencias. Si en cada uno de los rectángulos calculamos su punto medio, y si tenemos un alto número de medidas y los intervalos no son muy grandes, podemos llegar a trazar una línea que una estos puntos dando lugar a una curva normal.

Tipos de curvas

  • Curva simétrica: donde los valores de la variable se acumulan en la zona media de la escala y se dispersan de forma similar a la derecha y a la izquierda. En este caso, moda, mediana y media coinciden.
  • Curva asimétrica positiva: donde los valores de la variable se acumulan mayoritariamente en la parte izquierda de la curva. En este caso, la media se encuentra más a la derecha, le sigue la mediana y, por último, encontramos a la moda.
  • Curva asimétrica negativa: donde los valores de la variable se acumulan mayoritariamente en la parte derecha de la curva. En este caso, la moda se encuentra más a la izquierda, le sigue la mediana y, por último, encontramos la media.

Estudio conjunto de dos variables cuantitativas

Correlación

En investigación estadística es importante ver si hay correlación entre dos variables (ejemplo: dieta y peso en kg). En el caso de que se compruebe esta correlación, se pretende buscar un factor numérico que nos indique la cuantía de esa correlación. Para conocer el grado de asociación entre dos variables se realizan estudios de correlación.

Para ello, lo primero que se realiza es un diagrama de dispersión. Ya que estamos estudiando conjuntamente dos variables, vamos a tener pares de mediciones, ya que cada par va a representar a una variable. Para representarlas se utilizan unos ejes cartesianos en los que se representan dichos puntos:

  • Si X e Y aumentan, hablamos de una correlación lineal positiva.
  • Si X e Y disminuyen, la correlación lineal es negativa.
  • Si una aumenta y otra disminuye, se dice que la correlación lineal es variable.
  • Cuando hay una gran dispersión de los datos, se dice que no hay correlación.

Para indicar la intensidad de correlación de las dos variables se utiliza el coeficiente de Pearson (rXY).

Regresión

Una vez conocida la correlación, también es importante conseguir una ecuación matemática que nos permita predecir el valor de una variable cuando se modifica la otra. Para ello se utiliza la ecuación de la regresión, que es la ecuación de la recta y = a + bx, que va a representar a todos los puntos del diagrama de dispersión.

Comparación de medidas

Para poder llevar a cabo esta comparación se utiliza un valor conocido como T de Student, que permite comparar las medidas de dos grupos para una variable cuantitativa continua. Es importante que el valor p que obtengamos sea menor a 0,05, ya que esto significaría que las diferencias entre las variables son estadísticamente significativas.

Variables cualitativas

Comparación de porcentajes (porcentaje de sí, porcentaje de no): en el caso de las variables cualitativas, la comparación se realiza mediante el parámetro Chi-cuadrado. En los estudios realizados es importante que p sea menor a 0,05, ya que esto significa que las diferencias son estadísticamente significativas.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.