Fundamentos de Estadística: Conceptos Clave y Medidas Descriptivas

Conceptos Fundamentales de Estadística

La Estadística es un conjunto de procedimientos basados en el método científico, utilizados para recopilar, procesar y analizar los datos extraídos de un sistema en estudio. Su objetivo es interpretarlos para extraer conclusiones, realizar inferencias y tomar decisiones basadas en la evidencia obtenida de dicho análisis.

Tipos de Estadística

  • Estadística Descriptiva: Se ocupa de la recopilación, representación y análisis elemental de los datos.
  • Estadística Inferencial: Saca conclusiones generales para toda la población a partir del estudio de una muestra.

Elementos Clave en Estadística

  • Población: Constituye el marco de referencia del cual han sido extraídos los datos. Es el conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones.
  • Muestra: Es una parte de la población, un subconjunto de ella.
  • Dato: Es una cualidad de un elemento susceptible de ser medida.
  • Variable: Es una propiedad característica de la población en estudio, susceptible de tomar diferentes valores, los cuales se pueden observar y medir.

Clasificación de Variables

  • Cualitativas: Corresponden a características que no pueden ser medidas numéricamente, pero sí pueden ser clasificadas.
  • Cuantitativas: Dan respuestas numéricas.

Escalas de Medición

Se entiende como el grado de precisión de la medida de la característica o variable en estudio. Se conocen 4 tipos:

  1. Escala Nominal: Las observaciones se clasifican en categorías de acuerdo con la presencia o ausencia de un atributo o característica, no existiendo un orden o jerarquía entre estas categorías. Es de tipo cualitativo.
    • En su forma más sencilla, la escala nominal es Dicotómica: Se consideran solo dos categorías. Por ejemplo: la clasificación de un paciente como enfermo o sano.
    • Politómicas: Las categorías para la clasificación son más de dos. Ejemplo: una politómica con 4 categorías, como la clasificación de los pacientes en función del grupo sanguíneo (A, B, AB, 0).
  2. Escala Ordinal: Las observaciones correspondientes a una variable se agrupan en categorías y existe un orden entre las categorías que expresa la intensidad del atributo.
  3. Escalas Numéricas de Intervalo y de Razón: Aquí se establece un orden entre las observaciones y también es posible conocer la distancia que separa una de otra. En la clasificación de variables cuantitativas, hay dos clases de escalas numéricas:
    • Escala de Intervalo
    • Escala de Razón

Medidas Descriptivas y de Tendencia Central

Las medidas descriptivas calculadas a partir de los datos de una muestra se denominan Estadísticos, mientras que las obtenidas a partir de los datos de la población se denominan Parámetros.

Medidas de Tendencia Central

Corresponden a valores que generalmente se ubican en la parte central de un conjunto de datos. Permiten analizar los datos en torno a un valor central. Las medidas de tendencia central más utilizadas son: media, mediana y moda.

  1. Mediana: Es un estadístico que divide la distribución en dos grupos con igual número de observaciones; es decir, es la observación central. La mitad de los valores son menores y la otra mitad mayores.
    • Ventaja: Su cálculo es posible aun cuando los intervalos extremos no están bien determinados o con observaciones ordinales, debido a que su cálculo no emplea los valores de las observaciones. Se aconseja su uso cuando se tiene una escala ordinal o numérica.
    • Desventaja: Radica en la inestabilidad en el muestreo.
  2. Moda: Es el dato que más veces se repite, es decir, aquel que tiene mayor frecuencia absoluta. Se emplea para números grandes de observaciones, cuando se desea notar cuál es el valor más popular, para escalas nominales o cuando solo se desea tener una idea de dónde está la mayor concentración de observaciones.
  3. Media (Aritmética): Es el estadístico de posición más conocido y más utilizado. Se emplea cuando los datos pueden sumarse, es decir, cuando las características se miden en una escala numérica. No deberá usarse para datos ordinales o cuando se quiere establecer inferencias de una muestra a la población.
  4. Media Geométrica: Se usa específicamente en los casos en que existe una tasa de crecimiento relativamente constante o, simplemente, cuando se desea conocer un porcentaje medio de aumento o disminución. También se la utiliza de preferencia cuando es conveniente dar importancia a los valores pequeños.
  5. Media Armónica: Se emplea para obtener un valor representativo de un conjunto de datos expresados en forma de tasas.

Uso de las Medidas de Tendencia Central

Para tomar esta decisión son importantes dos factores: la escala de medición (ordinal o numérica) y la forma de la distribución, esto es, si es simétrica alrededor de la media o si presenta un sesgo a la izquierda o a la derecha de la media.

  • Si hay observaciones distantes (extremas) solo en una dirección —sean unos cuantos valores pequeños o unos cuantos valores grandes— se dice que la distribución es sesgada.
  • Si los valores extremos son pequeños, es sesgada hacia la izquierda o con asimetría negativa, y la relación es: X̄ < Md < Mo.
  • Mientras que si los valores extremos son grandes, la distribución es sesgada hacia la derecha o con asimetría positiva, y la relación es: X̄ > Md > Mo.

Una distribución simétrica como la distribución normal, presenta la misma forma a ambos lados de la media, y en este caso particular la posición de la media, mediana y moda son coincidentes, de manera que cualquiera de ellas puede ser usada como medida de tendencia central.

Conceptos de Probabilidad y Distribuciones

  • A Priori: Probabilidad de la que se parte antes de efectuar un experimento que pueda arrojar nueva información sobre dicha probabilidad, para obtener luego la probabilidad revisada o a posteriori.
  • A Posteriori: Probabilidad que resulta de revisar una probabilidad a priori, inicial o de partida, en función de la información deducida de las nuevas pruebas practicadas.
  • Distribución Binomial: Es una de las distribuciones de probabilidad de variable discreta más útiles. Describe una variedad de procesos de interés que son el resultado de un experimento conocido como proceso de Bernoulli. Sus áreas de aplicación incluyen el control de calidad, mercadotecnia, medicina, encuestas de opinión, etc.
  • Distribución de Poisson: Se aplica cuando el número de ensayos (n) es grande y la probabilidad de éxito (p) tiende a 0, es decir, muestras grandes y sucesos raros. Esta distribución no se aplica solo al número de eventos que ocurren en un continuo de tiempo, sino en cualquier continuo de superficie, volumen, etc.
  • Distribución Muestral de un Estadístico: Es aquella constituida por todos los valores posibles que puede asumir dicho estadístico, calculados a partir de muestras del mismo tamaño, extraídas aleatoriamente de una población.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.