Fundamentos de Probabilidad, Distribuciones Estadísticas y Métodos de Muestreo

Conceptos Fundamentales de Probabilidad

La probabilidad es el método por el cual se obtiene la frecuencia de ocurrencia de un evento determinado mediante la realización de un experimento aleatorio, del cual se conocen todos los resultados posibles, bajo condiciones estables.

Propiedades de la Probabilidad

Sea A un evento de interés:

  • La probabilidad de ocurrencia de un evento A imposible es P(A) = 0.
  • La probabilidad de ocurrencia de un evento A seguro es P(A) = 1.

Entendiendo las Distribuciones de Probabilidad

Una distribución de probabilidad (o densidad de probabilidad) es la función de distribución de la probabilidad de la variable aleatoria que estamos estudiando.

Las distribuciones de probabilidad se pueden clasificar en distribuciones de probabilidad discretas o continuas.

Si hablamos de “función”, podemos pensar en una curva en el plano. Cuando graficamos las distribuciones de probabilidad, el área bajo la curva tendrá un significado importante: esta representará la probabilidad de que la variable tome ciertos valores, que están en esa área.

En teoría, cada población que podemos estudiar tiene su propia función de distribución de probabilidad, y esta dependerá también de la variable que estemos estudiando en esa población. Por lo anterior, podemos decir que existen infinitas distribuciones de probabilidad.

Sin embargo, hay algunas distribuciones que sirven como referencia y nos permiten estudiar y aproximarnos al comportamiento de muchas variables. Algunas de ellas son:

  • Geométrica
  • Binomial
  • Hipergeométrica
  • Poisson
  • Normal

Tipos de Distribuciones de Probabilidad Comunes

Distribución Geométrica

Esta distribución es útil cuando tenemos dos posibles resultados y cada uno de ellos tiene una probabilidad determinada de suceder. Además, esta probabilidad considera que solo tendremos éxito en el último intento, entre todas las veces que repetimos el experimento.

Distribución Binomial

Al ser un modelo de Bernoulli, implica que trabajamos con probabilidades p y q; sin embargo, ahora debemos considerar todos los casos posibles en que puede suceder el resultado buscado. Volvamos con el conocidísimo futbolista que se pone nervioso en las finales.

Distribución de Poisson

Esta distribución tiene la particularidad de que nos permite calcular probabilidades de que ocurra un evento en un intervalo de tiempo, en alguna longitud determinada, etc. Para esto, tendremos en cuenta las siguientes características:

  • El evento debe ser aleatorio.
  • Debe existir independencia entre los eventos que sucedan en el “intervalo”.

Distribución Hipergeométrica

La distribución de probabilidad hipergeométrica se caracteriza por entregarnos la probabilidad de obtener la combinación de ciertos elementos que cumplen con ciertas características implicadas en el resultado que estamos buscando.

Introducción a la Regresión Lineal Simple

Ciertos sucesos pueden tener algún grado de relación con una causa. Este grado de relación puede cuantificarse para determinar qué tan fuerte es el vínculo de causa y efecto entre ambos sucesos.

Se asume que una variable depende de la otra, denominándose variable dependiente (también conocida como explicada, respuesta o de salida).

Medidas de Forma: Asimetría y Curtosis

Asimetría

Es una medida de forma de una distribución que permite identificar y describir la manera como los datos tienden a reunirse de acuerdo con la frecuencia con que se hallen dentro de la distribución. Permite identificar las características de la distribución de datos sin necesidad de generar el gráfico.

Tipos de Asimetría

La asimetría presenta las siguientes formas:

Asimetría Negativa o a la Izquierda

Se da cuando en una distribución la minoría de los datos está en la parte izquierda de la media. Este tipo de distribución presenta un alargamiento o sesgo hacia la izquierda, es decir, la distribución de los datos tiene una cola más larga a la izquierda.

Simétrica

Se da cuando en una distribución se distribuyen aproximadamente la misma cantidad de los datos a ambos lados de la media aritmética. No tiene alargamiento o sesgo. Se representa por una curva normal en forma de campana, llamada campana de Gauss.

Asimetría Positiva o a la Derecha

Se da cuando en una distribución la minoría de los datos está en la parte derecha de la media aritmética. Este tipo de distribución presenta un alargamiento o sesgo hacia la derecha, es decir, la distribución de los datos tiene a la derecha una cola más larga que a la izquierda. También se dice que una distribución es asimétrica a la derecha o tiene sesgo positivo cuando el valor de la media aritmética es mayor que la mediana, y esta a su vez es mayor que la moda (Media > Mediana > Moda).

Curtosis o Apuntamiento

La curtosis mide el grado de agudeza o achatamiento de una distribución con relación a la distribución normal, es decir, mide cuán puntiaguda es una distribución.

Tipos de Curtosis

La curtosis determina el grado de concentración que presentan los valores en la región central de la distribución. Así puede ser:

  • Leptocúrtica: Existe una gran concentración.
  • Mesocúrtica: Existe una concentración normal.
  • Platicúrtica: Existe una baja concentración.

Estimación por Intervalos de Confianza

Para estimar el valor aproximado de un parámetro de una población, identificamos un intervalo en el cual puede estar contenido. Este intervalo es acotado inferior y superiormente. Los valores que limitan este intervalo son estadísticamente calculados a partir de la muestra que se está utilizando como base para la estimación.

Fundamentos de la Prueba de Hipótesis

  • Es una técnica de la inferencia estadística que nos permitirá comprobar si es o no acertada la hipótesis estadística formulada, respecto al modelo de probabilidad en estudio.

Hipótesis Estadística

Es una afirmación sobre una característica en estudio.

Principios y Técnicas de Muestreo

Definiciones Fundamentales en Muestreo

Población: Conjunto total de elementos que comparten una característica común de interés a investigar.

Criterio de segmentación: Variables o características de importancia para el estudio, que debe tener la unidad de observación para ser consideradas parte de la población o muestra.

Muestra: Subconjunto de la población, obtenida con una fórmula de muestreo.

Muestreo (proceso): Proceso de seleccionar una muestra.

Muestreo Probabilístico

Se caracteriza porque cada elemento en estudio tiene la misma probabilidad de ser elegido en el estudio. Hablamos de “selección al azar”. Además, tiene como principal característica el basarse en procedimientos estadísticos y matemáticos.

Muestreo Aleatorio Simple

  • Selección al azar.
  • Igual probabilidad de ser seleccionados.
  • La población se considera muy homogénea.

Muestreo Estratificado

  • La población se divide en estratos diferentes (características relevantes para el estudio).
  • En cada estrato, se selecciona una muestra aleatoria.
  • Cada estrato, internamente, es muy homogéneo.
  • Entre sí, los estratos son heterogéneos.

Muestreo por Conglomerados

  • Se divide la población en subconjuntos de elementos.
  • Se seleccionan “grupos” de elementos, desde los conglomerados.
  • La selección de “grupos” se detiene cuando se completa el tamaño muestral.

Muestreo Sistemático

  • Se determina un intervalo de longitud k, respecto a la cantidad de elementos de la muestra.
  • Se selecciona un elemento de la muestra, después de k elementos no seleccionados.

Muestreo no Probabilístico

Muestreo por Juicio

  • Se considera una muestra sesgada.
  • El investigador selecciona los elementos de la población que él considera que la representan.

Muestreo por Conveniencia

  • Los elementos que forman parte de la muestra son los que están en el momento y lugar donde se hace el estudio.

Muestreo por Cuotas

  • Se divide a la población en subconjuntos (sin intersección).
  • Se observa la proporción de cada subconjunto respecto a la población.
  • Se seleccionan elementos de cada subconjunto, manteniendo la proporción de la población en la muestra final.
  • La selección se realiza por Juicio o por Conveniencia.

Muestreo de Bola de Nieve

  • Se selecciona un grupo inicial de sujetos de estudio. Esta selección se realiza por Juicio o por Conveniencia.
  • Se le pide a cada sujeto seleccionado que dé la referencia de otro sujeto de estudio que pueda formar parte de esta muestra.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.