Conceptos de Estadística Descriptiva y Análisis de Datos
Evaluación de Conocimientos: Kahoot 1
En el conjunto de datos 5-5-5-5-5, la media y la varianza valen: la media es 5 y la varianza es 0.
Si una distribución de gastos en libras se pasa a euros (1 libra = 1,2 €): su media se multiplica por 1,2 y su varianza se multiplica por 1,44 (ya que se eleva la constante al cuadrado).
Si a un conjunto de dietas de viaje se añaden a todas 30 € extra de taxi, la media se incrementa en 30 €; sin embargo, la desviación típica no varía.
Esta medida de dispersión no se ve afectada por la presencia de valores extremos: el recorrido intercuartílico.
Para comparar la dispersión entre el PIB de los países y el número de medallas olímpicas en Río 2016, se utiliza el coeficiente de variación.
La afirmación FALSA para la media aritmética es: «No se ve afectada por valores extremos».
En el conjunto de cinco datos 12-2-8-6-2: la Media = 6, la Mediana = 6 y la Moda = 2.
En la distribución de edades de actrices ganadoras del Oscar a la mejor actriz: la media de edad es mayor que la edad mediana (hay más jóvenes y menos viejas).
El primer cuartil de la variable «vida» es de 3 años. Esto implica que: el 75 % de las empresas dura 3 años o más.
Se estudia en 100 personas la variable ingresos y se obtiene un Q3 = 3000 €: esto significa que el 25 % de las personas tienen ingresos superiores a 3000 €.
Evaluación de Conocimientos: Kahoot 2
La nota tipificada de un alumno en estadística es 2. Su nota original (antes de tipificar) está muy por encima de la media.
En una empresa, 9 vehículos tienen entre 0 y 5 años de antigüedad, pero hay uno que tiene 10 años: en este caso, la media será superior a la mediana.
La covarianza entre X e Y vale -0,9: esto indica que X e Y son dependientes.
La correlación lineal entre X e Y vale 0,9: esto significa que si X decrece, Y casi siempre decrece.
En la correlación entre tiempo de estudio y nota de examen (0,67), si se mide el tiempo en minutos en vez de en horas, la correlación será igual.
Si COV(X;Y) = 12, var(X) = 9 y var(Y) = 4, la correlación entre X e Y es inconsistente: los datos son erróneos porque el coeficiente debe oscilar entre -1 y 1.
Según el gráfico, la correlación entre natalidad y mortalidad en España es positiva (observando los gráficos en descenso).
Se pregunta a 15 personas sobre su «sexo» y «decisión de compra» de un producto. Según la tabla obtenida, ambas variables son dependientes porque las distribuciones condicionadas no son iguales.
Glosario de Términos Estadísticos
Medidas de Frecuencia
Frecuencia absoluta: es el número de veces que se repite un suceso.
Frecuencia relativa: basada en la regla de Laplace, es la proporción de veces que ocurre un evento respecto al número total.
Frecuencias acumuladas: se obtienen al sumar las frecuencias de los valores de menor a mayor.
Histogramas: representación gráfica de una distribución de frecuencias.
Relaciones entre Variables
Variables Cuantitativas: se representan mediante un gráfico de dispersión.
Variables Cualitativas: se analizan mediante tablas de contingencia.
Frecuencia Conjunta: número de casos en los que se repiten dos variables simultáneamente.
Frecuencia relativa conjunta: porcentaje de datos que ocurren a la vez respecto al número total de datos.
Medidas de Centralización, Posición y Dispersión
Media, mediana, moda, percentiles y cuartiles: medidas para resumir y posicionar los datos.
Rango: diferencia entre el valor mayor y el menor.
Rango intercuartílico: medida donde se eliminan el 25 % de los valores más altos y el 25 % de los más bajos.
Varianza: utilizada para detectar variaciones con respecto a la media.
Desviación típica: detecta variaciones con respecto a la media (es la raíz cuadrada de la varianza).
Coeficiente de Variación: mide la dispersión porcentual con respecto a la media.
Covarianza: si X,Y > 0, van en la misma dirección; si X,Y < 0, van en distintas direcciones (indica dependencia).
Coeficiente de correlación: valor adimensional situado entre -1 y 1.
Metodología de la Investigación
Tipos de Información
Información Cualitativa: son datos que no se pueden contar y sirven para adquirir conocimientos profundos sobre los problemas.
Ventajas: son más económicos y permiten obtener una gran cantidad de datos referentes a actitudes.
Desventajas: los resultados no pueden generalizarse a otros grupos de individuos y es complicado encontrar entrevistadores cualificados.
Información Cuantitativa: se basa en preguntas cerradas y cuestionarios muy estructurados.
Técnicas de Recogida de Información
Entrevista en profundidad: es un proceso formal no estructurado en el que se persigue, de forma individual, que el entrevistado revele libremente sus opiniones, sentimientos y actitudes sobre el tema objeto de análisis.
Dinámica de grupo: reunión de un grupo de personas (entre seis y doce) para una discusión espontánea e interactiva. A través de un proceso de comunicación dinámico sobre un tema, proporcionan información guiados por un moderador.
Técnicas proyectivas: recogen una serie de métodos de recolección de datos internos del individuo (creencias, ideas, etc.) dirigidos a conocer el porqué de su comportamiento. Incluyen:
Test de asociación de palabras.
Test de frases incompletas.
Test de respuestas a imágenes.
Técnicas de creatividad: se utilizan para la generación de nuevas ideas, detección de problemas de marketing y propuesta de soluciones.
Brainstorming: lluvia de ideas.
Sinéctica: sesión de brainstorming más estructurada.
Philips 66: a partir del acuerdo razonado de un grupo de individuos, permite plantear soluciones a un problema concreto.
Delphi: grupo de 10 a 40 expertos a los que se les pide su opinión independiente y anónima a través de un cuestionario.
Observación: herramienta utilizada para recopilar datos primarios mediante el registro del comportamiento de las personas.
Encuesta: se utiliza para obtener información primaria cuantitativa.
Cuestionario: documento que recoge un conjunto de preguntas y respuestas relevantes para ser contestado por los encuestados.
Preguntas abiertas: el entrevistado responde libremente.
Preguntas cerradas: ofrecen diferentes opciones predefinidas para contestar.