a. Interpretación de resultados
Como accidente es una variable dicotómica, nos encontramos con un modelo de probabilidad lineal.
Dado que β0 = 0,05, para una persona que no consume alcohol, la probabilidad estimada de tener un accidente es del 5%. Por su parte, la estimación de β1 indica que, por cada litro adicional de alcohol consumido durante la noche, la probabilidad promedio de tener un accidente aumenta en un punto porcentual.
b. Especificación del modelo
accidente_i = β0 + β1 alcohol_i + β2 d2020 + β3 (alcohol * d2020) + ui
- 2015: β1
- 2020: β1 + β3
- Diferencia (2020-2015): β3
Hipótesis:
- H0: β3 = 0
- H1: β3 ≠ 0
Si se rechaza la hipótesis nula, habría suficiente evidencia estadística para aceptar que el efecto parcial del consumo de alcohol cambió a lo largo del tiempo.
c. Control de cambios agregados
Para controlar por cambios agregados en la variable dependiente entre 2020 y 2015, se incluyó en la regresión una variable dummy de año (D2020), donde 1 representa observaciones de 2020 y 0 representa observaciones de 2015.
d. Probabilidad en 2020
accidente_i = β0 + β1 alcohol_i + β2 d2020 + β3 (alcohol * d2020) + ui
- 2020: β0 + β2
- 2015: β0
La probabilidad de tener un accidente para una persona que consume alcohol en 2020 es β0 + β2. (H0: β2 = 0; H1: β2 ≠ 0).
e. Sesgo por variable omitida
El sesgo se define como: Sesgo(α1) = (α2 * cov(alcohol, impul)) / var(alcohol).
El sesgo es positivo porque la varianza siempre es positiva y el enunciado establece que la impulsividad actúa como un incremento tanto en el consumo de alcohol como en la probabilidad de tener un accidente.
f. Impacto en la magnitud del sesgo
El posible impacto sobre la magnitud del sesgo en β1 es que este aumente, a raíz de que la varianza en el consumo de alcohol disminuya.
g. Condiciones de los instrumentos
- Relevancia: Cov(distancia, alcohol) ≠ 0
- Exogeneidad: Cov(distancia, ui) = 0
h. Evaluación de condiciones
En este contexto, la relevancia se cumple, ya que existe una relación entre la distancia y el consumo de alcohol (por ejemplo, la proximidad a un bar aumenta la propensión a ingerir alcohol). Sin embargo, la exogeneidad es cuestionable, ya que la distancia puede estar correlacionada con variables omitidas en el término de error, como el ingreso (alguien con mayores ingresos podría elegir vivir cerca de zonas de ocio, mientras que otros no).
i. Prueba de relevancia
El modelo Alcohol = β0 + β1 distancia + ui no permite probar la exogeneidad directamente porque el término de error es inobservable.
j. Estimador de Variables Instrumentales (VI)
Para accidente = β0 + β1 alcohol + ei, el estimador es:
β1 = Cov(distancia, accidente) / Cov(distancia, alcohol)
k. Comparación de varianzas
Var(β1 MCO) < Var(β1 VI). El MCO utiliza toda la varianza observada del alcohol, mientras que en VI, la varianza del alcohol es explicada únicamente por su instrumento.
l. Análisis de resultados
Si β1_VI = 0,016 > β1_MCO = 0,010, y nuestro sesgo es positivo, el estimador de MCO debería estar sobreestimado. Por lo tanto, no tiene sentido que el estimador de VI sea mayor al de MCO.
m. Consideraciones sobre el modelo
En el modelo 1, la impulsividad sigue siendo parte del término de error y mantiene relación con el consumo de alcohol, por lo que no esperamos resultados radicalmente diferentes mediante MCO.
n. Diferencias en diferencias
Δaccidente = γ1 Δalcohol + Δui
Donde γ1 se estima mediante la covarianza de las diferencias entre el cambio en el alcohol y el cambio en los accidentes, sobre la varianza del cambio en el alcohol.
o. Condición de existencia
Para que el estimador sea válido, el cambio en Δalcohol debe ser distinto de cero; si los valores son iguales, el denominador se vuelve 0 y el estimador no está definido.
