La mayoría de las tareas de la econometría se reducen a uno de los dos objetivos:
$$ \begin{align} y = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \cdots + \beta_k x_k + u \end{align} $$
La mayoría de las tareas de la econometría se reducen a uno de los dos objetivos:
$$ \begin{align} y = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \cdots + \beta_k x_k + u \end{align} $$
La mayoría de las tareas de la econometría se reducen a uno de los dos objetivos:
$$ \begin{align} y = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \cdots + \beta_k x_k + u \end{align} $$
Predicción: Precisión y fiabilidad predicción/pronóstico \(\color{#6A5ACD}{y}\) utilizando un conjunto de variables explicativas-no es necesario que sean \(x_1\) hasta \(x_k\). Se centra en \(\color{#6A5ACD}{hat{y}}\). \(\beta_j\) no importa realmente.
Estimación causal:† La estimación del proceso real de generación de datos-aprendizaje del modelo poblacional verdadero que explica cómo \(\color{#e64173}{y}\) cambia cuando cambiamos \(\color{#e64173}{x_j}\)-se centra en \(\color{#e64173}{beta_j}\). La precisión de \(\hat{y}\) no es importante.
† Usualmente llamado identificación causal.
Como hemos visto hasta ahora, determinar y estimar el verdadero modelo puede ser bastante difícil, tanto en términos prácticos como econométricos.
Como hemos visto hasta ahora, determinar y estimar el verdadero modelo puede ser bastante difícil, tanto en términos prácticos como econométricos.
Desafíos prácticos
Como hemos visto hasta ahora, determinar y estimar el verdadero modelo puede ser bastante difícil, tanto en términos prácticos como econométricos.
Desafíos prácticos
Desafíos econométricos
Como hemos visto hasta ahora, determinar y estimar el verdadero modelo puede ser bastante difícil, tanto en términos prácticos como econométricos.
Desafíos prácticos
Desafíos econométricos
Muchos de estos retos se relacionan con la exogeneidad, es decir, \(\color{#314f4f}{\mathop{\boldsymbol{E}}\left[ u_i | X \right] = 0}\).
Ocasionalmente, las relaciones causales se pueden entender simplemente, por ejemplo,
Ocasionalmente, las relaciones causales se pueden entender simplemente, por ejemplo,
Ocasionalmente, las relaciones causales se pueden entender simplemente, por ejemplo,
En general, las relaciones causales son complejas y difíciles de responder, por ejemplo,
Ocasionalmente, las relaciones causales se pueden entender simplemente, por ejemplo,
En general, las relaciones causales son complejas y difíciles de responder, por ejemplo,
Es probable que hayan escuchado el dicho
Correlación no es causalidad.
El refrán sólo señala que hay violaciones de la exogeneidad.
Es probable que hayan escuchado el dicho
Correlación no es causalidad.
El refrán sólo señala que hay violaciones de la exogeneidad.
Aunque la correlación no es causalidad, .hi [la causalidad requiere correlación].
Es probable que hayan escuchado el dicho
Correlación no es causalidad.
El refrán sólo señala que hay violaciones de la exogeneidad.
Aunque la correlación no es causalidad, .hi [la causalidad requiere correlación].
Nueva frase:
Correlación más exogeneidad es causalidad.
Veamos algunos ejemplos.
† Muchos de los primeros estudios estadísticos y econométricos incluían ensayos de campo agrícolas.
Supongamos que queremos conocer el efecto causal del fertilizante sobre el rendimiento del maíz.
† Muchos de los primeros estudios estadísticos y econométricos incluían ensayos de campo agrícolas.
Supongamos que queremos conocer el efecto causal del fertilizante sobre el rendimiento del maíz.
P: ¿Podríamos simplemente hacer una regresión del rendimiento en función del fertilizante?
† Muchos de los primeros estudios estadísticos y econométricos incluían ensayos de campo agrícolas.
Supongamos que queremos conocer el efecto causal del fertilizante sobre el rendimiento del maíz.
P: ¿Podríamos simplemente hacer una regresión del rendimiento en función del fertilizante?
R: Probablemente no (si queremos el efecto causal).
† Muchos de los primeros estudios estadísticos y econométricos incluían ensayos de campo agrícolas.
Supongamos que queremos conocer el efecto causal del fertilizante sobre el rendimiento del maíz.
P: ¿Podríamos simplemente hacer una regresión del rendimiento en función del fertilizante?
R: Probablemente no (si queremos el efecto causal).
P: ¿Por qué no?
† Muchos de los primeros estudios estadísticos y econométricos incluían ensayos de campo agrícolas.
Supongamos que queremos conocer el efecto causal del fertilizante sobre el rendimiento del maíz.
P: ¿Podríamos simplemente hacer una regresión del rendimiento en función del fertilizante?
R: Probablemente no (si queremos el efecto causal).
P: ¿Por qué no?
R: Sesgo de variable omitida: Los agricultores pueden aplicar menos fertilizantes en zonas que ya son peores en otras dimensiones que afectan al rendimiento (suelo, pendiente, agua).
Viola todo lo demás igual (exogeneidad). Resultados sesgados y/o espurios.
† Muchos de los primeros estudios estadísticos y econométricos incluían ensayos de campo agrícolas.
Supongamos que queremos conocer el efecto causal del fertilizante sobre el rendimiento del maíz.
P: ¿Podríamos simplemente hacer una regresión del rendimiento en función del fertilizante?
R: Probablemente no (si queremos el efecto causal).
P: ¿Por qué no?
R: Sesgo de variable omitida: Los agricultores pueden aplicar menos fertilizantes en zonas que ya son peores en otras dimensiones que afectan al rendimiento (suelo, pendiente, agua).
Viola todo lo demás igual (exogeneidad). Resultados sesgados y/o espurios.
P: Entonces, ¿qué deberíamos hacer?
† Muchos de los primeros estudios estadísticos y econométricos incluían ensayos de campo agrícolas.
Supongamos que queremos conocer el efecto causal del fertilizante sobre el rendimiento del maíz.
P: ¿Podríamos simplemente hacer una regresión del rendimiento en función del fertilizante?
R: Probablemente no (si queremos el efecto causal).
P: ¿Por qué no?
R: Sesgo de variable omitida: Los agricultores pueden aplicar menos fertilizantes en zonas que ya son peores en otras dimensiones que afectan al rendimiento (suelo, pendiente, agua).
Viola todo lo demás igual (exogeneidad). Resultados sesgados y/o espurios.
P: Entonces, ¿qué deberíamos hacer?
R: ¡Hacer un experimento!
† Muchos de los primeros estudios estadísticos y econométricos incluían ensayos de campo agrícolas.
Supongamos que queremos conocer el efecto causal del fertilizante sobre el rendimiento del maíz.
P: ¿Podríamos simplemente hacer una regresión del rendimiento en función del fertilizante?
R: Probablemente no (si queremos el efecto causal).
P: ¿Por qué no?
R: Sesgo de variable omitida: Los agricultores pueden aplicar menos fertilizantes en zonas que ya son peores en otras dimensiones que afectan al rendimiento (suelo, pendiente, agua).
Viola todo lo demás igual (exogeneidad). Resultados sesgados y/o espurios.
P: Entonces, ¿qué deberíamos hacer?
R: ¡Hacer un experimento! 💩
Los experimentos aleatorios nos ayudan a mantener todo lo demás igual (exogeneidad).
Los experimentos aleatorios nos ayudan a mantener todo lo demás igual (exogeneidad).
A menudo llamamos a estos experimentos randomized control trials (RCT).†
† La econometría (y la estadística) toma prestado este lenguaje de la bioestadística y los ensayos farmacéuticos.
Los experimentos aleatorios nos ayudan a mantener todo lo demás igual (exogeneidad).
A menudo llamamos a estos experimentos randomized control trials (RCT).†
† La econometría (y la estadística) toma prestado este lenguaje de la bioestadística y los ensayos farmacéuticos.
Imaginemos un RCT en el que tenemos dos grupos:
Los experimentos aleatorios nos ayudan a mantener todo lo demás igual (exogeneidad).
A menudo llamamos a estos experimentos randomized control trials (RCT).†
† La econometría (y la estadística) toma prestado este lenguaje de la bioestadística y los ensayos farmacéuticos.
Imaginemos un RCT en el que tenemos dos grupos:
Al distribuir aleatoriamente las parcelas en tratamiento o control, incluiremos, en promedio, todos los tipos de tierra (suelo, pendiente, agua, etc.) en ambos grupos.
Los experimentos aleatorios nos ayudan a mantener todo lo demás igual (exogeneidad).
A menudo llamamos a estos experimentos randomized control trials (RCT).†
† La econometría (y la estadística) toma prestado este lenguaje de la bioestadística y los ensayos farmacéuticos.
Imaginemos un RCT en el que tenemos dos grupos:
Al distribuir aleatoriamente las parcelas en tratamiento o control, incluiremos, en promedio, todos los tipos de tierra (suelo, pendiente, agua, etc.) en ambos grupos.
¡Todo lo demás es igual!
54 parcelas de igual tamaño
54 parcelas de igual tamaño de distinta calidad
54 parcelas de igual tamaño de distinta calidad más el tratamiento asignado al azar
54 parcelas de igual tamaño de distinta calidad más el tratamiento asignado al azar
54 parcelas de igual tamaño de distinta calidad más el tratamiento asignado al azar
54 parcelas de igual tamaño de distinta calidad más el tratamiento asignado al azar
54 parcelas de igual tamaño de distinta calidad más el tratamiento asignado al azar
54 parcelas de igual tamaño de distinta calidad más el tratamiento asignado al azar
54 parcelas de igual tamaño de distinta calidad más el tratamiento asignado al azar
54 parcelas de igual tamaño de distinta calidad más el tratamiento asignado al azar
54 parcelas de igual tamaño de distinta calidad más el tratamiento asignado al azar
54 parcelas de igual tamaño de distinta calidad más el tratamiento asignado al azar
54 parcelas de igual tamaño de distinta calidad más el tratamiento asignado al azar
54 parcelas de igual tamaño de distinta calidad más el tratamiento asignado al azar
Podemos estimar el efecto causal del fertilizante sobre el rendimiento de los cultivos comparando el rendimiento medio del grupo de tratamiento (💩) con el grupo de control (sin 💩).
$$ \begin{align} \overline{\text{Rendimiento}}_\text{Tratamiento} - \overline{\text{Rendimiento}}_\text{Control} \end{align} $$
Podemos estimar el efecto causal del fertilizante sobre el rendimiento de los cultivos comparando el rendimiento medio del grupo de tratamiento (💩) con el grupo de control (sin 💩).
$$ \begin{align} \overline{\text{Rendimiento}}_\text{Tratamiento} - \overline{\text{Rendimiento}}_\text{Control} \end{align} $$
Como alternativa, podemos utilizar la regresión
Podemos estimar el efecto causal del fertilizante sobre el rendimiento de los cultivos comparando el rendimiento medio del grupo de tratamiento (💩) con el grupo de control (sin 💩).
$$ \begin{align} \overline{\text{Rendimiento}}_\text{Tratamiento} - \overline{\text{Rendimiento}}_\text{Control} \end{align} $$
Como alternativa, podemos utilizar la regresión
$$ \begin{align} \text{Rendimiento}_i = \beta_0 + \beta_1 \text{Trt}_i + u_i \tag{1} \end{align} $$
donde \(\text{Trt}_i\) es una variable binaria (=1 si la parcela \(i\) recibió el tratamiento de fertilización).
Podemos estimar el efecto causal del fertilizante sobre el rendimiento de los cultivos comparando el rendimiento medio del grupo de tratamiento (💩) con el grupo de control (sin 💩).
$$ \begin{align} \overline{\text{Rendimiento}}_\text{Tratamiento} - \overline{\text{Rendimiento}}_\text{Control} \end{align} $$
Como alternativa, podemos utilizar la regresión
$$ \begin{align} \text{Rendimiento}_i = \beta_0 + \beta_1 \text{Trt}_i + u_i \tag{1} \end{align} $$
donde \(\text{Trt}_i\) es una variable binaria (=1 si la parcela \(i\) recibió el tratamiento de fertilización).
P: ¿Debemos esperar que \((1)\) satisfaga la exogeneidad? ¿Por qué?
Podemos estimar el efecto causal del fertilizante sobre el rendimiento de los cultivos comparando el rendimiento medio del grupo de tratamiento (💩) con el grupo de control (sin 💩).
$$ \begin{align} \overline{\text{Rendimiento}}_\text{Tratamiento} - \overline{\text{Rendimiento}}_\text{Control} \end{align} $$
Como alternativa, podemos utilizar la regresión
$$ \begin{align} \text{Rendimiento}_i = \beta_0 + \beta_1 \text{Trt}_i + u_i \tag{1} \end{align} $$
donde \(\text{Trt}_i\) es una variable binaria (=1 si la parcela \(i\) recibió el tratamiento de fertilización).
P: ¿Debemos esperar que \((1)\) satisfaga la exogeneidad? ¿Por qué?
R: Por término medio, la asignación aleatoria del tratamiento debe equilibrar trt. y control en las demás dimensiones que afectan al rendimiento (suelo, pendiente, agua).
Los economistas laborales, los responsables políticos, los padres y los estudiantes están interesados en el retorno monetario de la educación.
Los economistas laborales, los responsables políticos, los padres y los estudiantes están interesados en el retorno monetario de la educación.
Experimento mental:
Este cambio en los ingresos nos da el efecto causal de la educación sobre los ingresos.
P: ¿Podríamos simplemente hacer una regresión de los ingresos en función de la educación?
P: ¿Podríamos simplemente hacer una regresión de los ingresos en función de la educación?
R: De nuevo, probablemente no si queremos el verdadero efecto causal.
P: ¿Podríamos simplemente hacer una regresión de los ingresos en función de la educación?
R: De nuevo, probablemente no si queremos el verdadero efecto causal.
P: ¿Podríamos simplemente hacer una regresión de los ingresos en función de la educación?
R: De nuevo, probablemente no si queremos el verdadero efecto causal.
El punto (2) anterior también ilustra la dificultad de aprender sobre la educación manteniendo todo lo demás constante.
Muchas variables importantes tienen el mismo reto: género, raza, ingresos.
P: Entonces, ¿cómo podemos estimar los rendimientos de la educación?
P: Entonces, ¿cómo podemos estimar los rendimientos de la educación?
Opción 1: Correr un experimento.
P: Entonces, ¿cómo podemos estimar los rendimientos de la educación?
Opción 1: Correr un experimento.
P: Entonces, ¿cómo podemos estimar los rendimientos de la educación?
Opción 1: Correr un experimento.
Opción 2: Busque un experimento natural-una política o accidente en la sociedad que haya aumentado arbitrariamente la educación de un subconjunto de personas.
P: Entonces, ¿cómo podemos estimar los rendimientos de la educación?
Opción 1: Correr un experimento.
Opción 2: Busque un experimento natural-una política o accidente en la sociedad que haya aumentado arbitrariamente la educación de un subconjunto de personas.
En ambos ejemplos se consideran experimentos reales que aíslan los efectos causales.
Características
En ambos ejemplos se consideran experimentos reales que aíslan los efectos causales.
Características
Nota: Los resultados de su experimento son sólo tan buenos como su aleatorización.
Una aleatorización desafortunada
El experimento ideal sería sutilmente diferente.
En lugar de comparar unidades aleatorizadas como tratamiento frente a control, el experimento ideal compararía el tratamiento y el control para la misma y exacta unidad.
El experimento ideal sería sutilmente diferente.
En lugar de comparar unidades aleatorizadas como tratamiento frente a control, el experimento ideal compararía el tratamiento y el control para la misma y exacta unidad.
$$ \begin{align} y_{\text{Tratamiento},i} - y_{\text{Control},i} \end{align} $$
El experimento ideal sería sutilmente diferente.
En lugar de comparar unidades aleatorizadas como tratamiento frente a control, el experimento ideal compararía el tratamiento y el control para la misma y exacta unidad.
$$ \begin{align} y_{\text{Tratamiento},i} - y_{\text{Control},i} \end{align} $$
que escribiremos (para simplificar) como
$$ \begin{align} y_{1,i} - y_{0,i} \end{align} $$
El experimento ideal sería sutilmente diferente.
En lugar de comparar unidades aleatorizadas como tratamiento frente a control, el experimento ideal compararía el tratamiento y el control para la misma y exacta unidad.
$$ \begin{align} y_{\text{Tratamiento},i} - y_{\text{Control},i} \end{align} $$
que escribiremos (para simplificar) como
$$ \begin{align} y_{1,i} - y_{0,i} \end{align} $$
Este experimento ideal es claramente inviable†, pero crea una bonita notación para la causalidad (el modelo causal de Rubin/marco de resultados potenciales de Neyman).
† Sin (1) habilidades similares a las de Dios y múltiples universos o (2) una máquina del tiempo.
The ideal data for 10 people
> i trt y1i y0i> 1 1 1 5.01 2.56> 2 2 1 8.85 2.53> 3 3 1 6.31 2.67> 4 4 1 5.97 2.79> 5 5 1 7.61 4.34> 6 6 0 7.63 4.15> 7 7 0 4.75 0.56> 8 8 0 5.77 3.52> 9 9 0 7.47 4.49> 10 10 0 7.79 1.40The ideal data for 10 people
> i trt y1i y0i> 1 1 1 5.01 2.56> 2 2 1 8.85 2.53> 3 3 1 6.31 2.67> 4 4 1 5.97 2.79> 5 5 1 7.61 4.34> 6 6 0 7.63 4.15> 7 7 0 4.75 0.56> 8 8 0 5.77 3.52> 9 9 0 7.47 4.49> 10 10 0 7.79 1.40Calcula el efecto causal del trt. $$ \begin{align} \tau_i = y_{1,i} - y_{0,i} \end{align} $$ para cada individuo \(i\).
Los datos ideales para 10 personas
> i trt y1i y0i effect_i> 1 1 1 5.01 2.56 2.45> 2 2 1 8.85 2.53 6.32> 3 3 1 6.31 2.67 3.64> 4 4 1 5.97 2.79 3.18> 5 5 1 7.61 4.34 3.27> 6 6 0 7.63 4.15 3.48> 7 7 0 4.75 0.56 4.19> 8 8 0 5.77 3.52 2.25> 9 9 0 7.47 4.49 2.98> 10 10 0 7.79 1.40 6.39Calcula el efecto causal del trt. $$ \begin{align} \tau_i = y_{1,i} - y_{0,i} \end{align} $$ para cada individuo \(i\).
Los datos ideales para 10 personas
> i trt y1i y0i effect_i> 1 1 1 5.01 2.56 2.45> 2 2 1 8.85 2.53 6.32> 3 3 1 6.31 2.67 3.64> 4 4 1 5.97 2.79 3.18> 5 5 1 7.61 4.34 3.27> 6 6 0 7.63 4.15 3.48> 7 7 0 4.75 0.56 4.19> 8 8 0 5.77 3.52 2.25> 9 9 0 7.47 4.49 2.98> 10 10 0 7.79 1.40 6.39Calcula el efecto causal del trt. $$ \begin{align} \tau_i = y_{1,i} - y_{0,i} \end{align} $$ para cada individuo \(i\).
La media \(\tau_i\) es el
average treatment effect (ATE).
Entonces, \(\color{#e64173}{\overline{\tau} = 3.82}\)
Este modelo pone de manifiesto el problema fundamental de la inferencia causal. $$ \begin{align} \tau_i = \color{#e64173}{y_{1,i}} &- \color{#6A5ACD}{y_{0,i}} \end{align} $$
Este modelo pone de manifiesto el problema fundamental de la inferencia causal. $$ \begin{align} \tau_i = \color{#e64173}{y_{1,i}} &- \color{#6A5ACD}{y_{0,i}} \end{align} $$
El desafío:
Si observamos \(\color{#e64173}{y_{1,i}}\) entonces no podemos observar \(\color{#6A5ACD}{y_{0,i}}\).
Si observamos \(\color{#6A5ACD}{y_{0,i}}\), entonces no podemos observar \(\color{#e64173}{y_{1,i}}\).
Por lo tanto, un conjunto de datos que realmente observamos para 6 personas será algo así como
> i trt y1i y0i> 1 1 1 5.01 NA> 2 2 1 8.85 NA> 3 3 1 6.31 NA> 4 4 1 5.97 NA> 5 5 1 7.61 NA> 6 6 0 NA 4.15> 7 7 0 NA 0.56> 8 8 0 NA 3.52> 9 9 0 NA 4.49> 10 10 0 NA 1.40Por lo tanto, un conjunto de datos que realmente observamos para 6 personas será algo así como
> i trt y1i y0i> 1 1 1 5.01 NA> 2 2 1 8.85 NA> 3 3 1 6.31 NA> 4 4 1 5.97 NA> 5 5 1 7.61 NA> 6 6 0 NA 4.15> 7 7 0 NA 0.56> 8 8 0 NA 3.52> 9 9 0 NA 4.49> 10 10 0 NA 1.40No podemos observar \(\color{#e64173}{y_{1,i}}\) y \(\color{#6A5ACD}{y_{0,i}}\).
Pero, si observamos
Por lo tanto, un conjunto de datos que realmente observamos para 6 personas será algo así como
> i trt y1i y0i> 1 1 1 5.01 NA> 2 2 1 8.85 NA> 3 3 1 6.31 NA> 4 4 1 5.97 NA> 5 5 1 7.61 NA> 6 6 0 NA 4.15> 7 7 0 NA 0.56> 8 8 0 NA 3.52> 9 9 0 NA 4.49> 10 10 0 NA 1.40No podemos observar \(\color{#e64173}{y_{1,i}}\) y \(\color{#6A5ACD}{y_{0,i}}\).
Pero, si observamos
P: ¿Cómo "rellenamos" los NAs y estimamos \(\overline{\tau}\)?
Notación: Sea \(D_i\) una variable indicadora binaria tal que
Notación: Sea \(D_i\) una variable indicadora binaria tal que
Entonces, reformulando la diapositiva anterior,
Notación: Sea \(D_i\) una variable indicadora binaria tal que
Entonces, reformulando la diapositiva anterior,
P: ¿Cómo podemos estimar \(\overline{\tau}\) usando solamente \(\left(\color{#e64173}{y_{1,i}|D_i=1}\right)\) y \(\left(\color{#6A5ACD}{y_{0,i}|D_i=0}\right)\)?
P: ¿Cómo podemos estimar \(\overline{\tau}\) usando solamente \(\left(\color{#e64173}{y_{1,i}|D_i=1}\right)\) y \(\left(\color{#6A5ACD}{y_{0,i}|D_i=0}\right)\)?
P: ¿Cómo podemos estimar \(\overline{\tau}\) usando solamente \(\left(\color{#e64173}{y_{1,i}|D_i=1}\right)\) y \(\left(\color{#6A5ACD}{y_{0,i}|D_i=0}\right)\)?
Idea: What if we compare the groups' means? ,es decir, $$ \begin{align} \color{#e64173}{\mathop{Promedio}\left( y_i\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_i\mid D_i =0 \right)} \end{align} $$
P: ¿Cómo podemos estimar \(\overline{\tau}\) usando solamente \(\left(\color{#e64173}{y_{1,i}|D_i=1}\right)\) y \(\left(\color{#6A5ACD}{y_{0,i}|D_i=0}\right)\)?
Idea: What if we compare the groups' means? ,es decir, $$ \begin{align} \color{#e64173}{\mathop{Promedio}\left( y_i\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_i\mid D_i =0 \right)} \end{align} $$
P: ¿Cuándo esta simple diferencia en las medias de los grupos proporciona información sobre el efecto causal del tratamiento?
P: ¿Cómo podemos estimar \(\overline{\tau}\) usando solamente \(\left(\color{#e64173}{y_{1,i}|D_i=1}\right)\) y \(\left(\color{#6A5ACD}{y_{0,i}|D_i=0}\right)\)?
Idea: What if we compare the groups' means? ,es decir, $$ \begin{align} \color{#e64173}{\mathop{Promedio}\left( y_i\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_i\mid D_i =0 \right)} \end{align} $$
P: ¿Cuándo esta simple diferencia en las medias de los grupos proporciona información sobre el efecto causal del tratamiento?
P2.0: ¿Es \(\color{#e64173}{\mathop{Promedio}\left( y_i\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_i\mid D_i =0 \right)}\) un buen estimador para \(\overline{\tau}\)?
P: ¿Cómo podemos estimar \(\overline{\tau}\) usando solamente \(\left(\color{#e64173}{y_{1,i}|D_i=1}\right)\) y \(\left(\color{#6A5ACD}{y_{0,i}|D_i=0}\right)\)?
Idea: What if we compare the groups' means? ,es decir, $$ \begin{align} \color{#e64173}{\mathop{Promedio}\left( y_i\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_i\mid D_i =0 \right)} \end{align} $$
P: ¿Cuándo esta simple diferencia en las medias de los grupos proporciona información sobre el efecto causal del tratamiento?
P2.0: ¿Es \(\color{#e64173}{\mathop{Promedio}\left( y_i\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_i\mid D_i =0 \right)}\) un buen estimador para \(\overline{\tau}\)?
¡Hora de las matemáticas! 🎉
Supuesto: Sea \(\tau_i = \tau\) para todos los \(i\).
Esta suposición dice que el efecto del tratamiento es igual (constante) en todos los individuos \(i\).
Supuesto: Sea \(\tau_i = \tau\) para todos los \(i\).
Esta suposición dice que el efecto del tratamiento es igual (constante) en todos los individuos \(i\).
Nota: Definimos
$$ \begin{align} \tau_i = \tau = \color{#e64173}{y_{1,i}} - \color{#6A5ACD}{y_{0,i}} \end{align} $$
lo cual implica que
$$ \begin{align} \color{#e64173}{y_{1,i}} = \color{#6A5ACD}{y_{0,i}} + \tau \end{align} $$
P3.0: ¿Es \(\color{#e64173}{\mathop{Promedio}\left( y_i\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_i\mid D_i =0 \right)}\) un buen estimador para \(\tau\)?
P3.0: ¿Es \(\color{#e64173}{\mathop{Promedio}\left( y_i\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_i\mid D_i =0 \right)}\) un buen estimador para \(\tau\)?
Diferencia de las medias de los grupos
P3.0: ¿Es \(\color{#e64173}{\mathop{Promedio}\left( y_i\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_i\mid D_i =0 \right)}\) un buen estimador para \(\tau\)?
Diferencia de las medias de los grupos
\(\quad \color{#ffffff}{\Bigg|}=\color{#e64173}{\mathop{Promedio}\left( y_i\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_i\mid D_i =0 \right)}\)
P3.0: ¿Es \(\color{#e64173}{\mathop{Promedio}\left( y_i\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_i\mid D_i =0 \right)}\) un buen estimador para \(\tau\)?
Diferencia de las medias de los grupos
\(\quad \color{#ffffff}{\Bigg|}=\color{#e64173}{\mathop{Promedio}\left( y_i\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_i\mid D_i =0 \right)}\)
\(\quad \color{#ffffff}{\Bigg|}=\color{#e64173}{\mathop{Promedio}\left( y_{1,i}\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_{0,i}\mid D_i =0 \right)}\)
P3.0: ¿Es \(\color{#e64173}{\mathop{Promedio}\left( y_i\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_i\mid D_i =0 \right)}\) un buen estimador para \(\tau\)?
Diferencia de las medias de los grupos
\(\quad \color{#ffffff}{\Bigg|}=\color{#e64173}{\mathop{Promedio}\left( y_i\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_i\mid D_i =0 \right)}\)
\(\quad \color{#ffffff}{\Bigg|}=\color{#e64173}{\mathop{Promedio}\left( y_{1,i}\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_{0,i}\mid D_i =0 \right)}\)
\(\quad \color{#ffffff}{\Bigg|}=\color{#e64173}{\mathop{Promedio}\left( \color{#000000}{\tau \: +} \: \color{#6A5ACD}{y_{0,i}} \mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_{0,i}\mid D_i =0 \right)}\)
P3.0: ¿Es \(\color{#e64173}{\mathop{Promedio}\left( y_i\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_i\mid D_i =0 \right)}\) un buen estimador para \(\tau\)?
Diferencia de las medias de los grupos
\(\quad \color{#ffffff}{\Bigg|}=\color{#e64173}{\mathop{Promedio}\left( y_i\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_i\mid D_i =0 \right)}\)
\(\quad \color{#ffffff}{\Bigg|}=\color{#e64173}{\mathop{Promedio}\left( y_{1,i}\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_{0,i}\mid D_i =0 \right)}\)
\(\quad \color{#ffffff}{\Bigg|}=\color{#e64173}{\mathop{Promedio}\left( \color{#000000}{\tau \: +} \: \color{#6A5ACD}{y_{0,i}} \mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_{0,i}\mid D_i =0 \right)}\)
\(\quad \color{#ffffff}{\Bigg|}=\tau + \color{#e64173}{\mathop{Promedio}\left(\color{#6A5ACD}{y_{0,i}} \mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_{0,i}\mid D_i =0 \right)}\)
P3.0: ¿Es \(\color{#e64173}{\mathop{Promedio}\left( y_i\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_i\mid D_i =0 \right)}\) un buen estimador para \(\tau\)?
Diferencia de las medias de los grupos
\(\quad \color{#ffffff}{\Bigg|}=\color{#e64173}{\mathop{Promedio}\left( y_i\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_i\mid D_i =0 \right)}\)
\(\quad \color{#ffffff}{\Bigg|}=\color{#e64173}{\mathop{Promedio}\left( y_{1,i}\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_{0,i}\mid D_i =0 \right)}\)
\(\quad \color{#ffffff}{\Bigg|}=\color{#e64173}{\mathop{Promedio}\left( \color{#000000}{\tau \: +} \: \color{#6A5ACD}{y_{0,i}} \mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_{0,i}\mid D_i =0 \right)}\)
\(\quad \color{#ffffff}{\Bigg|}=\tau + \color{#e64173}{\mathop{Promedio}\left(\color{#6A5ACD}{y_{0,i}} \mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_{0,i}\mid D_i =0 \right)}\)
\(\quad \color{#ffffff}{\Bigg|}= \text{Average causal effect} + \color{#FFA500}{\text{Sesgo de selección}}\)
P3.0: ¿Es \(\color{#e64173}{\mathop{Promedio}\left( y_i\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_i\mid D_i =0 \right)}\) un buen estimador para \(\tau\)?
Diferencia de las medias de los grupos
\(\quad \color{#ffffff}{\Bigg|}=\color{#e64173}{\mathop{Promedio}\left( y_i\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_i\mid D_i =0 \right)}\)
\(\quad \color{#ffffff}{\Bigg|}=\color{#e64173}{\mathop{Promedio}\left( y_{1,i}\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_{0,i}\mid D_i =0 \right)}\)
\(\quad \color{#ffffff}{\Bigg|}=\color{#e64173}{\mathop{Promedio}\left( \color{#000000}{\tau \: +} \: \color{#6A5ACD}{y_{0,i}} \mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_{0,i}\mid D_i =0 \right)}\)
\(\quad \color{#ffffff}{\Bigg|}=\tau + \color{#e64173}{\mathop{Promedio}\left(\color{#6A5ACD}{y_{0,i}} \mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_{0,i}\mid D_i =0 \right)}\)
\(\quad \color{#ffffff}{\Bigg|}= \text{Average causal effect} + \color{#FFA500}{\text{Sesgo de selección}}\)
Así que nuestro estimador de diferencia de grupo propuesto nos da la suma de
Keyboard shortcuts
| ↑, ←, Pg Up, k | Go to previous slide |
| ↓, →, Pg Dn, Space, j | Go to next slide |
| Home | Go to first slide |
| End | Go to last slide |
| Number + Return | Go to specific slide |
| b / m / f | Toggle blackout / mirrored / fullscreen mode |
| c | Clone slideshow |
| p | Toggle presenter mode |
| t | Restart the presentation timer |
| ?, h | Toggle this help |
| Esc | Back to slideshow |