Endogeneidad

class: center, middle, inverse, title-slide

# Endogeneidad
## Econometría I
### Paula Pereda (<a href="mailto:ppereda@correo.um.edu.uy" class="email">ppereda@correo.um.edu.uy</a>)
### 29 de octubre de 2021

---

class: inverse, middle

# Causalidad

---

## Intro

La mayoría de las tareas de la econometría se reducen a uno de los dos objetivos:

$$
`\begin{align}
  y = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \cdots + \beta_k x_k + u
\end{align}`
$$

1. .hi-purple[Predicción:] Precisión y fiabilidad .purple[predicción/pronóstico] `$\color{#6A5ACD}{y}$` utilizando un conjunto de variables explicativas-no es necesario que sean `$x_1$` hasta `$x_k$`. Se centra en `$\color{#6A5ACD}{hat{y}}$`. `$\beta_j$` no importa realmente.

1. .hi[Estimación causal:].super[.pink[†]] La estimación del proceso real de generación de datos-aprendizaje del modelo poblacional verdadero que explica .pink[cómo] `$\color{#e64173}{y}$` .pink[cambia cuando cambiamos] `$\color{#e64173}{x_j}$`-se centra en `$\color{#e64173}{beta_j}$`. La precisión de `$\hat{y}$` no es importante.

.footnote[
.pink[†] Usualmente llamado *identificación causal*.
]

---
name: challenges

## Los desafíos

Como hemos visto hasta ahora, determinar y estimar el verdadero modelo puede ser bastante difícil, tanto en términos .purple[prácticos] como .pink[econométricos].

.pull-left[.purple[
**Desafíos prácticos**

- ¿Qué variables?
- ¿Qué forma(s) funcional(es)?
- ¿Existen datos? ¿Cuántos?
- ¿Es representativa la muestra?
]]

.pull-right[.pink[
**Desafíos econométricos**

- Sesgo de variable omitida
- Causalidad inversa
- Error de medición
- ¿Qué precisión podemos/debemos tener?
]]

Muchos de estos retos se relacionan con la .hi-slate[exogeneidad], _es decir_, `$\color{#314f4f}{\mathop{\boldsymbol{E}}\left[ u_i | X \right] = 0}$`.

---

## Es complicado

Ocasionalmente, las relaciones .hi[*causales*] se pueden entender simplemente, _por ejemplo_,

- ¿Qué ha .pink[provocado] el incendio forestal?
- .pink[¿Cómo] llegó este bebé aquí?

En general, las relaciones .hi[*causales*] son complejas y difíciles de responder, _por ejemplo_,

- ¿Qué causa el crecimiento de algunos países y el declive de otros?
- ¿Qué .pink[causó] la elección del presidente Trump en 2016?
- .pink[¿Cómo] afecta el número de policías a la delincuencia?
- ¿Cuál es el efecto de una mejor calidad del aire en los resultados de los exámenes?
- ¿Las penas de prisión más largas disminuyen la delincuencia?
- ¿Cómo afectó la legalización del cannabis a la salud mental y a la adicción a los opioides?

---

## Correlación ≠ Causalidad

Es probable que hayan escuchado el dicho

> Correlación no es causalidad.

El refrán sólo señala que hay violaciones de la exogeneidad.

Aunque la correlación no es causalidad, .hi [la causalidad *requiere* correlación].

.hi-slate[Nueva frase:]

> Correlación más exogeneidad es causalidad.

---
layout: false
class: clear, middle

Veamos algunos ejemplos.
---
layout: true
# Causalidad
---
name: fertilizer

## Ejemplo: El efecto causal del abono.super[.pink[†]]

.footnote[
.pink[†] Muchos de los primeros estudios estadísticos y econométricos incluían ensayos de campo agrícolas.
]

Supongamos que queremos conocer el efecto causal del fertilizante sobre el rendimiento del maíz.

**P:** ¿Podríamos simplemente hacer una regresión del rendimiento en función del fertilizante?
--
 **R:** Probablemente no (si queremos el efecto causal).
--
 **P:** ¿Por qué no?
--
 **R:** Sesgo de variable omitida: Los agricultores pueden aplicar menos fertilizantes en zonas que ya son peores en otras dimensiones que afectan al rendimiento (suelo, pendiente, agua). .pink[Viola *todo lo demás igual* (exogeneidad). Resultados sesgados y/o espurios].
--
 **P:** Entonces, ¿qué *deberíamos* hacer?
--
 **R:** .hi[¡Hacer un experimento!]
--
 💩
---

## Ejemplo: El efecto causal del fertilizante

Los experimentos aleatorios nos ayudan a mantener *todo lo demás igual* (exogeneidad).

A menudo llamamos a estos experimentos .hi[*randomized control trials*] (RCT)..super[.pink[†]]

.footnote[
.pink[†] La econometría (y la estadística) toma prestado este lenguaje de la bioestadística y los ensayos farmacéuticos.
]

Imaginemos un RCT en el que tenemos dos grupos:

- .hi-slate[Tratamiento:] Aplicamos fertilizante.
- .hi-slate[Control:] No aplicamos fertilizante.

Al distribuir aleatoriamente las parcelas en .hi-slate[tratamiento] o .hi-slate[control], incluiremos, en promedio, todos los tipos de tierra (suelo, pendiente, agua, *etc.*) en ambos grupos.

*¡Todo lo demás es igual*!
---
class: clear

.hi-slate[54 parcelas de igual tamaño]
<img src="index_files/figure-html/fertilizer_plot1-1.svg" style="display: block; margin: auto;" />
---
class: clear
count: false

.hi-slate[54 parcelas de igual tamaño] .hi[de distinta calidad]
<img src="index_files/figure-html/fertilizer_plot2-1.svg" style="display: block; margin: auto;" />
---
class: clear
count: false

.hi-slate[54 parcelas de igual tamaño] .hi[de distinta calidad] .hi-orange[más el tratamiento asignado al azar]
<img src="index_files/figure-html/fertilizer_plot3_1-1.svg" style="display: block; margin: auto;" />
---
class: clear
count: false

.hi-slate[54 parcelas de igual tamaño] .hi[de distinta calidad] .hi-orange[más el tratamiento asignado al azar]
<img src="index_files/figure-html/fertilizer_plot3_2-1.svg" style="display: block; margin: auto;" />
---
class: clear
count: false

.hi-slate[54 parcelas de igual tamaño] .hi[de distinta calidad] .hi-orange[más el tratamiento asignado al azar]
<img src="index_files/figure-html/fertilizer_plot3_3-1.svg" style="display: block; margin: auto;" />
---
class: clear
count: false

.hi-slate[54 parcelas de igual tamaño] .hi[de distinta calidad] .hi-orange[más el tratamiento asignado al azar]
<img src="index_files/figure-html/fertilizer_plot3_4-1.svg" style="display: block; margin: auto;" />
---
class: clear
count: false

.hi-slate[54 parcelas de igual tamaño] .hi[de distinta calidad] .hi-orange[más el tratamiento asignado al azar]
<img src="index_files/figure-html/fertilizer_plot3_5-1.svg" style="display: block; margin: auto;" />
---
class: clear
count: false

.hi-slate[54 parcelas de igual tamaño] .hi[de distinta calidad] .hi-orange[más el tratamiento asignado al azar]
<img src="index_files/figure-html/fertilizer_plot3_6-1.svg" style="display: block; margin: auto;" />
---
class: clear
count: false

.hi-slate[54 parcelas de igual tamaño] .hi[de distinta calidad] .hi-orange[más el tratamiento asignado al azar]
<img src="index_files/figure-html/fertilizer_plot3_7-1.svg" style="display: block; margin: auto;" />
---
class: clear
count: false

.hi-slate[54 parcelas de igual tamaño] .hi[de distinta calidad] .hi-orange[más el tratamiento asignado al azar]
<img src="index_files/figure-html/fertilizer_plot3_8-1.svg" style="display: block; margin: auto;" />
---
class: clear
count: false

.hi-slate[54 parcelas de igual tamaño] .hi[de distinta calidad] .hi-orange[más el tratamiento asignado al azar]
<img src="index_files/figure-html/fertilizer_plot3_9-1.svg" style="display: block; margin: auto;" />
---
class: clear
count: false

.hi-slate[54 parcelas de igual tamaño] .hi[de distinta calidad] .hi-orange[más el tratamiento asignado al azar]
<img src="index_files/figure-html/fertilizer_plot3_10-1.svg" style="display: block; margin: auto;" />
---
class: clear
count: false

.hi-slate[54 parcelas de igual tamaño] .hi[de distinta calidad] .hi-orange[más el tratamiento asignado al azar]
<img src="index_files/figure-html/fertilizer_plot3_11-1.svg" style="display: block; margin: auto;" />
---
class: clear
count: false

.hi-slate[54 parcelas de igual tamaño] .hi[de distinta calidad] .hi-orange[más el tratamiento asignado al azar]
<img src="index_files/figure-html/fertilizer_plot3_12-1.svg" style="display: block; margin: auto;" />
---

## Ejemplo: El efecto causal del fertilizante

Podemos estimar el .hi[efecto causal] del fertilizante sobre el rendimiento de los cultivos comparando el rendimiento medio del grupo de tratamiento (💩) con el grupo de control (sin 💩).

$$
`\begin{align}
  \overline{\text{Rendimiento}}_\text{Tratamiento} - \overline{\text{Rendimiento}}_\text{Control}
\end{align}`
$$

Como alternativa, podemos utilizar la regresión

$$
`\begin{align}
  \text{Rendimiento}_i = \beta_0 + \beta_1 \text{Trt}_i + u_i \tag{1}
\end{align}`
$$

donde `$\text{Trt}_i$` es una variable binaria (=1 si la parcela `$i$` recibió el tratamiento de fertilización).

**P:** ¿Debemos esperar que `$(1)$` satisfaga la exogeneidad? ¿Por qué?
--
 **R:** Por término medio, .hi[la asignación aleatoria del tratamiento debe equilibrar] trt. y control en las demás dimensiones que afectan al rendimiento (suelo, pendiente, agua).
---
layout: true
# Causalidad
## Ejemplo: Retornos a la educación
---
name: returns

Los economistas laborales, los responsables políticos, los padres y los estudiantes están interesados en el *retorno monetario de la educación*.

.hi-slate[Experimento mental:]
- Selecciona al azar un individuo.
- Dale un año más de educación.
- ¿Cuánto aumentan sus ingresos?

Este cambio en los ingresos nos da el .hi-slate[efecto causal] de la educación sobre los ingresos.
---

**P:** ¿Podríamos simplemente hacer una regresión de los ingresos en función de la educación?
--
 **R:** De nuevo, probablemente no si queremos el verdadero efecto causal.

--
1. La gente *elige* la educación en función de muchos factores, *por ejemplo*, la capacidad.
1. La educación probablemente reduzca la experiencia (tiempo fuera de la fuerza de trabajo).
1. La educación es .hi[*endógena*] (viola la *exogeneidad*).

El punto (2) anterior también ilustra la dificultad de aprender sobre la educación manteniendo todo lo demás constante.

Muchas variables importantes tienen el mismo reto: género, raza, ingresos.
---

**P:** Entonces, ¿cómo podemos estimar los rendimientos de la educación?

.hi-slate[Opción 1:] Correr un .hi[experimento].

- Aleatoriamente .pink[asignar educación] (podría ser difícil).
- Aleatoriamente .pink[fomentar la educación] (podría funcionar).
- Aleatoriamente .pink[asignar programas] que afecten a la educación (*por ejemplo, tutorías).

.hi-slate[Opción 2:] Busque un .hi-purple[*experimento natural*]-una política o accidente en la sociedad que haya aumentado arbitrariamente la educación de un subconjunto de personas.

- Admisiones .purple[límites]
- .purple[lotería] inscripción y/o capacidad .purple[limitaciones]
---
layout: true
# Causalidad
---
name: real

## Experimentos reales

En ambos ejemplos se consideran .hi-slate[experimentos reales] que aíslan los efectos causales.

.hi-slate[Características]

- .purple[Realizable]-podemos realmente (potencialmente) realizar el experimento.
- .morado[Comparar individuos] aleatorizados en el tratamiento con individuos aleatorizados en el control.
- .purple[Requiere una "buena" aleatorización] para obtener *todo lo demás igual* (exogeneidad).

*Nota:* Los resultados de su experimento son sólo tan buenos como su aleatorización.
---
class: clear
count: false

.hi-slate[Una aleatorización desafortunada]
<img src="index_files/figure-html/fertilizer_plot3_bad-1.svg" style="display: block; margin: auto;" />
---
layout: true
# Causalidad
## El experimento ideal
---
name: ideal

El .hi[experimento ideal] sería sutilmente diferente.

En lugar de comparar unidades aleatorizadas como .pink[tratamiento] frente a .pink[control], el experimento ideal compararía el tratamiento y el control .hi[para la misma y exacta unidad].

$$
`\begin{align}
  y_{\text{Tratamiento},i} - y_{\text{Control},i}
\end{align}`
$$

que escribiremos (para simplificar) como

$$
`\begin{align}
  y_{1,i} - y_{0,i}
\end{align}`
$$

Este .pink[*experimento ideal*] es claramente inviable.super[.pink[†]], pero crea una bonita notación para la causalidad (el modelo causal de Rubin/marco de resultados potenciales de Neyman).

.footnote[
.pink[†] Sin (1) habilidades similares a las de Dios y múltiples universos o (2) una máquina del tiempo.
]
---

.pull-left[
The *ideal* data for 10 people

```
>     i trt  y1i  y0i
> 1   1   1 5.01 2.56
> 2   2   1 8.85 2.53
> 3   3   1 6.31 2.67
> 4   4   1 5.97 2.79
> 5   5   1 7.61 4.34
> 6   6   0 7.63 4.15
> 7   7   0 4.75 0.56
> 8   8   0 5.77 3.52
> 9   9   0 7.47 4.49
> 10 10   0 7.79 1.40
```
]

.pull-right[
Calcula el efecto causal del trt.
$$
`\begin{align}
  \tau_i = y_{1,i} -  y_{0,i}
\end{align}`
$$
para cada individuo `$i$`.
]
---
count: false

.pull-left[
Los datos *ideales* para 10 personas

```
>     i trt  y1i  y0i effect_i
> 1   1   1 5.01 2.56     2.45
> 2   2   1 8.85 2.53     6.32
> 3   3   1 6.31 2.67     3.64
> 4   4   1 5.97 2.79     3.18
> 5   5   1 7.61 4.34     3.27
> 6   6   0 7.63 4.15     3.48
> 7   7   0 4.75 0.56     4.19
> 8   8   0 5.77 3.52     2.25
> 9   9   0 7.47 4.49     2.98
> 10 10   0 7.79 1.40     6.39
```
]

.pull-right[
Calcula el efecto causal del trt.
$$
`\begin{align}
  \tau_i = y_{1,i} -  y_{0,i}
\end{align}`
$$
para cada individuo `$i$`.
]
---
count: false

.pull-left[
Los datos *ideales* para 10 personas

.pull-right[
Calcula el efecto causal del trt.
$$
`\begin{align}
  \tau_i = y_{1,i} -  y_{0,i}
\end{align}`
$$
para cada individuo `$i$`.

La media `$\tau_i$` es el .hi[average treatment effect] (.pink[ATE]).

Entonces, `$\color{#e64173}{\overline{\tau} = 3.82}$`
]

---

Este modelo pone de manifiesto el problema fundamental de la inferencia causal.
$$
`\begin{align}
  \tau_i = \color{#e64173}{y_{1,i}} &- \color{#6A5ACD}{y_{0,i}}
\end{align}`
$$

.hi-slate[El desafío:]

Si observamos `$\color{#e64173}{y_{1,i}}$` entonces no podemos observar `$\color{#6A5ACD}{y_{0,i}}$`.
 Si observamos `$\color{#6A5ACD}{y_{0,i}}$`, entonces no podemos observar `$\color{#e64173}{y_{1,i}}$`.
---

Por lo tanto, un conjunto de datos que realmente observamos para 6 personas será algo así como
.pull-left[

```
>     i trt  y1i  y0i
> 1   1   1 5.01   NA
> 2   2   1 8.85   NA
> 3   3   1 6.31   NA
> 4   4   1 5.97   NA
> 5   5   1 7.61   NA
> 6   6   0   NA 4.15
> 7   7   0   NA 0.56
> 8   8   0   NA 3.52
> 9   9   0   NA 4.49
> 10 10   0   NA 1.40
```
]

.pull-right[
No podemos observar `$\color{#e64173}{y_{1,i}}$` y `$\color{#6A5ACD}{y_{0,i}}$`.

Pero, si observamos
- `$\color{#e64173}{y_{1,i}}$` para `$i$` en 1, 2, 3, 4, 5
- `$\color{#6A5ACD}{y_{0,j}}$` para `$j$` en 6, 7, 8, 9, 10

]

**P:** ¿Cómo "rellenamos" los `NA`s y estimamos `$\overline{\tau}$`?
---
layout: true
# Causalidad
## Estimación causal del efecto del tratamiento
---
name: estimation

.hi-slate[Notación:] Sea `$D_i$` una variable indicadora binaria tal que

- `$\color{#e64173}{D_i=1}$` .pink[si el individuo] `$\color{#e64173}{i}$` .pink[es tratado]
- `$\color{#6A5ACD}{D_i=0}$` .purple[si el individuo] `$\color{#6A5ACD}{i}$` .purple[no es tratado (grupo de *control*)].

Entonces, reformulando la diapositiva anterior,

- Sólo observamos `$\color{#e64173}{y_{1,i}}$` cuando `$\color{#e64173}{D_{i}=1}$`.
- Sólo observamos `$\color{#6A5ACD}{y_{0,i}}$` cuando `$\color{#6A5ACD}{D_{i}=0}$`.

**P:** ¿Cómo podemos estimar `$\overline{\tau}$` usando solamente `$\left(\color{#e64173}{y_{1,i}|D_i=1}\right)$` y `$\left(\color{#6A5ACD}{y_{0,i}|D_i=0}\right)$`?

---

**P:** ¿Cómo podemos estimar `$\overline{\tau}$` usando solamente `$\left(\color{#e64173}{y_{1,i}|D_i=1}\right)$` y `$\left(\color{#6A5ACD}{y_{0,i}|D_i=0}\right)$`?

**Idea:** What if we compare the groups' means? ,_es decir_,
$$
`\begin{align}
  \color{#e64173}{\mathop{Promedio}\left( y_i\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_i\mid D_i =0 \right)}
\end{align}`
$$

**P:** ¿Cuándo esta simple diferencia en las medias de los grupos proporciona información sobre el .hi-slate[efecto causal] del tratamiento?

**P.sub[2.0]:** ¿Es `$\color{#e64173}{\mathop{Promedio}\left( y_i\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_i\mid D_i =0 \right)}$` un *buen* estimador para `$\overline{\tau}$`?

¡Hora de las matemáticas! .bigger[🎉]
---

.hi-slate[Supuesto:] Sea `$\tau_i = \tau$` para todos los `$i$`.

Esta suposición dice que el efecto del tratamiento es igual (constante) en todos los individuos `$i$`.

.hi-slate[Nota:] Definimos

$$
`\begin{align}
  \tau_i = \tau = \color{#e64173}{y_{1,i}} - \color{#6A5ACD}{y_{0,i}}
\end{align}`
$$

lo cual implica que

$$
`\begin{align}
   \color{#e64173}{y_{1,i}} = \color{#6A5ACD}{y_{0,i}} + \tau
\end{align}`
$$

---
layout: false
class: clear
name: derivation

**P.sub[3.0]:** ¿Es `$\color{#e64173}{\mathop{Promedio}\left( y_i\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_i\mid D_i =0 \right)}$` un *buen* estimador para `$\tau$`?

Diferencia de las medias de los grupos
--
 `$\quad \color{#ffffff}{\Bigg|}=\color{#e64173}{\mathop{Promedio}\left( y_i\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_i\mid D_i =0 \right)}$`
--
 `$\quad \color{#ffffff}{\Bigg|}=\color{#e64173}{\mathop{Promedio}\left( y_{1,i}\mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_{0,i}\mid D_i =0 \right)}$`
--
 `$\quad \color{#ffffff}{\Bigg|}=\color{#e64173}{\mathop{Promedio}\left( \color{#000000}{\tau \: +} \: \color{#6A5ACD}{y_{0,i}} \mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_{0,i}\mid D_i =0 \right)}$`
--
 `$\quad \color{#ffffff}{\Bigg|}=\tau + \color{#e64173}{\mathop{Promedio}\left(\color{#6A5ACD}{y_{0,i}} \mid D_i = 1 \right)} - \color{#6A5ACD}{\mathop{Promedio}\left( y_{0,i}\mid D_i =0 \right)}$`
--
 `$\quad \color{#ffffff}{\Bigg|}= \text{Average causal effect} + \color{#FFA500}{\text{Sesgo de selección}}$`

Así que nuestro estimador de diferencia de grupo propuesto nos da la suma de

1. `$\tau$`, el .hi-slate[causal, efecto medio del tratamiento] que queremos
2. .hi-orange[Sesgo de selección:] Cuánto difieren los grupos de trt. y de control (en promedio).