+ - 0:00:00
Notes for current slide
Notes for next slide

Endogeneidad

Econometría I

Paula Pereda ()

29 de octubre de 2021

1 / 23

Causalidad

2 / 23

Intro

La mayoría de las tareas de la econometría se reducen a uno de los dos objetivos:

y=β0+β1x1+β2x2++βkxk+u

3 / 23

Intro

La mayoría de las tareas de la econometría se reducen a uno de los dos objetivos:

y=β0+β1x1+β2x2++βkxk+u

  1. Predicción: Precisión y fiabilidad predicción/pronóstico y utilizando un conjunto de variables explicativas-no es necesario que sean x1 hasta xk. Se centra en haty. βj no importa realmente.
3 / 23

Intro

La mayoría de las tareas de la econometría se reducen a uno de los dos objetivos:

y=β0+β1x1+β2x2++βkxk+u

  1. Predicción: Precisión y fiabilidad predicción/pronóstico y utilizando un conjunto de variables explicativas-no es necesario que sean x1 hasta xk. Se centra en haty. βj no importa realmente.

  2. Estimación causal: La estimación del proceso real de generación de datos-aprendizaje del modelo poblacional verdadero que explica cómo y cambia cuando cambiamos xj-se centra en betaj. La precisión de y^ no es importante.

Usualmente llamado identificación causal.

3 / 23

Los desafíos

Como hemos visto hasta ahora, determinar y estimar el verdadero modelo puede ser bastante difícil, tanto en términos prácticos como econométricos.

4 / 23

Los desafíos

Como hemos visto hasta ahora, determinar y estimar el verdadero modelo puede ser bastante difícil, tanto en términos prácticos como econométricos.

Desafíos prácticos

  • ¿Qué variables?
  • ¿Qué forma(s) funcional(es)?
  • ¿Existen datos? ¿Cuántos?
  • ¿Es representativa la muestra?
4 / 23

Los desafíos

Como hemos visto hasta ahora, determinar y estimar el verdadero modelo puede ser bastante difícil, tanto en términos prácticos como econométricos.

Desafíos prácticos

  • ¿Qué variables?
  • ¿Qué forma(s) funcional(es)?
  • ¿Existen datos? ¿Cuántos?
  • ¿Es representativa la muestra?

Desafíos econométricos

  • Sesgo de variable omitida
  • Causalidad inversa
  • Error de medición
  • ¿Qué precisión podemos/debemos tener?
4 / 23

Los desafíos

Como hemos visto hasta ahora, determinar y estimar el verdadero modelo puede ser bastante difícil, tanto en términos prácticos como econométricos.

Desafíos prácticos

  • ¿Qué variables?
  • ¿Qué forma(s) funcional(es)?
  • ¿Existen datos? ¿Cuántos?
  • ¿Es representativa la muestra?

Desafíos econométricos

  • Sesgo de variable omitida
  • Causalidad inversa
  • Error de medición
  • ¿Qué precisión podemos/debemos tener?

Muchos de estos retos se relacionan con la exogeneidad, es decir, E[ui|X]=0.

4 / 23

Es complicado

Ocasionalmente, las relaciones causales se pueden entender simplemente, por ejemplo,

5 / 23

Es complicado

Ocasionalmente, las relaciones causales se pueden entender simplemente, por ejemplo,

  • ¿Qué ha provocado el incendio forestal?
  • ¿Cómo llegó este bebé aquí?
5 / 23

Es complicado

Ocasionalmente, las relaciones causales se pueden entender simplemente, por ejemplo,

  • ¿Qué ha provocado el incendio forestal?
  • ¿Cómo llegó este bebé aquí?

En general, las relaciones causales son complejas y difíciles de responder, por ejemplo,

5 / 23

Es complicado

Ocasionalmente, las relaciones causales se pueden entender simplemente, por ejemplo,

  • ¿Qué ha provocado el incendio forestal?
  • ¿Cómo llegó este bebé aquí?

En general, las relaciones causales son complejas y difíciles de responder, por ejemplo,

  • ¿Qué causa el crecimiento de algunos países y el declive de otros?
  • ¿Qué causó la elección del presidente Trump en 2016?
  • ¿Cómo afecta el número de policías a la delincuencia?
  • ¿Cuál es el efecto de una mejor calidad del aire en los resultados de los exámenes?
  • ¿Las penas de prisión más largas disminuyen la delincuencia?
  • ¿Cómo afectó la legalización del cannabis a la salud mental y a la adicción a los opioides?
5 / 23

Correlación ≠ Causalidad

Es probable que hayan escuchado el dicho

Correlación no es causalidad.

El refrán sólo señala que hay violaciones de la exogeneidad.

6 / 23

Correlación ≠ Causalidad

Es probable que hayan escuchado el dicho

Correlación no es causalidad.

El refrán sólo señala que hay violaciones de la exogeneidad.

Aunque la correlación no es causalidad, .hi [la causalidad requiere correlación].

6 / 23

Correlación ≠ Causalidad

Es probable que hayan escuchado el dicho

Correlación no es causalidad.

El refrán sólo señala que hay violaciones de la exogeneidad.

Aunque la correlación no es causalidad, .hi [la causalidad requiere correlación].

Nueva frase:

Correlación más exogeneidad es causalidad.

6 / 23

Veamos algunos ejemplos.

7 / 23

Causalidad

Ejemplo: El efecto causal del abono

Muchos de los primeros estudios estadísticos y econométricos incluían ensayos de campo agrícolas.

Supongamos que queremos conocer el efecto causal del fertilizante sobre el rendimiento del maíz.

8 / 23

Causalidad

Ejemplo: El efecto causal del abono

Muchos de los primeros estudios estadísticos y econométricos incluían ensayos de campo agrícolas.

Supongamos que queremos conocer el efecto causal del fertilizante sobre el rendimiento del maíz.

P: ¿Podríamos simplemente hacer una regresión del rendimiento en función del fertilizante?

8 / 23

Causalidad

Ejemplo: El efecto causal del abono

Muchos de los primeros estudios estadísticos y econométricos incluían ensayos de campo agrícolas.

Supongamos que queremos conocer el efecto causal del fertilizante sobre el rendimiento del maíz.

P: ¿Podríamos simplemente hacer una regresión del rendimiento en función del fertilizante?
R: Probablemente no (si queremos el efecto causal).

8 / 23

Causalidad

Ejemplo: El efecto causal del abono

Muchos de los primeros estudios estadísticos y econométricos incluían ensayos de campo agrícolas.

Supongamos que queremos conocer el efecto causal del fertilizante sobre el rendimiento del maíz.

P: ¿Podríamos simplemente hacer una regresión del rendimiento en función del fertilizante?
R: Probablemente no (si queremos el efecto causal).

P: ¿Por qué no?

8 / 23

Causalidad

Ejemplo: El efecto causal del abono

Muchos de los primeros estudios estadísticos y econométricos incluían ensayos de campo agrícolas.

Supongamos que queremos conocer el efecto causal del fertilizante sobre el rendimiento del maíz.

P: ¿Podríamos simplemente hacer una regresión del rendimiento en función del fertilizante?
R: Probablemente no (si queremos el efecto causal).

P: ¿Por qué no?
R: Sesgo de variable omitida: Los agricultores pueden aplicar menos fertilizantes en zonas que ya son peores en otras dimensiones que afectan al rendimiento (suelo, pendiente, agua).
Viola todo lo demás igual (exogeneidad). Resultados sesgados y/o espurios.

8 / 23

Causalidad

Ejemplo: El efecto causal del abono

Muchos de los primeros estudios estadísticos y econométricos incluían ensayos de campo agrícolas.

Supongamos que queremos conocer el efecto causal del fertilizante sobre el rendimiento del maíz.

P: ¿Podríamos simplemente hacer una regresión del rendimiento en función del fertilizante?
R: Probablemente no (si queremos el efecto causal).

P: ¿Por qué no?
R: Sesgo de variable omitida: Los agricultores pueden aplicar menos fertilizantes en zonas que ya son peores en otras dimensiones que afectan al rendimiento (suelo, pendiente, agua).
Viola todo lo demás igual (exogeneidad). Resultados sesgados y/o espurios.

P: Entonces, ¿qué deberíamos hacer?

8 / 23

Causalidad

Ejemplo: El efecto causal del abono

Muchos de los primeros estudios estadísticos y econométricos incluían ensayos de campo agrícolas.

Supongamos que queremos conocer el efecto causal del fertilizante sobre el rendimiento del maíz.

P: ¿Podríamos simplemente hacer una regresión del rendimiento en función del fertilizante?
R: Probablemente no (si queremos el efecto causal).

P: ¿Por qué no?
R: Sesgo de variable omitida: Los agricultores pueden aplicar menos fertilizantes en zonas que ya son peores en otras dimensiones que afectan al rendimiento (suelo, pendiente, agua).
Viola todo lo demás igual (exogeneidad). Resultados sesgados y/o espurios.

P: Entonces, ¿qué deberíamos hacer?
R: ¡Hacer un experimento!

8 / 23

Causalidad

Ejemplo: El efecto causal del abono

Muchos de los primeros estudios estadísticos y econométricos incluían ensayos de campo agrícolas.

Supongamos que queremos conocer el efecto causal del fertilizante sobre el rendimiento del maíz.

P: ¿Podríamos simplemente hacer una regresión del rendimiento en función del fertilizante?
R: Probablemente no (si queremos el efecto causal).

P: ¿Por qué no?
R: Sesgo de variable omitida: Los agricultores pueden aplicar menos fertilizantes en zonas que ya son peores en otras dimensiones que afectan al rendimiento (suelo, pendiente, agua).
Viola todo lo demás igual (exogeneidad). Resultados sesgados y/o espurios.

P: Entonces, ¿qué deberíamos hacer?
R: ¡Hacer un experimento! 💩

8 / 23

Causalidad

Ejemplo: El efecto causal del fertilizante

Los experimentos aleatorios nos ayudan a mantener todo lo demás igual (exogeneidad).

9 / 23

Causalidad

Ejemplo: El efecto causal del fertilizante

Los experimentos aleatorios nos ayudan a mantener todo lo demás igual (exogeneidad).

A menudo llamamos a estos experimentos randomized control trials (RCT).

La econometría (y la estadística) toma prestado este lenguaje de la bioestadística y los ensayos farmacéuticos.

9 / 23

Causalidad

Ejemplo: El efecto causal del fertilizante

Los experimentos aleatorios nos ayudan a mantener todo lo demás igual (exogeneidad).

A menudo llamamos a estos experimentos randomized control trials (RCT).

La econometría (y la estadística) toma prestado este lenguaje de la bioestadística y los ensayos farmacéuticos.

Imaginemos un RCT en el que tenemos dos grupos:

  • Tratamiento: Aplicamos fertilizante.
  • Control: No aplicamos fertilizante.
9 / 23

Causalidad

Ejemplo: El efecto causal del fertilizante

Los experimentos aleatorios nos ayudan a mantener todo lo demás igual (exogeneidad).

A menudo llamamos a estos experimentos randomized control trials (RCT).

La econometría (y la estadística) toma prestado este lenguaje de la bioestadística y los ensayos farmacéuticos.

Imaginemos un RCT en el que tenemos dos grupos:

  • Tratamiento: Aplicamos fertilizante.
  • Control: No aplicamos fertilizante.

Al distribuir aleatoriamente las parcelas en tratamiento o control, incluiremos, en promedio, todos los tipos de tierra (suelo, pendiente, agua, etc.) en ambos grupos.

9 / 23

Causalidad

Ejemplo: El efecto causal del fertilizante

Los experimentos aleatorios nos ayudan a mantener todo lo demás igual (exogeneidad).

A menudo llamamos a estos experimentos randomized control trials (RCT).

La econometría (y la estadística) toma prestado este lenguaje de la bioestadística y los ensayos farmacéuticos.

Imaginemos un RCT en el que tenemos dos grupos:

  • Tratamiento: Aplicamos fertilizante.
  • Control: No aplicamos fertilizante.

Al distribuir aleatoriamente las parcelas en tratamiento o control, incluiremos, en promedio, todos los tipos de tierra (suelo, pendiente, agua, etc.) en ambos grupos.

¡Todo lo demás es igual!

9 / 23

Causalidad

54 parcelas de igual tamaño

10 / 23

Causalidad

54 parcelas de igual tamaño de distinta calidad

10 / 23

Causalidad

54 parcelas de igual tamaño de distinta calidad más el tratamiento asignado al azar

10 / 23

Causalidad

54 parcelas de igual tamaño de distinta calidad más el tratamiento asignado al azar

10 / 23

Causalidad

54 parcelas de igual tamaño de distinta calidad más el tratamiento asignado al azar

10 / 23

Causalidad

54 parcelas de igual tamaño de distinta calidad más el tratamiento asignado al azar

10 / 23

Causalidad

54 parcelas de igual tamaño de distinta calidad más el tratamiento asignado al azar

10 / 23

Causalidad

54 parcelas de igual tamaño de distinta calidad más el tratamiento asignado al azar

10 / 23

Causalidad

54 parcelas de igual tamaño de distinta calidad más el tratamiento asignado al azar

10 / 23

Causalidad

54 parcelas de igual tamaño de distinta calidad más el tratamiento asignado al azar

10 / 23

Causalidad

54 parcelas de igual tamaño de distinta calidad más el tratamiento asignado al azar

10 / 23

Causalidad

54 parcelas de igual tamaño de distinta calidad más el tratamiento asignado al azar

10 / 23

Causalidad

54 parcelas de igual tamaño de distinta calidad más el tratamiento asignado al azar

10 / 23

Causalidad

54 parcelas de igual tamaño de distinta calidad más el tratamiento asignado al azar

10 / 23

Causalidad

Ejemplo: El efecto causal del fertilizante

Podemos estimar el efecto causal del fertilizante sobre el rendimiento de los cultivos comparando el rendimiento medio del grupo de tratamiento (💩) con el grupo de control (sin 💩).

Rendimiento¯TratamientoRendimiento¯Control

11 / 23

Causalidad

Ejemplo: El efecto causal del fertilizante

Podemos estimar el efecto causal del fertilizante sobre el rendimiento de los cultivos comparando el rendimiento medio del grupo de tratamiento (💩) con el grupo de control (sin 💩).

Rendimiento¯TratamientoRendimiento¯Control

Como alternativa, podemos utilizar la regresión

11 / 23

Causalidad

Ejemplo: El efecto causal del fertilizante

Podemos estimar el efecto causal del fertilizante sobre el rendimiento de los cultivos comparando el rendimiento medio del grupo de tratamiento (💩) con el grupo de control (sin 💩).

Rendimiento¯TratamientoRendimiento¯Control

Como alternativa, podemos utilizar la regresión

(1)Rendimientoi=β0+β1Trti+ui

donde Trti es una variable binaria (=1 si la parcela i recibió el tratamiento de fertilización).

11 / 23

Causalidad

Ejemplo: El efecto causal del fertilizante

Podemos estimar el efecto causal del fertilizante sobre el rendimiento de los cultivos comparando el rendimiento medio del grupo de tratamiento (💩) con el grupo de control (sin 💩).

Rendimiento¯TratamientoRendimiento¯Control

Como alternativa, podemos utilizar la regresión

(1)Rendimientoi=β0+β1Trti+ui

donde Trti es una variable binaria (=1 si la parcela i recibió el tratamiento de fertilización).

P: ¿Debemos esperar que (1) satisfaga la exogeneidad? ¿Por qué?

11 / 23

Causalidad

Ejemplo: El efecto causal del fertilizante

Podemos estimar el efecto causal del fertilizante sobre el rendimiento de los cultivos comparando el rendimiento medio del grupo de tratamiento (💩) con el grupo de control (sin 💩).

Rendimiento¯TratamientoRendimiento¯Control

Como alternativa, podemos utilizar la regresión

(1)Rendimientoi=β0+β1Trti+ui

donde Trti es una variable binaria (=1 si la parcela i recibió el tratamiento de fertilización).

P: ¿Debemos esperar que (1) satisfaga la exogeneidad? ¿Por qué?
R: Por término medio, la asignación aleatoria del tratamiento debe equilibrar trt. y control en las demás dimensiones que afectan al rendimiento (suelo, pendiente, agua).

11 / 23

Causalidad

Ejemplo: Retornos a la educación

Los economistas laborales, los responsables políticos, los padres y los estudiantes están interesados en el retorno monetario de la educación.

12 / 23

Causalidad

Ejemplo: Retornos a la educación

Los economistas laborales, los responsables políticos, los padres y los estudiantes están interesados en el retorno monetario de la educación.

Experimento mental:

  • Selecciona al azar un individuo.
  • Dale un año más de educación.
  • ¿Cuánto aumentan sus ingresos?

Este cambio en los ingresos nos da el efecto causal de la educación sobre los ingresos.

12 / 23

Causalidad

Ejemplo: Retornos a la educación

P: ¿Podríamos simplemente hacer una regresión de los ingresos en función de la educación?

13 / 23

Causalidad

Ejemplo: Retornos a la educación

P: ¿Podríamos simplemente hacer una regresión de los ingresos en función de la educación?
R: De nuevo, probablemente no si queremos el verdadero efecto causal.

13 / 23

Causalidad

Ejemplo: Retornos a la educación

P: ¿Podríamos simplemente hacer una regresión de los ingresos en función de la educación?
R: De nuevo, probablemente no si queremos el verdadero efecto causal.

  1. La gente elige la educación en función de muchos factores, por ejemplo, la capacidad.
  2. La educación probablemente reduzca la experiencia (tiempo fuera de la fuerza de trabajo).
  3. La educación es endógena (viola la exogeneidad).
13 / 23

Causalidad

Ejemplo: Retornos a la educación

P: ¿Podríamos simplemente hacer una regresión de los ingresos en función de la educación?
R: De nuevo, probablemente no si queremos el verdadero efecto causal.

  1. La gente elige la educación en función de muchos factores, por ejemplo, la capacidad.
  2. La educación probablemente reduzca la experiencia (tiempo fuera de la fuerza de trabajo).
  3. La educación es endógena (viola la exogeneidad).

El punto (2) anterior también ilustra la dificultad de aprender sobre la educación manteniendo todo lo demás constante.

Muchas variables importantes tienen el mismo reto: género, raza, ingresos.

13 / 23

Causalidad

Ejemplo: Retornos a la educación

P: Entonces, ¿cómo podemos estimar los rendimientos de la educación?

14 / 23

Causalidad

Ejemplo: Retornos a la educación

P: Entonces, ¿cómo podemos estimar los rendimientos de la educación?

Opción 1: Correr un experimento.

14 / 23

Causalidad

Ejemplo: Retornos a la educación

P: Entonces, ¿cómo podemos estimar los rendimientos de la educación?

Opción 1: Correr un experimento.

  • Aleatoriamente asignar educación (podría ser difícil).
  • Aleatoriamente fomentar la educación (podría funcionar).
  • Aleatoriamente asignar programas que afecten a la educación (*por ejemplo, tutorías).
14 / 23

Causalidad

Ejemplo: Retornos a la educación

P: Entonces, ¿cómo podemos estimar los rendimientos de la educación?

Opción 1: Correr un experimento.

  • Aleatoriamente asignar educación (podría ser difícil).
  • Aleatoriamente fomentar la educación (podría funcionar).
  • Aleatoriamente asignar programas que afecten a la educación (*por ejemplo, tutorías).

Opción 2: Busque un experimento natural-una política o accidente en la sociedad que haya aumentado arbitrariamente la educación de un subconjunto de personas.

14 / 23

Causalidad

Ejemplo: Retornos a la educación

P: Entonces, ¿cómo podemos estimar los rendimientos de la educación?

Opción 1: Correr un experimento.

  • Aleatoriamente asignar educación (podría ser difícil).
  • Aleatoriamente fomentar la educación (podría funcionar).
  • Aleatoriamente asignar programas que afecten a la educación (*por ejemplo, tutorías).

Opción 2: Busque un experimento natural-una política o accidente en la sociedad que haya aumentado arbitrariamente la educación de un subconjunto de personas.

  • Admisiones límites
  • lotería inscripción y/o capacidad limitaciones
14 / 23

Causalidad

Experimentos reales

En ambos ejemplos se consideran experimentos reales que aíslan los efectos causales.

Características

  • Realizable-podemos realmente (potencialmente) realizar el experimento.
  • Comparar individuos aleatorizados en el tratamiento con individuos aleatorizados en el control.
  • Requiere una "buena" aleatorización para obtener todo lo demás igual (exogeneidad).
15 / 23

Causalidad

Experimentos reales

En ambos ejemplos se consideran experimentos reales que aíslan los efectos causales.

Características

  • Realizable-podemos realmente (potencialmente) realizar el experimento.
  • Comparar individuos aleatorizados en el tratamiento con individuos aleatorizados en el control.
  • Requiere una "buena" aleatorización para obtener todo lo demás igual (exogeneidad).

Nota: Los resultados de su experimento son sólo tan buenos como su aleatorización.

15 / 23

Causalidad

Una aleatorización desafortunada

15 / 23

Causalidad

El experimento ideal

El experimento ideal sería sutilmente diferente.

En lugar de comparar unidades aleatorizadas como tratamiento frente a control, el experimento ideal compararía el tratamiento y el control para la misma y exacta unidad.

16 / 23

Causalidad

El experimento ideal

El experimento ideal sería sutilmente diferente.

En lugar de comparar unidades aleatorizadas como tratamiento frente a control, el experimento ideal compararía el tratamiento y el control para la misma y exacta unidad.

yTratamiento,iyControl,i

16 / 23

Causalidad

El experimento ideal

El experimento ideal sería sutilmente diferente.

En lugar de comparar unidades aleatorizadas como tratamiento frente a control, el experimento ideal compararía el tratamiento y el control para la misma y exacta unidad.

yTratamiento,iyControl,i

que escribiremos (para simplificar) como

y1,iy0,i

16 / 23

Causalidad

El experimento ideal

El experimento ideal sería sutilmente diferente.

En lugar de comparar unidades aleatorizadas como tratamiento frente a control, el experimento ideal compararía el tratamiento y el control para la misma y exacta unidad.

yTratamiento,iyControl,i

que escribiremos (para simplificar) como

y1,iy0,i

Este experimento ideal es claramente inviable, pero crea una bonita notación para la causalidad (el modelo causal de Rubin/marco de resultados potenciales de Neyman).

Sin (1) habilidades similares a las de Dios y múltiples universos o (2) una máquina del tiempo.

16 / 23

Causalidad

El experimento ideal

The ideal data for 10 people

> i trt y1i y0i
> 1 1 1 5.01 2.56
> 2 2 1 8.85 2.53
> 3 3 1 6.31 2.67
> 4 4 1 5.97 2.79
> 5 5 1 7.61 4.34
> 6 6 0 7.63 4.15
> 7 7 0 4.75 0.56
> 8 8 0 5.77 3.52
> 9 9 0 7.47 4.49
> 10 10 0 7.79 1.40
17 / 23

Causalidad

El experimento ideal

The ideal data for 10 people

> i trt y1i y0i
> 1 1 1 5.01 2.56
> 2 2 1 8.85 2.53
> 3 3 1 6.31 2.67
> 4 4 1 5.97 2.79
> 5 5 1 7.61 4.34
> 6 6 0 7.63 4.15
> 7 7 0 4.75 0.56
> 8 8 0 5.77 3.52
> 9 9 0 7.47 4.49
> 10 10 0 7.79 1.40

Calcula el efecto causal del trt. τi=y1,iy0,i para cada individuo i.

17 / 23

Causalidad

El experimento ideal

Los datos ideales para 10 personas

> i trt y1i y0i effect_i
> 1 1 1 5.01 2.56 2.45
> 2 2 1 8.85 2.53 6.32
> 3 3 1 6.31 2.67 3.64
> 4 4 1 5.97 2.79 3.18
> 5 5 1 7.61 4.34 3.27
> 6 6 0 7.63 4.15 3.48
> 7 7 0 4.75 0.56 4.19
> 8 8 0 5.77 3.52 2.25
> 9 9 0 7.47 4.49 2.98
> 10 10 0 7.79 1.40 6.39

Calcula el efecto causal del trt. τi=y1,iy0,i para cada individuo i.

17 / 23

Causalidad

El experimento ideal

Los datos ideales para 10 personas

> i trt y1i y0i effect_i
> 1 1 1 5.01 2.56 2.45
> 2 2 1 8.85 2.53 6.32
> 3 3 1 6.31 2.67 3.64
> 4 4 1 5.97 2.79 3.18
> 5 5 1 7.61 4.34 3.27
> 6 6 0 7.63 4.15 3.48
> 7 7 0 4.75 0.56 4.19
> 8 8 0 5.77 3.52 2.25
> 9 9 0 7.47 4.49 2.98
> 10 10 0 7.79 1.40 6.39

Calcula el efecto causal del trt. τi=y1,iy0,i para cada individuo i.

La media τi es el
average treatment effect (ATE).

Entonces, τ¯=3.82

17 / 23

Causalidad

El experimento ideal

Este modelo pone de manifiesto el problema fundamental de la inferencia causal. τi=y1,iy0,i

18 / 23

Causalidad

El experimento ideal

Este modelo pone de manifiesto el problema fundamental de la inferencia causal. τi=y1,iy0,i

El desafío:

Si observamos y1,i entonces no podemos observar y0,i.
Si observamos y0,i, entonces no podemos observar y1,i.

18 / 23

Causalidad

El experimento ideal

Por lo tanto, un conjunto de datos que realmente observamos para 6 personas será algo así como

> i trt y1i y0i
> 1 1 1 5.01 NA
> 2 2 1 8.85 NA
> 3 3 1 6.31 NA
> 4 4 1 5.97 NA
> 5 5 1 7.61 NA
> 6 6 0 NA 4.15
> 7 7 0 NA 0.56
> 8 8 0 NA 3.52
> 9 9 0 NA 4.49
> 10 10 0 NA 1.40
19 / 23

Causalidad

El experimento ideal

Por lo tanto, un conjunto de datos que realmente observamos para 6 personas será algo así como

> i trt y1i y0i
> 1 1 1 5.01 NA
> 2 2 1 8.85 NA
> 3 3 1 6.31 NA
> 4 4 1 5.97 NA
> 5 5 1 7.61 NA
> 6 6 0 NA 4.15
> 7 7 0 NA 0.56
> 8 8 0 NA 3.52
> 9 9 0 NA 4.49
> 10 10 0 NA 1.40

No podemos observar y1,i y y0,i.

Pero, si observamos

  • y1,i para i en 1, 2, 3, 4, 5
  • y0,j para j en 6, 7, 8, 9, 10
19 / 23

Causalidad

El experimento ideal

Por lo tanto, un conjunto de datos que realmente observamos para 6 personas será algo así como

> i trt y1i y0i
> 1 1 1 5.01 NA
> 2 2 1 8.85 NA
> 3 3 1 6.31 NA
> 4 4 1 5.97 NA
> 5 5 1 7.61 NA
> 6 6 0 NA 4.15
> 7 7 0 NA 0.56
> 8 8 0 NA 3.52
> 9 9 0 NA 4.49
> 10 10 0 NA 1.40

No podemos observar y1,i y y0,i.

Pero, si observamos

  • y1,i para i en 1, 2, 3, 4, 5
  • y0,j para j en 6, 7, 8, 9, 10

P: ¿Cómo "rellenamos" los NAs y estimamos τ¯?

19 / 23

Causalidad

Estimación causal del efecto del tratamiento

Notación: Sea Di una variable indicadora binaria tal que

  • Di=1 si el individuo i es tratado
  • Di=0 si el individuo i no es tratado (grupo de control).
20 / 23

Causalidad

Estimación causal del efecto del tratamiento

Notación: Sea Di una variable indicadora binaria tal que

  • Di=1 si el individuo i es tratado
  • Di=0 si el individuo i no es tratado (grupo de control).

Entonces, reformulando la diapositiva anterior,

  • Sólo observamos y1,i cuando Di=1.
  • Sólo observamos y0,i cuando Di=0.
20 / 23

Causalidad

Estimación causal del efecto del tratamiento

Notación: Sea Di una variable indicadora binaria tal que

  • Di=1 si el individuo i es tratado
  • Di=0 si el individuo i no es tratado (grupo de control).

Entonces, reformulando la diapositiva anterior,

  • Sólo observamos y1,i cuando Di=1.
  • Sólo observamos y0,i cuando Di=0.

P: ¿Cómo podemos estimar τ¯ usando solamente (y1,i|Di=1) y (y0,i|Di=0)?

20 / 23

Causalidad

Estimación causal del efecto del tratamiento

P: ¿Cómo podemos estimar τ¯ usando solamente (y1,i|Di=1) y (y0,i|Di=0)?

21 / 23

Causalidad

Estimación causal del efecto del tratamiento

P: ¿Cómo podemos estimar τ¯ usando solamente (y1,i|Di=1) y (y0,i|Di=0)?

Idea: What if we compare the groups' means? ,es decir, Promedio(yiDi=1)Promedio(yiDi=0)

21 / 23

Causalidad

Estimación causal del efecto del tratamiento

P: ¿Cómo podemos estimar τ¯ usando solamente (y1,i|Di=1) y (y0,i|Di=0)?

Idea: What if we compare the groups' means? ,es decir, Promedio(yiDi=1)Promedio(yiDi=0)

P: ¿Cuándo esta simple diferencia en las medias de los grupos proporciona información sobre el efecto causal del tratamiento?

21 / 23

Causalidad

Estimación causal del efecto del tratamiento

P: ¿Cómo podemos estimar τ¯ usando solamente (y1,i|Di=1) y (y0,i|Di=0)?

Idea: What if we compare the groups' means? ,es decir, Promedio(yiDi=1)Promedio(yiDi=0)

P: ¿Cuándo esta simple diferencia en las medias de los grupos proporciona información sobre el efecto causal del tratamiento?

P2.0: ¿Es Promedio(yiDi=1)Promedio(yiDi=0) un buen estimador para τ¯?

21 / 23

Causalidad

Estimación causal del efecto del tratamiento

P: ¿Cómo podemos estimar τ¯ usando solamente (y1,i|Di=1) y (y0,i|Di=0)?

Idea: What if we compare the groups' means? ,es decir, Promedio(yiDi=1)Promedio(yiDi=0)

P: ¿Cuándo esta simple diferencia en las medias de los grupos proporciona información sobre el efecto causal del tratamiento?

P2.0: ¿Es Promedio(yiDi=1)Promedio(yiDi=0) un buen estimador para τ¯?

¡Hora de las matemáticas! 🎉

21 / 23

Causalidad

Estimación causal del efecto del tratamiento

Supuesto: Sea τi=τ para todos los i.

Esta suposición dice que el efecto del tratamiento es igual (constante) en todos los individuos i.

22 / 23

Causalidad

Estimación causal del efecto del tratamiento

Supuesto: Sea τi=τ para todos los i.

Esta suposición dice que el efecto del tratamiento es igual (constante) en todos los individuos i.

Nota: Definimos

τi=τ=y1,iy0,i

lo cual implica que

y1,i=y0,i+τ

22 / 23

P3.0: ¿Es Promedio(yiDi=1)Promedio(yiDi=0) un buen estimador para τ?

23 / 23

P3.0: ¿Es Promedio(yiDi=1)Promedio(yiDi=0) un buen estimador para τ?

Diferencia de las medias de los grupos

23 / 23

P3.0: ¿Es Promedio(yiDi=1)Promedio(yiDi=0) un buen estimador para τ?

Diferencia de las medias de los grupos
|=Promedio(yiDi=1)Promedio(yiDi=0)

23 / 23

P3.0: ¿Es Promedio(yiDi=1)Promedio(yiDi=0) un buen estimador para τ?

Diferencia de las medias de los grupos
|=Promedio(yiDi=1)Promedio(yiDi=0)
|=Promedio(y1,iDi=1)Promedio(y0,iDi=0)

23 / 23

P3.0: ¿Es Promedio(yiDi=1)Promedio(yiDi=0) un buen estimador para τ?

Diferencia de las medias de los grupos
|=Promedio(yiDi=1)Promedio(yiDi=0)
|=Promedio(y1,iDi=1)Promedio(y0,iDi=0)
|=Promedio(τ+y0,iDi=1)Promedio(y0,iDi=0)

23 / 23

P3.0: ¿Es Promedio(yiDi=1)Promedio(yiDi=0) un buen estimador para τ?

Diferencia de las medias de los grupos
|=Promedio(yiDi=1)Promedio(yiDi=0)
|=Promedio(y1,iDi=1)Promedio(y0,iDi=0)
|=Promedio(τ+y0,iDi=1)Promedio(y0,iDi=0)
|=τ+Promedio(y0,iDi=1)Promedio(y0,iDi=0)

23 / 23

P3.0: ¿Es Promedio(yiDi=1)Promedio(yiDi=0) un buen estimador para τ?

Diferencia de las medias de los grupos
|=Promedio(yiDi=1)Promedio(yiDi=0)
|=Promedio(y1,iDi=1)Promedio(y0,iDi=0)
|=Promedio(τ+y0,iDi=1)Promedio(y0,iDi=0)
|=τ+Promedio(y0,iDi=1)Promedio(y0,iDi=0)
|=Average causal effect+Sesgo de selección

23 / 23

P3.0: ¿Es Promedio(yiDi=1)Promedio(yiDi=0) un buen estimador para τ?

Diferencia de las medias de los grupos
|=Promedio(yiDi=1)Promedio(yiDi=0)
|=Promedio(y1,iDi=1)Promedio(y0,iDi=0)
|=Promedio(τ+y0,iDi=1)Promedio(y0,iDi=0)
|=τ+Promedio(y0,iDi=1)Promedio(y0,iDi=0)
|=Average causal effect+Sesgo de selección

Así que nuestro estimador de diferencia de grupo propuesto nos da la suma de

  1. τ, el causal, efecto medio del tratamiento que queremos
  2. Sesgo de selección: Cuánto difieren los grupos de trt. y de control (en promedio).
23 / 23

Causalidad

2 / 23
Paused

Help

Keyboard shortcuts

, , Pg Up, k Go to previous slide
, , Pg Dn, Space, j Go to next slide
Home Go to first slide
End Go to last slide
Number + Return Go to specific slide
b / m / f Toggle blackout / mirrored / fullscreen mode
c Clone slideshow
p Toggle presenter mode
t Restart the presentation timer
?, h Toggle this help
Esc Back to slideshow