Causal Effect


因果模型

因果模型是一种用于描述因果关系的模型,它可以用于预测和干预。因果模型的基本假设是,我们可以通过观察到的变量来推断未观察到的变量。

因果模型图是因果模型的一种可视化表示,它是一个有向无环图,其中节点表示变量,边表示因果关系,从一个变量指向另一个变量的边表示前者是后者的原因。

对因果模型图进行分析时:

  1. 对于一个节点而言,它的所有父节点都是它的直接原因,它的所有子节点都是它的直接结果;它的所有祖先节点都是它的间接原因,它的所有后代节点都是它的间接结果。
  2. 对于两个节点而言,如果它们通过一条边直接相连,那么它们互为因果;如果它们之间存在至少一条路径,那么通过引入更多的中间节点,它们可能互为因果。
  3. 对于三个节点而言,其中一个节点位于连接另外两个节点的路径上,那么通过控制该中间节点,可以控制另外两个节点之间的关系。

乘积分解法则

对于链结构而言,我们可以将联合概率分解为条件概率的乘积,即乘积分解法则。

P(x1,x2,,xn)=i=1nP(xi|pa(xi))

其中pa(xi)表示xi的父节点。

考虑一个简单的例子,假设有三个变量XYZ,它们之间的关系为XYZ,那么有

P(X,Y,Z)=P(X)P(Y|X)P(Z|Y)

结构因果模型

结构因果模型用于描述数据的产生机制,包括:

  1. 外生变量集合U,它们是模型中的根节点,它们的值是由外部环境决定的,不依赖于模型中的其他变量。
  2. 内生变量集合V,它们是模型中的非根节点,它们的值是由模型中的其他变量决定的,即至少依赖于一个父节点。
  3. 确定内生变量取值的函数集合F,它们是模型中的边,它们的值是由父节点的值决定的,即它们是父节点的函数。
V=F{U}

因果模型图和独立性

以三个邻接的节点XYZ为例,将三个节点直接相连,考虑边的方向,有三种情况:

  1. 链结构:XYZ
  2. 分叉结构:XYZ
  3. 对撞结构:XYZ;也叫共因结构。

在独立性分析中,我们关注的是通过控制中间节点,是否可以推断出两个节点的独立性或依赖关系。通过下文的分析,我们可以得到如下结论:链结构和分叉结构中的独立性判断是类似的,而对撞结构中的独立性判断与它们不同。

链结构

在链结构中

  • X=FX{UX}
  • Y=FY{X,UY}
  • Z=FZ{Y,UZ}

给定YXZ只受外生变量影响,故XZ独立,记作XZ|Y

graph LR
    id1["U{X}"] --> X
    X --> Y
    id2["U{Y}"] --> Y
    Y --> Z
    id3["U{Z}"] --> Z
U{X}
X
Y
U{Y}
Z
U{Z}

分叉结构

在分叉结构中

  • X=FX{UX}
  • Y=FY{X,UY}
  • Z=FZ{X,UZ}

给定XYZ只受外生变量影响,故YZ独立,记作YZ|X

graph LR
    id1["U{X}"] --> X
    id2["U{Y}"] --> Y
    X --> Y
    X --> Z
    id3["U{Z}"] --> Z
U{X}
X
U{Y}
Y
Z
U{Z}

对撞结构

在对撞结构中

  • X=FX{UX}
  • Y=FY{UY}
  • Z=FZ{X,Y,UZ}

不给定额外信息,XY独立;给定ZXY的关系内含于Z=FZ{X,Y,UZ},故XY不独立,记作X⊥̸Y|Z

graph LR
    id1["U{X}"] --> X
    X --> Z
    id2["U{Z}"] --> Z
    id3["U{Y}"] --> Y
    Y --> Z
U{X}
X
Z
U{Z}
U{Y}
Y

d-分离

d-分离是一种判断两个节点是否独立的方法,它是基于因果模型图的有向路径的概念的。在前文的讨论中,我们通过控制中间结点说明:控制中间节点后的链结构分叉结构中的两个节点独立,而对撞结构中的两个节点不独立

此处我们给出阻断的概念:一条路径会被一组节点Z阻断,当且仅当:

  1. 该路径中包含链结构或分叉结构,且该结构中的中间节点在Z中。
  2. 该路径中包含对撞结构,且该结构中的中间节点不在Z中。

我们可以将阻断的概念理解为:阻断了因果关系的传递,使得节点互相独立。如果一组节点Z阻断了节点XY之间的所有路径,那么XY在给定Z的条件下是d-分离的,记作XdY|ZXY|Z

干预

干预是将变量固定为某个值,限制改变量的变化,等价于在因果模型中去除所有指向该变量的边。干预后的因果模型图称为干预模型图。

干预条件的区别在于干预改变了系统本身,而条件只是改变了系统的观测。一般用条件概率表示因果效应

干预 P(Y=y|do(X=x))条件 P(Y=y|X=x)

在只有观测数据时,我们只能从数据中估计干预操作的效果,称之为校正。校正公式描述了从观测数据中估计干预后的目标变量Y的概率分布

P(Y=y|do(X=x))=P(Y=y|X=x)全概公式 =P(Y=y|X=x,Pa(X)=z)P(Pa(X)=z|X=x)独立性 =P(Y=y|X=x,Pa(X)=z)P(Pa(X)=z)

这里的Pa(X)表示X的父节点集合。

后门准则

后门准则应用于干预中X的父节点集合Pa(X)不可观测的情况,即试图找出一个可观测的变量集合Z,使得Z阻断了XY之间的所有伪因果路径。

给定因果模型图中的一对有序变量(X,Y)和一组变量Z,如果满足以下条件:

  1. Z阻断XY之间的每条含有指向X的路径。(阻断XY之间的所有伪因果/后门路径)
  2. Z中没有X的后代节点。(保持XY的因果路径不变)

则称Z满足关于(X,Y)的后门准则。此时Z可以替代X的父节点集合Pa(X),用于校正X的干预效果,即后门校正

P(Y=y|do(X=x))=zP(Y=y|X=x,Z=z)P(Z=z)

前门准则

前门准则通过XY的中介变量估计因果效应。考虑因果模型图中的一对有序变量(X,Y)和一组变量Z,如果满足以下条件:

  1. Z切断了所有从XY的路径。(阻断XY之间的所有因果路径)
  2. XZ没有后门路径。(保持XZ的因果路径不变)
  3. 所有ZY的后门路径都被X阻断。(保持ZY的因果路径不变)

则称Z满足关于(X,Y)的前门准则。此时Z可以替代X的父节点集合Pa(X)和后门校正来校正X的干预效果,即前门校正

P(Y=y|do(X=x))=zP(Z=z|X=x)xP(Y=y|X=x,Z=z)P(X=x|Z=z)=zP(Z=z|X=x)XZxP(Y=y|X=x,Z=z)P(X=x)X后门校正ZY

反事实

在完全一致的现实条件下,比较不同假设的结果,即反事实。反事实的表示为Yx,表示在X=x的条件下,Y的取值。

给定结构因果模型,反事实计算分为三步

  1. 用观测确定当前环境,即外生变量U的取值。
  2. X=x替换X的定义,得到新的因果模型。(移除变量X出现在方程左边的情况,并用X=x替换)
  3. 用新的因果模型计算Y的取值。

后门的反事实计算

P(Yx=y)=zP(Y=y|X=x,Z=z)P(Z=z)