因果模型是一种用于描述因果关系的模型,它可以用于预测和干预。因果模型的基本假设是,我们可以通过观察到的变量来推断未观察到的变量。
因果模型图是因果模型的一种可视化表示,它是一个有向无环图,其中节点表示变量,边表示因果关系,从一个变量指向另一个变量的边表示前者是后者的原因。
对因果模型图进行分析时:
对于链结构而言,我们可以将联合概率分解为条件概率的乘积,即乘积分解法则。
\[ P(x_1, x_2, \cdots, x_n) = \prod_{i=1}^n P(x_i \vert pa(x_i)) \]
其中\(pa(x_i)\)表示\(x_i\)的父节点。
考虑一个简单的例子,假设有三个变量\(X\)、\(Y\)和\(Z\),它们之间的关系为\(X \rightarrow Y \rightarrow Z\),那么有
\[ P(X, Y, Z) = P(X)P(Y \vert X)P(Z \vert Y) \]
结构因果模型用于描述数据的产生机制,包括:
\[ V = F\{U\} \]
以三个邻接的节点\(X\)、\(Y\)和\(Z\)为例,将三个节点直接相连,考虑边的方向,有三种情况:
在独立性分析中,我们关注的是通过控制中间节点,是否可以推断出两个节点的独立性或依赖关系。通过下文的分析,我们可以得到如下结论:链结构和分叉结构中的独立性判断是类似的,而对撞结构中的独立性判断与它们不同。
在链结构中
给定\(Y\),\(X\)和\(Z\)只受外生变量影响,故\(X\)和\(Z\)独立,记作\(X \perp Z \vert Y\)
---
title: Chain
---
graph LR
id1["U{X}"] --> X
X --> Y
id2["U{Y}"] --> Y
Y --> Z
id3["U{Z}"] --> Z
在分叉结构中
给定\(X\),\(Y\)和\(Z\)只受外生变量影响,故\(Y\)和\(Z\)独立,记作\(Y \perp Z \vert X\)
---
title: Fork
---
graph LR
id1["U{X}"] --> X
id2["U{Y}"] --> Y
X --> Y
X --> Z
id3["U{Z}"] --> Z
在对撞结构中
不给定额外信息,\(X\)和\(Y\)独立;给定\(Z\),\(X\)和\(Y\)的关系内含于\(Z=F_Z\{X, Y, U_Z\}\),故\(X\)和\(Y\)不独立,记作\(X \not\perp Y \vert Z\)
---
title: Collision
---
graph LR
id1["U{X}"] --> X
X --> Z
id2["U{Z}"] --> Z
id3["U{Y}"] --> Y
Y --> Z
\(d\)-分离是一种判断两个节点是否独立的方法,它是基于因果模型图的有向路径的概念的。在前文的讨论中,我们通过控制中间结点说明:控制中间节点后的链结构
和分叉结构
中的两个节点独立
,而对撞结构
中的两个节点不独立
。
此处我们给出阻断
的概念:一条路径会被一组节点\(Z\)阻断,当且仅当:
我们可以将阻断的概念理解为:阻断了因果关系的传递,使得节点互相独立。如果一组节点\(Z\)阻断了节点\(X\)和\(Y\)之间的所有路径,那么\(X\)和\(Y\)在给定\(Z\)的条件下是\(d\)-分离的,记作\(X \perp_d Y \vert Z\)或\(X \perp Y \vert Z\)。
干预是将变量固定为某个值,限制改变量的变化,等价于在因果模型中去除所有指向该变量的边。干预后的因果模型图称为干预模型图。
干预
与条件
的区别在于干预改变了系统本身,而条件只是改变了系统的观测。一般用条件概率表示因果效应
\[ \begin{aligned} \text{干预 }& P(Y=y \vert do(X=x)) \\ \text{条件 }& P(Y=y \vert X=x) \end{aligned} \]
在只有观测数据时,我们只能从数据中估计干预操作的效果,称之为校正
。校正公式描述了从观测数据中估计干预后的目标变量\(Y\)的概率分布
\[ \begin{aligned} P(Y=y \vert do(X=x)) &= P(Y=y \vert X=x) \\ \text{全概公式 }&= \sum P(Y=y\vert X=x,Pa(X)=z)P(Pa(X)=z\vert X=x)\\ \text{独立性 }&= \sum P(Y=y\vert X=x,Pa(X)=z)P(Pa(X)=z) \end{aligned} \]
这里的\(Pa(X)\)表示\(X\)的父节点集合。
后门准则应用于干预中\(X\)的父节点集合\(Pa(X)\)不可观测的情况,即试图找出一个可观测的变量集合\(Z\),使得\(Z\)阻断了\(X\)和\(Y\)之间的所有伪因果路径。
给定因果模型图中的一对有序变量\((X, Y)\)和一组变量\(Z\),如果满足以下条件:
则称\(Z\)满足关于\((X, Y)\)的后门准则。此时\(Z\)可以替代\(X\)的父节点集合\(Pa(X)\),用于校正\(X\)的干预效果,即后门校正
\[ P(Y=y \vert do(X=x)) = \sum_z P(Y=y\vert X=x, Z=z)P(Z=z) \]
前门准则通过\(X\)到\(Y\)的中介变量估计因果效应。考虑因果模型图中的一对有序变量\((X, Y)\)和一组变量\(Z\),如果满足以下条件:
则称\(Z\)满足关于\((X, Y)\)的前门准则。此时\(Z\)可以替代\(X\)的父节点集合\(Pa(X)\)和后门校正来校正\(X\)的干预效果,即前门校正
\[ \begin{aligned} P(Y=y \vert do(X=x)) &= \sum_z P(Z=z\vert X=x)\sum_{x^{\prime}}P(Y=y\vert X=x^{\prime}, Z=z)P(X=x^{\prime}\vert Z=z) \\ &= \sum_z \underbrace{P(Z=z\vert X=x)}_{X\rightarrow Z} \underbrace{\sum_{x^{\prime}}P(Y=y\vert X=x^{\prime}, Z=z)P(X=x^{\prime})}_{X\text{后门校正}Z\rightarrow Y} \end{aligned} \]
在完全一致的现实条件下,比较不同假设的结果,即反事实。反事实的表示为\(Y_x\),表示在\(X=x\)的条件下,\(Y\)的取值。
给定结构因果模型,反事实计算分为三步
后门的反事实计算
\[ P(Y_x=y) = \sum_z P(Y=y\vert X=x, Z=z)P(Z=z) \]