Causal Effect
因果模型
因果模型是一种用于描述因果关系的模型,它可以用于预测和干预。因果模型的基本假设是,我们可以通过观察到的变量来推断未观察到的变量。
因果模型图是因果模型的一种可视化表示,它是一个有向无环图,其中节点表示变量,边表示因果关系,从一个变量指向另一个变量的边表示前者是后者的原因。
对因果模型图进行分析时:
- 对于一个节点而言,它的所有父节点都是它的直接原因,它的所有子节点都是它的直接结果;它的所有祖先节点都是它的间接原因,它的所有后代节点都是它的间接结果。
- 对于两个节点而言,如果它们通过一条边直接相连,那么它们互为因果;如果它们之间存在至少一条路径,那么通过引入更多的中间节点,它们可能互为因果。
- 对于三个节点而言,其中一个节点位于连接另外两个节点的路径上,那么通过控制该中间节点,可以控制另外两个节点之间的关系。
乘积分解法则
对于链结构而言,我们可以将联合概率分解为条件概率的乘积,即乘积分解法则。
其中
考虑一个简单的例子,假设有三个变量
结构因果模型
结构因果模型用于描述数据的产生机制,包括:
- 外生变量集合
,它们是模型中的根节点,它们的值是由外部环境决定的,不依赖于模型中的其他变量。 - 内生变量集合
,它们是模型中的非根节点,它们的值是由模型中的其他变量决定的,即至少依赖于一个父节点。 - 确定内生变量取值的函数集合
,它们是模型中的边,它们的值是由父节点的值决定的,即它们是父节点的函数。
因果模型图和独立性
以三个邻接的节点
- 链结构:
。 - 分叉结构:
。 - 对撞结构:
;也叫共因结构。
在独立性分析中,我们关注的是通过控制中间节点,是否可以推断出两个节点的独立性或依赖关系。通过下文的分析,我们可以得到如下结论:链结构和分叉结构中的独立性判断是类似的,而对撞结构中的独立性判断与它们不同。
链结构
在链结构中
给定
graph LR
id1["U{X}"] --> X
X --> Y
id2["U{Y}"] --> Y
Y --> Z
id3["U{Z}"] --> Z
分叉结构
在分叉结构中
给定
graph LR
id1["U{X}"] --> X
id2["U{Y}"] --> Y
X --> Y
X --> Z
id3["U{Z}"] --> Z
对撞结构
在对撞结构中
不给定额外信息,
graph LR
id1["U{X}"] --> X
X --> Z
id2["U{Z}"] --> Z
id3["U{Y}"] --> Y
Y --> Z
d-分离
链结构
和分叉结构
中的两个节点独立
,而对撞结构
中的两个节点不独立
。
此处我们给出阻断
的概念:一条路径会被一组节点
- 该路径中包含链结构或分叉结构,且该结构中的中间节点在
中。 - 该路径中包含对撞结构,且该结构中的中间节点不在
中。
我们可以将阻断的概念理解为:阻断了因果关系的传递,使得节点互相独立。如果一组节点
干预
干预是将变量固定为某个值,限制改变量的变化,等价于在因果模型中去除所有指向该变量的边。干预后的因果模型图称为干预模型图。
干预
与条件
的区别在于干预改变了系统本身,而条件只是改变了系统的观测。一般用条件概率表示因果效应
在只有观测数据时,我们只能从数据中估计干预操作的效果,称之为校正
。校正公式描述了从观测数据中估计干预后的目标变量
这里的
后门准则
后门准则应用于干预中
给定因果模型图中的一对有序变量
阻断了 和 之间的每条含有指向 的路径。(阻断 和 之间的所有伪因果/后门路径) 中没有 的后代节点。(保持 到 的因果路径不变)
则称
前门准则
前门准则通过
切断了所有从 到 的路径。(阻断 和 之间的所有因果路径) 到 没有后门路径。(保持 到 的因果路径不变)- 所有
到 的后门路径都被 阻断。(保持 到 的因果路径不变)
则称
反事实
在完全一致的现实条件下,比较不同假设的结果,即反事实。反事实的表示为
给定结构因果模型,反事实计算分为三步
- 用观测确定当前环境,即外生变量
的取值。 - 用
替换 的定义,得到新的因果模型。(移除变量 出现在方程左边的情况,并用 替换) - 用新的因果模型计算
的取值。
后门的反事实计算