核心思想
变分推理的核心想法是,用一个更简单的、容易得到的分布
对于问题1,通常我们会给
对于问题2,我们可以最小化
比如我们假设L是此空间上的距离函数,Q是空间中的一个概率分布族,则
这个思路是没问题的,可是现在我们并不知道具体
ELBO
当我们取L为KL散度时,这个问题变成Variational Bayes (VB) 问题,我们的目标如下
展开KL项可得
我们现在不知道
此时,我们把前两项称为-ELBO(Evidence Lower Bound)。这里是负的。
那么可知关于
我们再观察
因为等式左边是常数,目标为最小化KL项,那么可以转换为最大化
实际计算中
那为什么叫Evidence Lower Bound呢,因为KL散度始终大于等于0,因此有下列不等式
ELBO其实就是数据Evidence