玻尔兹曼方程详细推导（受限玻尔兹曼机）

小君 2023-08-04 07:08:46 83

玻尔兹曼方程详细推导（受限玻尔兹曼机）可以写出三个部分，包括与节点集合相关的两项以及与边其中能量函数。我们知道，无向图根据最大团的分解，可以写为玻尔兹曼分布的形式，这也是一个指数族分布。一个玻尔兹曼机存在一系列的问题，在其推断任务中，想要精确推断，是无法进行的，想要近似推断，计算量过大。为了解决这个问题，一种简化的玻尔兹曼机-受限玻尔兹曼机作出了假设，所有隐变量内部以及观测变量内部没有连接，只在隐变量和观测变量之间有连接，这样一来：

玻尔兹曼机是一种存在隐节点的无向图模型。在图模型中最简单的是朴素贝叶斯模型（朴素贝叶斯假设），引入单个隐变量后，发展出了 GMM，如果单个隐变量变成序列的隐变量，就得到了状态空间模型（引入齐次马尔可夫假设和观测独立假设就有HMM，Kalman Filter，Particle Filter），为了引入观测变量之间的关联，引入了一种最大熵模型-MEMM，为了克服 MEMM 中的局域问题，又引入了 CRF，CRF 是一个无向图，其中，破坏了齐次马尔可夫假设，如果隐变量是一个链式结构，那么又叫线性链 CRF。

在无向图的基础上，引入隐变量得到了玻尔兹曼机，这个图模型的概率密度函数是一个指数族分布。对隐变量和观测变量作出一定的限制，就得到了受限玻尔兹曼机（RBM）。

我们看到，不同的概率图模型对下面几个特点作出假设：

方向-边的性质

离散/连续/混合-点的性质

条件独立性-边的性质

隐变量-节点的性质

指数族-结构特点

将观测变量和隐变量分别记为

玻尔兹曼方程详细推导（受限玻尔兹曼机）(1)

。我们知道，无向图根据最大团的分解，可以写为玻尔兹曼分布的形式

玻尔兹曼方程详细推导（受限玻尔兹曼机）(2)

，这也是一个指数族分布。

一个玻尔兹曼机存在一系列的问题，在其推断任务中，想要精确推断，是无法进行的，想要近似推断，计算量过大。为了解决这个问题，一种简化的玻尔兹曼机-受限玻尔兹曼机作出了假设，所有隐变量内部以及观测变量内部没有连接，只在隐变量和观测变量之间有连接，这样一来：

玻尔兹曼方程详细推导（受限玻尔兹曼机）(3)

其中能量函数

玻尔兹曼方程详细推导（受限玻尔兹曼机）(4)

可以写出三个部分，包括与节点集合相关的两项以及与边

玻尔兹曼方程详细推导（受限玻尔兹曼机）(5)

相关的一项，记为：

玻尔兹曼方程详细推导（受限玻尔兹曼机）(6)

所以：

玻尔兹曼方程详细推导（受限玻尔兹曼机）(7)

上面这个式子也和 RBM 的因子图一一对应。

推断

推断任务包括求后验概率

玻尔兹曼方程详细推导（受限玻尔兹曼机）(8)

以及求边缘概率

玻尔兹曼方程详细推导（受限玻尔兹曼机）(9)

p(h∣v)

对于一个无向图，满足局域的 Markov 性质，即

玻尔兹曼方程详细推导（受限玻尔兹曼机）(10)

。我们可以得到：

玻尔兹曼方程详细推导（受限玻尔兹曼机）(11)

考虑 Binary RBM，所有的隐变量只有两个取值0 1：

玻尔兹曼方程详细推导（受限玻尔兹曼机）(12)

将能量函数写成和 L 相关或不相关的两项：

玻尔兹曼方程详细推导（受限玻尔兹曼机）(13)

定义：

玻尔兹曼方程详细推导（受限玻尔兹曼机）(14)

代入，有：

玻尔兹曼方程详细推导（受限玻尔兹曼机）(15)

于是就得到了后验概率。对于v的后验是对称的，所以类似的可以求解。

p(v)

玻尔兹曼方程详细推导（受限玻尔兹曼机）(16)

其中，

玻尔兹曼方程详细推导（受限玻尔兹曼机）(17)

叫做 Softplus 函数。

网站首页

返回栏目