神经分解机和系统分解机的区别（三分钟了解推荐系统中的分解机方法）

威哥 2023-08-13 12:57:20 505

神经分解机和系统分解机的区别（三分钟了解推荐系统中的分解机方法）3.2、FM的概率形式3.1、FM优化的目标一、FM提出的原因二、FM模型三、FM模型的求解

数据学习（DataLearner）- 关注人工智能算法、学术论文和程序开发

头条的内容显示有些不太友好，后续我们还会推出一些具体的推导以及代码实现方法，可以看原文：

datalearner/blog/1051509523356807

神经分解机和系统分解机的区别（三分钟了解推荐系统中的分解机方法）(1)

因子分解法在很多预测问题上都有很好的准确性。但是分解模型运用在一个新的问题上并不是一个简单的事情。目前有很多的分解模型，最流行的应该是矩阵分解（Matrix Factorization， MF）。这是预测两个分类变量之间关系的模型。类似的，张量分解（Tensor Factorization，TF）是矩阵分解的扩展，它可以预测多个分类变量之间的关系，张量分解有很多例子，如Tucker Decomposition，Parallel Factor Analysis以及Pairwise Interaction Tensor Factorization等。除了分类变量，还有如SVD 、STE、FPMC、BPTF等等可以用来处理非分类的变量（这些模型都可以去原文找到对应的，基本上做矩阵分解的人应该都知道类似的原理大约是什么样子的）。作者列举了这么多方法的原因就是想说明，针对新的问题，我们总是需要设计新的模型来求解，这是很耗费时间的。因此，作者提出了一个新的模型，即分解机模型（Factorization Machine FM），这是一个通用的方法，它可以通过特征工程来模仿大多数分解模型。据此，作者还提出了一个和LIBSVM很相似的通用的工具——LIBFM来帮助大家解决因子分解法的模型的应用。

一、FM提出的原因

二、FM模型

三、FM模型的求解

3.1、FM优化的目标
3.2、FM的概率形式

一、FM提出的原因

首先我们解释一下作者提出FM的初衷。在现实情况下，所有的特征对象一般都是使用一些向量来表示的，简单表示这些特征的方式就是独热模型（One-hot）。举个简单的例子，假使总共有5个商品，那么每一个商品都可以用一个5维的向量表示：

因此，一个推荐问题可以用下图来表示：

神经分解机和系统分解机的区别（三分钟了解推荐系统中的分解机方法）(2)

一个更好的示意图：

神经分解机和系统分解机的区别（三分钟了解推荐系统中的分解机方法）(3)

每一条购买记录都可以使用一个向量表示，上图中x1、x2、x3都是代表了同一个用户，但是看了三个不同的电影，后面还有些其他特征等等。最后每一个记录有个对应的类标签yy。但是这样的数据表示很稀疏，现实中电影太多了，用户也很多，这么大的一个稀疏矩阵不是很容易求解，即使求出来参数，由于非零数太少，结果一般也不够准确。而且特征之间很有可能有关联，所以在实际建模中还要考虑特征之间的交互（关于交互项可以花个三分钟参见：回归模型中的交互项简介（Interactions in Regression））。交互项一般用一个新的权重ww和项目之间的乘积表示，以二阶交互为例，需要两个交互项都是非零的情况下才能产生一个非零的交互项。这就导致了数据更加稀疏。为了解决稀疏性，可以借助矩阵分解的思想。矩阵分解会讲一个巨大的稀疏矩阵分解成两个隐矩阵，通常隐矩阵的维度要远小于原来矩阵的维度，因此可以有效的降低稀疏性。

二、FM模型

FM提出来的与原来的方法最大的不同就是将交互项的系数用一个分解出来的矩阵（向量）乘积表示。以2阶交互为例，原来大家的回归模型是：

神经分解机和系统分解机的区别（三分钟了解推荐系统中的分解机方法）(4)