嵌入式系统程序开发过程(嵌入方法在推荐系统中的应用)
嵌入式系统程序开发过程(嵌入方法在推荐系统中的应用)参考文献12提出了一个CoFactor模型,将矩阵分解和Word2Vec(参考文献27中证明Word2Vec嵌入等价于一类PMI矩阵的分解,本文作者也是采用的PMI分解的思路,而不是直接用Word2Vec)整合到一个模型中来学习嵌入并最终给用户做推荐,也是一个非常不错的思路。 的上下文中)数量。 最终可以用随机梯度下降算法来训练公式2中的模型,估计出U 、V。读者可以阅读参考文献1、2、3、4对Word2Vec进行深入学习和了解。
这里
是logistic函数,M是采样的负样本(这里负样本是指抽样的词
不在词目标
的上下文中)数量。
最终可以用随机梯度下降算法来训练公式2中的模型,估计出U 、V。读者可以阅读参考文献1、2、3、4对Word2Vec进行深入学习和了解。
参考文献12提出了一个CoFactor模型,将矩阵分解和Word2Vec(参考文献27中证明Word2Vec嵌入等价于一类PMI矩阵的分解,本文作者也是采用的PMI分解的思路,而不是直接用Word2Vec)整合到一个模型中来学习嵌入并最终给用户做推荐,也是一个非常不错的思路。
参考文献28借助Word2Vec的思路,提出了Prod2Vec模型,该算法利用发给用户的电子邮件广告数据,根据用户的邮件点击购买回执了解用户的偏好行为,通过将用户的行为序列等价为词序列,采用Word2Vec类似的方法进行嵌入学习获得商品的嵌入向量,最终给用户进行个性化推荐。该算法部署到线上,有9%点击率的提升。参考文献16基于Prod2Vec模型,提出了一种整合商品metadata等附加信息的Meta-Prod2Vec算法模型,提升了准确率,并且可以有效解决冷启动问题,感兴趣的读者可以阅读学习这两篇文章。
有很多开源的软件有Word2Vec的实现,比如Spark、gensim、TensorFlow、Pytorch等。我们公司采用的是gensim,使用下来效果不错。
- 基于有向图嵌入
给定一个图
,V、E分别代表图的顶点和边的集合。所谓图嵌入就是学习每个顶点在低维空间