- 构建企业级推荐系统:算法、工程实现与案例分析
- 刘强
- 372字
- 2021-08-06 14:59:59
6.4.1 整合偏差项
在6.2节,用户u对标的物v的评分采用公式来预测,但是不同的人对标的物的评价可能是不一样的,有的人倾向于给更高的评分,而有的人倾向于给更低的评分。对于同一个标的物,也会受到外界其他信息的干扰,影响人们对它的评价(比如可能由于主演的热点事件导致某视频突然火爆),这两种情况是由用户和标的物引起的偏差(bias)。我们可以在这里引入偏差项,将评分表中观察到的值分解为4个部分:全局均值(global average)、标的物偏差(item bias)、用户偏差(user bias)和用户标的物交叉项(user-item interaction)。这时,我们可以用如下公式来预测用户u对标的物v的评分:
其中μ是全局均值,bv是标的物偏差,bu是用户偏差,是用户与标的物交叉项。那么最终的优化问题就转化为
该优化问题同样可以采用SGD或者ALS算法来优化,该方法在开放数据集及工业实践上都被验证比不整合偏差项的方法有更好的预测效果(见本章参考文献[8])。