5.3.2 基于标的物聚类的推荐

如果有了标的物的聚类,推荐就好办了。从用户历史行为中的标的物所在的类别挑选用户没有操作行为的标的物推荐给该用户,这种推荐方式是非常直观自然的。具体计算公式如下

其中,Rec(u)是给用户u的推荐,H是用户的历史操作行为集合,Cluster(s)是标的物s所在的聚类。

同时,有了标的物聚类,我们还可以做标的物关联标的物的关联推荐,具体做法是将标的物A所在类别中的其他标的物作为关联推荐结果。

那么怎么对标的物聚类呢?可行的方法是利用标的物的metadata信息,采用TF-IDF、LDA、Word2vec等方式获得标的物的向量表示,再利用K-Means聚类。具体的实现细节这里不介绍(可参看第3章),感兴趣的读者可以自行搜索相关材料深入学习。另外,也可以基于用户的历史操作行为,获得标的物的嵌入表示(矩阵分解、Item2vec等算法),用户行为矩阵的列向量也是标的物的一种向量表示。

本章参考文献[17][18][19][20]有更多关于用聚类来做推荐的算法,感兴趣的读者可以参考学习。

到此为止,我们讲完了基于关联规则、朴素贝叶斯、聚类做个性化推荐的方法。下面就基于这几个方法的思想来介绍三个工业级推荐引擎,供大家学习参考,同时也希望借助这几个工业级推荐系统的介绍加深大家对这三个方法的思路理解。