- 构建企业级推荐系统:算法、工程实现与案例分析
- 刘强
- 1050字
- 2021-08-06 15:00:10
8.6 设计冷启动需要注意的问题
上面讲了冷启动的很多实现方案,不同的产品需要结合自身产品特征和拥有的数据、资源来选择采用什么方式解决冷启动。这里讲一下冷启动方案落地过程中需要注意的事情,让大家更好地将冷启动策略应用于真实的业务场景中。
1.逐步迭代让冷启动效果更好
冷启动有很多方法,我们需要通过AB测试选择一种效果更好的方法,并不断优化,让冷启动的效果越来越好。
2.量化冷启动用户的比例及转化效果
如上所述,要进行冷启动方案的AB测试,需要将用户的行为日志埋点,日志中需要包含用户标识(userid),采用的算法标识、用户具体行为(点击、播放、购买、点赞)等,这样就可以通过分析日志知道每天的DAU(Daily Active User)中有多少用户采用了冷启动策略、各种冷启动策略及非冷启动策略的比例、冷启动策略的转化效果及与其他非冷启动策略的转化效果的对比。只有知道了具体数据,才能够知道从哪些维度去优化冷启动方案。
3.采用级联推荐策略
一般来说协同过滤的效果比基于内容的推荐好,而基于内容的推荐比冷启动推荐好,我们在给用户做推荐时可以采用级联策略。比如如果协同过滤有推荐结果就采用协同过滤的结果,没有的话(可能是新注册不久的用户)就采用基于内容的推荐,如果用户没有操作过任何内容,这时可以采用冷启动推荐(如热门推荐等)。这样做效果肯定会更好,因为总是优先使用最好的算法,虽然实现起来可能会复杂一些,但是为了给用户提供最好的推荐体验,这也是值得的。
在笔者公司的相似视频推荐中采用的就是这种策略。如果某个视频有基于Item2vec算法(见本章参考文献[4],微软提出的一种基于Word2vec的变种算法)计算出的相关视频,就采用该算法的结果;如果没有就采用基于标签的相似推荐;如果该视频是新视频,标签不完善,就采用基于热门的冷启动推荐策略。
采用级联策略的目的主要是优先利用所有已知的最好信息,尽量减少采用冷启动推荐的比例,最大限度地提升用户的使用体验。
4.需要维护提供标的物的第三方利益
对于依赖第三方提供标的物的平台,如电商、新闻、短视频、小说阅读等,需要维护标的物提供方生态的繁荣。怎么保证新的标的物提供方可以获得流量、挣到钱,让提供优质标的物的提供方挣更多的钱,也是很重要的问题,这就涉及新标的物的冷启动问题。需要确保更好地将优质的标的物尽量推荐给更多的用户,质量差的标的物少推荐,这就涉及很多业务策略和评估指标了。前面讲到的流量池的思路就是一种比较好的方案。
在最后,笔者基于自己的思考和经验,讲讲冷启动未来的发展趋势。在不久的将来,随着技术的发展,肯定会有很多新的解决冷启动的策略和方法出现。