8.4.1 用户冷启动

基于上面7大思路,针对新注册用户或者只有很少用户行为的用户,可行的解决冷启动的策略有如下5种。

1.提供完全非个性化的推荐

给用户推荐非个性化的标的物作为解决冷启动的方法,主要有基于先验数据的推荐和基于多样性的推荐。

(1)利用先验数据做推荐

可以利用新热标的物作为推荐。人都是有喜新厌旧倾向的,推荐新的东西肯定能抓住用户的眼球(比如视频行业推荐新上映的大片)。推荐热门标的物的另外一个原因是,由于这些标的物是热点,而人是有从众心理的,如果大家都在看,那么新用户喜欢的可能性也比较大(比如视频行业推荐最近播放量topN的热门节目),基于二八定律,20%的头部内容会占到80%的流量,所以基于热门的推荐效果往往还不错。热门推荐一般也用来作为新推荐算法的AB测试的基准对照组。

还可以推荐常用的标的物及生活必需品。如在电商行业推荐生活必需品,这些物品是大家使用频次很高的,生活中必不可少的东西(比如纸巾等),将这些物品推荐给新用户,用户购买的可能性会更大。

对于特殊行业,可以根据该行业的经验给出相应的推荐策略。如婚恋网站,给新注册的男生推荐美女,新注册的女生推荐帅哥,效果肯定不会差。

(2)给用户提供多样化的选择

这里举个视频行业的例子,方便大家更好地理解。按照标签视频可以分几大类,如恐怖、爱情、搞笑、战争、科幻等,每大类选择一个并推荐给新用户,这样总有一个是用户喜欢的。

如果是新闻类产品(如今日头条),可以采用TF-IDF算法将文本转化为向量,再对文本做聚类,每一类代表一个不同的新闻类型,可以采用与上面视频类似的推荐策略每类推荐一个。

如果是图像或者视频(如快手),可以利用图像相关技术将图片或者视频转化为特征向量,基于该向量聚类,再采用每类推荐一个的策略。可以用OpenCV及深度学习技术从视频图像中提取特征,图像视频分析对技术要求更高,也需要大量计算。

这种方法要想保证有比较好的效果,类之间需要有一定的区分度。也可能碰到给用户的类是用户不喜欢的,最好是从一些热门的类(可能需要编辑做一下筛选)中挑选一些推荐给用户,对于太冷门的类,用户不喜欢的概率较大。

2.利用新用户在注册时提供的信息

用户在注册时的信息包括人口统计学信息、社交关系、用户主动填写的兴趣点等,这些信息都可以用来解决用户冷启动问题。下面分别进行讲解。

(1)利用人口统计学数据

很多产品在新用户注册时会要求用户填写一些信息,这些用户注册时填写的信息就可以作为为用户提供推荐的指导。典型的比如相亲网站,新用户注册时需要填写自己的相关信息,填写的信息越完善代表越真诚,这些完善的信息就是系统为用户推荐相亲对象的素材。

基于用户的信息(如年龄、性别、地域、学历、职业等)来做推荐,这要求平台事先知道用户的部分信息,这在某些行业是比较困难的,比如OTT端的视频推荐,因为用户主要通过遥控器操作,不方便输入信息。

这两年由于安全问题越来越严峻,用户也越来越不愿意填写自己的信息了,所以通过这个渠道来获取用户的画像是比较困难的。

(2)利用社交关系

有些APP在用户注册时要求导入社交关系,借此,这些APP可以将用户的好友喜欢的标的物推荐给用户。利用社交关系来做冷启动,特别是在有社交属性的产品中,是很常见的一种方法。社交推荐最大的好处是用户基本不会反感推荐的标的物(可以适当加一些推荐解释,比如“你的朋友XXX也喜欢”),所谓“人以群分”,你的好友喜欢的东西你也可能会喜欢。

(3)利用用户填写的兴趣点

还有一些APP,强制用户在注册时提供自己的兴趣点,有了这些兴趣点就可以为用户推荐他喜欢的内容了。通过该方法可以很精准地识别用户的兴趣,对用户兴趣把握相对准确。这是一个较好的冷启动方案,但是要注意产品的逻辑需简单易懂,不能让用户填写太多内容,用户操作也要非常简单,用户的耐心是有限的,若占用用户太多时间,操作太复杂,用户可能就不使用你的产品了。

3.基于内容做推荐

当用户只有很少的行为记录时,很多算法(比如协同过滤)无法给用户做很精准的推荐,这时可以采用基于内容的推荐算法。对于基于内容的推荐算法,只要用户有少量行为就可以给用户做推荐(比如你看一部电影,至少就知道你对这个题材的电影有兴趣,那么就可以推荐类似题材的电影),不像基于模型的算法那样需要有足够多的行为数据才能训练出精度够用的模型。

4.采用快速试探策略

这类策略一般可用于新闻短视频类应用,先随机或者按照完全非个性化推荐的策略给用户推荐,基于用户的点击反馈快速发现用户的兴趣点,从而在短时间内挖掘出用户的兴趣。由于新闻或者短视频时长短,只会占用用户的碎片化时间,试探出用户的兴趣也不会花太久。对于现在的新闻应用(如今日头条),用户可以采用下拉的方式快速选择自己感兴趣的内容,抖音、快手也一样,可以很快地切换视频,这些良好的交互形态有利于更好地挖掘用户兴趣点。

5.采用兴趣迁移策略

当一个公司已有一个成熟的APP,准备拓展新的业务、开发新的APP时,可以将用户在旧有APP上的特征迁移到新APP中,从而做出推荐。比如今日头条做抖音时,虽然对抖音来说,用户是新用户,但是如果这个用户刚好是头条的用户(抖音前期是通过头条来导流的,所以抖音很大一部分用户其实就是从头条来的),那么该公司是知道这个用户的兴趣点的,从而在抖音上就很容易为他做推荐了。

兴趣迁移策略借鉴了迁移学习的思路,在基于主产品拓展新产品形态的情况下,特别适合为新产品做冷启动。我们在9.5节中会讲解盒马鲜生采用迁移学习技术,利用淘宝数据来做冷启动的例子。