1.4.2 横向联邦学习
横向联邦学习的主要应用场景为用户特征部分重叠较多,但是用户样本部分重叠较少。如果两个或者多个数据集中的用户特征部分重叠较多,那么我们就按照横向切分的方式从数据集中取出特征完全相同但是用户不同的数据进行训练。简单来说,横向联邦学习根据用户维度进行切分(如图1-4所示),是一种基于用户样本的联邦学习方式。比如,对于不同地区的数据运营商服务(如四川省的移动服务、云南省的移动服务等)来说,因为其分布在不同的区域,所以用户样本部分重叠较少,但是这些不同区域的业务特征是很相似的,因此特征空间的重叠区域较大。这样的数据集就适合采用横向联邦学习的方式进行训练。
图1-4 横向联邦学习示意图
横向联邦学习的典型应用场景是“端-云”服务框架。该场景主要针对拥有同构数据的大量终端用户,比如在互联网中使用同一个App的用户,服务商通过融合不同终端用户的数据进行联合建模。在经过用户授权后,用户的个人隐私均不出个人终端设备(手机、平板电脑等)就可以参与模型的训练与更新。横向联邦学习通过去中心化、分布式的建模方式在保证用户个人隐私的前提下,利用了不同用户的数据,建立了有价值的联邦学习模型。在文献[30]中,研究者将横向联邦学习总结为
式(1-2)中各项的含义与式(1-1)中各项的含义相同。