1.4 联邦学习的分类及适用范围
在实际应用中,孤岛数据往往具有不同的分布特点。据此,联邦学习可以分为三类:横向联邦学习、纵向联邦学习、联邦迁移学习。本节将简要介绍各类方案对应的特点,以便读者初步了解不同业务场景中的联邦学习方法,三类联邦学习的架构和具体理论知识可参见第6章(纵向联邦学习)、第7章(横向联邦学习)和第8章(联邦迁移学习)。
假设有处于同一个领域的两个小公司A和B,A公司和B公司都拥有各自的数据集DA和DB。DA和DB都以矩阵形式表示,两个矩阵的行数据代表用户样本数据,矩阵的列数据代表用户特征,其中还分别拥有标签。A公司和B公司在进行联合训练时,可能存在以下四种情况:
(1)在数据集中,用户特征部分重叠较多,但是用户样本部分重叠较少。
(2)在数据集中,用户特征部分重叠较少,但是用户样本部分重叠较多。
(3)在数据集中,用户特征部分和用户样本部分都重叠较少。
(4)在数据集中,用户特征部分和用户样本部分都重叠较多。