1.2 机器学习类别
根据训练数据是否有标签,机器学习可分四类:有监督学习(有标签)、无监督学习(无标签)、半监督学习(有部分标签)和增强学习(有评级标签)。深度学习可以应用到这四类机器学习中,而迁移学习是一种新类别。
1.2.1 有监督学习
有监督学习(Supervised Learning)利用输入数据及其对应的标签来训练模型。这种学习方法类似学生通过研究问题和参考答案来学习,在掌握问题和答案之间的对应关系后,学生对于相似问题可自己给出答案。
在有监督学习中,数据=(特征,标签),其主要任务是分类和回归。下面以前面介绍的詹姆斯的个人数据统计预测结果为例来具体介绍。
如果预测的是离散值,例如比赛结果为赢或输(见左表),则此类学习任务被称为分类。
如果预测的是连续值,例如詹姆斯的效率为65.1、70.3等(见左表),则此类学习任务被称为回归。
1.2.2 无监督学习
无监督学习(Unsupervised Learning)用于找出输入数据的模式。比如,它可以根据电影的各种特征做聚类,为电影推荐系统提供标签。此外,无监督学习还可以降低数据的维度,它可以帮助我们更好地理解数据。
在无监督学习中,数据=(特征,)。在上例中,我们除可以根据詹姆斯的个人数据统计来预测骑士队输赢或者詹姆斯个人效率值外,还可以对该数据做聚类,即将训练集中的数据分成若干组,每组成为一个簇。
假设使用聚类方法将下表所示的数据聚成两个簇:A和B,如下图所示。
两个簇:A和B
后来发现簇A代表赢,簇B代表输。聚类的作用就是可以找到一个潜在的原因来解释为什么样例1和样例4可以赢得比赛。难道真的是只要詹姆斯“三双”[3]就可以赢得比赛?
1.2.3 半监督学习
半监督学习(Semi-Supervised Learning)介于有监督学习和无监督学习之间。有监督学习只利用标记的样例集进行学习,而无监督学习只利用未标记的样例集进行学习。在很多实际问题中,只有少量的数据带有标签,因为有时对大多数数据进行标记的代价很高,而半监督学习适用于样例集中有一部分数据没有标签的情况。
在半监督学习中,数据=(特征,标签)或者(特征,)。例如对猫和狗的照片进行分类:
● 有监督学习根据已有的猫和狗的标签,对新照片进行分类。
● 无监督学习将照片里的特征聚成两大类(猫和狗)。
● 半监督学习结合分类与聚类的思想,先将未标记的照片聚类生成标签,再结合已有的标签进行分类。
半监督学习可以降低获取标签的成本,很多时候也可以取得比无监督学习更好的效果。
1.2.4 增强学习
增强学习(Reinforcement Learning)是在行动中学习,与有监督学习不同,它不需要输入和标签,而是需要根据环境对智能体(Agent)在不同状态(State)下的行为(Action)进行评价。评价通常用回报表示,正回报就是奖励,负回报就是惩罚。
在增强学习中,数据=(特征,评价)。以股票交易为例,股票市场就是环境,智能体就是交易系统,股票价格就是状态,而买卖一定数量的股票就是行为。交易系统会从一个很简单的交易开始,起初大概率是亏钱的(回报为负),但是在学习过程中,交易系统与市场不断交互并得到反馈,从而会不断调整策略,越来越强大。
1.2.5 深度学习
深度学习(Deep Learning)只是机器学习的一种方法,它受生物学启发,通过各种神经网络来建模。深度学习可以解决以下问题(见下图)。
● 有监督学习里的分类问题(卷积神经网络在图像分类中的应用[3])。
● 有监督学习里的回归问题(循环神经网络的长短期记忆网络在时间序列上的应用[4])。
● 无监督学习里的聚类问题(自编码器在图片聚类上的应用[5])。
● 半监督学习里的生成问题(生成对抗网络在图像生成中的应用[6])。
● 增强学习里的玩游戏问题(在Atari游戏中的应用[7])。
深度学习无处不在,但它目前最让人期待的应用也许就在迁移学习上。
深度学习神经网络模型
1.2.6 迁移学习
迁移学习是把已训练好的模型参数迁移到新的模型中进行训练,而不需要从零学习。迁移学习的核心问题是——找到新问题与原问题之间的相似性,只有这样才可以顺利地实现知识的迁移。迁移学习是中国领先于其他国家的几个人工智能领域之一,目前比较权威的迁移学习概述性文章见参考资料[9]。
在迁移学习中,有一个有标签的数据s=(特征s,标签s)和一个无标签的数据t=(特征t,),在这两个领域中,特征s和特征t的分布不同,我们要借助数据s的知识(模型参数)来学习数据t中的知识(标签t)。
人类与生俱来就具有迁移学习的能力,比如我们学会C++,就可以触类旁通地学习Python,因为这些知识具有相似性。迁移学习也可以被分成有监督迁移学习、无监督迁移学习、半监督迁移学习和增强迁移学习,而这四类迁移学习都借助了深度学习的神经网络。