1.5 机器学习问题分类

机器学习可以应用于很多领域,主要问题可以归纳为以下几类(见图1-4)。

图1-4 机器学习问题具体类别的判断方法图

首先根据是否有监督,分为无监督学习(Unsupervised Learning)和有监督学习(Supervised Learning)。在机器学习中,这是一个很重要的分类,但如果之前没有接触过机器学习,“监督”这个词可能比较难理解,如果替换成“参考答案”是不是就熟悉多了?实际情况也正是如此,有监督学习就是有参考答案的学习,具体来说,就是数据集中包含了预测结果,譬如在房价的数据集中,除了给出面积、楼龄等数据外,真实房价也给了出来,这就是有监督学习,而无监督学习则相反。

根据预测的结果类型,有监督学习又分为回归问题和分类问题。如果预测结果是离散的,通常为分类问题,而为连续的,则为回归问题。

无监督学习没有参考答案,仅通过在样本之间进行比较计算来达成目标,常见的有聚类问题。