1.5 小结

  • 机器学习是一种从数据生成函数而不是直接编写函数的技术。它可以用来解决那些过于模糊而无法直接编程解决的问题。
  • 要开展机器学习,通常需要先选择一个模型,即一族通用的数学函数,接下来对模型进行训练,即用某种算法找到这一族函数中最适合的那个。研究机器学习时,最重要的技艺就在于如何选择正确的模型,以及将特定数据集转换成模型能够处理的格式。
  • 机器学习有3个主要的领域,分别是监督学习、无监督学习和强化学习。
  • 监督学习指利用已知的正确样本数据来学习一个函数。在能够得到人类行为或知识的样本时,可以使用监督学习在计算机上模仿它们。
  • 无监督学习是指在事先对数据的结构一无所知的情况下,从数据中抽取结构的算法。它的一个常见应用是将数据集拆分为多个逻辑组,即聚类问题。
  • 强化学习指通过反复试错来学习一个函数。如果要编程评估程序完成目标的程度,就可以应用强化学习,通过多次反复试错来逐步改进程序。
  • 深度学习是指在机器学习中使用的一种特殊的模型,它擅长处理非结构化的输入(如图像或文本)。它是当今计算机科学中最激动人心的领域之一,而且正在不断地突破我们对计算机能做什么的想法的极限。

[1] 原著中的单字指的是英文字母。——译者注