2.1 向量:多面手

几何视角

如图2.1所示,平面上,向量是有方向的线段(directed line segment)。线段的长度代表向量的大小(the length of the line segment represents the magnitude of the vector)。箭头代表向量的方向(the direction of the arrowhead indicates the direction of the vector)。

图2.1中,向量a起点(initial point)是原点O,向量的终点(terminal point)是A。如果向量的起点和终点相同,向量则为零向量(zero vector),可以表示为0

再次强调,本书中向量符号采用加粗、斜体、小写字母,比如a;矩阵符号则采用加粗、斜体、大写字母,比如A

图2.1 向量起点、终点、大小和方向

图2.2给出的是几种向量的类型。

和起点无关的向量叫做自由向量(free vector),如图2.2(a)。和起点有关的向量被称作固定向量(fixed vector),如图2.2(b)和(c)。方向上沿着某一个特定直线的向量为滑动向量(sliding vector),如图2.2(d)。

没有特别说明时,本书的向量一般是固定向量,且起点一般都在原点,除非特别说明。

图2.2 几种向量类型

坐标点

从解析几何角度看,向量和坐标存在直接联系。

一般情况下,直角坐标系中任意一点坐标可以通过多元组(tuple)来表达。比如,图2.3(a)所示平面直角坐标系上,A点坐标为(4, 3),B点坐标为(−3, 4)。

如图2.3(b)所示,以原点O作为向量起点、A为终点的向量对应向量a,而对应向量b

图2.3 平面坐标和向量关系

向量的元素也可以是未知量,如x=[x1, x2]Tx=[x1, x2, …, xD]T

Bk4_Ch2_01.py绘制图2.3(b)所示向量。matplotlib.pyplot.quiver()绘制箭头图。

继续丰富向量几何内涵

在几何上,切线指的是一条刚好触碰到曲线上某一点的直线。曲线的法线则是垂直于曲线上一点的切线的直线。将向量引入切线、法线可以得到切向量(tangent vector)和法向量(normal vector)。图2.4所示为直线和曲线某一点处的切向量和法向量,两个向量的起点都是切点(point of tangency)。

图2.4 切向量和法向量

梯度

自然界的风、水流、电磁场,在各自空间的每一个点上对应的物理量既有强度、也有方向。将这些既有大小又有方向的场抽象出来便可以得到向量场(vector field)。本书中,我们会使用向量场来描述函数在一系列排列整齐点的梯度向量。

图2.5(a)所示为某个二元函数fx1, x2)对应的曲面。把图2.5(a)比作一座山峰的话,在坡面上放置一个小球,松手瞬间小球运动的方向在x1x2平面上的投影就是梯度下降方向,也叫做下山方向;而它的反方向叫做梯度向量(gradient vector)方向,也叫上山方向。

图2.5(b)所示为在x1x2平面上,二元函数fx1, x2)在不同点处的平面等高线和梯度向量。坡面越陡峭,梯度向量长度越大。仔细观察,可以发现任意一点处梯度向量垂直于该点处的等高线。

二元函数fx1, x2)梯度向量定义为

fx1, x2)梯度向量中,我们看到了两个偏导数。

在求解优化问题中,梯度向量扮演着重要角色。本书将在第17章回顾偏导数,并讲解梯度向量。

图2.5 梯度向量