不可交换的矩阵乘法
在中学教科书中,已经引进了矩阵的概念。所谓矩阵,就是将n×m个数排成n行m列的矩形列阵,通常用一对圆括号将其括起来,也常常用一个大写字母表示矩阵,如
就是一个2行3列的2×3矩阵。
矩阵主要用来处理一些有关联的数据,比如在处理财务报表、实验数据、统计数据时经常会遇到。比如,表1显示的是某连锁商业公司各门店的销量统计表。
表1 (单位:件)
表1就可以表示成一个2×3矩阵。
19世纪中叶,英国数学家凯利(Arthur Cayley,1821—1895)系统建立了矩阵理论,规定了矩阵的算术运算。矩阵的加法比较简单,两个矩阵有相同的行数和列数,则它们的和就是对应位置的元素相加所得到的矩阵,例如,两个2×2矩阵相加为
矩阵乘法的规定有些奇怪,两个矩阵相乘,要求前一个矩阵的列数和后一个矩阵的行数相等,而其积在第i行、第j列的元素等于第一个矩阵的第i行和第二个矩阵第j 列对应位置元素相乘再求和所得。例如,两个2×2矩阵的乘积为
和代数中用ab表示乘法a×b一样,矩阵乘法中的符号×通常省略不用。
表2 (单位:元)
一些初学矩阵的人不太理解矩阵乘法:为什么矩阵乘法规定得如此古怪,而不是像加法一样将对应位置的元素相乘呢?其实,这样定义的矩阵乘法更符合实际需要。以上面的商业公司为例,假设某门店销售商品A计80件,每件商品单价为20元,则计算该门店销售商品A的营业额要用乘法,为80×20=1 600(元)。现在考虑该公司多个门店以及销售多个商品的情况。除前面的销量表外,如果还有如下的商品单价和单位利润表(见表2),则各门店的营业额和营业利润如下:门店1,营业额=80×20+25×100+120×15=5 900(元),利润=80×5+25×20+120×4=1 380(元);门店2,营业额=45× 20+30×100+85×15=5 175(元),利润=45×5+30×20+85× 4=1 165(元),则有如表3所示的营业额和利润表格。
表3 (单位:元)
表3用矩阵表示,即为
矩阵乘法这样定义的一个更重要的因素是来自数学中的线性变换。假设有如下变量之间的关系:
将②式代入①式,有
这些变换可以用矩阵来表示,变换①, ②, ③分别可表示为
以及。
,和分别称为变换①, ②, ③的系数矩阵,可见③式的系数矩阵就是①, ②式系数矩阵的乘法,即
可见,这样规定矩阵乘法既是实际计算的需要,也是数学理论的需要,是十分自然的。
矩阵乘法还有一个比较奇怪的性质。众所周知,两个数a与b相乘,总有a×b=b×a,这就是乘法交换率。但对于矩阵乘法,若以A, B表示两个矩阵,通常A×B与B×A并不相等。以上面的系数矩阵为例:
这就是说,矩阵乘法与相乘的两个矩阵的前后次序有关。
矩阵乘法的不可交换性也说明变换和其次序有关。旋转是一种变换,可以用矩阵来表示,比如在空间坐标系Oxyz中,绕x轴旋转90°和绕z轴旋转90°的系数矩阵分别为
显然,先绕x轴旋转90°、再绕z轴旋转90°与先绕z轴旋转90°、再绕x轴旋转90°的结果是不同的,而前者的系数矩阵为
后者的系数矩阵为
两者也不相同。
矩阵乘法的不可交换性这一点与数的乘法完全不同,乘法交换律是如此地理所当然,以至于遇到不可交换的矩阵乘法时让人们心存疑惑。然而,不可交换的矩阵乘法在量子力学的创建中发挥了重要作用。
图1
1925年前后,基于经典力学的旧量子论已经走到末路,客观上需要新的理论来取代。1925年夏,时年24岁的 海 森 堡(Werner Heisenberg, 1901—1976,见图1)为躲避花粉过敏来到赫尔格兰(Helgoland)岛,在岛上,海森堡以其天才的创造力构建了一套全新的量子理论。然而,他的新理论却必须借助一种奇怪的乘法,这种乘法的结果取决于相乘的次序,即A×B-B×A未必是0,这一点困扰着海森堡。海森堡从赫尔格兰岛回到哥廷根,将其论文交给他的老师玻恩(Max Born,1882—1970)。终于有一天,玻恩想起曾经学过的矩阵乘法,原来,海森堡用到的乘法正是矩阵乘法。尽管矩阵理论早在半个多世纪前已经建立,矩阵乘法对数学家来说已经毫不奇怪,但对于大多数物理学家来说还是个新鲜事。后来,玻恩与其学生约旦(E.P.Jordan)和海森堡一起,用矩阵论完善了海森堡的理论,后人称其为矩阵力学,这正是量子力学的重要组成部分。海森堡因其在创建量子力学理论中的重要贡献,于1932年获得诺贝尔物理学奖。
复旦大学数学科学学院 邱维元