![矩阵力量:线性代数全彩图解+微课+Python编程](https://wfqqreader-1252317822.image.myqcloud.com/cover/642/52842642/b_52842642.jpg)
2.6 向量内积:结果为标量
向量内积(inner product),又叫标量积(scalar product)、点积(dot product)、点乘。注意,向量内积的运算结果为标量,而非向量。
给定a和b两个等行数列向量,即
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P53_1258693.jpg?sign=1739374561-oR6KpxnrbLrNmKVVqrsqBAh7oAGONk6w-0-54bfa0c58feec8cb1e906ac5bf7753ad)
列向量a和b的内积定义为
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P54_1260168.jpg?sign=1739374561-tF3wa6AlB1CIuKJmdemH13lxppdt1O5a-0-a6fd3c141deeee93960fa9225680c417)
式(2.34)也适用于两个等列数行向量计算内积。注意,向量内积也是一种“向量→标量”的运算规则。
图2.16所示的两个列向量a和b的内积为
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P54_1260169.jpg?sign=1739374561-X48F6722mhmsIkAd5nbNEQr0KcQyOibo-0-da81243948daae068df73e2db97be8b6)
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P54_1260170.jpg?sign=1739374561-xW7WdbuUkE8q4cVOM3rtwfh6fjYW2hN9-0-82f1ed54e0167205fdb6831becb8256a)
图2.16 a和b两个平面向量
Bk4_Ch2_06.py计算上述向量内积。此外,还可以用numpy.dot()计算向量内积。值得注意的是,如果输入为一维数组,则numpy.dot()输出结果为内积。
如果输入为矩阵,则numpy.dot()输出结果为矩阵乘积,相当于矩阵运算符@,如Bk4_Ch2_07.py给出的例子。
numpy.vdot()函数也可以计算两个向量内积。如果输入是矩阵,则矩阵会按照先行后列顺序展开成向量之后,再计算向量内积。Bk4_Ch2_08.py给出相关示例。
常用的向量内积性质如下:
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P54_1260171.jpg?sign=1739374561-QtREEa9mj2umKWVS49vIYnwJqHE4ng7b-0-6a40000a17861430168623a15c04c9ca)
请读者格外注意以下几个向量内积运算和Σ求和运算的关系:
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P55_1266082.jpg?sign=1739374561-NCFr1l9A7CUKsTfRgYNFq08SRVAPyDpd-0-c662e4e11c433a5984eb06d876ee5197)
其中
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P55_1266083.jpg?sign=1739374561-7STPnznGVnmXRTVrKxbLe7JHTpk2O93p-0-46ef0085559894f8605ea1a7cbc41662)
本书第5章还会从矩阵乘法角度介绍更多求和运算。
几何视角
如图2.16所示,从几何角度看,向量内积相当于两个向量的模(L2范数)与它们之间夹角余弦值三者之积,即
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P55_1266084.jpg?sign=1739374561-1PeJGcsmN6NtZCY0vv5cQh0x6XgnPPu2-0-65e2487c65a41ec818092f3521aa2f31)
注意:式(2.39)中θ代表向量a和b的“相对夹角”。
此外,向量内积还可以从投影(projection)角度来解释,这是本书第9章要介绍的内容。
a的L2范数也可以通过向量内积求得,即有
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P55_1266086.jpg?sign=1739374561-jZp27FWBtr0RhQrxk69rn9CZlvr6fFxV-0-772bfab066f8d454fba6db75647ea173)
左右等式平方得到
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P55_1266087.jpg?sign=1739374561-e5VnCvwvbfISjIQmkBQqtu8fhwgX90mQ-0-9c80eb92b3b9a4dfd3af4a01c6ff4b3a)
式(2.41)相当于“距离的平方”。
柯西-施瓦茨不等式
观察,我们可以发现cosθ的取值范围为[−1, 1],因此a和b内积的取值范围为
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P55_1266088.jpg?sign=1739374561-GVg7eB3SF4rfPML4ZuDLB11gGJpju7oM-0-4b7d184e1920ee86a1d9bf647838a0a4)
图2.17所示为7个不同向量的夹角状态。
θ=0°时,cosθ=1,a和b同向,此时向量内积最大;θ=180°时,cosθ=−1,a和b反向,此时向量内积最小。
平面上,非零向量a与b垂直,a与b夹角为90°,两者向量内积为0,即
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P55_1266089.jpg?sign=1739374561-CbkeVXPYQ2tGrziTRAJ1BkOWHN2hd4qy-0-6eb7ad9671346f073916a8e42de2ee61)
多维向量a与b向量内积为0,我们称a与b正交(orthogonal)。本书上一章提到,正交是线性代数的概念,是垂直的推广。
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P56_1268010.jpg?sign=1739374561-yBDG3BUEmTfTiq69uROC1FecBhzp7KUC-0-ed828536bb6d279d25d07f909b28e015)
图2.17 向量夹角
有了以上分析,我们就可以引入一个重要的不等式——柯西-施瓦茨不等式(Cauchy–Schwarz inequality)
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P56_1268011.jpg?sign=1739374561-oDbtVkPF87yigkGxDKR63rWMmut1HBYm-0-fb0a6c7124109006d732dad70b545b63)
即
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P56_1268012.jpg?sign=1739374561-t0JepfJjrp5pVM5gPLDwEjRyFPo78TPU-0-c01f7e7e572c95cf80dae50b7ede4c1b)
其中:为a与b向量内积的绝对值。
用尖括号来表达向量内积,可以写成
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P56_1268014.jpg?sign=1739374561-xpKxi7SYXOVAQf1xbIgx1qIW4Nnkkfza-0-e193a4a2f5d634b90f82908c6aa3b302)
即
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P56_1268015.jpg?sign=1739374561-ZkpFfD9PZhPZd2QO6JJ5tGZKXWBUJqWD-0-796c3c0f35a72dc2d86b2afe6baf8aba)
在空间中,上述不等式等价于
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P56_1268018.jpg?sign=1739374561-baMzjmCoP0aEOwVz3vShfrVhcrG9lxJM-0-73539fbd62f75b061f6c4b7c5fa23568)
余弦定理
回忆丛书第一本书讲解的余弦定理(law of cosines)
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P57_1269532.jpg?sign=1739374561-ADh8Vre1tiUTDAHDxZbj4EJvwMtN3ipj-0-3d81fac9d8d865e6e8516e1e7e8f745c)
其中:a、b和c分别为图2.18所示三角形的三边的边长。下面,我们用余弦定理来推导式(2.39)。
如图2.18所示,将三角形三个边视作向量,将三个向量长度代入式(2.49),可以得到
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P57_1269533.jpg?sign=1739374561-thnwK5HAVzGuJ4E2DQOSl6IpBjeFrwi7-0-c7a2fd39866d8b6734f6516e4604f93a)
向量a和b之差为向量c,即
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P57_1269535.jpg?sign=1739374561-0AcxmxLezs2n4mHWPsSml7qC5yTOjFpy-0-c53e77d6c9e0134a7423963b28ce333c)
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P57_1269537.jpg?sign=1739374561-rZKmi2xUxAui6dUJoE9Zj5STVH0tJT1B-0-37b2162aa036be2bf24d57b5128f0201)
图2.18 余弦定理
式(2.51)等式左右分别和自身计算向量内积,得到等式
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P57_1269539.jpg?sign=1739374561-SW5ZiUkKhmNu5W1wtxUeSJ6XMLXt6tPI-0-675414c70294a9ec1e036549313ee9df)
整理得到
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P57_1269541.jpg?sign=1739374561-2r7zN5HQb87Y37JK6d2BtYxnozWIuGut-0-5299a84c6951599bc8ad189ec9888eb1)
利用式(2.41),式(2.53)可以写作
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P57_1269542.jpg?sign=1739374561-Faf0g8RpoO1KBz8q6Du8nIb6FtptGqn9-0-eb53e15687daf1dd35f155dd9a7c2917)
比较式(2.50)和式(2.54),可以得到
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P57_1269543.jpg?sign=1739374561-4R5bo8xSoa5Hbc4zz5kot7Pr4VV7yEZd-0-2c98104ddf6f013016c2136427abd825)
在概率统计、数据分析、机器学习等领域,向量内积无处不在。下面举几个例子。
在多维空间中,给定A和B坐标为
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P58_1274347.jpg?sign=1739374561-AFiowupNyeQspswO2rIcg5DW3zTsF7So-0-07b86c8d03d8878fdb20fef008f3e623)
计算A和B两点的距离AB为
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P58_1274348.jpg?sign=1739374561-xhzX3pXaO6j771yjRYvSVS4cP1txuEvB-0-92a79f4c8d2dbe66cd7284aaa5a30bcd)
用起点位于原点的向量a和b分别代表A和B点,AB距离就是a−b的L2范数,也就是欧几里得距离
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P58_1274349.jpg?sign=1739374561-9OSd0Gou6AziJLjd4aA7B26OSIuXJtuH-0-fae4b5a56f4ae1d0f2f6c4d01e00c5fe)
回忆《数学要素》一册中介绍的样本方差公式,具体为
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P58_1274350.jpg?sign=1739374561-1bDnA6XeWLoYwqnGhYUpunRClw3FuDv7-0-9db3b7fd80848ee9eb4b4e077ea09ac2)
注意:对于总体方差,式(2.59)分母中的n–1应改为n。还默认X为有n个相等概率值的平均分布。
令x为
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P58_1274352.jpg?sign=1739374561-SsKUCpFlQsJEZLOm2gquAiNhSp97VqgX-0-806301b20be783b8778b52c9f4693122)
式(2.59)可以写成
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P58_1274353.jpg?sign=1739374561-XuudWQ84tEQE6A0r7cbZFNqRPfubycSv-0-96be8ef3bfaa86ea21c5d0998fa71d16)
根据广播原则,x−µ相当于向量x的每一个元素分别减去µ。
回忆总样本协方差公式
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P58_1274354.jpg?sign=1739374561-QVXPaSuYsO9fFfqtTVNbInfsIAqXRiTi-0-9c26eee14d3b2264b311072fa04b95e4)
同样,对于总体协方差,式(2.62)分母中的n–1改为n即可。
同样利用向量内积运算法则,式(2.62)可以写成
![](https://epubservercos.yuewen.com/C88560/31398492103476706/epubprivate/OEBPS/Images/Figure-P58_1274355.jpg?sign=1739374561-CXLTG37p86drNDlmizvZUeBKnAwFZUrA-0-b10e4aa99febe3c56e244cd4986d8b2f)
本书第22章将从线性代数角度再和大家探讨概率统计的相关内容。