二次型与矩阵对应关系

f(x)=a11x12+a22x22++annxn2+2a12x1x2+2a13x1x3++2an1,nxn1xn 观察各个项,行和列按x1,x2,x3,,xnx_1,x_2,x_3,\cdots,x_n的顺序排列成表格,每个格子内为行列相乘的项,平方项恰在对角线位置,其他项放在对角线上三角区域,可以得到下面方阵: x1x2x3xnx1a11x122a12x1x22a13x1x32a1nx1xnx20a22x222a23x2x32a2nx2xnx300a33x322a3nx3xnxn000annxn2 如果把像 2a12,2a13,,2a(n1)n2a_{12} , 2a_{13},\dots,2a_{(n-1)n} 这样的2倍的系数沿着对角线对称的位置拆分放置,即a12=a21,a13=a31,,a(n1)n=an(n1)a_{12}=a_{21} , a_{13}=a_{31},\dots,a_{(n-1)n}=a_{n(n-1)},那么可以得到下面的样子:

x1x2x3xnx1a11x12a12x1x2a13x1x3a1nx1xnx2a21x1x2a22x22a23x2x3a2nx2xnx3a31x1x3a32x2x3a33x32a3nx3xnxnan1x1xnan2x2xnan3x3xnannxn2f(x)=x1(a11x1+a12x2++a1nxn+x2(a21x1+a22x2++a2nxn)+x3(a31x1+a32x2++a3nxn)++xn(an1x1+an2x2++annxn) \begin{aligned} f(x) &=x_1(a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n \\ & +x_2(a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n) \\ & +x_3(a_{31}x_1 + a_{32}x_2 + \cdots + a_{3n}x_n) \\ & + \cdots\\ & + x_n(a_{n1}x_1 + a_{n2}x_2 + \cdots + a_{nn}x_n) \\ \end{aligned} 写成矩阵相乘的方式为: f(x)=(x1,x2,,xn)(a11x1a12x2a1nxna21x1a22x2a2nxnan1x1an2x2annxn)=(x1,x2,,xn)(a11a12a1na21a22a2nan1an2ann)(x1x2xn)=xTAx \begin{aligned} f(x)&= (x_1, x_2, \cdots, x_n) \begin{pmatrix}a_{11}x_1 & a_{12}x_2 & \cdots & a_{1n}x_n \\ a_{21}x_1 & a_{22}x_2 & \cdots & a_{2n}x_n \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1}x_1 & a_{n2}x_2 & \cdots & a_{nn}x_n \end{pmatrix}\\ &=(x_1, x_2, \cdots, x_n)\begin{pmatrix}a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{pmatrix}\begin{pmatrix}x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix} \\ &=x^TAx \end{aligned} 其中 A=(a11a12a1na21a22a2nan1an2ann),x=(x1x2xn) A=\begin{pmatrix}a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{pmatrix} , x=\begin{pmatrix}x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix}

二次型f(x)f(x),和矩阵表示xTAxx^TAx是等价的。二次型可以通过配方法换元标准化。然而,只有表示成对称矩阵才可以的对角化为标准形。

那么怎么理解二次型如果表示为非对称矩阵为什么不能对角化呢?明明是等价的表示。例如, x12+x22+2x1x2x_1^2 + x_2^2 + 2x_1x_2如果表示为 A=(1111)B=(1201)C=(1021) \begin{aligned} A=\begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix} \\ B=\begin{pmatrix} 1 & 2 \\ 0 & 1 \end{pmatrix}\\ C=\begin{pmatrix} 1 & 0 \\ 2 & 1 \end{pmatrix} \end{aligned} B和C只是交换了位置,只讨论A、B两个矩阵的对角化。其特征值分别为0或2、重根1。

A的特征值为2、0,特征向量分别为: (11),(11) \begin{pmatrix}1 \\ 1\end{pmatrix}, \begin{pmatrix}-1 \\ 1\end{pmatrix} 所以, P=(1111)P1=(12121212) \begin{aligned} P&=\begin{pmatrix}1 & -1 \\ 1 & 1\end{pmatrix} \\ P^{-1}&=\begin{pmatrix}\frac{1}{2} & \frac{1}{2} \\ \frac{1}{2} & -\frac{1}{2}\end{pmatrix}\\ \end{aligned} 那么, P1AP=(12121212)(1111)(1111)=(2000) \begin{aligned} P^{-1}AP&=\begin{pmatrix}\frac{1}{2} & \frac{1}{2} \\ \frac{1}{2} & -\frac{1}{2}\end{pmatrix}\begin{pmatrix}1 & 1 \\ 1 & 1\end{pmatrix}\begin{pmatrix}1 & -1 \\ 1 & 1\end{pmatrix}\\ &=\begin{pmatrix}2 & 0 \\ 0 & 0\end{pmatrix} \end{aligned} x=Pyx=PyxT=(Py)T=yTPTx^T=(Py)^T=y^TP^T

但由于此时的PP未经酉变换,P1PTP^{-1}\neq P^T,所以yT(P1AP)ydiag(2,0)y^T(P^{-1}AP)y\neq diag(2,0)

PP矩阵转换为酉变换,

U=(12121212)U1=(12121212)=UT \begin{aligned} U&=\begin{pmatrix} \frac{1}{\sqrt{2}} & -\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}}\end{pmatrix} \\ U^{-1}&=\begin{pmatrix}\frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \\ -\frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}}\end{pmatrix}\\ &=U^T \end{aligned}

f(y1,y2)=2y12+0y22 \begin{aligned} f(y_1,y_2)&=2y_1^2+0y_2^2 \end{aligned} 此时对应的换元关系为: (x1x2)=U(y1y2)=(12121212)(y1y2){x1=12y112y2x2=12y1+12y2 \begin{aligned} \begin{pmatrix}x_1 \\ x_2\end{pmatrix}=U\begin{pmatrix}y_1 \\ y_2\end{pmatrix}=\begin{pmatrix} \frac{1}{\sqrt{2}} & -\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}}\end{pmatrix}\begin{pmatrix}y_1 \\ y_2\end{pmatrix}\\ \Rightarrow \left\{ \begin{aligned} x_1=\frac{1}{\sqrt{2}}y_1-\frac{1}{\sqrt{2}}y_2 \\ x_2=\frac{1}{\sqrt{2}}y_1+\frac{1}{\sqrt{2}}y_2 \end{aligned} \right. \end{aligned}

(y1y2)=U1(x1x2)=UT(x1x2)=(12121212)(x1x2){y1=12x1+12x2y2=12x1+12x2 \begin{aligned} \begin{pmatrix}y_1 \\ y_2\end{pmatrix}=U^{-1}\begin{pmatrix}x_1 \\ x_2\end{pmatrix}=U^{T}\begin{pmatrix}x_1 \\ x_2\end{pmatrix}=\begin{pmatrix}\frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \\ -\frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}}\end{pmatrix}\begin{pmatrix}x_1 \\ x_2\end{pmatrix}\\ \Rightarrow \left\{ \begin{aligned} y_1&=\frac{1}{\sqrt{2}}x_1+\frac{1}{\sqrt{2}}x_2 \\ y_2&=-\frac{1}{\sqrt{2}}x_1+\frac{1}{\sqrt{2}}x_2 \end{aligned} \right. \end{aligned}

如何理解这种变换呢?

这种变换,将坐标轴旋转45度,如下图。 正交变换

与配方法对照

对于上面的简单的二次型,很显然可以做y1=x1+x2y_1=x_1+x_2的换元,和y2y_2没有关系,可以取任意值,如果取y2=x2y_2=x_2。得到的结果为: f(x1,x2)=x12+x22+2x1x2=(x1+x2)2=y12 f(x_1,x_2)=x_1^2+x_2^2+2x_1x_2=(x_1+x_2)^2=y_1^2 A=(1111) \begin{aligned} A=\begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix} \end{aligned}

此时的变换关系为: (y1y2)=(1101)(x1x2)=Q(x1x2) \begin{pmatrix}y_1 \\ y_2\end{pmatrix}=\begin{pmatrix} 1 & 1 \\ 0 & 1\end{pmatrix}\begin{pmatrix}x_1 \\ x_2\end{pmatrix}=Q\begin{pmatrix}x_1 \\ x_2\end{pmatrix} 那么, (x1x2)=Q1(y1y2)=(1101)(y1y2)D=(1101) \begin{aligned} \begin{pmatrix}x_1 \\ x_2\end{pmatrix} &=Q^{-1}\begin{pmatrix}y_1 \\ y_2\end{pmatrix} \\ &=\begin{pmatrix} 1 & -1 \\ 0 & 1\end{pmatrix}\begin{pmatrix}y_1 \\ y_2\end{pmatrix}\\ D&=\begin{pmatrix} 1 & -1 \\ 0 & 1\end{pmatrix} \end{aligned} {x1=y1y2x2=y2 \left\{ \begin{aligned} x_1&=y_1-y_2 \\ x_2&=y_2 \end{aligned} \right. f(x)=xTAx=(Dy)TADy=yTDTADy=yT(1011)(1111)(1101)y=y12 \begin{aligned} f(x)&=x^TAx=(Dy)^TADy=y^TD^TADy\\ &=y^T\begin{pmatrix} 1 & 0 \\ -1 & 1\end{pmatrix}\begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix}\begin{pmatrix} 1 & -1 \\ 0 & 1\end{pmatrix}y \\ &=y_1^2 \end{aligned} 显然此处DTD1D^T \neq D^{-1},虽然可以变换成了标准形,但是并不是diag(2,0)diag(2,0)的形式,DD也不是特征向量矩阵。并且DD不是正规矩阵,不能做酉变换。DTD1D^T \neq D^{-1},此变换不能和特征向量和特征值建立联系。

如何理解这种变换呢?

这种变换效果如下图,变换后的坐标轴成45度角,并且和y2y_2无关。 不可逆变换

如果矩阵为B

其特征值为重根1,仅对应一个特征向量,无法对角化。但是二次型还是那个式子,为什么却不能对角化呢? 二次型和对称矩阵具有相同的计算特性,计算出来的特征向量恰好和换元变换关系。DTD^T表示换元变换关系,D1D^{-1}表示特征值和特征向量关系,DT=D1D^T=D^{-1}将特征值特征向量关系和换元关系联系了起来。

百度大模型

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

腾讯云图