特征向量

特征向量

矩陣理論上的重要概念
矩陣的特征向量是矩陣理論上的重要概念之一,它有着廣泛的應用。數學上,線性變換的特征向量(本征向量)是一個非簡并的向量,其方向在該變換下不變。該向量在此變換下縮放的比例稱為其特征值(本征值)。一個線性變換通常可以由其特征值和特征向量完全描述。特征空間是相同特征值的特征向量的集合。“特征”一詞來自德語的eigen。1904年希爾伯特首先在這個意義下使用了這個詞,更早亥爾姆霍爾茲也在相關意義下使用過該詞。eigen一詞可翻譯為”自身的”、“特定于……的”、“有特征的”、或者“個體的”,這顯示了特征值對于定義特定的線性變換的重要性。
    中文名:特征向量 外文名:Eigenvector 拼音: 近義詞: 反義詞: 别 名:本征向量 相關概念:特征值 學 科:線性代數、矩陣論 應用領域:數理科學

第一性質

線性變換的特征向量是指在變換下方向不變,或者簡單地乘以一個縮放因子的非零向量。

特征向量對應的特征值是它所乘的那個縮放因子。

特征空間就是由所有有着相同特征值的特征向量組成的空間,還包括零向量,但要注意零向量本身不是特征向量 。

線性變換的主特征向量是最大特征值對應的特征向量。

特征值的幾何重次是相應特征空間的維數。

有限維向量空間上的一個線性變換的譜是其所有特征值的集合。

例如,三維空間中的旋轉變換的特征向量是沿着旋轉軸的一個向量,相應的特征值是1,相應的特征空間包含所有和該軸平行的向量。該特征空間是一個一維空間,因而特征值1的幾何重次是1。特征值1是旋轉變換的譜中唯一的實特征值。

例子

随着地球的自轉,除了在轉軸上的兩個箭頭,每個從地心往外指的箭頭都在旋轉。考慮地球在自轉一小時後的變換:地心指向地理南極的箭頭是這個變換的一個特征向量,但是從地心指向赤道上任何一點的箭頭不會是一個特征向量。又因為指向極點的箭頭沒有被地球的自轉拉伸,所以它的特征值是1。

另一個例子是,薄金屬闆關于一個固定點均勻伸展,使得闆上每一個點到該固定點的距離翻倍。這個伸展是一個具有特征值2的變換。從該固定點到闆上任何一點的向量都是一個特征向量,而相應的特征空間是所有這些向量的集合。

但是,三維幾何空間不是唯一的向量空間。例如,考慮兩端固定的拉緊的繩子,就像弦樂器的振動弦那樣。振動弦的原子到它們在弦靜止時所處的位置的帶符号的那些距離視為一個空間中的一個向量的分量,那個空間的維數就是弦上原子的個數。

如果考慮繩子随着時間流逝發生的變換,它的特征向量,或者說特征函數(如果将繩子假設為一個連續媒介),就是它的駐波——即那些通過空氣的傳播讓人們聽到弓弦和吉他的撥動聲的振動。駐波對應于弦的特定振動,它們使得弦的形狀随着時間變化而伸縮一個因子(特征值)。和弦相關的該向量的每個分量乘上了一個依賴于時間的因子。駐波的振幅(特征值)在考慮到阻尼的情況下逐漸減小。因此可以将每個特征向量對應于一個壽命,并将特征向量的概念和共振的概念聯系起來。

方程

從數學上看,如果向量v與變換A滿足Av=λv,則稱向量v是變換A的一個特征向量,λ是相應的特征值。這一等式被稱作“特征值方程”。

假設它是一個線性變換,那麼v可以由其所在向量空間的一組基表示為:

其中vi是向量在基向量上的投影(即坐标),這裡假設向量空間為n 維。由此,可以直接以坐标向量表示。利用基向量,線性變換也可以用一個簡單的矩陣乘法表示。上述的特征值方程可以表示為:

但是,有時候用矩陣形式寫下特征值方程是不自然甚或不可能的。例如在向量空間是無窮維的時候,上述的弦的情況就是一例。取決于變換和它所作用的空間的性質,有時将特征值方程表示為一組微分方程更好。若是一個微分算子,其特征向量通常稱為該微分算子的特征函數。例如,微分本身是一個線性變換因為(若M和N是可微函數,而a和b是常數)

考慮對于時間t的微分。其特征函數滿足如下特征值方程:

其中λ是該函數所對應的特征值。這樣一個時間的函數,如果λ = 0,它就不變,如果λ為正,它就按比例增長,如果λ是負的,它就按比例衰減。例如,理想化的兔子的總數在兔子更多的地方繁殖更快,從而滿足一個正λ的特征值方程。

該特征值方程的一個解是N = exp(λt),也即指數函數;這樣,該函數是微分算子d/dt的特征值為λ的特征函數。若λ是負數,我們稱N的演變為指數衰減;若它是正數,則稱指數增長。λ的值可以是一個任意複數。因此d/dt的譜是整個複平面。在這個例子中,算子d/dt作用的空間是單變量可微函數的空間。該空間有無窮維(因為不是每一個可微函數都可以用有限的基函數的線性組合來表達的)。但是,每個特征值λ所對應的特征空間是一維的。它就是所有形為N = N0exp(λt)的函數的集合。N0是任意常數,也就在t=0的初始數量。

定理

譜定理在有限維的情況,将所有可對角化的矩陣作了分類:它顯示一個矩陣是可對角化的,當且僅當它是一個正規矩陣。注意這包括自共轭(厄爾米特)的情況。這很有用,因為對角化矩陣T的函數f(T)(譬如波萊爾函數f)的概念是清楚的。在采用更一般的矩陣的函數的時候譜定理的作用就更明顯了。例如,若f是解析的,則它的形式幂級數,若用T取代x,可以看作在矩陣的巴拿赫空間中絕對收斂。譜定理也允許方便地定義正算子的唯一的平方根。

譜定理可以推廣到希爾伯特空間上的有界正規算子,或者無界自共轭算子的情況。

特征向量概述

簡介

計算矩陣的特征值和特征向量

假設我們想要計算給定矩陣的特征值。若矩陣很小,我們可以用特征多項式進行符号演算。但是,對于大型矩陣這通常是不可行的,在這種情況我們必須采用數值方法。

求特征值

描述正方形矩陣的特征值的重要工具是特征多項式,λ是A的特征值等價于線性方程組(A – λI) v = 0 (其中I是單位矩陣)有非零解v (一個特征向量),因此等價于行列式|A – λI|=0 。

函數p(λ) = det(A – λI)是λ的多項式,因為行列式定義為一些乘積的和,這就是A的特征多項式。矩陣的特征值也就是其特征多項式的零點。

一個矩陣A的特征值可以通過求解方程pA(λ) = 0來得到。 若A是一個n×n矩陣,則pA為n次多項式,因而A最多有n個特征值。 反過來,代數基本定理說這個方程剛好有n個根,如果重根也計算在内的話。所有奇數次的多項式必有一個實數根,因此對于奇數n,每個實矩陣至少有一個實特征值。在實矩陣的情形,對于偶數或奇數的n,非實數特征值成共轭對出現。

求特征向量

一旦找到特征值λ,相應的特征向量可以通過求解特征方程(A – λI) v = 0 得到,其中v為待求特征向量,I為單位陣。

沒有實特征值的一個矩陣的例子是順時針旋轉90度。

數值計算

在實踐中,大型矩陣的特征值無法通過特征多項式計算,計算該多項式本身相當費資源,而精确的“符号式”的根對于高次的多項式來說很難計算和表達:阿貝爾-魯費尼定理顯示高次(5次或更高)多項式的根無法用n次方根來簡單表達。對于估算多項式的根的有效算法是有的,但特征值的小誤差可以導緻特征向量的巨大誤差。求特征多項式的零點,即特征值的一般算法,是叠代法。最簡單的方法是幂法:取一個随機向量v,然後計算一系列單位向量。

這個序列幾乎總是收斂于絕對值最大的特征值所對應的特征向量。這個算法很簡單,但是本身不是很有用。但是,象QR算法這樣的算法正是以此為基礎的。

第二性質

代數重次

A的一個特征值λ的代數重次是λ作為A的特征多項式的零點的次數;換句話說,若λ是一個該多項式的根,它是因子(t − λ)在特征多項式中在因式分解後中出現的次數。一個n×n矩陣有n個特征值,如果将代數重次計算在内的話,因為其特征多項式次數為n。

一個代數重次1的特征值為“單特征值”。

在關于矩陣理論的條目中,可能會遇到如下的命題:

"一個矩陣A的特征值為4,4,3,3,3,2,2,1"

表示4的代數重次為二,3的是三,2的是二,而1的是1。這樣的風格因為代數重次對于矩陣理論中的很多數學證明很重要而被大量使用。

回想一下,我們定義特征向量的幾何重次為相應特征空間的維數,也就是λI − A的零空間。代數重次也可以視為一種維數:它是相應廣義特征空間 (第一種意義)的維數,也就是矩陣(λI − A)^k對于任何足夠大的k的零空間。也就是說,它是“廣義特征向量”(第一種意義)的空間,其中一個廣義特征向量是任何一個如果 λI − A作用連續作用足夠多次就“最終”會變0的向量。任何特征向量是一個廣義特征向量,以此任一特征空間被包含于相應的廣義特征空間。這給了一個幾何重次總是小于代數重次的簡單證明。這裡的第一種意義不可和下面所說的廣義特征值問題混淆。

例如

它隻有一個特征值,也就是λ = 1。其特征多項式是(λ − 1)2,所以這個特征值代數重次為2。但是,相應特征空間是通常稱為x軸的數軸,由向量線性撐成,所以幾何重次隻是1。

廣義特征向量可以用于計算一個矩陣的若當标準型。若當塊通常不是對角化而是幂零的這個事實與特征向量和廣義特征向量之間的區别直接相關。

分解定理

如上所述,譜定理表明正方形矩陣可以對角化當且僅當它是正規的。對于更一般的未必正規的矩陣,我們有類似的結果。當然在一般的情況,有些要求必須放松,例如酉等價性或者最終的矩陣的對角性。 所有這些結果在一定程度上利用了特征值和特征向量。下面列出了一些這樣的結果:

舒爾三角形式表明任何矩陣等價于一個上三角矩陣;

奇異值分解定理, A = UΣV * 其中Σ為對角陣,而U,V為酉矩陣。A = UΣV * 的對角線上的元素非負,而正的項稱為A的奇異值。這對非正方形矩陣也成立;

若當标準型,其中A = UΛU − 1 其中Λ不是對角陣,但是分塊對角陣,而U是酉矩陣。若當塊的大小和個數由特征值的幾何和代數重次決定。若當分解是一個基本的結果。從它可以立即得到一個正方形矩陣可以完全用它的特征值包括重次來表述,最多隻會相差一個酉等價。這表示數學上特征值在矩陣的研究中有着極端重要的作用。

作為若當分解的直接結果,一個矩陣A可以“唯一”地寫作A = S + N其中S可以對角化,N是幂零的(也即,對于某個q,Nq=0),而S和N可交換(SN=NS)。

任何可逆矩陣A可以唯一地寫作A = SJ,其中S可對角化而J是麼幂矩陣(即使得特征多項式是(λ-1)的幂,而S和J可交換)。

其他屬性

譜在相似變換下不變: 矩陣A和P^-1AP有相同的特征值,這對任何方形矩陣A和任何可逆矩陣 P都成立。譜在轉置之下也不變:矩陣A和A^T有相同的特征值 。

因為有限維空間上的線性變換是雙射當且僅當它是單射,一個矩陣可逆當且僅當所有特征值都不是0。

若當分解的一些更多的結果如下:

一個矩陣A相似于對角陣當且僅當對于A的每一個特征值的代數重次等于幾何重次。特别地有,一個n×n矩陣如果有n個不同特征值,則總是可以對角化的。

矩陣作用的向量空間可以視為其廣義特征向量所撐成的不變子空間的直和。對角線上的每個塊對應于該直和的一個子空間。若一個塊是對角化的,其不變子空間是一個特征空間。否則它是一個廣義特征空間,如上面所定義;

因為迹,也就是矩陣主對角線元素之和,在酉等價下不變,若當标準型說明它等于所有特征值之和;

類似的有,因為三角矩陣的特征值就是主對角線上的項,其行列式等于等于特征值的乘積(按代數重次計算出現次數)。

正規矩陣的一些子類的譜的位置是:

一個厄爾米特矩陣(A = A*)的所有特征值是實數。進一步的有,所有正定矩陣(v*Av > 0 for all vectors v)的所有特征值是正數;

所有斜厄爾米特矩陣(A = −A*)的特征值是純虛數;

所有酉矩陣(A-1 = A*)的特征值絕對值為1;

假設A是一個m×n矩陣,其中m ≤ n,而B是一個n×m矩陣。則BA有和AB相同的特征值加上n − m個等于0的特征值。

每個矩陣可以被賦予一個算子範數。算子範數是其特征值的模的上确界,因而也是它的譜半徑。該範數直接和計算最大模的特征值的幂法直接相關。當一個矩陣是正規的,其算子範數是其特征值的最大模,并且獨立于其定義域的範數。

共轭特征向量

一個共轭特征向量或者說共特征向量是一個在變換下成為其共轭乘以一個标量的向量,其中那個标量稱為該線性變換的共轭特征值或者說共特征值。共轭特征向量和共轭特征值代表了和常規特征向量和特征值相同的信息和含義,但隻在使用交替坐标系統的時候出現。

例如,在相幹電磁散射理論中,線性變換A代表散射物體施行的作用,而特征向量表示電磁波的極化狀态。在光學中,坐标系統按照波的觀點定義,稱為前向散射對齊 (FSA),從而導緻了常規的特征值方程,而在雷達中,坐标系統按照雷達的觀點定義,稱為後向散射對齊 (BSA),從而給出了共轭特征值方程。

特征問題

一個廣義特征值問題(第二種意義)有如下形式

其中A和B為矩陣。其廣義特征值(第二種意義)λ 可以通過求解如下方程得到

形如A − λB的矩陣的集合,其中λ是一個複數,稱為一個“鉛筆”。 若B可逆,則最初的問題可以寫作标準的特征值問題。但是,在很多情況下施行逆操作是不可取的,而廣義特征值問題應該如同其原始表述來求解。

如果A和B是實對稱矩陣,則特征值都為實數。這在上面的第二種等價表述中并不明顯,因為矩陣B − 1A未必是對稱的。

環中元素

在方矩陣A,其系數屬于一個環的情況,λ稱為一個右特征值如果存在一個列向量x使得Ax=λx,或者稱為一個左特征值如果存在非零行向量y使得yA=yλ。

若環是可交換的,左特征值和右特征值相等,并簡稱為特征值。否則,例如當環是四元數集合的時候,它們可能是不同的。

若向量空間是無窮維的,特征值的概念可以推廣到譜的概念。譜是标量λ的集合,對于這些标量,沒有定義,也就是說它們使得沒有有界逆。

很明顯,如果λ是T的特征值,λ位于T的譜内。一般來講,反過來并不成立。在希爾伯特空間或者巴拿赫空間上有一些算子完全沒有特征向量。這可以從下面的例子中看到。 在希爾伯特空間(所有标量級數的空間,每個級數使得收斂)上的雙向平移沒有特征向量卻有譜值。

在無窮維空間,有界算子的譜系總是非空的,這對無界自共轭算子也成立。通過檢驗譜測度,任何有界或無界的自共轭算子的譜可以分解為絕對連續,離散,和孤立部分。指數增長或者衰減是連續譜的例子,而振動弦駐波是離散譜例子。氫原子是兩種譜都有出現的例子。氫原子的束縛态對應于譜的離散部分,而離子化狀态用連續譜表示。圖3用氯原子的例子作了解釋。

應用

薛定谔方程

一個變換用微分算子代表的特征值方程的例子是量子力學中的時不變薛定谔方程

HΨE = EΨE

其中H是哈密爾頓算子,一個二階微分算子而ΨE是波函數,對應于特征值E的特征函數,該值可以解釋為它的能量。

一個氫原子中的一個電子的束縛态所對應的波函數可以視為氫原子哈密爾頓算子的一個特征向量,也是角動量算子的一個特征向量。它們對應于可以解釋為它們的能量(遞增:n=1,2,3,...)和角動量(遞增:s, p, d,...)的特征值。這裡畫出了波函數絕對值的平方。更亮區域對應于位置測度的更高概率密度。每幅圖的中心都是原子核,一個質子但是,在這個情況我們隻尋找薛定鄂方程的束縛态解,就像在量子化學中常做的那樣,我們在平方可積的函數中尋找ΨE。因為這個空間是一個希爾伯特空間,有一個定義良好的标量積,我們可以引入一個基集合,在其中ΨE和H可以表示為一個一維數組和一個矩陣。這使得我們能夠用矩陣形式表達薛定鄂方程。

狄拉克記法經常在這個上下文中使用,以強調狀态的向量和它的表示,函數ΨE之間的區别。在這個情況下,薛定鄂方程寫作

并稱是H的一個本征态(H有時候在入門級課本中寫作),H被看作是一個變換(參看觀測值)而不是一個它用微分算子術語進行的特定表示。在上述方程中,理解為通過應用H到得到的一個向量。

分子軌道

在量子力學中,特别是在原子物理和分子物理中,在Hartree-Fock理論下,原子軌道和分子軌道可以定義為Fock算子的特征向量。相應的特征值通過Koopmans定理可以解釋為電離勢能。在這個情況下,特征向量一詞可以用于更廣泛的意義,因為Fock算子顯式地依賴于軌道和它們地特征值。如果需要強調這個特點,可以稱它為隐特征值方程。這樣地方程通常采用叠代程序求解,在這個情況下稱為自洽場方法。在量子化學中,經常會把Hartree-Fock方程通過非正交基集合來表達。這個特定地表達是一個廣義特征值問題稱為Roothaan方程。

因子分析

在因素分析中,一個協變矩陣的特征向量對應于因素,而特征值是因素負載。因素分析是一種統計學技術,用于社會科學和市場分析、産品管理、運籌規劃和其他處理大量數據的應用科學。其目标是用稱為因素的少量的不可觀測随機變量來解釋在一些可觀測随機變量中的變化。可觀測随機變量用因素的線性組合來建模,再加上“殘差項。

特征臉是特征向量的例子

在圖像處理中,臉部圖像的處理可以看作分量為每個像素的灰度的向量。該向量空間的維數是像素的個數。一個标準化面部圖形的一個大型數據集合的協變矩陣的特征向量稱為特征臉。它們對于将任何面部圖像表達為它們的線性組合非常有用。特征臉提供了一種用于識别目的的數據壓縮方式。在這個應用中,一般隻取那些最大特征值所對應的特征臉。

慣量張量

在力學中,慣量的特征向量定義了剛體的主軸。慣量是決定剛體圍繞質心轉動的關鍵數據。

應力張量

在固體力學中,應力張量是對稱的,因而可以分解為對角張量,其特征值位于對角線上,而特征向量可以作為基。因為它是對角陣,在這個定向中,應力張量沒有剪切分量;它隻有主分量。

圖的特征值

在譜系圖論中,一個圖的特征值定義為圖的鄰接矩陣A的特征值,或者(更多的是)圖的拉普拉斯算子矩陣I − T − 1 / 2AT − 1 / 2,其中T是對角陣表示每個頂點的度數,在T − 1 / 2中,0用于取代0 − 1 / 2。圖的主特征向量用于測量其頂點的中心度。Google的PageRank算法就是一個例子。www圖的修正鄰接矩陣的主特征向量的分量給出了頁面評分。

上一篇:收斂性

下一篇:丸藥

相關詞條

相關搜索

其它詞條