模式識别:計算機技術-中文百科頻道

發展曆程

早期的模式識别研究着重在數學方法上。20世紀50年代末，F．羅森布拉特提出了一種簡化的模拟人腦進行識别的數學模型——感知器，初步實現了通過給定類别的各個樣本對識别系統進行訓練，使系統在學習完畢後具有對其他未知類别的模式進行正确分類的能力。1957年，周紹康提出用統計決策理論方法求解模式識别問題，促進了從50年代末開始的模式識别研究工作的迅速發展。1962年，R．納拉西曼提出了一種基于基元關系的句法識别方法。付京孫(K．S．Fu）在笮的理論及應用兩方^行了系統的卓有成效的研究，并于1974年出版了一本專著《句法模式識别及其應用》。1982年和1984年，J．荷甫菲爾德發表了兩篇重要論文，深刻揭示出人工神經元，網路所具有的聯想存儲和計算能力，進一步推動了模式識别的研究工作，短短幾年在很多應用方面就取得了顯著成果，從而形成了模式識别的人工神經元網絡方法的新的學科方向。

人們在觀察事物或現象的時候，常常要尋找它與其他事物或現象的不同之處，并根據一定的目的把各個相似的但又不完全相同的事物或現象組成一類。字符識别就是一個典型的例子。例如數字“4”可以有各種寫法，但都屬于同一類别。更為重要的是，即使對于某種寫法的“4”，以前雖未見過，也能把它分到“4”所屬的這一類别。人腦的這種思維能力就構成了“模式”的概念。在上述例子中，模式和集合的概念是分開來的，隻要認識這個集合中的有限數量的事物或現象，就可以識别屬于這個集合的任意多的事物或現象。為了強調從一些個别的事物或現象推斷出事物或現象的總體，我們把這樣一些個别的事物或現象叫作各個模式。也有的學者認為應該把整個的類别叫作模式，這樣的“模式”是一種抽象化的概念，如“房屋”等都是“模式”，而把具體的對象，如人民大會堂，叫作“房屋”這類模式中的一個樣本。這種名詞上的不同含義是容易從上下文中弄清楚的。

模式識别是人類的一項基本智能，在日常生活中，人們經常在進行“模式識别”。随着20世紀40年代計算機的出現以及50年代人工智能的興起，人們當然也希望能用計算機來代替或擴展人類的部分腦力勞動。(計算機)模式識别在20世紀60年代初迅速發展并成為一門新學科。

模式識别是指對表征事物或現象的各種形式的(數值的、文字的和邏輯關系的)信息進行處理和分析，以對事物或現象進行描述、辨認、分類和解釋的過程，是信息科學和人工智能的重要組成部分。

研究方向

模式識别又常稱作模式分類，從處理問題的性質和解決問題的方法等角度，模式識别分為有監督的分類（Supervised Classification）和無監督的分類(Unsupervised Classification)兩種。二者的主要差别在于，各實驗樣本所屬的類别是否預先已知。一般說來，有監督的分類往往需要提供大量已知類别的樣本，但在實際問題中，這是存在一定困難的，因此研究無監督的分類就變得十分有必要了。

模式還可分成抽象的和具體的兩種形式。前者如意識、思想、議論等，屬于概念識别研究的範疇，是人工智能的另一研究分支。我們所指的模式識别主要是對語音波形、地震波、心電圖、腦電圖、圖片、照片、文字、符号、生物傳感器等對象的具體模式進行辨識和分類。

模式識别研究主要集中在兩方面，一是研究生物體(包括人)是如何感知對象的，屬于認識科學的範疇，二是在給定的任務下，如何用計算機實現模式識别的理論和方法。前者是生理學家、心理學家、生物學家和神經生理學家的研究内容，後者通過數學家、信息學專家和計算機科學工作者近幾十年來的努力，已經取得了系統的研究成果。

應用計算機對一組事件或過程進行辨識和分類，所識别的事件或過程可以是文字、聲音、圖像等具體對象，也可以是狀态、程度等抽象對象。這些對象與數字形式的信息相區别，稱為模式信息。

模式識别所分類的類别數目由特定的識别問題決定。有時，開始時無法得知實際的類别數，需要識别系統反複觀測被識别對象以後确定。

模式識别與統計學、心理學、語言學、計算機科學、生物學、控制論等都有關系。它與人工智能、圖像處理的研究有交叉關系。例如自适應或自組織的模式識别系統包含了人工智能的學習機制；人工智能研究的景物理解、自然語言理解也包含模式識别問題。又如模式識别中的預處理和特征抽取環節應用圖像處理的技術；圖像處理中的圖像分析也應用模式識别的技術。

研究方法

決策理論方法

又稱統計方法，是發展較早也比較成熟的一種方法。被識别對象首先數字化，變換為适于計算機處理的數字信息。一個模式常常要用很大的信息量來表示。許多模式識别系統在數字化環節之後還進行預處理，用于除去混入的幹擾信息并減少某些變形和失真。随後是進行特征抽取，即從數字化後或預處理後的輸入模式中抽取一組特征。所謂特征是選定的一種度量，它對于一般的變形和失真保持不變或幾乎不變，并且隻含盡可能少的冗餘信息。特征抽取過程将輸入模式從對象空間映射到特征空間。這時，模式可用特征空間中的一個點或一個特征矢量表示。這種映射不僅壓縮了信息量，而且易于分類。在決策理論方法中，特征抽取占有重要的地位，但尚無通用的理論指導，隻能通過分析具體識别對象決定選取何種特征。特征抽取後可進行分類，即從特征空間再映射到決策空間。為此而引入鑒别函數，由特征矢量計算出相應于各類别的鑒别函數值，通過鑒别函數值的比較實行分類。

句法方法

又稱結構方法或語言學方法。其基本思想是把一個模式描述為較簡單的子模式的組合，子模式又可描述為更簡單的子模式的組合，最終得到一個樹形的結構描述，在底層的最簡單的子模式稱為模式基元。在句法方法中選取基元的問題相當于在決策理論方法中選取特征的問題。通常要求所選的基元能對模式提供一個緊湊的反映其結構關系的描述，又要易于用非句法方法加以抽取。顯然，基元本身不應該含有重要的結構信息。模式以一組基元和它們的組合關系來描述，稱為模式描述語句，這相當于在語言中，句子和短語用詞組合，詞用字符組合一樣。基元組合成模式的規則，由所謂語法來指定。一旦基元被鑒别，識别過程可通過句法分析進行，即分析給定的模式語句是否符合指定的語法，滿足某類語法的即被分入該類。

模式識别方法的選擇取決于問題的性質。如果被識别的對象極為複雜，而且包含豐富的結構信息，一般采用句法方法；被識别對象不很複雜或不含明顯的結構信息，一般采用決策理論方法。這兩種方法不能截然分開，在句法方法中，基元本身就是用決策理論方法抽取的。在應用中，将這兩種方法結合起來分别施加于不同的層次，常能收到較好的效果。

統計模式識别

統計模式識别(statistic pattern recognition)的基本原理是：有相似性的樣本在模式空間中互相接近，并形成“集團”，即“物以類聚”。其分析方法是根據模式所測得的特征向量Xi=(xi1，xi2，…，xid)T(i=1，2，…，N)，将一個給定的模式歸入C個類ω1，ω2，…，ωc中，然後根據模式之間的距離函數來判别分類。其中，T表示轉置；N為樣本點數；d為樣本特征數。

統計模式識别的主要方法有：判别函數法，近鄰分類法，非線性映射法，特征分析法，主因子分析法等。

在統計模式識别中，貝葉斯決策規則從理論上解決了最優分類器的設計問題，但其實施卻必須首先解決更困難的概率密度估計問題。BP神經網絡直接從觀測數據(訓練樣本)學習，是更簡便有效的方法，因而獲得了廣泛的應用，但它是一種啟發式技術，缺乏指定工程實踐的堅實理論基礎。統計推斷理論研究所取得的突破性成果導緻現代統計學習理論——VC理論的建立，該理論不僅在嚴格的數學基礎上圓滿地回答了人工神經網絡中出現的理論問題，而且導出了一種新的學習方法——支持向量機（SVM）。

應用領域

模式識别可用于文字和語音識别、遙感和醫學診斷等方面。

①文字識别

漢字已有數千年的曆史，也是世界上使用人數最多的文字，對于中華民族燦爛文化的形成和發展有着不可磨滅的功勳。所以在信息技術及計算機技術日益普及的今天，如何将文字方便、快速地輸入到計算機中已成為影響人機接口效率的一個重要瓶頸，也關系到計算機能否真正在我國得到普及的應用。漢字輸入主要分為人工鍵盤輸入和機器自動識别輸入兩種。其中人工鍵入速度慢而且勞動強度大；自動輸入又分為漢字識别輸入及語音識别輸入。從識别技術的難度來說，手寫體識别的難度高于印刷體識别，而在手寫體識别中，脫機手寫體的難度又遠遠超過了聯機手寫體識别。除了脫機手寫體數字的識别已有實際應用外，漢字等文字的脫機手寫體識别還處在實驗室階段。

②語音識别

語音識别技術技術所涉及的領域包括：信号處理、模式識别、概率論和信息論、發聲機理和聽覺機理、人工智能等等。近年來，在生物識别技術領域中，聲紋識别技術以其獨特的方便性、經濟性和準确性等優勢受到世人矚目，并日益成為人們日常生活和工作中重要且普及的安驗證方式。而且利用基因算法訓練連續隐馬爾柯夫模型的語音識别方法現已成為語音識别的主流技術，該方法在語音識别時識别速度較快，也有較高的識别率。

③指紋識别

我們手掌及其手指、腳、腳趾内側表面的皮膚凹凸不平産生的紋路會形成各種各樣的圖案。而這些皮膚的紋路在圖案、斷點和交叉點上各不相同，是唯一的。依靠這種唯一性，就可以将一個人同他的指紋對應起來，通過比較他的指紋和預先保存的指紋進行比較，便可以驗證他的真實身份。一般的指紋分成有以下幾個大的類别:環型(loop)，螺旋型(whorl)，弓型(arch)，這樣就可以将每個人的指紋分别歸類，進行檢索。指紋識别基本上可分成：預處理、特征選擇和模式分類幾個大的步驟。

④遙感

遙感圖像識别已廣泛用于農作物估産、資源勘察、氣象預報和軍事偵察等。

⑤醫學診斷

在癌細胞檢測、X射線照片分析、血液化驗、染色體分析、心電圖診斷和腦電圖診斷等方面，模式識别已取得了成效。

發展潛力

模式識别技術是人工智能的基礎技術，21世紀是智能化、信息化、計算化、網絡化的世紀，在這個以數字計算為特征的世紀裡，作為人工智能技術基礎學科的模式識别技術，必将獲得巨大的發展空間。在國際上，各大權威研究機構，各大公司都紛紛開始将模式識别技術作為公司的戰略研發重點加以重視。

1、語音識别技術

語音識别技術正逐步成為信息技術中人機接口(Human Computer Interface，HCI)的關鍵技術，語音技術的應用已經成為一個具有競争性的新興高技術産業。中國互聯網中心的市場預測：未來5年，中文語音技術領域将會有超過400億人民币的市場容量，然後每年以超過30%的速度增長。

2、生物認證技術

生物認證技術(Biometrics)本世紀最受關注的安全認證技術，它的發展是大勢所趨。人們願意忘掉所有的密碼、扔掉所有的磁卡，憑借自身的唯一性來标識身份與保密。國際數據集團（IDG）預測：作為未來的必然發展方向的移動電子商務基礎核心技術的生物識别技術在未來10年的時間裡将達到100億美元的市場規模。

3、數字水印技術

90年代以來才在國際上開始發展起來的數字水印技術(Digital Watermarking)是最具發展潛力與優勢的數字媒體版權保護技術。IDC預測，數字水印技術在未來的5年内全球市場容量超過80億美元。

模式識别從20世紀20年代發展至今，人們的一種普遍看法是不存在對所有模式識别問題都适用的單一模型和解決識别問題的單一技術，我們擁有的隻是一個工具袋，所要做的是結合具體問題把統計的和句法的識别結合起來，把統計模式識别或句法模式識别與人工智能中的啟發式搜索結合起來，把統計模式識别或句法模式識别與支持向量機的機器學習結合起來，把人工神經元網絡與各種已有技術以及人工智能中的專家系統、不确定推理方法結合起來，深入掌握各種工具的效能和應有的可能性，互相取長補短，開創模式識别應用的新局面。

對于識别二維模式的能力，存在各種理論解釋。模闆說認為，我們所知的每一個模式，在長時記憶中都有一個相應的模闆或微縮副本。模式識别就是與視覺刺激最合适的模闆進行匹配。特征說認為，視覺刺激由各種特征組成，模式識别是比較呈現刺激的特征和儲存在長時記憶中的模式特征。特征說解釋了模式識别中的一些自下而上過程，但它不強調基于環境的信息和期待的自上而下加工。基于結構描述的理論可能比模闆說或特征說更為合适。