輸入法

輸入法

編碼方法
輸入法是指為将各種符号輸入計算機或其他設備(如手機)而采用的編碼方法。不同語言、國家、或地區,有多種不同的輸入法。多數的輸入法軟件是為漢語,韓語,和日語而設計,是因為鍵盤原在打字機時代為英文字母而設計,而中文、日文等文字卻無法直接輸入,所以必需集中輸入法編碼來輸入相應的文字。在中國,為了将漢字輸入計算機或手機等電子設備則需要中文輸入法。漢字輸入的編碼方法,基本上都是采用将音、形、義與特定的鍵相聯系,再根據不同漢字進行組合來完成漢字的輸入的。中文輸入法編碼可分為幾類:音碼、形碼、音形碼、無理碼等。廣泛使用中文輸入法有:拼音輸入法(全拼和雙拼)、五筆字型輸入法、二筆輸入法、鄭碼輸入法、倉颉輸入法等。流行的輸入法軟件有搜狗拼音輸入法、百度輸入法、QQ拼音輸入法、谷歌拼音輸入法、極點中文輸入法等。[1]
    中文名:輸入法 外文名: 别名: 其他外文名:Input Method

簡介

輸入法是指為了将各種符号輸入計算機或其他設備(如手機)而采用的編碼方法。英文字母隻有26個,它們對應着鍵盤上的26個字母,所以,對于英文而言是不存在什麼輸入法的。

漢字的字數有幾萬個,它們和鍵盤是沒有任何對應關系的,但為了向電腦中輸入漢字,我們必須将漢字拆成更小的部件,并将這些部件與鍵盤上的鍵産生某種聯系,才能使我們通過鍵盤按照某種規律輸入漢字,這就是漢字編碼。漢字編碼方案已經有數百種,其中在電腦上已經運行的就有幾十種,作為一種圖形文字,漢字是由字的音、形、義來共同表達的,漢字輸入的編碼方法,基本上都是采用将音、形、義與特定的鍵相聯系,再根據不同漢字進行組合來完成漢字的輸入的。

輸入法的需求是來源于鍵盤的限度。鍵盤原在打字機時代為英文字母而設計,但鍵盤隻有一百來鍵,在沒有軟件的幫助下它是無法輸入中文或其他大型形意文字的語言。

産生背景

不同語言、國家、或地區,有多種不同的輸入法。

現在世界上,多數的輸入法軟件是為漢語,韓語,和日語而設計。

*漢語有上萬字,必須使用特别方式輸入漢字。

*朝鮮語使用大量的諺文。雖然諺文是字母系統,但是它字母組合很特别,也需要一種轉換系統。而且,朝鮮語有許多的漢字借詞,偶爾需用漢字來分别同音詞。

*日語使用兩種假名字母文字和漢字。雖然大多軟件和鍵盤都支持假名輸入,但是人們普遍都用日語羅馬字來拼寫輸入日文,無論是輸入假名還是漢字。

除了這三種語言,其它需求輸入法的語言不是很普遍。這也是有種種原因,像曆史,經濟,政治、環境等等。拿越南語作比方,雖然越南語不是一種漢藏語系語言,曆史上,越南文人是用漢字來拼寫自己的語言。這拼寫方式叫喃字。但是在二十世紀初,殖民越南的法國建立了教育系統,用拉丁文拼寫越南語替換了喃字。

雖然輸入法由于速度不适合用于來輸入字母文字,但是輸入法系統還是可以搭配的。在UNIX系統裡,SCIM輸入法平台可以讓用戶輸入自己鍵盤不支持的字母,像添加附加符号的字母。

發展曆程

中文輸入法:

從1981年國家标準局發布《信息交換用漢字編碼字符集基本集》GB2312-80以來,27年中漢字輸入法經曆了從無到有,從難到易,從簡單到智能的巨大演變過程,回顧它的發展曆程,我們可以一窺整個個人電腦在國内的發展史。

第一階段:電腦中可以輸入漢字了代表輸入法:五筆字型輸入法:電腦在中國普及,第一個急需要解決的問題就是,如何将漢字輸入到電腦中,為此國家1981年發布了GB2312-80,1983年,王永民先生推出了劃時代的五筆字型輸入法,五筆輸入法不但可以讓我們輸入漢字,而且也極大的解決了輸入速度這一頑症。90年代初五筆輸入法的熱度,大家可以從日常生活中體會到一些,比如遍地開花的電腦培訓學校把五筆輸入法當成重點課程,你可以依靠對五筆輸入法的熟練程度,輕松找到一份不錯的文職工作,甚至可以開間打字社……,由此可見五筆輸入法在當時是多麼的重要。

第二階段:人人皆可輸入代表輸入法:智能ABC五筆輸入法解決了漢字輸入的問題,且輸入速度也很快,從而盛行一時。但很快随着電腦用戶的越來越多,強背字根、入門難的先天問題越來越突顯出來了,更多的人需要一款使用簡單,入門輕松的輸入法來代替五筆輸入法。這個時候,1991年由長城集團與北京大學合作推出的智能ABC漢字輸入法的出現解決了這一問題。它入門簡單隻要會拼音就能上手,而且帶有簡單的聯想和記憶功能,這些特點,讓它很快得到了初級用戶的喜愛,尤其是在Windows系統将它内置,成為系統默認安裝輸入法之一後,使用它的用戶越來越多。

第三階段:效率不再隻是五筆的代言詞代表輸入法:搜狗拼音輸入法:五筆入門較難,但輸入效率快,智能。

ABC入門簡單,但輸入效率不高。如何做到兩全其美呢?即入門簡單又可以保證輸入效率的輸入法在衆多呼聲中出現了,這種輸入法入門簡單(會拼音即可),且能保持較高的輸入速度(全拼聯想、龐大詞庫、簡拼等諸多功能極大的提高了輸入效率),搜狗拼音輸入法應該算是它們中的佼佼者,另外紫光拼音、谷歌拼音、QQ拼音也都屬于這一類的輸入法。

輸入不隻有文字代表輸入法:火星文輸入法:

輸入法的前三個發展階段,都是針對漢字的輸入方式和速度方面進行改進優化,不過随着網絡的高速發展,漢字的作用正在慢慢轉變,越來越多的人輸入文字不再隻是為了工作,更多的是為了交流、展現自我。網絡這個大舞台,讓原本少人問津的生僻字、古文字,甚至各種符号有了表現平台。新時代需求下,以上隻能輸入文字的常規輸入法,對這些需求已經無能為力。為此,不隻可輸入文字,對生僻字、古文字、火星字以及各類符号同樣支持的新一代輸入法孕育而生了,常見的火星文輸入法算是其中做的最為出色的一款,它解析了輸入法其實不隻能輸入文字。

輸入法一路走來,大概經曆了以上四個發展階段,我們可以看出,每個階段的發展原動力都是出于對用戶的需求滿足為出發點,如今,整個輸入法領域可謂百花齊放,大家都在為更快更簡單更全面的輸入法目标邁進。

輸入設備

根據輸入設備的不同,輸入方式又分為鍵盤、手寫、語音等等。鍵盤輸入是最基礎的計算機輸入方式。

手寫識别借着計算機的認字功能,由使用者的手寫字體來辯别中文字或其它符号。語音識别使用話筒和語音識别軟件來辯别中文字。由于技術難度和設備的不普遍,這兩種輸入方式都還未成熟。

編輯器

在英語裡,“輸入法”(InputMethod)指的是輸入方式而不是所實現它的軟件。早期,英語像中文沒有區分這兩概念。由于微軟Windows操作系統的影響,輸入法軟件被稱為“輸入法編輯”器(InputMethodEditor)。在中國地區,一般還是用“輸入法”表達這兩個不同的概念。有少數人用“輸入軟件”或“輸入系統”。

分類

鍵盤輸入法

目前的鍵盤輸入法種類繁多,而且新的輸入法不斷湧現,各種輸入法各有各的特點,各有各的優勢。随着各種輸入法版本的更新,其功能越來越強。目前的中文輸入法有以下幾類:

1.對應碼(流水碼):這種輸入方法以各種編碼表作為輸入依據,因為每個漢字隻有一個編碼,所以重碼率幾乎為零,效率高,可以高速盲打,但缺點是需要的記憶量極大,而且沒有什麼太多的規律可言。

常見的流水碼有區位碼、電報碼、内碼等,一個編碼對應一個漢字。

這種方法适用于某些專業人員,比如,電報員、通訊員等。但在電腦中輸入漢字時,這類輸入法已經基本淘汰,隻是作為一種輔助輸入法,主要用于輸入某些特殊符号。

2.音碼:這類輸入法,是按照拼音規定來進行輸入漢字的,不需要特殊記憶,符合人的思維習慣,隻要會拼音就可以輸入漢字。但拼音輸入法也有缺點:一是同音字太多,重碼率高,輸入效率低;二是對用戶的發音要求較高;三是難于處理不識的生字。

3.形碼:形碼是按漢字的字形(筆畫、部首)來進行編碼的。漢字是由許多相對獨立的基本部分組成的,例如,“好”字是由“女”和“子”組成,“助”字是由“且”和“力”組成,這裡的“女”“子”“且”“力”在漢字編碼中稱為字根或字元。形碼是一種将字根或筆劃規定為基本的輸入編碼,再由這些編碼組合成漢字的輸入方法。

4.音形碼:音形碼吸取了音碼和形碼的優點,将二者混合使用。

自然碼(其實就是一種雙拼,而且是實際上的标準雙拼方案)是目前比較常用的一種混合碼。這種輸入法以音碼為主,以形碼作為可選輔助編碼,而且其形碼采用“切音”法,解決了不認識的漢字輸入問題。自然碼6.0增強版,保持了原有的優秀功能,新增加的多環境、多内碼、多方案、多詞庫等功能大大提高了輸入速度和輸入性能。

這種輸入法的特點是速度較快,又不需要專門培訓。适合于對打字速度有些要求的非專業打字人員使用,如記者、作家等。相對于音碼和形碼,音形碼使用的人還比較少。

混合輸入法(其實是軟件實現的,而不能稱為一種輸入法):為了提高輸入效率,某些漢字系統結合了一些智能化的功能,同時采用音、形、義多途徑輸入。還有很多智能輸入法把拼音輸入法和某種形碼輸入法結合起來,使一種輸入法中包含多種輸入方法。

非鍵盤輸入法

非鍵盤輸入方式無非是手寫、聽、聽寫、讀聽寫等方式。但由于組合不同、品牌不同形成林林總總的産品,分為下面幾類:手寫筆、語音識别、手寫加語音識别、手寫語音識别加OCR掃描閱讀器。

1.手寫輸入法:手寫輸入法是一種筆式環境下的手寫中文識别輸入法,符合中國人用筆寫字的習慣,隻要在手寫闆上按平常的習慣寫字,電腦就能将其識别顯示出來。

手寫輸入法需要配套的硬件手寫闆,在配套的手寫闆上用筆(可以是任何類型的硬筆)來書寫錄入漢字,不僅方便、快捷,而且錯字率也比較低。用鼠标在指定區域内也可以寫出字來,隻是鼠标操作要求非常熟練。

2.語音輸入法:語音輸入法,顧名思義,是将聲音通過話筒轉換成文字的一種輸入方法。語音識别以IBM推出的ViaVoice為代表,國内則推出Dutty++語音識别系統、天信語音識别系統、世音通語音識别系統等。

3.OCR簡介:OCR,叫做光學字符識别技術,它要求首先把要輸入的文稿通過掃描儀轉化為圖形才能識别,所以,掃描儀是必須的,而且原稿的印刷質量越高,識别的準确率就越高,一般最好是印刷體的文字,比如圖書、雜志等,如果原稿的紙張較薄,那麼有可能在掃描時紙張背面的圖形、文字也透射過來,幹擾最後的識别效果。

OCR軟件種類比較多,常用的比如清華OCR,在系統對圖形進行識别後,系統會把不能肯定的字符标記出來,讓用戶自行修改。

4.混合輸入法:手寫加語音識别的輸入法有漢王聽寫、蒙恬聽寫王系統等,慧筆、紫光筆等也添加了這種功能。

語言分類

中文輸入法

中文輸入法是指為了将漢字輸入計算機或手機等電子設備而采用的編碼方法,是中文信息處理的重要技術。中文輸入法從1980年代發展起來的,中間為幾個階段:單字輸入、詞語輸入、整句輸入。對于中文輸入法的要求是以單字輸入為基礎達到全面覆蓋;以詞語輸入為主幹達到快速易用;整句輸入還處于發展之中。目前較流行的中文輸入法有:搜狗拼音輸入法、谷歌拼音輸入法、紫光拼音、拼音加加、黑馬神拼、王瑪五筆、智能五筆、萬能五筆、注音輸入法、粵語拼音輸入法、倉颉輸入法、行列輸入法、呒蝦米輸入法、大易輸入法、部首輸入法、筆劃輸入法等。

發展曆程:由于漢字有數以萬計,電腦鍵盤不可能為每一個漢字而造一個按鍵。因此,人們需要替漢字編輸入碼(檢索出漢字的代碼),用數個鍵來輸入一個漢字。

中文輸入法的發展過程,是“萬碼奔騰”的過程,在20年間出現了上千種編碼方法。

漢語拼音輸入法:漢語拼音輸入法是利用漢字的讀音(漢語拼音)進行輸入的一類中文輸入法。拼音輸入法有幾種輸入方案包括全拼和雙拼。市場上有許多用拼音作基礎的輸入軟件。首先,大部分的現代操作系統都跟随着一副漢語拼音輸入法,如内建于WindowsXP的智能ABC和微軟拼音。其他商業拼音輸入産品有:紫光拼音、拼音加加、黑馬神拼、南極星字詞拼音、搜狗拼音輸入法、谷歌拼音輸入法等等。

五筆字型輸入法:五筆字型輸入法是王永民在1983年8月發明的一種漢字輸入法。漢字編碼的方案很多,但基本依據都是漢字的讀音和字形兩種屬性。五筆字型完全依據筆畫和字形特征對漢字進行編碼,是典型的“形碼”。五筆字型輸入法在使用簡體中文的地區較廣泛,是這些地區最常用的形碼輸入法。

倉颉輸入法:倉颉輸入法,是由台灣人朱邦複于1976年所創制的中文輸入法,最初隻有繁體中文版本,原名“形意檢字法”,用以解決電腦輸入漢字的問題。1978年由前國防部長蔣緯國将軍重新定名為“倉颉輸入法”。

行列輸入法:發明者為台灣人廖明德,他曾任職發展倚天中文系統的倚天資訊,行列輸入法免費授權給海峽兩岸的中文電腦廠商,附在各系統中,讓使用者可以免費使用。

日文輸入法

日文輸入法是指為了将日語輸入電腦或手提電話等設備而采用的編碼方法。日文輸入法主要被設計成基于平假名(讀音)的轉換系統,而此也衍生出兩種輸入方法:通過輸入羅馬字來轉換成平假名或直接輸入平假名,後者需要先記憶平假名的鍵盤分布,所以兩種方法也不乏使用者。也有部分軟件采用GUI選字方式甚至支援手寫模式作為輔助。

日文鍵盤:日本工業規格(JIS)有對日文鍵盤上的假名的排放位置有作規定。在日本銷售的鍵盤,大部分都是QWERTY鍵盤。QWERTY在日文鍵盤對應着以下假名:たていすかん(TaTeISuKaN')

特殊鍵鈕:因為日語輸入是基于平假名的,輸入完整的日語還需要轉換漢字,片假名以及普通的英語字符,标點符号。所以日文鍵盤上會多了幾個特殊按鈕。普通鍵盤沒有的按鈕,可以通過按下其他組合鍵來模拟(例如:Ctrl+CapsLock切換為平假名,Alt+CapsLock切換為片假名)。

手提電話:手提電話的鍵盤較電腦少,所以必須另外研發出一套完全不同的輸入方法。

手機輸入法

手機輸入法,即用手機在編寫短信息或是電話簿等項目中用到的輸入方式。手機輸入法可分為英文輸入法和中文輸入法等各語言種類的輸入法。同時,中文中又有區分為漢語拼音輸入法、注意輸入法、筆畫輸入法、字形輸入法等等。手機輸入法目前主要有:T9智能輸入法、字能輸入法、iTAP輸入法、搜狗手機輸入法、訊輸入法S60數字鍵版、能手機輸入法積木式漢字輸入法、首輸入法手機版、拟手寫手機中文輸入法、lumSIP(梅花輸入法)、字五筆中文輸入系統、碼手機輸入法、nSun1.2手機輸入法、意10鍵輸入法(ppc版)、筆輸入系統、意中文整句輸入法、中文之星掌上狂拼輸入法等。

三足鼎立之勢:從硬件的角度出發,手機的輸入技術大緻可劃分為數字鍵盤、字母鍵盤、手寫輸入等幾個方向。相對于字母鍵盤以及手寫輸入方式,目前最為成熟、用戶最經常使用的當屬數字鍵盤輸入法。在數字鍵盤輸入法領域,無論從用戶數量還是從影響力上來看,T9智能輸入法、字能輸入法和iTAP輸入法都占據了主流地位。同時,三種輸入法在具有高效輸入這一共性的同時,也因各有千秋而吸引着不同的用戶,形成了各自的市場和發展空間。

T9智能輸入法是針對移動小終端的文字輸入解決方案,以輸入字符高效快捷而著稱。T9可應用于42種語言,支持基于繁體和簡體中文輸入,以及基于聲碼的拼音和注音文字輸入。世界上有近300款手機預裝了T9智能輸入法,目前T9占據了全球80%的市場份額。字能輸入法具有20902個漢字的高容量字庫,是T9輸入法字庫的兩倍多,而這也是其相對于T9輸入法最大的優勢。目前該輸入法主要被愛立信的早期機型、阿爾卡特以及一些國産手機所采用。iTAP輸入法則是摩托羅拉的專利。摩托羅拉不斷地對iTAP輸入法的字庫進行更新,具有支持更多種語言的優勢。但由于iTAP是在T9的基礎上發展起來的,因此在輸入的算法方面與T9基本相似,而在筆畫輸入上則支持倒插筆。

事件

因輸入法而對薄公堂事件

2009年11月16日兩大IT巨頭搜狐和騰訊,為了一個小小的輸入法軟件鬧上法庭。庭上,雙方就虛假宣傳、惡意阻止、幹預排序等三個焦點問題展開了激烈的争論。由于雙方都不接受調解,北京市二中院宣布擇日宣判。

該案主要的原告、被告分别為搜狐旗下子公司北京搜狗科技發展有限公司(以下簡稱“搜狗公司”)、深圳市騰訊計算機系統有限公司(以下簡稱“騰訊公司”)。搜狗公司稱,騰訊公司提供的“QQ拼音輸入法”軟件服務業務,破壞原告運營的“搜狗拼音輸入法”軟件服務,實施了不正當競争行為,因此要求被告賠償經濟損失2000萬元以及相關費用。騰訊公司則對此斷然否認。

對這一案件,網友們的态度明顯分化。有網友表示力挺騰訊公司:“支持騰訊,騰訊是至今我見到的最偉大的公司,是最有可能超越微軟公司一統互聯網江湖的霸主。”有網友則持反對意見:“騰訊一向就是看人家推出什麼軟件受歡迎了,它也緊跟着推出,沒有什麼自己的東西,就靠模仿!”

雙方激辯三大焦點

焦點1:是否引入虛假宣傳

搜狗公司認為,被告騰訊公司在其網站上宣稱“QQ拼音輸入法最快、最準、最幹淨”、“速度最快,占用系統資源最小,利用最好的算法,最少的損耗,達到最優的性能”、“包含最新最全的流行詞彙,不僅僅适合任何場合使用,而且是最适合聊天軟件和其他互聯網應用中使用的輸入法”等,“片面誇大了自己在行業内的地位”,“給原告造成了巨大的經濟損失。”

而騰訊公司表示,IT和互聯網行業發展快、創新多、從業人員年紀輕等特點決定業内多數企業都是采用這樣的宣傳方式,“原告和原告的母公司搜狐公司的宣傳方式中都是使用該方式進行宣傳”,例如,關聯公司搜狐公司稱搜狐網是“中國最大的門戶網站”,搜狐網站稱“搜狐公司為中國互聯網第一品牌,中國搜索引擎的鼻祖,中國互聯網文化運動的先驅,中國綜合門戶網站的創始者,中文世界最大的網絡資産,擁有最先進的搜索引擎——搜狗”。

焦點2:是否惡意阻止對方軟件

搜狗公司認為:“被告在用戶下載、使用‘QQ拼音輸入法’軟件的同時,采取誘導、欺騙的方法,利用其破壞性技術手段直接删除網絡用戶終端的‘搜狗拼音輸入法’軟件的快捷方式,惡意阻止了網絡用戶同時使用‘搜狗拼音輸入法’軟件。”

而騰訊公司則表示:“QQ輸入法設置向導僅僅是為用戶設置了一種管理系統輸入法的快捷方式,原告指控的這一行為實質上是用戶根據設置向導的提示自己選擇的結果。”

焦點3:是否人為幹預自然排序

搜狗公司認為:“在用戶選擇同時使用‘搜狗拼音輸入法’軟件、‘QQ拼音輸入法’軟件的情況下,被告騰訊公司利用其破壞性技術手段将網絡用戶終端的各種輸入法快捷方式的自然排序進行人為幹預,使‘搜狗拼音輸入法’軟件的快捷方式的排序位置始終處于‘QQ拼音輸入法’之後。”

而騰訊公司則稱:“輸入法安裝過程中實際遵循的規則是:後安裝者排第一”;“‘QQ拼音輸入法’并非故意壓制‘搜狗輸入法’。”另外,騰訊公司還特别指出:“先安裝‘QQ拼音輸入法’,再安裝‘搜狗拼音輸入法’,搜狗自動也會排在第一位。

相關詞條

相關搜索

其它詞條