圖靈測試

圖靈測試

科學研究實驗
圖靈(Turing1950)提出了一個任務,這個任務中一個人和某一生物進行交流,人提出問題,而這個生物使用一種不知名的語言。簡單地說,人的任務是判斷該生物是否與人有所區别。多虧了圖靈,這個模拟遊戲,即後來衆所周知的圖靈測試(turingtest),它的使用具有非常精妙的欺騙性,讓人工智能專家。把注意力從哲學思辨轉向具體化的研究工作一-哲學思辨一直是科學和心理學曆史上的主要障礙[1]。
  • 中文名:圖靈測試
  • 類 别:對人工智能的測試
  • 外文名:The Turing test
  • 發明者:艾倫·麥席森·圖靈
  • 提出時間:1950年

創始人物

艾倫·麥席森·圖靈,英國數學家、邏輯學家,被視為計算機科學之父。

1931年,艾倫·圖靈(Alan Turing)進入劍橋大學國王學院,畢業後到美國普林斯頓大學攻讀博士學位。1936年,圖靈向倫敦權威的數學雜志投一篇論文,題為“論數字計算在決斷難題中的應用”。在這篇開創性的論文中,圖靈給“可計算性”下了一個嚴格的數學定義,并提出著名的“圖靈機”(Turing Machine)的設想。

“圖靈機”不是一種具體的機器,而是一種思想模型,可制造一種十分簡單但運算能力極強的計算裝置,用來計算所有能想象得到的可計算函數。“圖靈機”與“馮·諾伊曼機”齊名,被永遠載入計算機的發展史中。

1950年10月,圖靈又發表另一篇題為“機器能思考嗎”的論文,成為劃時代之作。也正是這篇文章,為圖靈赢得了“人工智能之父”的桂冠。圖靈還進一步預測稱,到2000年,人類應該可以用10GB的計算機設備,制造出可以在5分鐘的問答中騙過30%成年人的人工智能。

研究曆程

1936年,哲學家阿爾弗雷德·艾耶爾思考心靈哲學問題:我們怎麼知道其他人曾有同樣的體驗。在《語言,真理與邏輯》中,艾爾提出有意識的人類及無意識的機器之間的區别。

1950年,圖靈發表了一篇劃時代的論文,文中預言了創造出具有真正智能的機器的可能性。由于注意到“智能”這一概念難以确切定義,他提出了著名的圖靈測試:如果一台機器能夠與人類展開對話(通過電傳設備)而不能被辨别出其機器身份,那麼稱這台機器具有智能。這一簡化使得圖靈能夠令人信服地說明“思考的機器”是可能的。論文中還回答了對這一假說的各種常見質疑。圖靈測試是人工智能哲學方面第一個嚴肅的提案。

1952年,在一場BBC廣播中,圖靈談到了一個新的具體想法:讓計算機來冒充人。如果不足70%的人判對,也就是超過30%的裁判誤以為在和自己說話的是人而非計算機,那就算作成功了。1956年達特茅斯會議之前,英國研究者已經探索十幾年的機器人工智能研究。比率俱樂部是一個非正式的英國控制論和電子産品研究團體,成員包括艾倫·麥席森·圖靈。1967年由英國哲學家費麗帕·弗特提出。鐵軌上有五個小孩在玩,停用的岔軌上有一個小孩在玩,要把車轉移到岔軌上壓死一個孩子救下五個嗎?這是一個非常典型的關于道德問題的直覺泵。1980年約翰·塞爾在《心智、大腦和程序》一文中提到的中文屋子思想實驗,對圖靈測試發表了批評。

美國科學家兼慈善家休·羅布納20世紀90年代初設立人工智能年度比賽,把圖靈的設想付諸實踐。比賽分為金、銀、銅三等獎。

2014年6月8日,一台計算機(計算機尤金·古斯特曼并不是超級計算機,也不是電腦,而是一個聊天機器人,是一個電腦程序)成功讓人類相信它是一個13歲的男孩,成為有史以來首台通過圖靈測試的計算機。這被認為是人工智能發展的一個裡程碑事件。 2015年11月,《Science》雜志封面刊登了一篇重磅研究:人工智能終于能像人類一樣學習,并通過了圖靈測試。測試的對象是一種AI系統,研究者分别進行了展示它未見過的書寫系統(例如,藏文)中的一個字符例子,并讓它寫出同樣的字符、創造相似字符等任務。結果表明這個系統能夠迅速學會寫陌生的文字,同時還能識别出非本質特征(也就是那些因書寫造成的輕微變異),通過了圖靈測試,這也是人工智能領域的一大進步。 

測試内容

圖靈提出了一種測試機器是不是具備人類智能的方法。即假設有一台電腦,其運算速度非常快、記憶容量和邏輯單元的數目也超過了人腦,而且還為這台電腦編寫了許多智能化的程序,并提供了合适種類的大量數據,那麼,是否就能說這台機器具有思維能力?

圖靈肯定機器可以思維的,他還對智能問題從行為主義的角度給出了定義,由此提出一假想:即一個人在不接觸對方的情況下,通過一種特殊的方式,和對方進行一系列的問答,如果在相當長時間内,他無法根據這些問題判斷對方是人還是計算機,那麼,就可以認為這個計算機具有同人相當的智力,即這台計算機是能思維的。這就是著名的“圖靈測試”(Turing Testing)。當時全世界隻有幾台電腦,其他幾乎所有計算機根本無法通過這一測試。 

要分辨一個想法是“自創”的思想還是精心設計的“模仿”是非常難的,任何自創思想的證據都可以被否決。圖靈試圖解決長久以來關于如何定義思考的哲學争論,他提出一個雖然主觀但可操作的标準:如果一台電腦表現(act)、反應(react)和互相作用(interact)都和有意識的個體一樣,那麼它就應該被認為是有意識的。為消除人類心中的偏見,圖靈設計了一種“模仿遊戲”即圖靈測試:遠處的人類測試者在一段規定的時間内,根據兩個實體對他提出的各種問題的反應來判斷是人類還是電腦。通過一系列這樣的測試,從電腦被誤判斷為人的幾率就可以測出電腦智能的成功程度。

圖靈預言,在20世紀末,一定會有電腦通過“圖靈測試”。2014年6月7日在英國皇家學會舉行的“2014圖靈測試”大會上,舉辦方英國雷丁大學發布新聞稿,宣稱俄羅斯人弗拉基米爾·維西羅夫(Vladimir Veselov)創立的人工智能軟件尤金·古斯特曼(Eugene Goostman)通過了圖靈測試。雖然“尤金”軟件還遠不能“思考”,但也是人工智能乃至于計算機史上的一個标志性事件。

人機測試

圖靈采用“問”與“答”模式,即觀察者通過控制打字機向兩個測試對象通話,其中一個是人,另一個是機器。要求觀察者不斷提出各種問題,從而辨别回答者是人還是機器。圖靈還為這項測試親自拟定了幾個示範性問題:

問: 請給我寫出有關“第四号橋”主題的十四行詩。

答:不要問我這道題,我從來不會寫詩。

問:34957加70764等于多少?

答:(停30秒後)105721

問:你會下國際象棋嗎?

答:是的。

問:我在我的K1處有棋子K;你僅在K6處有棋子K,在R1處有棋子R。輪到你走,你應該下哪步棋?

答:(停15秒鐘後)棋子R走到R8處,将軍!

圖靈指出:“如果機器在某些現實的條件下,能夠非常好地模仿人回答問題,以至提問者在相當長時間裡誤認它不是機器,那麼機器就可以被認為是能夠思維的。”

從表面上看,要使機器回答按一定範圍提出的問題似乎沒有什麼困難,可以通過編制特殊的程序來實現。然而,如果提問者并不遵循常規标準,編制回答的程序是極其困難的事情。例如,提問與回答呈現出下列狀況:

問:你會下國際象棋嗎?

答:是的。

問:你會下國際象棋嗎?

答:是的。

問:請再次回答,你會下國際象棋嗎?

答:是的。

你多半會想到,面前的這位是一部笨機器。如果提問與回答呈現出另一種狀态:

問: 你會下國際象棋嗎?

答:是的。

問:你會下國際象棋嗎?

答:是的,我不是已經說過了嗎?

問:請再次回答,你會下國際象棋嗎?

答:你煩不煩,幹嘛老提同樣的問題。

那麼,你面前的這位,大概是人而不是機器。上述兩種對話的區别在于,第一種可明顯地感到回答者是從知識庫裡提取簡單的答案,第二種則具有分析綜合的能力,回答者知道觀察者在反複提出同樣的問題。“圖靈測試”沒有規定問題的範圍和提問的标準,如果想要制造出能通過試驗的機器,以我們的技術水平,必須在電腦中儲存人類所有可以想到的問題,儲存對這些問題的所有合乎常理的回答,并且還需要理智地作出選擇。

社會評價

現代計算機之父馮·諾依曼生前曾多次謙虛地說,如果不考慮查爾斯·巴貝奇等人早先提出的有關思想,現代計算機的概念當屬于艾倫·圖靈。馮·諾依曼能把“計算機之父”的桂冠戴在比自己小10歲的圖靈頭上,足見圖靈對計算機科學影響之巨大   。

相關詞條

相關搜索

其它詞條