圖靈測試目的是甚麼?

A+A-
圖片來源:Westworld 劇照
圖片來源:Westworld 劇照

霍金Elon Musk 不約而同警告人類或需面對人工智能(AI)的威脅,2016 年初 AlphaGO 四比一大勝韓國頂尖職業棋手李世石。人工智能看似終將要超越人類。HBO 美劇「西部世界」再一次把這憂慮帶到人前,劇中借助 1950 年的「圖靈測試」(Turing Test)理論,把這種焦慮描繪得歷歷在目,但到底甚麼是「圖靈測試」?圖靈測試又有甚麼局限?

圖靈測試:決定電腦是否具備與人難分的思考表現

1950 年,電腦科學家圖靈(Alan Turing)假設一個情況:電腦和人類均在一個密閉的房間中,分別被詢問各種問題,目的是讓第三者分辨出誰是電腦,誰是人類。假如電腦能成功誤導第三者,使其認為自己不是電腦而是人類,則為人工智能通過一個重要的里程碑。這測試稱為「圖靈測試」。圖靈估計,人類需要 50 年才有能力設計出電腦程式,讓電腦的模仿能力達到一個水平——在一般人質問電腦 5 分鐘後,正確判斷的機率低於 7 成。

電腦科學家圖靈(Alan Turing)
電腦科學家圖靈(Alan Turing)。圖靈測試原意是決定電腦是否具備與人類不能分辨的思考表現。 圖片來源:wikimedia

1982 年的科幻電影 Blade Runner Voight-Kampff 機器便是經典借鑑圖靈測試的橋段,基於測量目標對象在回應問題時引起的呼吸、臉紅、心跳頻率、眼球運動等生理活動,來判斷是否人造人。資深科學作家 Philip Ball 卻指出,大多數的科幻作品還是錯誤解讀了圖靈測試,圖靈測試原意並非用於分辨機械人是否通過,從而成為人類中;而是決定電腦是否具備與人類不能分辨的思考表現。

圖靈測試本身亦忽略了許多方面的「人性」,於是研究者不斷嘗試改進測試,例如在遊戲博奕方面,像國際象棋要用上戰略思維,圖靈本人便認為可作為著眼點。不過在 1997 年,電腦「深藍」戰勝國際象棋世界冠軍 Garry Kasparov 後,長遠而言,運用演算法(即讓電腦執行預計好的公式),電腦在所有博奕遊戲必然戰無不勝,最近的 AlphaGO 便再證一例。

那麼在需要創意和難以名狀的領域,例如音樂,電腦也能欺騙我們嗎?作曲電腦 Iamus 便能創作出令專業音樂家注目的精巧樂曲。Iamus 的研發者、西班牙馬拉加大學的 Francisco Vico 及其團隊對 250 名聽眾做類似「圖靈測試」的實驗,聽眾中一半是專業的音樂家,讓他們聽其中一首 Iamus 的樂曲,Vico 說:「參與者不能分辨樂曲,電腦創作的樂章能帶出與人類創作的相同感覺。」

除了音樂,有說電腦也能創作幾可亂真的詩歌,也有科學家製造出觸感和真皮膚一樣的假手,像西部世界的接待員或許真的指日可待?

在各方面意義的圖靈測試

美國約翰·霍普金斯大學與美國布朗大學的研究員,則著眼於「視覺圖靈測試」,研究系統能否分析出物體影像間的關係,而非單純辨認物體。例如「到底電腦能分析出某人是否在路上行走?」「某人是否與另一人正在溝通?」

視覺圖靈測試
「視覺圖靈測試」研究系統能否分析出物體影像間的關係,不僅是單純辨認物體,以上是布朗大學的研究示例問題。 圖片來源: Stuart Geman

至於原版的圖靈測試,目前最有可能見於網上世界,例如網絡遊戲玩家或會懷疑,到底他是與真人玩家還是與通訊機械人對戰?就在日前,中日韓三國圍棋冠軍悉數落敗於名為「Master」的網上棋手,讓外界猜測其真身到底是人類還是電腦(雖然最終揭曉 Master 是 AlphaGO 的黃士傑所操作)。但吊詭的是,因棋手棋力太高,一開始便讓人懷疑「他」大有可能是電腦,要模仿人類還需掌握不確定的「人性」。

在 2014 年,來自俄羅斯的 Eugene Goostman 超級電腦在倫敦皇家學會所舉辦的「圖靈測試」比賽中,成功在「鍵盤對話」中讓 33% 的裁判相信它是一名「13 歲非英語母語烏克蘭男孩」,但過程被批評取巧,例如身份為 13 歲小孩讓評判在心理上未有着意電腦的一些古怪回應,如此有違圖靈測試的原意。

實際上,該超級電腦的實力也有限,當被提問及:「你認為你有能力愚弄平庸的評判,來顯示圖靈測試的缺憾,或僅反映他人解讀測試的方法呢?」Eugene 回答:「基於要下線維護或容量問題,伺服器暫時未能提供你所要求的答案,請稍後再試。」幾可亂真的人工智能時代,人工智能還需花點時間「學習」。