早前 Google 發表新技術,機械助理以人類語氣打電話為用戶預約時間,機械不再帶合成「口音」,更可以模仿人類思考時發出的嘆詞,整個對話中,接聽者完全沒有察覺到端倪。長此下去,若非看見真人,在電話或是在網上的另一端是人,還是人工智能,已難分辨。要識破人工智能的超完美模仿能力,有何方法?麻省理工學院最近就進行研究,調查人類如何從用字上作「人機之辨」。
聊天機械人(Chatbot)、自然語言生成技術等日趨成熟,人工智能愈來愈多與人直接進行對話,在電話或網上跟客戶服務人員溝通,對方是真人還是演算法,界線開始模糊。麻省理工學院其中一位研究人員 John McCoy 指出,相關研究最初的靈感來自與同事閒聊,談及由英國科學家圖靈(Alan Turing)於 1950 年首次開發的圖靈測試,參與測試者在看不到對方是人或機械的情況下,只能透過隨意詢問問題,並得對方文字回答,以分辨人及機器。如果機器能夠愚弄到預定數量的參與者,就能通過圖靈測試。是次研究就參考其方法,進一步測試人類靠甚麼分辨人及機器。
人類的字眼
在測試之前,研究人員先假設是否只用一個單詞就找能出人機分別,但問題在於人類實際上會說出怎樣的話呢?所以在第一個實驗中,McCoy 及同事 Tomer Ullman 先要求超過 1,000 名參與者回答此問題,然後分析說話中單詞出現的共通點,發現在回答中,首 4 個最常出現的字眼分別為「愛(Love)」、「同情(Compassion)」、「人類(Human)」、「請求(Please)」。對於這樣的結果, McCoy 說:「他們(明明)可以從標準英語詞典中,選擇任何喜歡的單詞,但個人的選擇之間,卻存在巨大的一致。」
「愛」這個詞有 134 個回應提到,大約 10% 的參與者在成千上萬的可能性中,選擇了這個詞。至主題方面的共通點,以「形容身體機能」為例,如「大便」;「信仰及寬恕」,就有「憐憫」或「希望」;至於「情感」,如「同理心」;「食物」方面,如「香蕉」等,均是最常提及的類別。
然後,McCoy 及 Ullman 進行第二次實驗,看看其他人對第一個實驗中篩選出來的單詞,有何反應,最受歡迎的字能否顯示「人味」?為了找到答案,研究人員將最多人選擇的單字以各種組合,如「愛」與「人類」組合在一起,並要求另一組參與者確定哪個是人類,哪個是電腦。
諷刺是人性化表現
正如在第一項研究中的結果,「愛」成為最成功分辨出來的其中一個字。但在這次測試中,排名最高的詞卻是「大便」。有趣的是,糞便被認定是一種人類的諷刺用語,因此不是對事物作出描述,而是蓄意無視禁忌,以此作出挑釁,反而可能最直接表達出人性的情感。而一些被視為人類獨有詞語,使用時超出了字典的定義時,也被視作人性的表現,如「please」及「moist」。
雖然機械人現在可以編寫基本的描述性句子,甚至是可理解短故事,但他們仍難理解幽默及諷刺,畢竟幽默需要深刻了解語境,而每個詞同時亦存在許多文化聯想,McCoy 說:「這個非常簡單的問題,讓你深入思考人與電腦,以及兩者如何溝通。」
總的來說,如果將來你置身在機器的世界中,證明自己是一個人,要不就是無禮,要不就是有趣。研究論文最終發表在期刊 Journal of Experimental Social Psychology 上。