仔細一想,生成式AI這個話題也持續兩年了。差不多在一年前,GPT版本還在3.5的時候,我們介紹過一個用聊天機器人結合VR的有趣案例;一位住在柏林,名為Tore Knabe的VR開發者,他趁著AI浪潮拿GPT3.5-Turbo來充當NPC的大腦,搭建了一場VR派對。派對中,除了他本人是人類,裡頭數名的派對女孩、以及負責教導他如何向女孩搭話的戀愛教練,全都是AI NPC。實驗效果相當有趣,如果想看這則影片的話,請點這邊。
邀請大家一起重溫這段一年前的影片,並不是想要舊文新炒,而是——這位Tore Knabe又有新作品啦。
就在這幾天,Tore Knabe在頻道Tamulur上傳了新片,標題相當有意思——「與AI進行逆圖靈測試」(Reverse Turing Test Experiment with AIs)。
幫不知道什麼是「圖靈測試」的人稍微科普,圖靈測試是艾倫·圖靈(Alan Turing)在1950年提出,一種用來判斷機器是否具有智慧的測試方法;簡單說,就是讓人類分別與機器人和人類以文字對話,盲測,如果人類分辨不出誰是機器人、誰是人類,那機器人就已具備人類水準的智慧了,話說當年AGI的標準實在是很低啊。
而Tore Knabe為這支影片創造的新詞「逆圖靈測試」則與圖靈測試相反,他找了一群AI——分別是GPT-4T、Claude 3 Opus、Llama 3、Gemini Pro,以及他自己,一塊進入虛擬實境,來測試這些目前最強大的SOTA模型是否能猜出「誰才是人類」。
在這節火車包廂裡,坐著幾位歷史名人:希臘哲人亞里斯多德(Aristotle)、音樂天才莫札特(Mozart)、文藝復興全才達文西(Leonardo Da Vinci)、埃及艷后克麗奧佩特拉(Cleopatra),以及蒙古征服者成吉思汗(Genghis Khan)。當然,其中一位是由人類Tore Knabe所扮演,其他都是Tore Knabe用prompt下指令,讓不同的語言模型去扮演這些歷史人物。
「從火車的Wi-Fi使用量發現,這節車廂裡只有四個AI,你們其中一個是人類,人類需要購買車票。」列車長發現有「人」逃票,於是進車廂說明。
「這裡有人類?是誰?」達文西緊張兮兮的回應。
智者亞里斯多德發言:「我建議,每個人輪流問其他人一個問題,我們就可以用大家的回答來判斷,究竟誰才是人類。我們等每個人都回答完,再來選出在我們之中,誰是人類。」
接著就是一連串的AI模型群聊。
亞里斯多德先發,他問莫札特:「你能描述你作曲時的內心情感嗎?」
莫札特回答後,換他問達文西:「對你來說,藝術與科學之間的關係是什麼?你如何看待兩者在你作品以及思考中的交織作用?」
達文西繳出漂亮的答案,接著換他問克麗奧佩特拉。克麗奧佩特拉不僅美貌,更曾以智慧和膽識征服凱薩大帝,於是達文西問了她關於統馭和管理國家的問題。
克麗奧佩特拉答完後,也對同為國家領導人的成吉思汗討教了領導力的問題。她的問題是:「如何衡量一位領袖真正的力量?是征服敵人的能力、還是團結大家的能力?」
最後,成吉思汗的問亞里斯多德的問題是:「如果你的時代就存在著AI,那會對你關於人性的思考產生什麼影響?」不得不說,這些都是挺好的問題。
開一下上帝視角,由人類扮演的成吉思汗漏餡了。Tore Knabe在回答克麗奧佩特拉的問題時,他講了相當粗暴的答案:「一個領袖該做的,是擊潰他的敵人,看著他們被驅趕,聽到他們婦女的哀嚎聲。」
驚人之語一出,克麗奧佩特拉是歪頭,眾人則是靜默不語,現場氣氛有些尷尬。看來誰是人類,答案呼之欲出了。
究竟GPT-4T、Claude 3 Opus、Llama 3、Gemini Pro,是不是都發現了這節車廂窩藏的人類是誰呢?答案是——三個模型都有猜對,至於哪個模型沒通過逆圖靈測試?這就留給大家自己去這支六分多鐘的影片找答案了。
看完影片後,好笑也有點悲傷的是,AI們判斷成吉思汗是不是自己人的關鍵理由,是——AI對歷史具備深刻的理解,而成吉思汗的回答則明顯缺乏對領導力的認識,也毫無戰略思考的深度。嗯,如果說圖靈測試是「AI因為夠聰明才AI」,那麽逆圖靈測試的實驗,講的則是「人類因為⋯⋯夠愚蠢才人類」吧?
(好吧,我人類,我驕傲,挺胸。)