約AI NPC進VR裡群聊，ChatGPT和一眾AI模型能找到誰是人類嗎？

仔細一想，生成式AI這個話題也持續兩年了。差不多在一年前，GPT版本還在3.5的時候，我們介紹過一個用聊天機器人結合VR的有趣案例；一位住在柏林，名為Tore Knabe的VR開發者，他趁著AI浪潮拿GPT3.5-Turbo來充當NPC的大腦，搭建了一場VR派對。派對中，除了他本人是人類，裡頭數名的派對女孩、以及負責教導他如何向女孩搭話的戀愛教練，全都是AI NPC。實驗效果相當有趣，如果想看這則影片的話，請點這邊。

邀請大家一起重溫這段一年前的影片，並不是想要舊文新炒，而是——這位Tore Knabe又有新作品啦。

就在這幾天，Tore Knabe在頻道Tamulur上傳了新片，標題相當有意思——「與AI進行逆圖靈測試」（Reverse Turing Test Experiment with AIs）。

幫不知道什麼是「圖靈測試」的人稍微科普，圖靈測試是艾倫·圖靈（Alan Turing）在1950年提出，一種用來判斷機器是否具有智慧的測試方法；簡單說，就是讓人類分別與機器人和人類以文字對話，盲測，如果人類分辨不出誰是機器人、誰是人類，那機器人就已具備人類水準的智慧了，話說當年AGI的標準實在是很低啊。

而Tore Knabe為這支影片創造的新詞「逆圖靈測試」則與圖靈測試相反，他找了一群AI——分別是GPT-4T、Claude 3 Opus、Llama 3、Gemini Pro，以及他自己，一塊進入虛擬實境，來測試這些目前最強大的SOTA模型是否能猜出「誰才是人類」。

車長（中）、達文西（左）、克麗奧佩特拉（右）。奇怪的組合。（來源：Tamulur）

在這節火車包廂裡，坐著幾位歷史名人：希臘哲人亞里斯多德（Aristotle）、音樂天才莫札特（Mozart）、文藝復興全才達文西（Leonardo Da Vinci）、埃及艷后克麗奧佩特拉（Cleopatra），以及蒙古征服者成吉思汗（Genghis Khan）。當然，其中一位是由人類Tore Knabe所扮演，其他都是Tore Knabe用prompt下指令，讓不同的語言模型去扮演這些歷史人物。

「從火車的Wi-Fi使用量發現，這節車廂裡只有四個AI，你們其中一個是人類，人類需要購買車票。」列車長發現有「人」逃票，於是進車廂說明。

「這裡有人類？是誰？」達文西緊張兮兮的回應。

智者亞里斯多德發言：「我建議，每個人輪流問其他人一個問題，我們就可以用大家的回答來判斷，究竟誰才是人類。我們等每個人都回答完，再來選出在我們之中，誰是人類。」

接著就是一連串的AI模型群聊。

亞里斯多德先發，他問莫札特：「你能描述你作曲時的內心情感嗎？」

莫札特回答後，換他問達文西：「對你來說，藝術與科學之間的關係是什麼？你如何看待兩者在你作品以及思考中的交織作用？」

達文西繳出漂亮的答案，接著換他問克麗奧佩特拉。克麗奧佩特拉不僅美貌，更曾以智慧和膽識征服凱薩大帝，於是達文西問了她關於統馭和管理國家的問題。

克麗奧佩特拉答完後，也對同為國家領導人的成吉思汗討教了領導力的問題。她的問題是：「如何衡量一位領袖真正的力量？是征服敵人的能力、還是團結大家的能力？」

最後，成吉思汗的問亞里斯多德的問題是：「如果你的時代就存在著AI，那會對你關於人性的思考產生什麼影響？」不得不說，這些都是挺好的問題。

開一下上帝視角，由人類扮演的成吉思汗漏餡了。Tore Knabe在回答克麗奧佩特拉的問題時，他講了相當粗暴的答案：「一個領袖該做的，是擊潰他的敵人，看著他們被驅趕，聽到他們婦女的哀嚎聲。」

驚人之語一出，克麗奧佩特拉是歪頭，眾人則是靜默不語，現場氣氛有些尷尬。看來誰是人類，答案呼之欲出了。