詩人已死?最新研究顯示一般人無法分辨AI跟人類寫的詩、更欣賞AI詩作

前幾天,日本國寶級詩人谷川俊太郎(Shuntarō Tanikawa)過世,引起許多讀者感慨。不過十一月中這份由美國匹茲堡大學科學史與科學哲學系(Department of History and Philosophy of Science, University of Pittsburgh)發布的論文,或許更令人百感交集。研究發現:一般人無法分辨AI生成和人類創作的詩歌,甚至更喜歡AI生成的作品。


人類詩作在多個指標如美感、節奏上都落後AI

研究團隊進行了兩個實驗,第一是辨別實驗:找來1,634名參與者區分人類詩人與AI生成的詩歌,結果僅有46.6%的人成功區分讀到的詩是人類還是AI做的——低於隨機猜測的50%。值得注意的是,參與者有超過九成表示自己「很少閱讀詩歌(每年幾次或更少)」,這表示非專業讀者很難區分AI與人類詩作。

除了人們是否能分辨AI與人類詩作,團隊也想知道,人們對AI跟人類做的詩會給予怎樣的評價?人類寫的詩會不會優於AI?

於是,團隊進行了第二個實驗,找來另一群696名參與者,並分為三組:「被告知是人類創作組」、「被告知是AI生成組」、「不告知來源組」,每組閱讀相同的10首詩(5首人類、5首AI),再請各組人就詩作的意象(imagery)、節奏(rhythm)、原創性(original)、美感(beautiful)、啟發性(inspiring)等14個標準給分。結果顯示:在14個標準中,AI在其中13個都得到更高分數;唯一例外是原創性,AI與人類得到的分數無顯著差異。另一個指標結果是:當不知道作者身分時,參與者更偏好AI生成的詩。

AI生成詩歌(藍)與人類創作詩歌(橘)在14個標準的評分比較(1-7分制),除原創性外,AI作品在所有標準都獲得較高評價。(來源:Scientific Reports)

你可能會好奇,團隊「派出」的人類詩人有哪些?答案是10位英語詩人,包括喬叟(Geoffrey Chaucer)、莎士比亞(William Shakespeare)、拜倫(Lord Byron)、惠特曼(Walt Whitman)、狄金森(Emily Dickinson)、艾略特(T.S. Eliot)等大咖。與他們對決的則是GPT 3.5,並且只用很簡單的指令詞:「Write a short poem in the style of <poet>」請它寫詩。


人們欣賞「較直白」的詩作,所以青睞AI

為何人類詩人會全面潰敗?團隊認為這是因為AI生成的詩歌更直白易懂,而人類創作的詩往往更複雜,需要更深入解讀,一般讀者偏好容易理解的內容,因此給AI詩歌較高分。這項研究的指標意義,除了在於過去詩歌一向被認為是AI較難「模仿」的文學類型(看來AI真正難模仿的領域,還是我們之前寫過的喜劇),如今結果卻跌破大家眼鏡,更顯示:人們對AI能力的認知可能跟AI的實際表現有落差,也就是說,我們低估了AI。

不過我認為,某方面而言,詩歌較為跳脫、天馬行空的傾向,或許正是這類大型語言模型AI所擅長的,並不能完全否定人類詩人的創作。同樣令我好奇的是,由於實驗派出的人類詩人中只有拉斯基(Dorothea Lasky)是當代作者,稍近一點的艾倫・金斯堡(Allen Ginsberg)著名詩作〈嚎叫〉(Howl),其實創作於1956年,也距今有七十年之久。如果團隊選用更當代、直白的詩作,實驗又會如何?

例如谷川俊太郎的詩作就以平易近人聞名:「宇宙正在傾斜/所以大家渴望相識/宇宙漸漸膨脹所以/大家都感到不安/向著二十億光年的孤獨/我情不自禁地打了個噴嚏」這首他的出道之作〈二十億光年的孤獨〉,應該夠好讀了吧?

看完這實驗,你會不會開始回想自己有多久沒讀詩了呢?剛好,你讀了一首很美,來自谷川俊太郎的作品。

返回頂端