影片版Midjourney來了,Phenaki讓你一句話就能AI生成劇情片

這陣子AI生成藝術發展的速度,好像在趕火車一樣;原以為Midjourney、DALL-E 2等工具能夠生成圖片已經很震撼,沒想到以目前的技術發展,只要輸入文字和關鍵字等提示,AI還能幫忙生成影片。譬如最近Meta就在官方部落格曝光了他們的AI影片製作工具「Make-a-Video」,上傳圖文就可做出五秒鐘短片。

Meta家的AI也太忙,之前還在批評自家老闆「令人毛骨悚然」,現在又跑來做小狗影片,值得獲頒斜槓勳章。(來源:Meta)


如果你覺得「Make-a-Video」秒數太短、沒有故事情節,無法讓你感到驚艷,不妨看看同一天在國際學習展示會議ICLR的網站上,由匿名作者(更新:後經披露為Google Brain團隊上傳的另一款AI影片製作工具——Phenaki。

Phenaki不只可將文字、圖片由靜轉動,厲害的是它能讀懂提示中的時間變化,代表其容許創作者自行規定劇情發展,以驅使AI生成影片;此外,Phenaki生成的影片,時長最多可達2分鐘,這已經比YouTuber「反正我很閒」爆紅的那集「卑鄙源之助」還要長了啊。

有興趣的朋友也可到Phenaki網站看看他們的白皮書。

今年6月上線的新創平台PromptBase,就是一個專門給「AI溝通師」上架、販售自創提示詞的地方,這些提示詞可運用在Midjourney、DALL-E 2給AI指令,讓使用者不必歷經百般試錯,也能順利生成自己想要的圖片。其創辦人Ben Stokes在科技新聞網站TechCrunch的專訪中,表示看好Midjourney、DALL-E 2等生成藝術作為創作者工具的發展:

「今天,我們靠提示詞就可以生成文章和圖片;不難想像,在未來幾年之後,我們能靠出一張嘴讓AI產出影片,甚至有一天,我們能用AI生成帶有管弦配樂的電影。」


很難相信Ben Stokes描繪的將來竟然來得如此之快。(說好的「未來幾年後」呢?)

Phenaki的白皮書裡收錄了幾支用它生成的影片;尼尼我個人最喜歡的是一支關於「泰迪熊在水裡游泳」的作品,提示詞如下:「寫實的泰迪熊在舊金山的海裡游泳/泰迪熊到水面下/泰迪熊和五彩繽紛的魚一起游泳/一隻熊貓在水底游泳」。

影片裡還真能看到泰迪熊的熊生逐漸黑白,變化成熊貓的起承轉合,尼尼我看完到現在,下巴都還沒接回來啊!

訂閱電子報

返回頂端