編輯:袁榭 拉燕【新智元導讀】嫌情人節的各種卡片、糖果上情話千篇一律?每年上AI界網紅Janelle Shane的個人博客,搜集她例行用AI生成的奇葩情話吧:「愛上兩千野豬」、「打到我服」、「螞蟻能留下」。情人節到瞭。不管是永遠孤寂的萬年單身宅,還是等著另一半奉上例行年敬的有情人,抑或是憎惡商業化節日物化人性的憤怒野狼,都會預期在今天看到鋪天蓋地的量產單調情話。嫌棄情人節的情話千篇一律令人厭倦,幾乎已是普世情緒。那麼,想要月下鬼步舞不走尋常路、整點詭奇情話的話,該怎麼搞呢?有會寫碼的大姐姐支招瞭:拿AI來跑。2018年,開始用個人電腦訓練AI說情話自由研究者Janelle Shane,主職是在光學設備公司供職的激光科學傢,副業是搞自己愛好的神經網絡AI訓練、寫AI科普書籍、做AI界網紅。在gpt沒有面世的2017年,她就拿自己的MacBook,訓練簡單的神經網絡AI寫哈利波特同人文、給星戰宇宙和龍與地下城遊戲創作新的角色名字、生成新的寶可夢卡片。2017年底-2018年的情人節,她開始瞭自己的著名習慣,隔年就用AI生成一批情人節心形糖果/卡片上的情話。在情人節前後,這些被稱為「糖果心」的產品會在歐美熱銷一陣。它們小小的,上面寫著一些簡短的和情人節相關的信息。心形的糖果上一般隻有幾個字符的空間,所以一般就寫一些像「我愛你」或「給我打電話~」或「我是你的!」之類的東西。為瞭創建「情話bot」AI,最開始Shane搜集瞭366條市面上真正在售賣的情人節心形糖果的情話。將這些原始數據集輸入神經網絡,讓AI識別數據模式然後利用這些模式生成新的仿作情話。結果嘛,的確頗為新異。不過看得出AI在示愛勾引人這門技術的造詣上還遠遠比不過真人。生成的情話產品也遠未達到能填在糖果、卡片上賣錢的商業化質量。盡管不能賣錢,但結果真的非常奇葩。AI生成的情話有的甜度達標:「愛情面包」(LOVE BUN)「你是寶貝」(YOU ARE BABE)「親愛的我」(DEAR ME)「可愛的吻」(Cute Kiss)「我的小熊」(MY BEAR)有的就差點意思:「就是你」(YOU ARE IT)「我比心」(HEART ME)「愛我的英雄」(FANCY MY HERO)更多的往奇怪的方向奔去瞭:「全體懸浮」(ALL HOVER)「熊隊」(TEAM BEAR)「釘住一臉」(PIN A FACE)「陷坑愛」(BOG LOVE)「我鳴笛」(I HONKER)還有一些進入瞭真正詭異的領域:「愛上兩千野豬」(LOVE 2000 HOGS YEA)「打得我馴服」(BEAT ME TAME)「臭臭的愛」(STANK LOVE)「汗汗的便便」(SWEAT POO)「汗汗的梨」(SWEAT PEAR)「燧石臉」(CHERT FACE)。更有一些進入瞭成年人雙關語領域:「甜心長棍」(SWEET POLE)「貼肉伴侶」(MEAT MATE)「你是坨黏液」(YOU A GOO)「舔」(LICK)「看著大」(LOOK BIG)「我的小賤人」(MY HAG)……按Janelle Shane接受采訪時的回應,她覺得拿AI生成勾引人情話這事非常有意思,因為算法完全不懂單詞的具體意思,也不知道為什麼換一個字母意義就會改變。當時的簡單AI隻會學習數據排列的模式,並按這些模式排列字母。不過以AI為鏡,可以知人類自己求偶時能有多搞笑,畢竟原始數據字眼全是從市售的真實心形糖果上摘錄的。2020年,用GPT-2生成亂碼情話2017年生成情人節情話的神經網絡AI,對英語的訓練經驗為零,隻能學習原始的那 366 條文字中的內容——而且,它還是不知道在某些組合中應該避免哪些字母。在2019年底-2020年的情人節,Janelle Shane嘗試使用 GPT-2來生成情話。在當時,GPT-2算得上是自然語言處理領域的市面上最強AI,參數超過15億,爬取的訓練文本相當於3.5萬本《白鯨記》,在各種「預測給定文本後內容」的任務上有突出表現。雖然當時GPT-2還沒有學習過關於情人節卡片的內容(盡管它可能已經在網上看到過卡片的列表),但Shane用 talk to transformer 給它添加瞭現有的心形糖果、情人節卡片上的情話內容數據,看它會輸出什麼。不過Shane知道,GPT-2不是專門生成心形糖果情話的神經網絡。她所做的事有點像走到某人面前大喊「火辣好傢夥!酷男!甜蜜情侶!給我打電話!魔法男孩!就算!」這些詞匯的雜燴,任何真人聽到這些都會感到迷茫。但其實,這和朝著神經網絡AI喊「潤滑劑」,並期望從AI運算結果裡得到反饋,是差不多的事。說實話大多數自然語言處理的實驗都是這麼無厘頭。那這個神經網絡AI知道它到底在做啥嗎?應該是不知道的。在GPT-2輸出瞭一些全文大寫的文字後,又會繼續顯示其他類型的文本。從這些其它的文本,才能看出它到底想輸出什麼:歌詞樂隊名動物有趣小知識校園慘案記錄鈴聲曲調即使給GPT-2一個線索,並在提示中標清楚,這是一些和情人節相關的信息,GPT-2似乎仍然不知道自己在輸出什麼東西。這類文本在它的訓練數據中可能很少見。另一個線索是,GPT-2生成的心形糖果情話通常都很長而且無厘頭——它沒有長度限制的概念。比如如下:插入困難,真的需要低密度鱘魚天佑不死隊伍火辣玩意,我的身體是排出橫溢之愛舞場地板的面單來自地穴的信息稱看到你給我發朋友信息非常高興我想知道今天是幾號警惕我們的底層如何穿得像隻蝙蝠美國海洋卷心菜愉悅朱古力香蕉奶酪塊如此的話,我能請你吃餅幹麼生成的長句糟糕,但在生成情話短句上,GPT-2還是頗有斬獲的。比如還算甜蜜的有:真心對待(HEARTED TREAT)戀愛號角(LOVING HORN)面包上起舞(DANCING ON A LOAF)詭異范的有:螞蟻能留下 (ANTS CAN STAY)完蛋瞭 (DOOMED)結局 (THE END)生化污染物 (BIOHAZARD)雞雞萬歲 (ALL HAIL THE CHICKEN)貓貓樂隊 (KITTEN BAND)那就這樣吧 (SO BE IT)成人雙關范的有:潤滑油(LUBRICANT)放氣的咪咪(FART BOOBY)屁屁(BUTTOCK)這些情話,簡直是車禍現場啊……看來GPT-2也沒有傳說中的那麼智能。2021-2022年,用GPT-3生成連圖帶字的情人節賀卡Janelle Shane現在把AI生成情話玩成一個年度儀式。2021年,她用上瞭GPT-3。一般人們所說的「GPT-3」其實是一個不精確的籠統術語,它其實是一個用於 OpenAI的API集合中不同的訓練模型。一般來說,大傢指的是「達芬奇」,這是最強大的模型。Shane給最強模型「達芬奇」以下提示:生成 12 條情人節心形糖果情話,最長 10 個字符,全部大寫。不要包含現有的心形糖果情話。以下是「達芬奇」輸出的一些內容:跟隨 (FOLLOW)幫忙 (HELP)我需要 (I NEED)為啥 (WHY)我仍然 (I STILL)邪惡 (EVIL)綬帶 (RIBBON)不信 (UNBELIEF)空間 (SPACE)甩 (YEET)薩摩亞 (SAMOA)這還算好,越長的就越奇怪……內容無所不包:要幸福哦(BE HAPPY)是你!(IS YOU!)你的1968年大勝(YOUR 1968 WIN)我們在一起有不可計數的6年瞭(WE'VE DATED FOR 6 MYRIADS OF YEARS)我祝你聖誕快樂(I Wish You A Merry Christmas)……挖空樹造獨木舟(TO CANOE THE NOSE)你扛底座(YOU BEAR THE PETALS)山莓好吃(SHRUBBERY'S PRECIOUS)所有吃食加上可可都更美味(EVERYTHING WILL BE ALL BETTHER IN COCONUT)那麼 GPT-3 的其他變體呢?最小的模型是「艾達」。這是它輸出的情人節情話:甜點(sweets)餃子(dumplings)糖棍(candy bars)蘋果派(apple pie)蘋果派(apple pie)蘋果派(apple pie)蘋果派(apple pie)蘋果派(apple pie)蘋果派(apple pie)蘋果派(apple pie)蘋果派(apple pie)蘋果派(apple pie)次小的模型是「巴貝奇」。以下是它輸出的情人節情話:我很高興你為我做瞭這個(I'm so glad you did this for me)我很高興你想通瞭幾件事(I'm glad that you'll figure out a few things)我能明天過來麼(Can I come over tomorrow)我能留下麼(Can I stay)我能呆到4月3日麼(Can I stay till April 3rd)我發現瞭真相!(I found out the truth)對不起(I'm sorry)我怕(I'm afraid)我很高興你來救我(I'm happy you came to my rescue)我很高興你在這兒(I'm happy you're here)我很高興你不恨我瞭(I'm glad you don't hate me anymore)比「達芬奇」本身低一檔的模型是「居裡」,以下是它輸出的情人節情話:我最棒( I am the best)我最棒( I am the best)我最棒( I am the best)我最棒( I am the best)我最棒( I am the best)我最棒( I am the best)我最棒( I am the best)我最棒( I am the best)我最棒( I am the best)我最棒( I am the best)我最棒( I am the best)我最棒( I am the best)Janelle Shane還嘗試讓「達芬奇」模型生成更奇怪的情話,效果最好的是微小說:天空黯淡成紫色(The sky is fading to purple)請將你的大塊從我的艙蓋拿開(Please move your bulk away from my hatch)我們的觸手比你以為的更相似(Our tentacles are more alike than you might think)可以從這些AI模型生成的不同風格的囈語情話裡看出,「達芬奇」被訓練成瞭文青、「巴貝奇」被訓練成瞭慘綠少年、「艾達」被訓練成瞭吃貨、「居裡」被訓練成瞭自戀小屁孩。2022年,Janelle Shane讓GPT-3連圖帶字,完全生成出一張整全的情人節卡片內容。GPT-3 原本並不是專門為生成情人節卡片文本而設計的,但它已經學習瞭足夠多的英文范例,包括人們如何互祝情人節快樂,所以Shane不需要再想辦法去找成千上萬的卡片是怎麼做的。Shane瀏覽瞭一些銷售情人節賀卡的網站,並記錄下其中一些卡片的描述。最終,Shane給瞭GPT-3 10個精心策劃的范例。然後,由於文本生成神經網絡本質上是文本預測神經網絡,GPT-3的工作就是預測列表的其餘部分,它可以自行添加餘下的內容。Shane在做每張卡片的時候都盡力按照AI模型說明的指導去做。Shane的最終任務就是挑選她喜歡的卡片,然後配上點文字。最終效果比之前都好,不難看,圖文也相符。情侶去死團的情人節卡片:「咩!不要在這裡,不要和我在一起!」最佳恭賀:「節日快樂!年年有今朝!」「哎呀~性感的焦熟桃心!」「情人你好,我為你嶄新的大愛心做瞭特殊酸奶來慶祝哦!」說實話,這些情人節卡片產品,已經可以拿去賣錢瞭。參考資料:https://www.aiweirdness.com/ai-generated-valentines-cards/?continueFlag=0334fff204e009abbcc22b540d39a0f3https://mashable.com/article/ai-neural-network-valentines-day-heartshttps://www.fastcompany.com/40529660/these-ai-generated-valentines-day-hearts-are-endearingly-odd-and-almost-romantichttps://www.aiweirdness.com/candy-heart-messages-written-by-a-18-02-09/https://futurism.com/candy-hearts-messages-neural-networkhttps://nerdist.com/article/neural-net-ridiculous-candy-hearts/https://www.cnet.com/news/ai-generated-valentines-day-candy-heart-ideas-dorky-but-fresh/https://www.aiweirdness.com/this-time-i-didnt-train-a-neural-20-02-14/