其他活動
Others

【2021「悅讀科技」閱讀心得寫作比賽】社會組佳作|邱逸華
2022.01.29

【標題】

數位科技解密––讓電腦「讀出」暢銷書的不凡基因

【選書資料】

書名:《暢銷書密碼》

作者:Jodie Archer茱蒂・亞契;Matthew L.Jockers 馬修・賈克斯

譯者:葉妍伶

出版發行:雲夢千里文化創意事業有限公司

出版日期:2016 年 12 月初版 1 刷

【書目大意】

  來自史丹佛大學文學實驗室的兩位作者,歷時五年,運用文字探勘技術,訓練電腦「閱讀」兩萬部小說,為的是全面破解《紐約時報》暢銷書在題材、情節、角色和風格上的共同模式,告訴你人類如何閱讀,以及小說引人入勝的終極關鍵。原來––《格雷的五十道陰影》和《達文西密碼》竟然擁有完全相同的故事節奏!暢銷作家都有兩至三個拿手題材,而且占據了每部作品三分之一的篇幅。標點符號具有預測能力,暢銷書出現問號的比例特別高……。

  電腦還可以只憑書稿就預測暢銷書,不論作者名氣或行銷運算,預測的準確度超過八成。這是第一本「電腦觀點」的小說分析,運用新科技帶我們重新理解好故事如何打動人心。

【段落摘錄】

  維吉尼亞吳爾芙的《戴洛維夫人》開場很優雅:戴洛維夫人說她要自己去買花。托爾斯泰的《安娜卡列尼娜》開場很犀利:所有幸福的家庭都十分相似;而每個不幸的家庭各有各的不幸。珍奧斯汀的《傲慢與偏見》開場很淘氣:凡是有錢的單身漢,總想娶位太太,這已經成了一條舉世公認的真理。……這三位經典作家都很清楚地在第一句話就建立了態度。認真看看這三句話的所有細節––長度、標點、言簡意賅。彷彿有人在對我們說話。(p.121-12)

【閱讀心得】

  數位科技解密––讓電腦「讀出」暢銷書的不凡基因

  「暢銷書」和「好書」之間,究竟能不能畫上等號?暢銷是以「數字」,亦即銷售量衡量;而「好」,是價值判斷––是否具有文學性?能否提供我們智性滿足、美感經驗,或是靈魂深處的震動?但凡出書的人總希望自己的創作「叫好又叫座」,不但銷售長紅,還具有傳世的藝術價值。

  身為一個小說愛好者,無論是《紅樓夢》、《人間失格》,或是《達文西密碼》、《反恐任務》等暢銷佳構,無不讓我在閱讀過程中得到感動或刺激。我知道怎樣的作品讀來酣暢淋漓,但若要抽絲剝繭地分析他們同具有哪些吸引人的條件,則非人工智慧不可。

  《暢銷書密碼》向我們揭露的是暢銷書的「基因」,透過電腦分析,讓身為讀者的我們了解閱讀時的認知模式、情感起伏,幫助我在日後引介或評價一本小說時,有更多元的切入角度,也不再那麼容易落入暢銷書的迷障或論者的偏見中。

  本書開頭以「超級暢銷書」––《龍紋身的女孩》引起讀者好奇。究竟這本書,以及同一作者其他兩部作品(《直搗蜂窩的女孩》、《玩火的女孩》)有何魅力,會成為廣受讀者青睞的暢銷書?明明是被書評家指摘得體無完膚之作,何以竟能投市場所好,獲得令人瞠目結舌的銷售量?我們會理所當然地推測,暢銷書應該具備一些基本條件––動人的角色設定、高潮迭起的情節、生動的文筆,再加上各種看似有利的行銷策略……,但作者明確地宣告,一本書能暢銷,跟行銷曝光、作者名氣都無必然關聯,最重要的關鍵還是書稿本身。此書最驚人的主張是,只要有一套電腦模型,就能預測一部書稿能否暢銷,準確度還高達八至九成。

  在市場上,成為暢銷書的機率不到 0.5%,「要押對寶其實是一場豪賭」。但試想,一旦有一套可以預測的系統,賭徒可以成為賭神,盲人也能看見曙光,抱著忐忑情緒選書的編輯,也能更篤定地推出一本「穩賺不賠」的作品;更重要的是,這將有助於那些注定受大眾喜愛的書籍能早日出版。

  這套聰明的電腦模型稱為「暢銷書量表」。電腦接收書籍資料後,能將資料區分為若干「意義」單元,如字詞、標點等細節,做到人類無法負載的大規模辨識,並且不放過任何細微線索。和「文學神經科學」一樣,電腦在「看書」時,也在分析讀者對哪些字、如何排列,或是怎樣的字句組合能觸發反應。只要有適合的程式或演算法,就能處理人腦無法歸納的語言資訊。這種「機器學習」,和過濾垃圾郵件的機制類似––儘管仍有可能把暢銷書誤判為冷門書(反之亦然),但高達八成以上的準確率,不得不令人感嘆,電腦比人類自己更能掌握大眾閱讀的口味。

  這本書甚至大膽地開出一百本電腦嚴選的冠軍書單,並且保證絕無「人為介入」。透過小說題材組合、情緒轉折、文字運用、風格及人物角色塑造等分析,我們似乎更能領略暢銷書所擁有的不凡基因。但作者提醒我們,即使知道暢銷書的特性,卻無法依樣複製,因為寫作本就沒有公式。沒有一套模型,讓文字躺進去就受歡迎;也不是抱著要創作暢銷書的企圖心,就一定能寫出暢銷書。

  例如「主題模型」演算,會利用「文字雲」來辨識不同題材在小說裡佔的比例,進而逆向分析暢銷書組合題材的模式。深入研究之後發現:「所有成功的作家都會把 30% 的篇幅投入到一到兩個題材上,但非暢銷書則會塞進太多題材」(註 1)。據此我反思自己的閱讀經驗,確實有過這樣的抱怨––某些小說挾著強烈企圖心,想塞進許多炫目的題材,卻讓人覺得焦點模糊。畢竟,重點清楚的故事才更容易得到共鳴。另外,暢銷書要符合現實,並吸引主流讀者。因為演算法發現,「奇幻」、「異世界」較不容易得到市場青睞。

  書中對於《格雷的五十道陰影》的分析也很有趣。這本暢銷書後來拍成電影依舊賣座。許多批評的人聚焦在書中所描述的變態性癖,也因此認為它是低俗失焦的糟糕作品。明明電腦模型在大量閱讀市場作品後,已得出「露骨性愛作品不易登上暢銷書榜」的結論,何以演算法卻給了《格雷》這本書極高的分數?原來是評論者都放錯了重點,因為此書比例最大的題材是「人與人的情感連結」(21%),其次為「親暱對話」(13%),第三則是「肢體語言」(10%)(註 2)。所以,它吸引人的並非性癖,更重要的是主角的內心戲。而且,這本書的情節煽動了讀者的情緒,造就了暢銷書完美的「情緒曲線」。

  作家的風格也能透過語言的數據分析(文本計量分析)做出推論。簡單地說,電腦文字探勘程式能透過文字使用頻率、標點偏好、語法等資訊,配合人物塑造,「解讀」出作者特有的布局與伏筆,而這些都是打造作者風格的基礎。

  「暢銷書量表」所指出的暢銷書「密碼」,雖未必能全面贏得傳統書評家的認同,但珍貴的實證論據必然刺激了作家與出版業的認知。深受大眾喜愛,並願意以實際購買行動支持的作品,必定有它呼應現代社會及讀者心理需求的價值。

  暢銷書密碼出現後,許多人都期待「人工智慧小說家」的問世。畢竟有一些市場報告或新聞已能透過電腦產生文稿。尤有甚者,師承 519 位中國現代詩人,經過六千分鐘訓練,加上一萬次寫作風格演練的「微軟小冰」在 2017 年出現,她「十秒成詩」的技能讓我們見識到人工智能的學習能力。(註 3)

  但作者忠實地告訴我們,電腦「產生文字」和「創作」之間仍有一道巨大鴻溝,即使資料庫裡累積了巨量數據,但那只是「書獃子」式的聰明。小說最動人的是「人與人的情感連結」,而這正是機器無法做到的。這和小冰寫詩仍是不同的層次,因為現代詩本身就存在跳躍思考,表意系統也能刻意斷裂,所以小冰才能寫出「貌似」詩歌的作品。

  「暢銷書」雖不必然是評論者眼中的「好書」,但透過「暢銷書密碼」的揭露,讀者如何受作品牽引,以及作品如何抓住讀者的心緒,有了更「科學」的解釋。一本暢銷書的出現絕非偶然,「魔鬼藏在細節中」,小說引人入勝的原理及觸動人心的轉折,竟在人工智慧的探勘下,大方地向我們展現。

【引用文獻】

註 1:出自《暢銷書密碼》,p.62。

註 2:出自《暢銷書密碼》,p.80。

註 3:《陽光失了玻璃窗》(史上第一本人工智慧詩集),作者:小冰;2107/08/01:時報出版。