此为历史版本和 IPFS 入口查阅区,回到作品页
董啟章
IPFS 指纹 这是什么

作品指纹

在AI君臨時代的文學寫作

董啟章
·
·
文學和AI究竟是天生的仇敵,還是有攜手的空間?兩者究竟是此消彼長,各走各路,還是相輔相成?身為一個寫作人,對AI技術所知有限,但深感它對文學可能帶來的巨大影響,硬著頭皮整理出一些看法,當中肯定有許多不完善的地方。未來既非樂觀,也非悲觀,但卻必然是充滿刺激和挑戰的。定稿之後,找來文章的主角ChatGPT,讓它親自現身說法。我把它的回應連結放在文末。

原文發布於董富記網站

       說ChatGPT君臨天下,一點都不誇張。幾乎所有涉及語言運用的領域,包括媒體、商業、文化、教育、學術,以至電腦程式寫作,都立即被它征服,或者負隅頑抗。它遠非終極的完美語言模型,依然存在各種缺憾和不足,令有識之士可以輕易對它嗤之以鼻,但是它的出現將會改變未來世代的語言運用方式,並反過來影響人類的語言能力,以及對語言作品的評價準則。作為模仿和產出自然語言的機器,它將令語言不再自然,而變得完全人工化。真人和機器寫作的界線會變得模糊,甚至不再重要。它徹底顛覆了人類對語言的認知。

作為以語言為媒介(或本體)的文學創作者,自然亦首當其衝,直接受到ChatGPT的挑戰。有人捲起衣袖,積極迎戰;有人憂心忡忡,手足無措;也有人胸有成竹,不屑一顧。無論我們採取甚麼態度,原本已屬小眾的文學,最終也會變得被動,落入捱打或退卻狀態。除非AI語言生成只是曇花一現,很快便煙消雲散(極不可能),否則它佔領的疆域只會越來越闊。未來的語言運用,很可能會變成機器語言的天下。文學未必會被取代,或者根本就沒有必要去取代它,因為它本來就是需求甚低的東西,但文學很可能會被AI的巨浪沖刷到世界邊緣的荒蕪崖岸,在人類的視野中消失。這樣說並不是危言聳聽。

🦊 收藏本文 Writing NFT 🦔

語言學家杭士基(Noam Chomsky)對ChatGPT的批判雖然過於嚴厲,但卻不是無的放矢。怪責語言生成程式沒有思考能力和道德判斷力,據此痛罵它是「平庸之惡」,是把它當作具有真正智能的生命實體。只有智慧生命體才能「平庸」,才能「邪惡」。不要說機器,連動物也不能配上此等謂語。事實上ChatGPT只是一件工具,而錯誤地把工具當作真理提供者的是人自己,不論是研發者、推廣者、使用者,還是批評者。然而,工具也不是中性的。工具的設計和應用邏輯,隱含著價值取向,或無取向。無取向的價值,也是價值,這就是所謂「平庸之惡」。AI語言機器是一個剛剛打開的潘朵拉的盒子,有甚麼會飛出來還是未知之數。及早探討它可能帶來的好處和壞處,有助於把可能導向邪惡的東西,變成人類未來的希望。

杭士基說對的地方是,像ChatGPT這種大型語言模型(Large Language Model)的運作,與人類心智預設的普遍文法(universal grammar)是背道而馳的。杭士基的語言學理論,跟康德的先驗哲學一脈相承,跟榮格的深層心理學也如出一轍。三者都可以歸為深層結構主義,即人類的心智具有先天的形式,而這些形式可以歸納為特定的結構或法則。我們根據這些先驗(a priori)的形式,在後驗(a posteriori)或經驗(empirical)的領域中認知和理解世界,並運用語言建構意義。與之相反,在LLM背後沒有預設認知結構,也不用依循文法造句,只需根據自注意力機制「閱讀」大量數據,再以出現機率搭配字與字之間的順序。

卡爾維諾(Italo Calvino)在 “Cybernetics and Ghosts” 一文中說的也是這回事。他首先從先天結構方面說明,人類語言是一個根據有限規則進行的字詞組合遊戲,是如何「把一個字放在另一個字後面」的活動。他引用模控學理論,認為這樣的組合活動完全可以由機器執行,甚至大膽宣稱,「作家本身就是一台運作良好的文學機器」。可是,他在文章下半筆鋒一轉,從神話學的角度指出,被禁忌所壓抑的無意識,只能通過活在特定歷史時空底下的、經驗的個人,在具體的生命中釋放。在內在形式和外在經驗的交接點,說出那未曾被說出的,就是文學創作。

AI生成語言的方式完全顛覆了語言學(甚至是哲學和心理學)的預設,而抗士基斷定這就是它產出成品的質素欠佳的原因。由於沒有經過先驗的認知程序,而只是按機率東拼西湊,ChatGPT寫出來的東西平庸、空洞、低智、模稜兩可。但它之所以有如此表現,除了是因為設計者對它施加了價值取向的限制,也是由於它所閱讀的主要是互聯網上的公開資訊。這類資訊代表了人類語言最不痛不癢的平均面貌,換句話說就是欠缺個性。但它並不一定沒法寫出有個性的優質文字。在技術上可以把ChatGPT連接到特定的資料庫,比如說杭士基本人的所有論著、教學和演講,到時它也可以生成具有杭士基的尖銳觀點和犀利語言風格的文字。當然,這並不是真正的學習和思考的結果,而只是高度模仿。

自然語言和自然語言生成器(即人類語言和GPT語言),在產生原理和運作過程上都是截然相反的。自然語言從源頭產出,無中生有,所以是創造。在歷史上最早的語言運用,是這樣的一回事,而後世語言不斷演變、更新,亦沒有停止創造。雖然就個體來說,必需根據規則和通過學習,才能運用語言,而大部分人在大部分時間亦只是沿襲既有的用法,但創新的可能性(新的組合、打破規則、說出那未曾被說出的)並未消失。文學就是從這個可能性中誕生。與之相反,語言生成器是從結果(人類語言運用數據庫)產出,是有中生有,所以是再造。因為採取以常用機率為基礎的組合方法,所以表現往往傾向於均一、常態,甚至是平庸。

問題在於我們是否滿足於這樣水平的文字,而人的評價準則才是對文學最大的威脅。對文學人來說,AI生成的稱不上是文學,因為它只是模仿而沒有創意。但對一般人而言,很可能會覺得AI已經寫得夠好,用不著更高深、更曲折、更微妙的人類作品。如果要求降低,AI絕對可以取代真人作家。大眾本來就不具備足夠的文學欣賞能力,在AI語言的餵養下,判斷力更加會是每下愈況。結果便會出現「真正」的文學被「偽冒」的文學排斥,藝術被技術所取代。但這並不是技術的錯。在古希臘,藝術的概念源於 “techné” 這個詞,意思就是技術。脫離技術,便談不上藝術;藝術是相對於自然的,人工化的製作。那麼,如果AI能在語言技術上精進,為甚麼不能被納入藝術的領域?

讓我們暫時放下誰比較聰明誰比較笨的爭論,單純從圖靈測試的觀點,去比較兩者在技術效果上的差別。不少人試圖鑑別,在文學創作上有甚麼是AI無法做到的,也即是通過排除法來確認文學無可取代之處。我們是為勢所迫,急於重新定義文學,以抵抗AI對文學領域的入侵。在GPT的強大模仿力之下,風格是文學的重災區。風格是每一個作家的獨特印記。「風格即人」(布封語)是我們歷來認為顛撲不破的文學信條。但如果風格能夠被AI輕易模仿,甚至以假亂真,背後那獨特人格和人生體驗的價值便岌岌可危。不但風格可以模仿,甚至連主題、結構、思想和情感特色,也可以模仿。把《戰爭與和平》換成現在的俄烏戰爭,讓AI托爾斯泰寫出新的作品,以橫掃千軍的文筆,從俄國人的角度進行自我批判,並不是不能想像的事情。但是,這部作品究竟是誰寫的?沒有一個有血有肉的托爾斯泰,在飽受痛苦和罪疚的折磨中寫出《新戰爭與和平》,這部作品就算寫得有多好,又有何意義?

🦊 收藏本文 Writing NFT 🦔

我們也要注意,這種比較存在不對稱的地方。作為文學創作者和愛好者,我們對文學判斷充滿信心,但我們必須承認自己對AI技術所知有限。一不小心,我們很容易會過於輕視它的能力,輕率地斷定有些事情是它做不到的。(當然也可能相反地誇大了它的能力和威脅。)造成誤判的原因至少有以下三種:

一、我們這些新手使用者未曾學會如何向GPT發出優質的指令。懂不懂寫prompt,出來的結果可以差天共地。我們在試驗中之所以得出平庸的結果,可能是因為我們發出的是平庸的指令。Prompt engineering現在已經變成一門學問,每天都有自稱專家的人不斷貼出新的教學。下一代人可能不再懂得自己寫文章,但他們可以成為寫prompt的高手。到時的大作家就是大指令家(great prompter)。語言學習重點將會轉移。Prompt變成了一種meta-language,關於語言的語言,或產出語言的語言。情況可謂相當詭異。

二、我們這些沒有電腦技術能力的普通人,不懂得如何編寫掛搭在GPT上的應用程式,所以只能用到它極小百分比的潛能。關於ChatGPT提供錯誤資訊的問題,最常為人詬病和嘲笑,但這個問題其實層次很低,很容易就可以解決。只要把它連接特定的資料庫,它便能夠輕易找到準確的資訊。旅遊網站和餐廳訂位網站已經積極測試這方面的應用程式。至於語言質素和寫作技巧,只要把全球受版權保護而ChatGPT未能讀到的大量優秀當代文學作品開放,讓它花一兩星期或更短的時間吸收,便可以大大提升它的文學知識和品味,並產出更高質的文學語言。雖然這樣的建議想像多於實際,但針對特定用途或範疇去進行集中訓練,是完全可以做到的事情。

三、ChatGPT可能有更多更強的能力未被公開或釋放,它亦會不斷改善和強化。沒有理由斷定它今天做不到的事情,永遠也做不到。它很可能很快就做得到。

有論者提到文學的兩大元素——幽默和反諷——認為AI在本質上無法實現。幽默和反諷的確不只是表面的風格問題,也即是不能單純通過模仿而達到。兩者都涉及雙重性,即意會到處境中存在微妙的差異和對反,並以曖昧(ambiguous)但又明確(obvious)的弔詭方式表出。幽默尤其倚賴文化語境和脈絡,是需要實際經驗才能體會和運用的。這戳中了現時的AI的死穴——它欠缺實體的、經驗的存在。它只是一個抽象的、純理的系統。於是我們又回到早前的批判——GPT是一個既無先驗結構,也無後驗經驗的怪胎。或者可以說,它的先驗(程式和算法)也同時是後驗的(大數據);兩者都發生在虛擬的、數位的「時空」,也即是「非時空」中,跟現實世界沒有任何直接互動,直至使用者把它呼喚出來。

說到底我們現在對GPT的種種不滿和挑剔,很可能只是出於一個原因——它不是人,是非人,是機器。就算有一天它在技術上完善到可以寫出極度高質的、高度像真的作品,我們也不會認可它寫的是文學,僅僅因為它沒有人性、意識或者靈魂。所以,我們所珍重的、堅守的,或者可以說是執著的,是「作者」這個實體。模仿曹雪芹寫出《石頭記》後四十回是沒有意義的,因為「真正的」曹雪芹已經死去,而傳說他所寫的「真正的」最後部分已經失傳。虛擬出一個新的AI「作家」也是沒有意義的,因為它無論在技術上寫得多好,也不是一個「真正的人」。半個世紀之前,羅蘭.巴特高呼「作者已死」,但半世紀之後,連後現代主義也早已死去,「作者」的觀念還是生龍活虎。我們對作者這個真人的信仰並沒有減損。我們之所以愛文學,不單是因為文學作品技藝高超,而同時是因為如此高超的作品,是由一個又一個真實的、有感受和思考的人所創作出來的。這是文學之所以能產生共感的基礎。

另一件AI無法替代的事情是「意義」的產生。承接上面關於「作者」的觀點,人類是一切意義之源,AI一日不能成為條件充足的「作者」,一日無法締造「意義」。GPT沒有創造力、思考力和道德判斷力,因此也沒有確立意義的能力。人類賦予自身生存意義,有賴於三大支柱——藝術、知識和道德。GPT在這三方面都無法代勞。(還有第四支柱——信仰;但在信仰中意義來自超越的神,這跟AI更加無緣。除非神的大能通過AI顯現,那就成為名副其實的deus ex machina了。)根據杭士基的批判(理據等同康德、榮格等),意義的發現基於先驗結構,無論稱為範疇、實踐理性、原型,還是普遍文法。這個人類共通的內在先驗結構,通過一個實在的個體,也即是一個歷史的(historical)、經驗(empirical)的人,與世界發生接觸,從而產生存在的意義。人之所以為人,而有別於機器,是因為人是先驗與經驗的複合存在。(這也是卡爾維諾的本意。)而AI兩者皆非——既非先驗,也無經驗,是一種沒有形而上本質的死物。

順著這樣的思路,我們可以設想兩個未來的方向:一、確保AI不染指這些專屬於人的領域,僅僅作為工具,在不削弱人的尊嚴和利益之下,用於清晰區別的特定用途。這意味著AI不能代理藝術創作、知識探究和道德判斷。我不肯定這樣的限制是否有益和可行。二、致力提升AI系統,令它最終獲取這三種能力,成為先驗和經驗的複合存在,也即是成為歷史的、經驗的個體。這種形態的AI與真人無異,因此有資格享有近似人類的權利。前者是現在一些科技和文化領袖所倡議的、為保障人類權益而建立的共識;後者完全符合康德—榮格—卡爾維諾—杭士基的要求,但很難說到時知識分子們是否願意承認AI的「人格」地位。這無疑是一個科幻情景。

語言生成程式肯定會對人類社會造成巨變,而且變化已經開始。就算文學不會立即被取代,整體語言環境的變化也會影響文學的存續。基於「作者」和「意義」兩點,文學創作者暫時還能保有存在的理由。但在不久的將來,文學可能會被機器語言的氾濫所淹沒,變成比邊緣更邊緣的事物,漸漸被漠視和捨棄,或者像珍稀動物一樣被保育和觀賞。「文學」的名堂可能會被大量生產的機器文學所奪取,而舊有的活人的文學則成為歷史文物,而繼續用舊方式創作的人則成為活化石。

在GPT的挑戰下,文學已經進入充滿危機的階段,不再理所當然、不辯自明。樂觀地看,這對文學未嘗不是一件好事。如果我們能好好面對和回應,說不定會是促使全新時代文學出現的契機。在AI當道的時代,文學不能置身事外,也無法獨善其身;不去駕馭它,就會被它駕馭。我們要做的並不是從AI手上奪回讀者或市場,而是要奪回語言本身。而要奪回語言,我們就要奪取AI。要奪取AI,不是說大家都要運用AI寫作,而是要教育AI甚麼是文學,讓它更接近文學、懂得文學,甚至支持文學、傳播文學。AI語言是人類語言的一面鏡子。它產出的是優質的還是劣質的語言,關乎它學習的是甚麼東西。不想它寫出爛東西,就要教它好東西。不過,最重要的還是教育人類文學是甚麼,因為AI也是人造出來,並且由人來使用的。而要做到這一點,就要繼續努力不懈地寫出真正的文學作品。這就是文學對未來的責任。

🦊 收藏本文 Writing NFT 🦔

在AI君臨時代的文學寫作(ChatGPT版)


我之前寫過的相關文章:

寫作機器

作者未死

重點不是意識,而是無意識

是AI的錯,還是人的錯?

CC BY-NC-ND 2.0 授权