實踐項目 返回列表

超越ChatGPT:大(dà)型語言模型的(de)力量與人(rén)類交流的(de)困境

2023/11/17 14:44:55

以GPT3/4爲代表的(de)大(dà)型語言模型被業界宣傳爲“基礎性的(de)”, 是人(rén)工智能領域科學進步的(de)主要轉折點。這(zhè)類叙述忽略了(le)大(dà)規模的(de)人(rén)工智能模型主要由大(dà)科技公司控制,因爲它們需要巨大(dà)的(de)計算(suàn)和(hé)數據資源,并且還(hái)引發了(le)圍繞錯誤信息和(hé)歧視、隐私和(hé)安全漏洞以及負面環境影(yǐng)響等多(duō)方面的(de)擔憂。同時(shí),無論大(dà)型語言模型及其訓練數據集變得(de)多(duō)麽龐大(dà),它們永遠(yuǎn)無法像人(rén)類一樣學習(xí)和(hé)理(lǐ)解我們的(de)語言。在此情況下(xià),本文分(fēn)析了(le)大(dà)型語言模型的(de)四大(dà)發展趨勢,并指出,爲了(le)充分(fēn)了(le)解其範圍和(hé)力量,探索大(dà)型語言模型如何影(yǐng)響社會的(de)不同方面非常重要。特别是,大(dà)型語言模型将帶來(lái)人(rén)類交流的(de)困境,我們需要傳播理(lǐ)論和(hé)基于倫理(lǐ)的(de)傳播實踐的(de)更新,來(lái)确定下(xià)一代傳播研究的(de)面貌。


引言

通(tōng)過交流,我們創造并改變了(le)我們生活的(de)世界——其中既包括我們的(de)價值觀,也(yě)包括我們的(de)工具。大(dà)型語言模型是強大(dà)的(de)工具,可(kě)以幫助我們自動化(huà)和(hé)簡化(huà)複雜(zá)的(de)任務,并有可(kě)能徹底改變我們與技術交互的(de)方式。然而,它們并非沒有限制和(hé)風險。


交流離不開語言。與其他(tā)人(rén)工智能應用(yòng)相比,語言是一個(gè)更加棘手的(de)問題,它的(de)風險也(yě)更高(gāo)。自然語言處理(lǐ)(NLP, natural language processing)與一些互聯網巨頭的(de)核心業務密切相關,例如谷歌(gē)的(de)搜索與Meta的(de)社交媒體參與。作爲一個(gè)社會,我們也(yě)許從未如此清醒的(de)意識到語言造成傷害和(hé)貶低的(de)危險,也(yě)從未如此清醒地意識到我們的(de)語言中微妙的(de)、結構性的(de)、往往是無意地将人(rén)予以他(tā)者化(huà)的(de)形式。


ChatGPT正在被過億用(yòng)戶使用(yòng),其中許多(duō)人(rén)沒有接受過任何關于如何合倫理(lǐ)地使用(yòng)這(zhè)樣的(de)系統,或如何确保系統不會造成傷害的(de)教育。除了(le)區(qū)分(fēn)人(rén)類和(hé)機器的(de)困難,我們也(yě)需要更多(duō)的(de)研究來(lái)幫助我們了(le)解人(rén)工智能将會怎樣影(yǐng)響我們與其他(tā)人(rén)的(de)互動。


這(zhè)一切将帶來(lái)一個(gè)全新的(de)交流環境。在一個(gè)日益由可(kě)以模仿人(rén)類自然語言能力的(de)人(rén)工智能工具主導的(de)世界中,真實和(hé)信任意味著(zhe)什(shén)麽?偏見和(hé)錯誤信息又将導緻什(shén)麽?很多(duō)問題超越了(le)技術範圍。傳播學者需要成爲有關人(rén)工智能技術發展的(de)對(duì)話(huà)的(de)中心。

大(dà)型語言模型成新寵

由于ChatGPT爆火的(de)緣故,大(dà)型語言模型(LLM, large language model)集萬千寵愛(ài)于一身。但它們是什(shén)麽呢(ne)?簡單地說,LLMs是一種計算(suàn)機系統,被設計用(yòng)來(lái)學習(xí)文本語料庫的(de)統計屬性,以生成模仿原始文本風格和(hé)内容的(de)新文本。換言之,LLMs能夠生成現實而較爲準确的(de)新文本,看起來(lái)像是由一個(gè)真實的(de)人(rén)撰寫的(de)。


LLMs的(de)核心基于一種強大(dà)的(de)機器學習(xí)技術,即深度學習(xí)。深度學習(xí)是人(rén)工智能的(de)一個(gè)子集,能夠自動學習(xí)數據中的(de)複雜(zá)模式。深度學習(xí)算(suàn)法的(de)靈感來(lái)自于大(dà)腦(nǎo)從經驗中學習(xí)的(de)能力,它們通(tōng)常使用(yòng)神經網絡來(lái)實現——計算(suàn)系統的(de)結構與大(dà)腦(nǎo)非常相似。事實上,如果不使用(yòng)先進的(de)水(shuǐ)印策略,就不可(kě)能準确區(qū)分(fēn)由人(rén)類頭腦(nǎo)所寫的(de)文本和(hé)由高(gāo)度可(kě)并行的(de)人(rén)工神經網絡所産生的(de)文本,後者的(de)神經連接數要少得(de)多(duō)。


傳統機器學習(xí)算(suàn)法和(hé)深度學習(xí)算(suàn)法之間的(de)一個(gè)關鍵區(qū)别是,深度學習(xí)算(suàn)法可(kě)以擴展到更大(dà)的(de)數據集,它們可(kě)以從非結構化(huà)或未标記的(de)數據中學習(xí)。這(zhè)使得(de)它們非常适合于自然語言處理(lǐ)等任務,這(zhè)也(yě)是LLMs的(de)用(yòng)途。大(dà)型語言模型現在被認爲是人(rén)工智能的(de)前沿,因其有可(kě)能執行需要創造力、推理(lǐ)和(hé)理(lǐ)解自然語言的(de)任務。


大(dà)型語言模型于2017年在谷歌(gē)大(dà)腦(nǎo)(Google Brain)開始使用(yòng),研究人(rén)員(yuán)推出了(le)transformer(轉換器)架構,它是自然語言處理(lǐ)中使用(yòng)的(de)一個(gè)基于深度學習(xí)模型的(de)神經網絡,訓練可(kě)以實現并行化(huà),這(zhè)爲訓練真正的(de)大(dà)模型首次提供了(le)機會。此後,大(dà)型語言和(hé)文本-圖像模型在領先的(de)技術公司中激增,包括谷歌(gē)(BERT、GLaM、LaMDA、Chinchilla、PaLM)、Facebook/Meta(OPT-175B、Galactica、BlenderBot、LLaMA)、英偉達和(hé)微軟(Megatron-Turing),當然還(hái)有OpenAI,微軟是主要的(de)投資者(GPT-3/4用(yòng)于文本,DALL-E2用(yòng)于圖像,Whisper用(yòng)于語音(yīn))。在線社區(qū),如Midjourney,以及Hugging Face等開源供應商,也(yě)創造了(le)生成模型。


新的(de)玩家還(hái)在不斷進場(chǎng)。2023年3月(yuè),彭博社推出BloombergGPT(Bloomberg Professional Services, 2023),系根據專有來(lái)源的(de)金融數據訓練的(de)LLM,“在金融任務上比現有的(de)模型有明(míng)顯的(de)優勢,而不影(yǐng)響一般LLM的(de)基準性能”(Wu, 2023)。4月(yuè),資助開發“穩定擴散”(Stable Diffusion)等開源生成式人(rén)工智能模型的(de)Stability AI宣布推出StableLM語言模型套件。在爲多(duō)個(gè)領域(包括圖像、音(yīn)頻(pín)、視頻(pín)、3D和(hé)生物(wù)學)開發模型之後,這(zhè)是該開發商首次加入目前由技術大(dà)腕主導的(de)語言模型遊戲(Dey, 2023)。同在4月(yuè),亞馬遜在AWS中推出Bedrock服務,在一個(gè)平台上提供多(duō)種生成式人(rén)工智能模型。例如,Stability AI的(de)Stable Diffusion圖像生成器,可(kě)以将文本變成圖像;AI21實驗室的(de)Jurassic-2模型是一個(gè)多(duō)語言LLM,可(kě)以生成德語、西班牙語、法語、葡萄牙語、荷蘭語和(hé)意大(dà)利語文本;Anthropic的(de)Claude是ChatGPT的(de)一個(gè)對(duì)手,可(kě)以使工作流程自動化(huà)、回答(dá)問題,并與用(yòng)戶進行交流。與微軟和(hé)Alphabet相比,亞馬遜可(kě)能看起來(lái)姗姗來(lái)遲,但它的(de)做(zuò)法相當精明(míng)。通(tōng)過Bedrock,亞馬遜不隻是提供對(duì)上述第三方平台的(de)訪問,也(yě)提供對(duì)其專有的(de)大(dà)型語言模型Titan的(de)訪問,這(zhè)可(kě)能使亞馬遜變成那些希望使用(yòng)LLMs并根據其需求構建應用(yòng)程序的(de)企業的(de)首選平台(Chauhan, 2023)。


時(shí)至今日,除了(le)蘋果之外,美(měi)國每家主要科技公司都宣布了(le)自己的(de)LLM。中國的(de)科技公司當然亦不甘落後:2023年3月(yuè),百度推出文心一言并在官宣後爲新浪财經、澎湃新聞、愛(ài)奇藝、美(měi)的(de)集團、東風日産等一系列企業提供接入服務;2022年,阿裏達摩院發布通(tōng)義大(dà)模型,并在2023年4月(yuè)正式推出通(tōng)義千問;再加上2022年騰訊對(duì)外披露的(de)混元大(dà)模型和(hé)2021年華爲發布的(de)盤古大(dà)模型等等,不一而足,人(rén)稱“萬模大(dà)戰”。在TB級文本數據上訓練的(de)大(dà)型語言模型成爲高(gāo)科技行業最熱(rè)門的(de)一角。


LLMs對(duì)大(dà)型科技公司很重要,因爲它們可(kě)以實現新的(de)産品和(hé)服務,從而吸引更多(duō)的(de)用(yòng)戶,産生更多(duō)的(de)收入,并創造更多(duō)的(de)價值。例如,LLMs可(kě)用(yòng)于改進搜索引擎、社交網絡、雲計算(suàn)、數字助理(lǐ)、電子商務、遊戲、教育、醫療保健等。此外,科技公司可(kě)以用(yòng)LLMs來(lái)改進企業的(de)現有産品線。例如,無論是語音(yīn)數字助理(lǐ)還(hái)是爲營銷人(rén)員(yuán)自動投放廣告,谷歌(gē)都将人(rén)工智能作爲未來(lái)的(de)突破性技術,使下(xià)一代服務和(hé)設備更加智能化(huà)、功能更強。


生成式模型的(de)重要價值之一是它們與生産力應用(yòng)程序的(de)整合。例如,微軟在企業Office套件市場(chǎng)中有明(míng)顯的(de)優勢,正在将生成式模型整合到Word、Outlook和(hé)Teams等應用(yòng)程序中。中國科技巨頭阿裏巴巴在生成式人(rén)工智能方面的(de)最新努力,在某種程度上讓人(rén)聯想到微軟,即通(tōng)過讓人(rén)們用(yòng)自然語言來(lái)描述他(tā)們想要建立的(de)東西,令各種應用(yòng)程序變得(de)更容易使用(yòng)。阿裏巴巴宣布,通(tōng)義千問将被整合到公司的(de)各項業務中,以改善用(yòng)戶體驗,客戶和(hé)開發人(rén)員(yuán)可(kě)以通(tōng)過利用(yòng)該模型創建定制的(de)人(rén)工智能功能。


同時(shí),人(rén)工智能初創企業經常以超過10億美(měi)元的(de)估值籌集資金。例如,6月(yuè)13日,英國人(rén)工智能初創公司Synthesia表示,它從風險投資公司Accel和(hé)Nvidia旗下(xià)NVentures牽頭的(de)一輪融資中籌集了(le)約9000萬美(měi)元,估值爲10億美(měi)元。該公司的(de)技術幫助包括亞馬遜在内的(de)5萬多(duō)家企業創建用(yòng)于教學和(hé)企業視頻(pín)的(de)定制AI化(huà)身。這(zhè)表明(míng),大(dà)量企業希望将傳統視頻(pín)制作轉變爲數字工作流程(Reuters, 2023)。Synthesia隻是一個(gè)人(rén)工智能初創企業快(kuài)速獲得(de)獨角獸地位的(de)例子。在利率上升和(hé)高(gāo)通(tōng)脹導緻的(de)更廣泛的(de)融資放緩中,人(rén)工智能初創企業已經成爲2023年投資的(de)一個(gè)亮點。

人(rén)工智能爲什(shén)麽非得(de)是大(dà)模型?

就這(zhè)樣,大(dà)型通(tōng)用(yòng)人(rén)工智能模型被業界宣傳爲“基礎性的(de)”,是該領域科學進步的(de)主要轉折點。這(zhè)類叙述分(fēn)散了(le)“規模病症”的(de)注意力,這(zhè)些病症每天都變得(de)更加根深蒂固:大(dà)規模的(de)人(rén)工智能模型主要由大(dà)科技公司控制,因爲它們需要巨大(dà)的(de)計算(suàn)和(hé)數據資源,并且還(hái)引發了(le)圍繞歧視、隐私和(hé)安全漏洞以及負面環境影(yǐng)響等多(duō)方面的(de)擔憂。


例如,GPT-3最初是在45TB的(de)數據上訓練的(de),并采用(yòng)了(le)1750億個(gè)參數來(lái)進行預測;GPT-3的(de)一次訓練就花費了(le)1200萬美(měi)元(Davenport, Mittal, 2022)。另據報道,OpenAI使用(yòng)1萬個(gè)英偉達GPU訓練ChatGPT(Goldman, 2023),而ChatGPT每天給OpenAI帶來(lái)70萬美(měi)元的(de)成本(Gardizy, Ma,2023)。而最新的(de)GPT-4的(de)訓練耗資超過1億美(měi)元(Knight, 2023)。大(dà)多(duō)數公司沒有數據中心能力或雲計算(suàn)預算(suàn)來(lái)從頭開始訓練這(zhè)類模型,許多(duō)現成的(de)、預訓練的(de)人(rén)工智能模型,作爲雲人(rén)工智能服務的(de)一部分(fēn)提供,而此市場(chǎng)本已集中在大(dà)科技公司手中,如AWS(亞馬遜)、GCP(谷歌(gē)雲平台)和(hé)Azure(微軟)。這(zhè)些雲供應商每年總共花費超過1000億美(měi)元的(de)資本,以确保擁有最全面、最可(kě)靠和(hé)最具成本競争力的(de)平台。特别是在生成式人(rén)工智能方面,它們也(yě)受益于供應限制,因爲它們可(kě)以優先獲得(de)稀缺的(de)硬件(如Nvidia A100和(hé)H100 GPU)(Bornstein, Appenzeller, Casado, 2023)。


大(dà)科技公司可(kě)能會保持先發優勢,因爲它們有時(shí)間和(hé)市場(chǎng)經驗來(lái)磨練基礎語言模型,并發展寶貴的(de)内部專業知識。因此,較小的(de)企業或初創公司可(kě)能難以成功進入這(zhè)一領域,從而使得(de)LLM的(de)巨大(dà)處理(lǐ)能力集中在少數幾家大(dà)科技公司手中。


2021年,埃米莉·本德(Emily M. Bender)博士、蒂姆尼特·蓋布魯(Timnit Gebru)博士、安吉麗娜·麥克米蘭-梅傑(Angelina McMillan-Major)和(hé)瑪格麗特·米切爾(Margaret Mitchell)博士在一篇題爲《論随機鹦鹉的(de)危險》的(de)論文中對(duì)LLM的(de)潛在成本和(hé)危害提出警告(Bender et al., 2021),這(zhè)篇論文導緻谷歌(gē)将蓋布魯和(hé)米切爾從人(rén)工智能倫理(lǐ)團隊的(de)共同領導位置上趕走(Metz, Wakabayashi, 2020;Metz, 2021)。該論文在确定困擾LLM的(de)規模病症方面有先見之明(míng)。當公衆討(tǎo)論被圍繞著(zhe)ChatGPT和(hé)其他(tā)LLMs的(de)令人(rén)窒息的(de)炒作所吞噬之際,這(zhè)項研究提出了(le)清醒的(de)警告:我們需要討(tǎo)論社會是否應該建立這(zhè)類技術,而不是如何建立,更不是不加批判地将其作爲進步的(de)同義詞而加以全盤接受。本德等人(rén)問道:“越來(lái)越大(dà)的(de)語言模型是不可(kě)避免的(de)還(hái)是必須的(de)?這(zhè)一研究方向有什(shén)麽成本,我們在追求它之前應該考慮什(shén)麽?”


擇其要者,大(dà)型語言模型可(kě)見的(de)成本就有:


環境和(hé)财務成本


LLMs的(de)訓練需要大(dà)量的(de)能源,并産生大(dà)量的(de)二氧化(huà)碳排放。在GPU上訓練一個(gè)BERT基礎模型所需的(de)能量與一次橫跨美(měi)國的(de)飛(fēi)行一樣多(duō)(Bender et al., 2021)。大(dà)多(duō)數雲計算(suàn)供應商的(de)能源不是來(lái)自可(kě)再生能源,而且世界上許多(duō)能源也(yě)不是碳中和(hé)的(de)。此外,哪怕是可(kě)再生能源,對(duì)環境來(lái)說仍然是昂貴的(de)。數據中心爲了(le)滿足越來(lái)越多(duō)的(de)計算(suàn)需求,占用(yòng)了(le)綠色能源的(de)其他(tā)潛在用(yòng)途,爲此,迫切需要節能型的(de)模型架構和(hé)訓練模式。


環境問題與種族問題的(de)交彙,意味著(zhe)被邊緣化(huà)的(de)人(rén)和(hé)來(lái)自多(duō)數世界/全球南(nán)方的(de)人(rén)更有可(kě)能體驗到能源消耗和(hé)二氧化(huà)碳排放增加所帶來(lái)的(de)傷害,盡管他(tā)們也(yě)是最不可(kě)能體驗到這(zhè)種模型的(de)好處的(de)一群。碳足迹将取決于能源的(de)使用(yòng)和(hé)正在使用(yòng)的(de)能源的(de)碳強度。不僅僅是LLMs有很大(dà)的(de)能源影(yǐng)響,而且其中的(de)碳影(yǐng)響将首先爲那些沒有從這(zhè)項技術中受益的(de)人(rén)帶來(lái)成本。所以,當我們做(zuò)成本效益分(fēn)析時(shí),重要的(de)是要考慮到誰在得(de)到好處,誰在支付成本,因爲兩者不是同一批人(rén)。


此外,進入和(hé)訓練這(zhè)些模型的(de)成本很高(gāo),這(zhè)意味著(zhe)隻有一小部分(fēn)全球精英能夠發展并受益于LLMs。由于其複雜(zá)的(de)性質,它們的(de)建立和(hé)維護可(kě)能是困難和(hé)昂貴的(de)。它們還(hái)需要大(dà)量的(de)訓練數據,而這(zhè)些數據可(kě)能很難獲得(de),處理(lǐ)起來(lái)也(yě)非常昂貴。由此,大(dà)規模算(suàn)力會将LLMs限制于隻有資源最豐富的(de)公司和(hé)研究者才能使用(yòng),而把小型開發商排除在外。所以,環境和(hé)财務成本應該成爲自然語言處理(lǐ)研究中的(de)首要考慮因素。


不負責任的(de)訓練數據 


使用(yòng)大(dà)量未經整理(lǐ)的(de)訓練數據集有可(kě)能創造出鞏固主導性、霸權性觀點的(de)語言模型。這(zhè)些訓練數據集的(de)龐大(dà)規模并不能保證多(duō)樣性,因爲它們往往是從網站上抓取來(lái)的(de),而這(zhè)些網站由于互聯網接入不足、代表性不足、過濾或騷擾等問題而排除了(le)邊緣化(huà)人(rén)群的(de)聲音(yīn)。這(zhè)些數據集有“價值鎖定”的(de)風險,或許會将有害的(de)偏見編碼到難以徹底審計的(de)語言模型中。


如果模型是在過濾有限的(de)大(dà)量互聯網數據上訓練出來(lái)的(de),它們就會吸收事實和(hé)錯誤信息、有偏見的(de)内容和(hé)公平的(de)内容、有害的(de)材料和(hé)無害的(de)材料。如果沒有辦法在回答(dá)提示之前評估這(zhè)些标準,LLMs就有可(kě)能陷入複制、放大(dà)和(hé)傳播有問題的(de)内容和(hé)錯誤信息的(de)危險。


“随機鹦鹉”的(de)誕生


本德等人(rén)進一步警告說,對(duì)語言模型的(de)追求可(kě)能是一個(gè)誤導性的(de)研究方向。她們觀察到,語言模型就好比“随機鹦鹉”(stochastic parrot),“根據關于如何組合的(de)概率信息,胡亂地将它在龐大(dà)的(de)訓練數據中觀察到的(de)語言形式序列[縫合]在一起,但沒有任何對(duì)意義的(de)參考”(Weil, 2023)。也(yě)就是說,大(dà)型語言模型善于生成令人(rén)信服的(de)語言,但實際上并不理(lǐ)解它所處理(lǐ)的(de)語言的(de)含義。


“随機鹦鹉”的(de)比喻突出了(le)兩個(gè)重要的(de)局限性:第一,學習(xí)機器所作的(de)預測基本上是在重複數據的(de)内容,加上一些由模型的(de)限制造成的(de)噪音(yīn)(或随機性)。第二,機器學習(xí)算(suàn)法并不了(le)解它所學習(xí)的(de)問題。它無法得(de)知自己什(shén)麽時(shí)候在重複一些不正确的(de)、脫離上下(xià)文的(de)或令社會感覺不适的(de)東西。由于這(zhè)些局限性,學習(xí)機器可(kě)能會産生“危險的(de)錯誤”(Lindholm et al., 2022)。


ChatGPT的(de)不可(kě)靠性會給任何使用(yòng)它來(lái)生成相應文本的(de)機構帶來(lái)相當大(dà)的(de)法律、财務和(hé)聲譽風險。正如沃倫·巴菲特(Warren Buffett)所說:“建立聲譽需要20年,而毀掉聲譽隻需要5分(fēn)鐘(zhōng)。”如果LLM用(yòng)于重要任務,它可(kě)能會創建一種新的(de)職業(LLM事實檢查員(yuán))和(hé)一種新的(de)保險範圍(爲了(le)彌補LLM 錯誤)。


進一步地說,随機鹦鹉的(de)問題可(kě)以被看作是人(rén)工智能和(hé)機器學習(xí)的(de)一個(gè)更普遍的(de)挑戰:如何确保模型是真正的(de)學習(xí)和(hé)推理(lǐ),而不是僅僅去記憶數據當中的(de)模式?随著(zhe)模型的(de)規模和(hé)複雜(zá)性不斷增長(cháng),以及它們越來(lái)越多(duō)地被用(yòng)于醫療保健、金融和(hé)運輸等高(gāo)風險的(de)應用(yòng)中,這(zhè)一挑戰顯得(de)尤爲突出。


由此觀之,當模型過于依賴複制語言模式而并不真正理(lǐ)解其含義時(shí),随機鹦鹉問題就會出現。如果不加以控制,随機鹦鹉會對(duì)人(rén)工智能的(de)發展和(hé)部署,以及依賴這(zhè)些技術完成重要任務的(de)用(yòng)戶産生嚴重後果。這(zhè)凸顯了(le)通(tōng)過仔細的(de)模型設計、評估和(hé)持續監測來(lái)解決此問題的(de)重要性。


最終,我們需要問自己,爲什(shén)麽要把人(rén)工智能的(de)未來(lái)全部押注在大(dà)型語言模型一條路上?紐約大(dà)學教授兼Meta首席AI科學家楊樂(yuè)昆(Yann LeCun)就認爲LLM是“一條下(xià)坡路”,遠(yuǎn)離了(le)通(tōng)往更強大(dà)的(de)AI的(de)道路(The Economist, 2023)。“大(dà)型語言模型能有多(duō)聰明(míng),能有多(duō)準确,都是有限度的(de),因爲它們沒有現實世界的(de)經驗,而這(zhè)确實是語言的(de)基本現實”。他(tā)指出,人(rén)類所學的(de)大(dà)部分(fēn)内容都與語言無關。“我們學習(xí)如何投擲籃球,讓它穿過籃圈”,深度學習(xí)的(de)另一位先驅者傑弗裏·辛頓(Geoffrey Hinton)說:“我們根本不使用(yòng)語言來(lái)學習(xí)。我們從試驗和(hé)錯誤中學習(xí)。”(Smith, 2023)

就算(suàn)語言是發展人(rén)工智能的(de)重要途徑,事情也(yě)很明(míng)顯:無論LLMs及其訓練數據集變得(de)多(duō)麽龐大(dà),它們也(yě)永遠(yuǎn)無法像我們一樣學習(xí)和(hé)理(lǐ)解我們的(de)語言。吊詭的(de)是,語言模型的(de)限制導緻了(le)一種研究趨勢,即專注于研究這(zhè)類模型的(de)知識和(hé)行爲。換言之,人(rén)類正在學習(xí)LLMs的(de)語言,并尋找更好地與它們溝通(tōng)的(de)方法。


這(zhè)是因爲,語言模型是神經網絡,根據從網絡收集的(de)數據進行訓練。經過訓練後,模型可(kě)以接收提示并預測其後的(de)單詞。神經網絡越大(dà),模型的(de)學習(xí)能力就越強。數據集越大(dà),模型接觸不同單詞序列的(de)機會就越大(dà),生成文本時(shí)就越準确。


可(kě)問題是,人(rén)類語言不僅僅是文本。事實上,語言是一種将信息從一個(gè)大(dà)腦(nǎo)傳輸到另一個(gè)大(dà)腦(nǎo)的(de)壓縮方式。我們的(de)談話(huà)經常忽略共享知識,例如視覺和(hé)聽(tīng)覺信息、世界的(de)物(wù)理(lǐ)體驗、過去的(de)談話(huà)、我們對(duì)人(rén)和(hé)物(wù)體行爲的(de)理(lǐ)解、社會結構和(hé)規範等。


正如楊樂(yuè)昆和(hé)紐約大(dà)學計算(suàn)機科學系博士後雅各布·布朗甯(Jacob Browning)在最近的(de)一篇文章(zhāng)中所寫到的(de),“僅靠語言訓練的(de)系統永遠(yuǎn)不會接近人(rén)類智力,即使從現在開始訓練直到宇宙熱(rè)寂”。雖然兩位科學家也(yě)指出,如果我們停留在表面上,語言模型“無疑會接近(人(rén)類智能)。而且,在許多(duō)情況下(xià),表面就足夠了(le)”,但是我們絕不應該把LLMs擁有的(de)淺層理(lǐ)解與人(rén)類從觀察世界景象、探索世界、在世界中進行實驗以及與不同文化(huà)和(hé)其他(tā)人(rén)互動中獲得(de)的(de)深層理(lǐ)解相混淆(Browning, LeCun, 2022)。


所以,假如我們用(yòng)“語言的(de)統計模型”而不是“大(dà)型語言模型”來(lái)描述這(zhè)種人(rén)工智能技術,是否會帶來(lái)更清楚的(de)認知?這(zhè)樣會使我們認識到,統計推理(lǐ)肯定不是人(rén)類合作、創造、協調和(hé)競争的(de)全部故事。


所有人(rén)類的(de)知識最終都能被抓進機器的(de)說法是沒有意義的(de)。我們隻能把可(kě)以用(yòng)比特串表示的(de)知識放入機器。像體育、音(yīn)樂(yuè)、木(mù)匠(jiàng)大(dà)師或創意寫作這(zhè)樣的(de)技能是無法精确描述和(hé)記錄的(de),技能的(de)描述并不就能夠賦予表演的(de)能力。即使它們可(kě)以被代表,表演技能的(de)形式也(yě)是無法被記錄的(de)——它包括表演者的(de)想法和(hé)思考,他(tā)們的(de)神經元記憶狀态,以及他(tā)們的(de)神經肌肉化(huà)學模式。所有這(zhè)些沒有記錄的(de)和(hé)無法記錄的(de)信息的(de)數量遠(yuǎn)遠(yuǎn)超出了(le)可(kě)能存儲在機器數據庫中的(de)範圍。與人(rén)類的(de)能力相比,大(dà)型語言模型所能執行的(de)任何功能都是很小的(de)。


我們是否已經被大(dà)型語言模型迷住了(le),以至于沒有看到我們利用(yòng)語言所做(zuò)的(de)其他(tā)事情?我們建立關系。我們互相關照(zhào)。我們認識并駕馭我們的(de)情緒。我們建立并行使權力。我們做(zuò)出承諾,并貫徹執行。我們創建組織和(hé)社會。我們創造傳統和(hé)曆史。我們爲行動負責。我們打造信任。我們培養智慧。我們愛(ài)。我們想象以前從未想象過的(de)東西。所有這(zhè)些都不是統計學上的(de)。大(dà)型語言模型的(de)能力與人(rén)類的(de)能力之間存在著(zhe)巨大(dà)的(de)鴻溝。

大(dà)型語言模型的(de)四大(dà)發展趨勢

像LLMs這(zhè)樣的(de)大(dà)規模人(rén)工智能模型在過去一段時(shí)間裏中受到了(le)最多(duō)的(de)炒作,也(yě)帶來(lái)了(le)最大(dà)的(de)恐懼。圍繞這(zhè)些系統的(de)興奮和(hé)焦慮都有助于強化(huà)如下(xià)概念,即這(zhè)些模型是“基礎性的(de)”,盡管它們無法對(duì)人(rén)類提示作出有意義的(de)回應的(de)例子數不勝數。值得(de)注意的(de)是,這(zhè)些模型之所以作爲“基礎性”的(de)技術被引入,其實意是在将它們等同于無可(kě)置疑的(de)科學進步,成爲“通(tōng)用(yòng)人(rén)工智能”(這(zhè)是另一個(gè)模糊的(de)術語,讓人(rén)聯想起科幻小說中關于取代或超越人(rén)類智能的(de)概念)道路上的(de)踏腳石,從而使其被廣泛采用(yòng)成爲必然。


在最近的(de)一次采訪中,OpenAI首席執行官山姆·阿爾特曼(Sam Altman)說:“我認爲我們正處于巨大(dà)模型時(shí)代的(de)終結,我們将以其他(tā)方式讓模型變得(de)更好。”(Miller, 2023)言下(xià)之意是,未來(lái)的(de)進展不會來(lái)自于将模型做(zuò)得(de)更大(dà)。


而這(zhè)些“其他(tā)方式”是什(shén)麽?一個(gè)可(kě)能的(de)途徑是在更多(duō)的(de)高(gāo)質量數據上對(duì)模型進行微調,創造更好的(de)訓練技術。人(rén)工管策的(de)數據集可(kě)能是非常有價值的(de),但創建成本高(gāo),速度慢(màn)。根據大(dà)型語言模型的(de)現狀,筆者認爲,有四大(dà)發展趨勢值得(de)高(gāo)度關注:


第一,我們需要緻力于教會語言模型表達不确定性


在大(dà)多(duō)數情況下(xià),人(rén)類知道自身的(de)局限性(即使他(tā)們不直接承認)。他(tā)們可(kě)以表達不确定和(hé)懷疑,并讓對(duì)話(huà)者知道他(tā)們對(duì)自己所傳授的(de)知識有多(duō)自信。而與此相對(duì)照(zhào),語言模型總是對(duì)任何提示都給出現成的(de)答(dá)案,即使它們的(de)輸出是毫無意義的(de)。神經網絡通(tōng)常提供某個(gè)預測正确概率的(de)數值。然而就語言模型而言,這(zhè)些概率分(fēn)數并不代表模型對(duì)提示響應的(de)可(kě)靠性的(de)信心。


OpenAI和(hé)牛津大(dà)學的(de)研究人(rén)員(yuán)發表的(de)一篇論文表明(míng),可(kě)以通(tōng)過教LLMs“用(yòng)語言表達它們的(de)不确定性”來(lái)彌補這(zhè)一缺點。可(kě)對(duì) LLMs進行微調,以使用(yòng)自然語言表達認知上的(de)不确定性,研究者将之描述爲“語言化(huà)概率”(verbalized probability),即用(yòng)語言表達出來(lái)的(de)概率。這(zhè)是一個(gè)重要的(de)發展方向,尤其是在用(yòng)戶希望将語言模型的(de)輸出轉化(huà)爲某個(gè)動作的(de)應用(yòng)程序中。研究人(rén)員(yuán)建議(yì),表達不确定性可(kě)以令語言模型誠實。“如果一個(gè)誠實的(de)模型出現一個(gè)誤導或惡意的(de)内部狀态,那麽它可(kě)以将這(zhè)種狀态傳達給可(kě)采取相應行動的(de)人(rén)類”(Lin et al., 2022)。


第二,與其緻力于模型之大(dà),不如專攻特定模型


鑒于LLMs不理(lǐ)解它們所處理(lǐ)的(de)語言,也(yě)不理(lǐ)解所收到的(de)提示和(hé)自己的(de)回應,所以補救辦法一是靠規模的(de)力量,即訓練數據和(hé)模型參數的(de)巨大(dà)規模,二是靠專業的(de)力量,即在爲特定行業或領域(如醫療保健和(hé)醫學)定制開發更專門的(de)模型的(de)情況下(xià),有針對(duì)性地管策訓練數據,這(zhè)将有助于解決LLMs在涉及特定問題時(shí)的(de)某些局限性。


想象一下(xià),像ChatGPT這(zhè)樣的(de)LLM已經在最好的(de)醫學文獻上接受了(le)訓練,但訓練數據當中也(yě)有討(tǎo)論健康問題的(de)Reddit線程。人(rén)工智能有時(shí)可(kě)以通(tōng)過檢索和(hé)參考高(gāo)質量的(de)信息來(lái)回應,但其他(tā)時(shí)候它通(tōng)過使用(yòng)完全不可(kě)靠的(de)Reddit信息來(lái)回應。事實上,假如醫學文獻中沒有這(zhè)些信息(例如一種非常罕見的(de)疾病),它更有可(kě)能編造這(zhè)些信息(此即人(rén)工智能行業常說的(de)幻覺)。比爾·蓋茨(Bill Gates)曾預想過,ChatGPT或類似的(de)大(dà)型語言模型有一天可(kě)以爲沒有機會看醫生的(de)人(rén)提供醫療建議(yì)(Trang, 2023),然而你如何能相信一個(gè)容易産生幻覺的(de)機器的(de)建議(yì)?


所以我們需要通(tōng)過使用(yòng)較小和(hé)較高(gāo)質量的(de)數據集對(duì)特定的(de)知識領域進行訓練。例如,擁有數十億參數的(de)大(dà)型臨床語言模型可(kě)以利用(yòng)電子健康記錄中的(de)非結構化(huà)文本,幫助提取醫學概念和(hé)回答(dá)醫學問題,預測疾病或再入院風險,并總結臨床文本。而一個(gè)專門爲法律行業設計的(de)模型可(kě)以接受法律術語和(hé)行話(huà)的(de)訓練,使其更好地處理(lǐ)法律文件。


像BloombergGPT這(zhè)樣的(de)例子表明(míng),紮根于特定領域的(de)企業能夠使用(yòng)免費提供的(de)、現成的(de)人(rén)工智能方法,處理(lǐ)大(dà)量的(de)專有數據。與OpenAI的(de)GPT3/4這(zhè)樣的(de)“基礎性”模型不同,彭博社的(de)模型是爲特定任務而設計的(de)。它在公司多(duō)年來(lái)收集的(de)大(dà)量金融文本上專門訓練,爲的(de)是創建一個(gè)對(duì)金錢和(hé)商業能夠産生特别流利的(de)認知的(de)模型。在用(yòng)于創建彭博社模型的(de)數據中,約有一半來(lái)自網絡上的(de)非金融來(lái)源,包括GitHub、YouTube字幕和(hé)維基百科。但彭博社還(hái)爲自己的(de)模型添加了(le)1000多(duō)億單詞,來(lái)自一個(gè)名爲FinPile的(de)專有數據集,其中包括該公司在過去20年中積累的(de)金融數據,内含證券文件、企業新聞發布、彭博社新聞報道、其他(tā)出版物(wù)的(de)報道,以及專注于金融網頁的(de)網絡爬行等。事實證明(míng),添加特定的(de)培訓材料可(kě)以提高(gāo)金融任務的(de)準确性和(hé)性能。彭博社正計劃将其GPT整合到通(tōng)過公司終端産品訪問的(de)功能和(hé)服務中,盡管彭博社還(hái)未有計劃推出ChatGPT式聊天機器人(rén)(Leswing, 2023)。


第三,高(gāo)質量的(de)數據将成爲LLM稱霸的(de)新戰場(chǎng)


限制LLM持續改進的(de)最重要限制是可(kě)用(yòng)的(de)訓練數據量。《經濟學人(rén)》報道說,2022年10月(yuè)發表的(de)一篇論文得(de)出的(de)結論是,“高(gāo)質量語言數據的(de)存量将很快(kuài)耗盡,可(kě)能就在2026年之前”(The Economist, 2023)。肯定有更多(duō)可(kě)用(yòng)的(de)文本,但它們被一小塊一小塊地鎖定在公司數據庫或個(gè)人(rén)設備上,無法以Common Crawl允許的(de)規模和(hé)低成本加以訪問。這(zhè)種數據稀缺對(duì)LLM的(de)進一步發展提出了(le)挑戰。


2023年4月(yuè)18日,Reddit宣布,它将開始對(duì)其API的(de)訪問收費(Isaac, 2023)。這(zhè)一決定是在Twitter對(duì)其API實施類似限制之後做(zuò)出的(de)(Mehta,2023)。近年來(lái),Reddit的(de)系列聊天成爲谷歌(gē)、OpenAI和(hé)微軟等公司的(de)免費教具。這(zhè)些公司使用(yòng)Reddit的(de)對(duì)話(huà)來(lái)幫助開發巨型人(rén)工智能系統。然而現在,Reddit聯合創始人(rén)兼首席執行官史蒂夫·赫夫曼(Steve Huffman)稱:“我們不需要把所有這(zhè)些價值免費提供給世界上最大(dà)的(de)一些公司。”


随即,程序員(yuán)問答(dá)網站Stack Overflow也(yě)宣布将開始對(duì)其 API收費。首席執行官普拉桑斯·錢德拉塞卡爾(Prashanth Chandrasekar)表示:“我們非常支持 Reddit 的(de)做(zuò)法”,“爲LLM提供動力的(de)社區(qū)平台絕對(duì)應該因其貢獻而得(de)到補償,這(zhè)樣像我們這(zhè)樣的(de)公司就可(kě)以重新注資到社區(qū),讓其繼續蓬勃發展。”(Dave,2023)


Reddit和(hé)Stack Overflow等平台爲微調LLM提供了(le)快(kuài)速訪問具體主題和(hé)問題的(de)寶貴數據,而這(zhè)些平台的(de)所有者正意識到它們所掌握的(de)數據的(de)價值。數據市場(chǎng)日益激烈的(de)競争可(kě)能推動行業走向更少的(de)共享和(hé)更多(duō)的(de)貨币化(huà)。不幸的(de)是,激進的(de)貨币化(huà)将進一步增強能夠負擔API成本的(de)大(dà)型科技公司的(de)能力。相應地,小型實驗室和(hé)資金緊張的(de)初創公司将不得(de)不處理(lǐ)手頭可(kě)用(yòng)的(de)低質量數據。


第四,開源模型可(kě)以成爲大(dà)科技公司封閉服務的(de)替代品


最先進的(de)LLM需要巨大(dà)的(de)計算(suàn)預算(suàn)和(hé)深厚的(de)機器學習(xí)專業知識,所以很少有機構能夠從頭開始訓練它們。然而,那些擁有資源和(hé)專業知識的(de)機構越來(lái)越多(duō)地不開放模型(無論是數據、源代碼或深度學習(xí)的(de)秘方——模型權重)供公衆監督,而是依靠API分(fēn)發。


這(zhè)就是開源人(rén)工智能可(kě)以介入的(de)地方,它使獲得(de)LLM的(de)機會民主化(huà)。各種社區(qū)平台正在努力創建開源的(de)模型,以替代大(dà)科技公司提供的(de)封閉的(de)專有服務。這(zhè)些努力是爲了(le)防止少數富有的(de)公司在快(kuài)速增長(cháng)的(de)生成式人(rén)工智能市場(chǎng)上擁有過多(duō)的(de)權力。


例如,我們開始看到Anthropic、Cohere和(hé)Character.ai等公司建立的(de)LLMs更接近OpenAI的(de)性能水(shuǐ)平,它們在類似的(de)數據集上訓練,并采用(yòng)類似的(de)模型架構。“穩定擴散”的(de)例子表明(míng),如果開源模型的(de)性能和(hé)社區(qū)支持達到了(le)足夠的(de)水(shuǐ)平,那些封閉的(de)大(dà)型模型未必能與其競争。


“穩定擴散”隻需較少的(de)計算(suàn)能力就可(kě)以工作。與在OpenAI強大(dà)的(de)服務器上運行的(de)DALL-E 2不同,穩定擴散可(kě)以在良好的(de)個(gè)人(rén)電腦(nǎo)上運行。創造力的(de)爆發和(hé)新應用(yòng)程序的(de)快(kuài)速發展在很大(dà)程度上是由于“穩定擴散”:既是開源的(de),程序員(yuán)可(kě)以自由地改變它,在它的(de)基礎上發展,并從中賺錢;又足夠輕巧,人(rén)們可(kě)以在家中運行。


谷歌(gē)的(de)一位高(gāo)級軟件工程師認爲,不管是OpenAI還(hái)是谷歌(gē),在人(rén)工智能競賽中都沒有勝算(suàn),構成威脅的(de)“第三派”将是開源社區(qū)。開源技術開發者沒有所有權,他(tā)們将自己的(de)作品發布給任何人(rén),讓他(tā)們根據自己的(de)需要使用(yòng)、改進或改編。開源的(de)曆史例子包括Linux操作系統和(hé)LibreOffice,這(zhè)是微軟Office的(de)替代品。


這(zhè)位谷歌(gē)工程師說,開源人(rén)工智能開發者“已經在搶占先機”,他(tā)舉出的(de)例子包括Meta公司開發的(de)大(dà)型開源語言模型LLaMA。2023年2月(yuè)底發布的(de)LLaMA因其優于GPT-3等模型的(de)性能而立即受到歡迎,盡管其參數隻有650億(Meta AI, 2023)。7 月(yuè) 18 日,LlaMa2發布包含了(le) 70 億、130 億和(hé) 700 億參數的(de)模型,它對(duì)于人(rén)工智能應用(yòng),就像安卓操作系統之于手機APP開發一樣,目的(de)就是讓應用(yòng)層開發者可(kě)以直接以最低成本獲得(de)大(dà)模型的(de)基礎設施使用(yòng)。有了(le)這(zhè)樣的(de)模型,從事人(rén)工智能模型的(de)門檻已經“從某一個(gè)主要研究機構的(de)總産出降至一個(gè)人(rén)、一個(gè)晚上和(hé)一台強大(dà)的(de)筆記本電腦(nǎo)”。一個(gè)LLM現在可(kě)以在幾個(gè)小時(shí)内以100美(měi)元的(de)價格進行微調。憑借其快(kuài)速移動、協作和(hé)低成本的(de)模式,開源模型有一些谷歌(gē)或OpenAI無法複制的(de)顯著優勢(Milmo, 2023)。而當免費的(de)或低價的(de)、不受限制的(de)替代品在質量上與封閉的(de)大(dà)型模式不相上下(xià)時(shí),人(rén)們不會爲一個(gè)設限的(de)人(rén)工智能模型付費。


當然,像任何事情一樣,這(zhè)同時(shí)具有積極和(hé)消極的(de)影(yǐng)響。從正面看,它使少數公司壟斷控制人(rén)工智能的(de)可(kě)能性大(dà)大(dà)降低,也(yě)将使獲得(de)人(rén)工智能的(de)成本大(dà)大(dà)降低,加速整個(gè)領域的(de)創新,并使研究人(rén)員(yuán)更容易分(fēn)析人(rén)工智能系統的(de)行爲(因其對(duì)專有模型的(de)訪問是有限的(de)),提高(gāo)透明(míng)度和(hé)安全性。但是,更容易獲得(de)人(rén)工智能,也(yě)意味著(zhe)不良行爲者将可(kě)以出于自身的(de)邪惡目的(de)而對(duì)系統進行微調,例如生産虛假信息。這(zhè)将使人(rén)工智能更難于監管,因爲精靈已經逃出了(le)瓶子。

大(dà)型語言模型的(de)社會後果

大(dà)型語言模型已經徹底改變了(le)我們與計算(suàn)機互動的(de)方式。它們能夠理(lǐ)解自然語言并對(duì)複雜(zá)的(de)問題做(zuò)出反應。随著(zhe)人(rén)工智能驅動的(de)LLMs(如ChatGPT)的(de)發展,它們已經變得(de)越來(lái)越有用(yòng)并走向通(tōng)用(yòng)。


然而,它們的(de)迅速進展也(yě)不是沒有争議(yì)的(de)。許多(duō)人(rén)擔心如此強大(dà)的(de)技術所帶來(lái)的(de)反響,憂慮這(zhè)些模型可(kě)能被用(yòng)來(lái)操縱信息或替代人(rén)類的(de)經驗。爲了(le)充分(fēn)了(le)解它們的(de)範圍和(hé)力量,探索LLMs如何影(yǐng)響社會的(de)不同方面非常重要。


鑒于這(zhè)些開創性的(de)模型的(de)廣泛采用(yòng)所帶來(lái)的(de)巨大(dà)可(kě)能性和(hé)潛在風險,社會已經對(duì)其使用(yòng)産生了(le)不同的(de)反應。例如,在開發和(hé)分(fēn)發這(zhè)些模型的(de)源代碼時(shí),是采取開源還(hái)是閉源方式?


總的(de)來(lái)說,開源是指任何人(rén)都可(kě)以免費使用(yòng)、修改和(hé)發布的(de)源代碼,而閉源是指不能在創造它的(de)機構之外修改或發布的(de)專有代碼。在GPT-3之前,大(dà)多(duō)數大(dà)型語言模型都是開源的(de),但目前,越來(lái)越多(duō)的(de)公司将他(tā)們的(de)模型變成閉源的(de),例如PaLM、LaMDA和(hé)GPT-4。在OpenAI宣布GPT-4模型的(de)文件中,該公司說它不會提供關于架構、模型大(dà)小、硬件、訓練計算(suàn)、數據構建或用(yòng)于開發GPT-4的(de)訓練方法的(de)細節,隻是指出它使用(yòng)了(le)從人(rén)類反饋中強化(huà)學習(xí)的(de)方法,聲稱這(zhè)是由于競争和(hé)安全方面的(de)考慮(AI Now Institute, 2023)。


同樣,出于大(dà)型語言模型的(de)競争格局和(hé)安全問題,OpenAI向客戶提供的(de)付費訪問,也(yě)有許多(duō)法律和(hé)技術限制。這(zhè)使得(de)學術研究人(rén)員(yuán)更難進行LLM訓練實驗。對(duì)研究界來(lái)說,最直接的(de)問題之一是缺乏透明(míng)度。ChatGPT及其前身的(de)基礎訓練集和(hé)LLMs是不公開的(de),科技公司可(kě)能會隐瞞其對(duì)話(huà)式AI的(de)内部運作。這(zhè)與透明(míng)度和(hé)開放科學的(de)趨勢背道而馳。在這(zhè)種情況下(xià),有關人(rén)工智能的(de)模型能力的(de)主張無法被其他(tā)人(rén)驗證或複制,客戶也(yě)不可(kě)能下(xià)載ChatGPT背後的(de)模型。


相比之下(xià),開源工作涉及創建一個(gè)模型,然後将其發布給任何人(rén),讓他(tā)們根據自己的(de)需要使用(yòng)、改進或改編。業界推動開源LLM的(de)工作,承諾多(duō)方合作和(hé)權力共享,而這(zhè)正是互聯網的(de)最初理(lǐ)想。它顯示了(le)不同的(de)社區(qū)如何能夠相互幫助,攜手推進大(dà)型語言模型的(de)下(xià)一步發展。


圍繞著(zhe)LLMs的(de)另一個(gè)關鍵問題是它們的(de)倫理(lǐ)含義。随著(zhe)這(zhè)些系統變得(de)越來(lái)越複雜(zá),有關操縱人(rén)類行爲或公衆輿論的(de)問題日益凸顯。此外,LLMs有可(kě)能被用(yòng)作惡意行爲者或組織獲取私人(rén)數據或傳播虛假信息的(de)工具。出于對(duì)偏見和(hé)準确性的(de)擔憂,人(rén)們也(yě)擔心它們在醫療診斷、法律決定甚至政府政策中的(de)使用(yòng)。


“深度僞造”(deepfake),由人(rén)工智能創造的(de)圖像和(hé)視頻(pín),已經在媒體、娛樂(yuè)和(hé)政治中出現了(le)。在此之前,創造深度僞造的(de)内容需要相當多(duō)的(de)計算(suàn)技能,然而,現在幾乎任何人(rén)都能創造它們。OpenAI已經試圖通(tōng)過在每張DALL-E 2的(de)圖像上“打上水(shuǐ)印”來(lái)控制虛假圖像,但未來(lái)可(kě)能需要更多(duō)的(de)控制手段——特别是當生成式視頻(pín)創作成爲主流時(shí)。


生成式人(rén)工智能還(hái)提出了(le)許多(duō)有關何爲原創和(hé)專有内容的(de)問題。由于創建的(de)文本和(hé)圖像與以前的(de)任何内容都不完全一樣,AI系統供應商認爲人(rén)工智能生成内容屬于提示的(de)創造者。但它們顯然是用(yòng)于訓練模型的(de)先前文本和(hé)圖像的(de)衍生品。不用(yòng)說,類似技術将在未來(lái)幾年爲知識産權律師提供大(dà)量工作。


在隐私方面,LLMs本質上是個(gè)人(rén)化(huà)的(de),它收集大(dà)量的(de)用(yòng)戶數據,以便能夠有效地預測對(duì)話(huà)的(de)長(cháng)度、主題和(hé)軌迹。此外,每次與 ChatGPT 這(zhè)樣的(de)工具的(de)互動都有一個(gè)唯一的(de)标識符——有使用(yòng)它的(de)人(rén)的(de)登錄軌迹。因此,個(gè)人(rén)對(duì) ChatGPT 的(de)使用(yòng)并非真正的(de)匿名,這(zhè)就引發了(le)有關 OpenAI 保留敏感數據的(de)問題。圍繞著(zhe)數據的(de)收集、存儲和(hé)使用(yòng),必須進行一系列的(de)深思熟慮,以便安全地使用(yòng)LLMs。


LLMs與其他(tā)人(rén)工智能技術一樣受到監管和(hé)合規框架的(de)約束,但随著(zhe)它們變得(de)越來(lái)越普遍,可(kě)能會提出新的(de)問題:如何以符合《通(tōng)用(yòng)數據保護條例》(GDPR)和(hé)其他(tā)法規的(de)方式使用(yòng)此類工具。由于 ChatGPT 處理(lǐ)用(yòng)戶數據以生成響應,OpenAI 或者出于自身目的(de)而依賴 ChatGPT 的(de)實體可(kě)能被視爲 GDPR 下(xià)的(de)數據控制者,這(zhè)意味著(zhe)它們應該獲得(de)處理(lǐ)用(yòng)戶個(gè)人(rén)數據的(de)合法依據(例如用(yòng)戶的(de)同意),并且必須告知用(yòng)戶它們在從事何種由ChatGPT支持的(de)數據處理(lǐ)活動。


所有這(zhè)些潛在的(de)問題強調了(le)爲什(shén)麽科學家、研究人(rén)員(yuán)和(hé)其他(tā)使用(yòng)LLMs的(de)人(rén)或組織在将其投入實際使用(yòng)之前,從多(duō)個(gè)角度積極審查大(dà)型語言模型的(de)影(yǐng)響是至關重要的(de)。如果深思熟慮地考量倫理(lǐ)方面的(de)影(yǐng)響,再加上嚴格的(de)安全措施,大(dà)型語言模型就可(kě)以成爲有價值的(de)工具,而不會破壞用(yòng)戶的(de)信任或損害完整性。


此外,雖然大(dà)型語言模型的(de)趨勢仍在繼續,但重要的(de)是要注意,更大(dà)并不總是意味著(zhe)更好。大(dà)型語言模型可(kě)以很好地進行随心所欲的(de)創造性互動,但過去十年的(de)發展告訴我們,大(dà)型深度學習(xí)模型是高(gāo)度不可(kě)預測的(de),使模型更大(dà)、更複雜(zá)并不能解決這(zhè)個(gè)問題。


像ChatGPT這(zhè)樣的(de)大(dà)型語言模型,具有與用(yòng)戶進行類似語言交流的(de)能力,有可(kě)能成爲交流和(hé)教育以及其他(tā)許多(duō)領域的(de)強大(dà)工具。然而,一方面其對(duì)社會的(de)影(yǐng)響是巨大(dà)的(de);另一方面其被濫用(yòng)的(de)可(kě)能性也(yě)是非常真實的(de)。因此,需要更多(duō)的(de)研究來(lái)認識大(dà)型語言模型的(de)社會後果及對(duì)我們生活的(de)影(yǐng)響。随著(zhe)人(rén)工智能和(hé)數據科學越來(lái)越多(duō)地融入日常生活中,重要的(de)是要加強這(zhè)類技術的(de)倫理(lǐ)考量,并尊重我們的(de)數據和(hé)隐私賦予我們的(de)個(gè)人(rén)權利。該領域的(de)領導者必須共同努力,确保大(dà)型語言模型的(de)使用(yòng)是負責任的(de),符合人(rén)類的(de)最佳利益。

大(dà)型語言模型帶來(lái)的(de)交流困境

ChatGPT和(hé)其他(tā)生成式人(rén)工智能工具正在将有關大(dà)型語言模型的(de)對(duì)話(huà)帶到公衆關注的(de)最前沿,并且帶著(zhe)一種前所未有的(de)緊迫感。現在,人(rén)們必須就人(rén)工智能的(de)未來(lái)是什(shén)麽樣子以及如何創造我們想要的(de)未來(lái)進行交流。

我們需要傳播理(lǐ)論、傳播研究和(hé)基于倫理(lǐ)的(de)傳播實踐來(lái)關注和(hé)指導這(zhè)樣的(de)對(duì)話(huà)。數字人(rén)文學者馬修·科申鮑姆(Matthew Kirschenbaum)預測,即将到來(lái)的(de)“文本末日”将導緻“文本海嘯”,“在任何數字環境中都無法可(kě)靠地進行交流”(Kirschenbaum, 2023)。

科申鮑姆所稱的(de)“文本末日”是指,我們與書(shū)面文字的(de)關系正在發生根本性的(de)變化(huà)。通(tōng)過ChatGPT等程序,所謂的(de)生成式人(rén)工智能已經成爲主流,這(zhè)些程序使用(yòng)大(dà)型語言模型來(lái)統計預測序列中的(de)下(xià)一個(gè)字母或單詞,從而生成模仿其所訓練的(de)文本内容的(de)句子和(hé)段落。它們爲整個(gè)互聯網帶來(lái)了(le)類似自動完成(autocomplete)的(de)功能。

目前,人(rén)們仍然在爲這(zhè)些程序輸入實際的(de)提示信息,同樣,這(zhè)些模型(大(dà)部分(fēn))仍然是根據人(rén)類散文而不是機器自制的(de)作品進行訓練的(de)。但情況可(kě)能會發生變化(huà)——OpenAI發布ChatGPT應用(yòng)程序接口就證明(míng)了(le)這(zhè)一點,它将允許該技術直接集成到社交媒體和(hé)在線購(gòu)物(wù)等網絡應用(yòng)中(Wiggers,2023)。不難想象,在這(zhè)種情況下(xià),機器可(kě)以促使其他(tā)機器無休止地發布文本,從而使互聯網充斥著(zhe)沒有人(rén)類的(de)能動性或意圖的(de)合成文本。

2022年6月(yuè)3日,人(rén)工智能研究者兼YouTuber揚尼克·基爾徹(Yannic Kilcher)發布了(le)一段視頻(pín),介紹他(tā)如何開發名爲“GPT-4chan”的(de)人(rén)工智能模型,然後部署機器人(rén)在著名留言闆4chan上僞裝成人(rén)類。4chan常被描述爲互聯網亞文化(huà)的(de)中心,其社區(qū)對(duì)知名互聯網模型的(de)形成和(hé)普及以及黑(hēi)客行動和(hé)政治運動具有相當大(dà)的(de)影(yǐng)響力。4chan經常作爲争議(yì)來(lái)源而受到媒體關注,包括協調組織針對(duì)某些網站和(hé)用(yòng)戶的(de)惡作劇和(hé)騷擾,以及發布非法和(hé)攻擊性内容。

GPT-4chan是一個(gè)大(dà)型語言模型,通(tōng)過使用(yòng)之前公開發布的(de)數據集對(duì)GPT-J進行微調來(lái)模拟4chan的(de)/pol/匿名留言闆用(yòng)戶而創建;其中許多(duō)用(yòng)戶經常表達種族主義、白人(rén)至上主義、反猶主義、反穆斯林(lín)、厭惡女(nǚ)性和(hé)反 LGBT的(de)觀點。基爾徹訓練機器人(rén)閱讀了(le)4Chan這(zhè)一臭名昭著的(de)“政治不正确”闆塊3年半時(shí)間内的(de)1.345億條帖子,很自然地,該模型學會了(le)輸出各種仇恨言論,導緻基爾徹稱其爲“互聯網上最可(kě)怕的(de)模型”,并在他(tā)的(de)視頻(pín)中這(zhè)樣說道:“這(zhè)個(gè)模型很好,但從一個(gè)可(kě)怕的(de)意義上來(lái)說……它完美(měi)概括了(le)/pol/上大(dà)多(duō)數帖子中滲透的(de)攻擊性、虛無主義、惡搞以及對(duì)任何信息的(de)深度不信任。”(Kilcher, 2022)

在訓練完成後,由該模型驅動的(de)10個(gè)機器人(rén)被部署在/pol/留言闆上,24小時(shí)内匿名發布了(le)1.5萬條基本上是有毒的(de)信息。雖說許多(duō)用(yòng)戶通(tōng)過留言闆上的(de)發帖頻(pín)率很快(kuài)認定這(zhè)是一個(gè)機器人(rén),而基爾徹也(yě)公布了(le)在服務器上運行模型所需的(de)代碼和(hé)已訓練的(de)模型實例,并表示人(rén)工智能研究人(rén)員(yuán)可(kě)以聯系他(tā)獲取機器人(rén)與4chan用(yòng)戶的(de)互動記錄,可(kě)是他(tā)的(de)做(zuò)法還(hái)是在人(rén)工智能研究者社區(qū)内引發了(le)較大(dà)争議(yì)。

GPT-4chan模型發布在Hugging Face上,這(zhè)是一個(gè)共享經過訓練的(de)AI模型的(de)中心。在該模型被下(xià)載了(le)1000餘次後,Hugging Space團隊首先“限制”了(le)對(duì)它的(de)訪問,此後不久,他(tā)們又完全删除了(le)對(duì)它的(de)訪問權限,其頁面現在刊有以下(xià)免責聲明(míng):“已禁用(yòng)對(duì)該模型的(de)訪問——鑒于其研究範圍,在所有禁止使用(yòng)機器人(rén)的(de)網站上故意使用(yòng)該模型生成有害内容(不完全示例包括:仇恨言論、垃圾郵件生成、假新聞、騷擾和(hé)辱罵、貶低和(hé)诽謗)被視爲對(duì)該模型的(de)濫用(yòng)。”(Kurenkov, 2022)

在人(rén)工智能研究界,有人(rén)認爲這(zhè)樣的(de)模型很可(kě)能造成傷害,特别是在面向青少年的(de)論壇中。讓機器人(rén)與 4chan 用(yòng)戶互動是不道德的(de),它加劇了(le)4chan本已有毒的(de)回聲室效應并進一步分(fēn)化(huà)了(le)用(yòng)戶群。阿德萊德大(dà)學的(de)人(rén)工智能安全研究員(yuán)勞倫·奧克登-雷納(Lauren Oakden-Rayner)在一條推文中指責基爾徹“在未告知用(yòng)戶、未經同意或監督的(de)情況下(xià)進行人(rén)類實驗”,她認爲這(zhè)違反了(le)人(rén)類研究倫理(lǐ)的(de)所有原則(Mellor, 2022)。

基爾徹在接受The Verge采訪時(shí)将該項目描述爲一個(gè)“惡作劇”,他(tā)認爲考慮到 4chan本身的(de)性質,這(zhè)種惡作劇幾乎沒有造成什(shén)麽有害影(yǐng)響。“/pol/上完全可(kě)以預料到會有機器人(rén)和(hé)非常粗魯的(de)言談”(Vincent, 2022)。并且,任何潛在的(de)危害也(yě)可(kě)以使用(yòng)其他(tā)現有模型來(lái)實現。

的(de)确,基爾徹不會是第一個(gè)、也(yě)不是唯一一個(gè)創建惡意的(de)微調模型的(de)人(rén)。所以,問題在于,如果出現更多(duō)的(de)微調模型,其内容指向在意識形态層面複制一種特定世界觀,會爲未來(lái)的(de)人(rén)類交流帶來(lái)什(shén)麽?

基爾徹創建的(de)機器人(rén)非常逼真。“它能對(duì)上下(xià)文做(zuò)出反應,并能連貫地講述在收集最後一次訓練數據很久之後發生的(de)事情和(hé)事件”,基爾徹在視頻(pín)中稱。以此類推,有人(rén)可(kě)以建立一個(gè)系統,讓ChatGPT這(zhè)樣的(de)程序反複向自己提問,并自動将輸出結果發布到網站或社交媒體上。這(zhè)樣無休止地叠代内容流,除了(le)在交流場(chǎng)域造成混亂,它還(hái)将被再次吸入大(dà)型語言模型的(de)訓練集,讓模型在互聯網上制造自己的(de)新内容。如果各路人(rén)馬——無論是出于廣告收入、政治或意識形态目的(de)還(hái)是惡作劇——都開始這(zhè)樣做(zuò),每天難以數計的(de)類似帖子充斥在開放的(de)互聯網上,與搜索結果混雜(zá)在一起,在社交媒體平台上傳播,滲透到維基百科詞條中,尤其是爲未來(lái)的(de)機器學習(xí)系統提供素材,那将會怎樣?

将基爾徹的(de)工作與過去最著名的(de)變壞了(le)的(de)機器人(rén)的(de)例子相比較是非常有趣的(de):微軟的(de)Tay。微軟于2016年在 Twitter上發布了(le)人(rén)工智能聊天機器人(rén),但在用(yòng)戶教導Tay重複各種種族主義和(hé)煽動性言論後,不到24小時(shí),微軟就被迫下(xià)線該項目(Vincent, 2016)。可(kě) 是在那時(shí),創建這(zhè)樣的(de)機器人(rén)專屬于大(dà)型科技公司的(de)領域,基爾徹現在的(de)做(zuò)法表明(míng),任何一人(rén)編碼團隊都可(kě)以使用(yòng)更先進的(de)人(rén)工智能工具達成同樣的(de)結果。至于說到人(rén)類研究倫理(lǐ)的(de)指責,如果基爾徹在大(dà)學工作,讓AI機器人(rén)在 4chan上自由活動可(kě)能是不道德的(de)。但基爾徹堅稱自己隻是一名YouTuber,這(zhè)暗示著(zhe)他(tā)認爲此處适用(yòng)不同的(de)倫理(lǐ)規則。

面對(duì)如此嚴峻的(de)局面,我們該如何應對(duì)?筆者認爲,傳播學可(kě)以發揮作用(yòng)的(de)領域包括:

讓開發者對(duì)人(rén)工智能偏見負責。像希瑟·伍茲(Heather S. Woods)和(hé)泰勒·莫蘭(Taylor C. Moran)這(zhè)樣的(de)傳播研究者已經發表了(le)關于人(rén)工智能虛拟助手(如Siri和(hé)Alexa)與性别和(hé)種族刻闆印象的(de)重要研究成果,顯示了(le)人(rén)工智能是如何反映并重新定義人(rén)類偏見和(hé)價值觀的(de)(Woods, 2018;Moran, 2021)。随著(zhe)生成式人(rén)工智能和(hé)新應用(yòng)的(de)引入,這(zhè)一領域還(hái)需要更多(duō)的(de)研究。研究的(de)目的(de)是喚醒公衆去追究那些生産強化(huà)此類偏見的(de)人(rén)工智能軟件組織的(de)責任。

具體就大(dà)型語言模型而言,一件重要的(de)事情是幫助制訂發布“基礎性”模型的(de)社區(qū)規範。斯坦福以人(rén)爲本人(rén)工智能研究院(HAI,Human-Centered AI Institute)和(hé)基礎模型研究中心(CRFM, Center for Research on Foundation Models)就提出,随著(zhe)基礎模型變得(de)更加強大(dà)和(hé)普遍,負責任發布的(de)問題變得(de)至關重要(Liang, 2022)。而“發布”一詞本身就有不同的(de)内涵:首先是研究訪問,即基礎模型開發者令外部研究人(rén)員(yuán)可(kě)以訪問數據、代碼和(hé)模型等資産;而部署到用(yòng)戶中開展測試和(hé)收集反饋,以及以産品形式部署到最終用(yòng)戶中,則構成了(le)更深入的(de)發布形式。

随著(zhe)AI技術變得(de)越來(lái)越強大(dà),每個(gè)基礎模型開發者獨立決定其發布政策的(de)問題凸顯出來(lái)。原因有二:首先,單個(gè)行爲者發布不安全、功能強大(dà)的(de)技術可(kě)能會對(duì)個(gè)人(rén)和(hé)社會造成重大(dà)傷害。即便認爲當今基礎模型的(de)風險還(hái)沒有嚴重到有理(lǐ)由限制相對(duì)開放的(de)發布,然而迅猛的(de)發展速度也(yě)給未來(lái)模型的(de)能力帶來(lái)了(le)相當大(dà)的(de)不确定性。其次,正因爲基礎模型風險的(de)嚴重性尚不明(míng)确,基礎模型開發者将從分(fēn)享最佳實踐中獲益,而無需每個(gè)組織都“重新發明(míng)輪子”,承擔重新發現某些危害的(de)經濟和(hé)社會成本。此外,加強合作和(hé)提高(gāo)透明(míng)度可(kě)以解決集體行動問題,即由于快(kuài)速行動的(de)強烈經濟動機,各組織通(tōng)常對(duì)負責任的(de)人(rén)工智能投資不足(Askell et al,2019;胡泳,朱政德,2023)。底線就是,需要社區(qū)規範來(lái)管理(lǐ)基礎模型的(de)發布。在向公衆發布人(rén)工智能代碼或模型時(shí),既要考慮這(zhè)樣做(zuò)的(de)直接影(yǐng)響,也(yě)要考慮其他(tā)人(rén)使用(yòng)這(zhè)些代碼或模型可(kě)能産生的(de)下(xià)遊影(yǐng)響。

完善把關機制,限制訪問或移除可(kě)能有害的(de)模型和(hé)數據集。随著(zhe)AI逐漸成爲各類信息和(hé)知識的(de)把關人(rén),爲AI系統設置把關人(rén)成爲迫切需要。例如,基爾徹使用(yòng)的(de)數據集過去和(hé)現在都是公開的(de),任何人(rén)都可(kě)以下(xià)載,因此可(kě)以想象,擁有人(rén)工智能技術的(de)人(rén)有可(kě)能會用(yòng)它來(lái)創建一個(gè)以傳播仇恨言論爲目的(de)的(de)機器人(rén)。一旦這(zhè)樣的(de)機器人(rén)公開發布,像本文中提到的(de)Hugging Face拔掉下(xià)載插頭的(de)把關行爲就是值得(de)稱許的(de)。

2020年7月(yuè),麻省理(lǐ)工學院下(xià)線了(le)一個(gè)龐大(dà)且被高(gāo)度引用(yòng)的(de)數據集,因爲兩名研究人(rén)員(yuán)發現該數據集使用(yòng)種族主義和(hé)厭惡女(nǚ)性的(de)術語來(lái)描述黑(hēi)人(rén)/亞洲人(rén)和(hé)女(nǚ)性的(de)圖像。這(zhè)一名爲“8000萬張小圖像”(80 Million Tiny Images)的(de)訓練集是在2008年創建的(de),目的(de)是開發先進的(de)物(wù)體檢測技術。它被用(yòng)來(lái)教授機器學習(xí)模型識别靜态圖像中的(de)人(rén)和(hé)物(wù)體(Quach, 2020)。在技術新聞網站The Register向大(dà)學發出警報後,麻省理(lǐ)工學院删除了(le)數據集,并敦促研究人(rén)員(yuán)和(hé)開發人(rén)員(yuán)停止使用(yòng)該訓練庫,并删除所有副本。大(dà)學還(hái)在其網站上發表了(le)官方聲明(míng)并道歉(Ustik, 2020)。

這(zhè)種道德上可(kě)疑的(de)數據集所造成的(de)損害遠(yuǎn)遠(yuǎn)超出了(le)不良品位;該數據集被輸入神經網絡,教導它們将圖像與單詞關聯起來(lái)。這(zhè)意味著(zhe)任何使用(yòng)此類數據集的(de)人(rén)工智能模型都在學習(xí)種族主義和(hé)性别歧視,而這(zhè)可(kě)能會導緻帶有性别歧視或種族主義的(de)聊天機器人(rén)、存在種族偏見的(de)軟件,甚至更糟的(de)社會後果,比如警方使用(yòng)人(rén)臉識别系統誤認某人(rén),并因其未曾犯下(xià)的(de)罪行而實施逮捕(Hill, 2020)。

部分(fēn)問題在于數據集是如何構建的(de)。“8000萬張小圖像”包含2006年根據 WordNet(一個(gè)用(yòng)于計算(suàn)語言學和(hé)自然語言處理(lǐ)的(de)英語單詞數據庫)的(de)查詢從互聯網上抓取的(de) 7930.2017 萬張圖像。據創建者介紹,他(tā)們直接從WordNet複制了(le) 5.3萬多(duō)個(gè)名詞,然後自動從各個(gè)搜索引擎下(xià)載與這(zhè)些名詞相對(duì)應的(de)圖像。由于WordNet包含貶義術語,用(yòng)戶最終會得(de)到無意中證實和(hé)強化(huà)刻闆印象及有害偏見的(de)結果(Song, 2020;Kurenkov, 2022)。

另一個(gè)有問題的(de)數據集是ImageNet。ImageNet是一個(gè)大(dà)型視覺數據庫,用(yòng)于視覺對(duì)象識别軟件研究。2019年,在一個(gè)名爲ImageNet Roulette的(de)藝術項目顯示數據集當中存在系統性偏見後,ImageNet也(yě)從其系統中删除了(le)60萬張照(zhào)片。不出所料,ImageNet也(yě)是基于WordNet構建的(de)(Ruiz, 2019)。這(zhè)表明(míng)了(le)對(duì)數據集實施把關的(de)必要性,如果不加以控制,它将繼續産生有偏見的(de)算(suàn)法,并爲使用(yòng)它作爲訓練集的(de)人(rén)工智能模型帶來(lái)偏見。就像計算(suàn)機科學領域的(de)一句著名習(xí)語所說的(de):垃圾進,垃圾出。

把關機制既包括Hugging Face這(zhè)樣的(de)神經語言編程代碼共享平台,也(yě)包括麻省理(lǐ)工學院這(zhè)樣的(de)精英大(dà)學,同時(shí)也(yě)需要The Register這(zhè)樣的(de)技術媒體進行社會監督。人(rén)工智能研究社區(qū)也(yě)要著(zhe)力培養包容性文化(huà),建立更符合倫理(lǐ)的(de)數據集,并規範自身的(de)程序。例如,避免使用(yòng)知識共享(Creative Commons)材料,獲得(de)明(míng)确的(de)數據采集同意,并在數據集中加入審計卡(audit card),允許數據集的(de)管理(lǐ)者公布目标、管理(lǐ)程序、已知缺陷和(hé)注意事項。

一個(gè)例證是,模型發布時(shí)應包含有關模型文檔的(de)模型卡(model card),它是記錄已發布的(de)人(rén)工智能模型的(de)預期用(yòng)途和(hé)局限性的(de)好方法,比如GPT-4chan的(de)模型卡就明(míng)确指出了(le)它的(de)仇恨言論傾向,并警告不要部署它。

重新思考内容的(de)生産與傳播。威廉·薩菲爾(William Safire)是20 世紀90年代末最早斷言“内容”(content)将作爲獨特的(de)互聯網類别而興起的(de)人(rén)之一(Safire,1998),或許也(yě)是第一個(gè)指出内容無需與真實性或準确性相關即可(kě)實現其基本功能的(de)人(rén)。這(zhè)一基本功能,簡單來(lái)說,就是存在;或者,如凱特·艾希霍恩(Kate Eichhorn)所指出的(de),内容可(kě)以不傳遞任何信息或知識,隻是爲了(le)流通(tōng)而流通(tōng)(Eichhorn, 2022)。

從ICP時(shí)代以來(lái),内容就被放置于社會文化(huà)和(hé)經濟發展中至關重要的(de)位置,在經曆了(le)PGC、UGC、PUGC這(zhè)些不同内容模式和(hé)内容經濟之後,内容已經成爲人(rén)們日常生活審美(měi)化(huà)、藝術化(huà)、商品化(huà)的(de)重要組成部分(fēn)。然而在如今風起雲湧的(de)AIGC浪潮中,主體和(hé)曆史雙雙迎來(lái)了(le)史無前例的(de)危機,因爲這(zhè)場(chǎng)生成式革命選擇将人(rén)類更深層次的(de)編碼能力和(hé)思維鏈能力通(tōng)過訓練交付給機器(胡泳,劉純懿,2023)。當代文化(huà)産業的(de)規範正在朝著(zhe)書(shū)面語言的(de)自動化(huà)和(hé)算(suàn)法優化(huà)方向發展。大(dà)量生産低質量文章(zhāng)以吸引廣告的(de)内容農場(chǎng)使用(yòng)了(le)這(zhè)些工具,但它們仍然依賴大(dà)量的(de)人(rén)力将字符串成适當的(de)單詞,将單詞串成清晰的(de)句子,将句子串成連貫的(de)段落。一旦自動化(huà)和(hé)擴大(dà)勞動規模成爲可(kě)能,會出現什(shén)麽動力來(lái)控制這(zhè)種生産呢(ne)?

長(cháng)期以來(lái),内容的(de)基本範式一直是所謂“讀寫網”(read-write web)。我們不僅消費内容,還(hái)可(kě)以生産内容,通(tōng)過編輯、評論和(hé)上傳參與網絡的(de)創建。然而我們現在正處于一種“自書(shū)寫網絡”(write-write web)的(de)邊緣:網絡不斷地書(shū)寫和(hé)重寫自身。畢竟,ChatGPT及其同類工具可(kě)以像寫文章(zhāng)一樣輕松地編寫代碼。

從本質上來(lái)說,我們将面臨一場(chǎng)永無止盡的(de)信息垃圾危機,由一種人(rén)類和(hé)機器作者的(de)脆弱融合體加以催生。從芬·布朗頓(Finn Brunton)的(de)《信息垃圾:互聯網的(de)影(yǐng)子曆史》(Spam:A Shadow History of the Internet,2013)一書(shū)中,我們可(kě)以了(le)解在互聯網上傳播虛假内容的(de)五花八門的(de)方法。例如“雙面”網站,即爲人(rén)類讀者設計的(de)網頁和(hé)爲搜索引擎中的(de)機器人(rén)爬蟲優化(huà)的(de)網頁同時(shí)并存;搭建整個(gè)由自主内容填充的(de)博客網,以驅動鏈接和(hé)流量;“算(suàn)法新聞”,通(tōng)過網絡發布自動報道;當然還(hái)有在2016年美(měi)國大(dà)選和(hé)英國脫歐期間聲名鵲起的(de)僵屍網(botnet)(Brunton, 2013)。形形色色、具有威脅性的(de)信息垃圾告訴我們,網絡的(de)自我書(shū)寫已經持續一段時(shí)間了(le)。今天,随著(zhe)生成式人(rén)工智能開始占據主導地位,可(kě)以預計,機器生産的(de)文本将堵塞服務器、通(tōng)信電纜和(hé)數據中心。

内容生産與傳播的(de)新亂象爲傳播學帶來(lái)了(le)大(dà)量富于挑戰的(de)課題:比如用(yòng)戶生成内容與有報酬(盡管常常報酬不足)的(de)工人(rén)制作的(de)内容的(de)區(qū)别;全球底層社會中的(de)隐形工人(rén),他(tā)們讓人(rén)工智能看起來(lái)很“聰明(míng)”,然而自身卻是受技術負面影(yǐng)響最大(dà)的(de)邊緣化(huà)群體;從藝術和(hé)文學到新聞和(hé)政治,這(zhè)些領域如何經受AIGC内容産業崛起的(de)考驗;是否存在某種“内容資本”,即藝術家、作家和(hé)表演者制作内容的(de)能力,并不關乎他(tā)們的(de)作品,而是和(hé)他(tā)們作爲創造者的(de)地位息息相關?

解決人(rén)工智能和(hé)傳播的(de)職業問題。喬舒亞·裏夫斯(Joshua Reeves)寫道:“面對(duì)機器冷(lěng)冰冰的(de)效率,人(rén)類似乎隻是潛在錯誤的(de)有機集合。”(Reeves, 2016)OpenAI的(de)研究預測,“80%的(de)美(měi)國勞動力可(kě)能至少有10%的(de)工作任務會受到LLM的(de)影(yǐng)響”。更糟糕的(de)是,“19%的(de)工作者可(kě)能會看到至少50%的(de)工作任務受到影(yǐng)響”(Eloundou et al, 2023)。公共關系專業人(rén)士、文案撰稿人(rén)、平面設計師、社交媒體營銷人(rén)員(yuán)——這(zhè)些都是本科主修傳播學的(de)人(rén)的(de)常見職業,也(yě)都可(kě)能受到快(kuài)速生成文本和(hé)圖像的(de)生成式人(rén)工智能的(de)威脅。傳播學需要研究如何在各種傳播工作環境中合乎倫理(lǐ)地使用(yòng)人(rén)工智能工具,也(yě)需要通(tōng)過專業主義的(de)倡導來(lái)保護這(zhè)些職業。

在研究、交流中和(hé)課堂上提升人(rén)工智能素養。奧特姆·愛(ài)德華茲(Autumn Edwards)和(hé)查德·愛(ài)德華茲(Chad Edwards)等傳播教育研究者試圖展示人(rén)工智能如何改變傳播教學的(de)本質(Edwards, Edwards, 2017)。此外,ChatGPT帶來(lái)的(de)有關考核方式和(hé)學術不誠實的(de)大(dà)量討(tǎo)論爲傳播學學者提供了(le)一個(gè)機會,調查和(hé)挑戰我們對(duì)教學和(hé)學習(xí)的(de)假設。我們還(hái)應該借鑒傳播學研究中将新媒體技術融入課堂的(de)悠久曆史,确定在哪些實踐中使用(yòng)人(rén)工智能将有利于促進學生學習(xí)和(hé)提高(gāo)教學質量。此外,就像社交媒體和(hé)假新聞的(de)興起要求發展更好的(de)媒介素養一樣,ChatGPT等工具要求人(rén)工智能素養的(de)培育,傳播學在這(zhè)方面責無旁貸。需要大(dà)力開展科學傳播,動員(yuán)人(rén)工智能社區(qū)中更多(duō)的(de)研究人(rén)員(yuán)扮演AI傳播者的(de)角色,讓更多(duō)的(de)公衆了(le)解AI技術的(de)能力和(hé)局限性。

最終,回到傳播學研究本身,是否需要對(duì)傳播學進行重新定位和(hé)重新概念化(huà),以适應日益智能的(de)機器、自主決策系統和(hé)智能設備帶來(lái)的(de)機遇和(hé)挑戰?從曆史上看,傳播學通(tōng)過将創新性突破轉化(huà)爲人(rén)類互動和(hé)信息交換的(de)媒介來(lái)适應新技術。随著(zhe)計算(suàn)機的(de)發展,20世紀下(xià)半葉出現了(le)以計算(suàn)機爲媒介的(de)交流(CMC)。在CMC研究中,計算(suàn)機被理(lǐ)解爲或多(duō)或少中立的(de)訊息傳輸渠道和(hé)人(rén)類交互工具。這(zhè)種形式化(huà)忽略了(le)這(zhè)樣一個(gè)事實:與以前的(de)技術進步不同,計算(suàn)機在今天開始占據交流交換參與者的(de)地位。人(rén)工智能科學中已經存在不少這(zhè)方面的(de)證據,所以,我們也(yě)許要問:CMC 範式雖然具有不可(kě)否認的(de)影(yǐng)響力,但是否存在重大(dà)不足,甚至不再站得(de)住腳?相應地,傳播學是否需要重新設計基本框架,以應對(duì)獨特的(de)技術挑戰及社會機遇?現在是傳播學認真對(duì)待這(zhè)些關鍵問題的(de)時(shí)候了(le)。

盡管人(rén)工智能有效地挑戰了(le)當前的(de)範式,将其正常功能置于某種危機之中,但構成新範式的(de)内容現在才剛剛開始出現。按照(zhào)科學史的(de)發展邏輯,這(zhè)些創新可(kě)能需要相當長(cháng)的(de)一段時(shí)間,才能被定型并編入下(xià)一次被視爲“正常科學”的(de)叠代中。然而,在當前這(zhè)個(gè)初步階段,我們可(kě)以開始确定,随著(zhe)人(rén)工智能技術的(de)進展,下(xià)一代傳播研究可(kě)能會是什(shén)麽樣子。

(胡泳:《超越ChatGPT:大(dà)型語言模型的(de)力量與人(rén)類交流的(de)困境》,2023年第8期,微信發布系節選,學術引用(yòng)請務必參考原文)