自2022年11月(yuè)起,以ChatGPT爲典型代表的(de)大(dà)模型在全球數字科技界引起了(le)極大(dà)關注。全球範圍内的(de)大(dà)模型數量受其影(yǐng)響在不到一年的(de)時(shí)間内就已超過一百種。截至2023年10月(yuè),大(dà)模型技術已經步入了(le)快(kuài)速發展的(de)階段。在中國,超過10種大(dà)模型已完成備案。其中,百度的(de)文心大(dà)模型升級至4.0版本後,在理(lǐ)解、生成、邏輯和(hé)記憶等四項核心能力上均實現了(le)顯著的(de)提升。與此同時(shí),OpenAI的(de)ChatGPT也(yě)經曆了(le)一次重大(dà)升級,除了(le)多(duō)模态視覺能力、DALL·E 3以及語音(yīn)合成API的(de)開放。最引人(rén)注目的(de)升級是,爲每個(gè)用(yòng)戶提供了(le)一種名爲GPTS的(de)工具,使用(yòng)戶能夠構建專屬的(de)GPT模型。微軟公司創始人(rén)比爾·蓋茨公開表示,自1980年首次看到圖形用(yòng)戶界面以來(lái),以GPT爲代表的(de)大(dà)模型是他(tā)所見過的(de)最具革命性的(de)技術進步。對(duì)于大(dà)模型未來(lái)的(de)産業發展趨勢和(hé)面臨的(de)挑戰究竟如何,我們可(kě)以從三個(gè)方面進行探討(tǎo)。其一,人(rén)類種群知識庫從外化(huà)、索引化(huà)到智能化(huà)的(de)三部曲。
我們在《崛起的(de)超級智能》一書(shū)中提出,生物(wù)的(de)競争本質上是種群知識庫的(de)競争。在過去的(de)幾億年裏,恐龍因爲滅絕導緻種群知識庫消失爲0,鲨魚一直保持在海洋中遊蕩,種群知識庫沒有發生大(dà)的(de)變化(huà),熊貓因爲趨于滅絕從而種群知識庫不斷萎縮。隻有人(rén)類在近200萬年裏,在知識和(hé)智慧上不斷擴展和(hé)加速,在最近數百年裏随著(zhe)蒸汽機、工業革命、核能的(de)出現,人(rén)類種群知識庫出現了(le)巨大(dà)的(de)增長(cháng)。特别是互聯網誕生後,第一次将人(rén)類的(de)種群知識庫外化(huà)成一個(gè)龐大(dà)的(de)網絡知識庫,通(tōng)過萬維網的(de)發明(míng)進一步促使人(rén)類種群知識庫急劇擴容。表現在科技領域就是21世紀大(dà)量新科技新概念不斷湧現。面對(duì)海量的(de)互聯網公共知識,如何索引就成了(le)人(rén)類必須解決的(de)重要課題。20世紀90年代,搜索引擎出現了(le)蓬勃發展,其中優秀和(hé)典型的(de)代表分(fēn)别是谷歌(gē)和(hé)百度,它們成長(cháng)背後的(de)推動力也(yě)是人(rén)類種群知識庫發展的(de)必然要求。互聯網知識庫被索引之後,如何智能化(huà)也(yě)就成爲了(le)一個(gè)重要議(yì)題。在過去的(de)近30年裏,以谷歌(gē)、百度爲代表的(de)搜索引擎公司加大(dà)了(le)智能化(huà)的(de)步伐,人(rén)工智能的(de)興起也(yě)與此有密切的(de)關系。2022年OpenAI的(de)ChatGPT成功引發了(le)大(dà)模型的(de)興起,标志著(zhe)互聯網這(zhè)個(gè)外化(huà)的(de)人(rén)類種群知識庫完成了(le)從索引化(huà)到智能化(huà)的(de)轉變。但不能忘記的(de)是,OpenAI ChatGPT的(de)成功離不開谷歌(gē)提出的(de)Transformer注意力機制模型,也(yě)離不開微軟通(tōng)過Bing搜索引擎提供的(de)海量數據和(hé)巨大(dà)資金支持。從搜索引擎的(de)發展看,通(tōng)過激烈的(de)競争,搜索引擎最終形成了(le)若幹個(gè)巨頭公司爲人(rén)類提供互聯網海量數據的(de)索引服務,同樣我們認爲作爲搜索引擎的(de)升級版,人(rén)類社會也(yě)不需要很多(duō)大(dà)模型提供同質的(de)服務。我們判斷包括搜索引擎、大(dà)數據、社交網絡等領域擁有優質大(dà)數據、人(rén)工智能技術積累和(hé)廣泛應用(yòng)場(chǎng)景的(de)公司中,在未來(lái)的(de)競争中會脫穎而出一家或若幹家爲人(rén)類提供集中統一的(de)智能服務。
其二,行業垂直大(dà)模型建設思路:繼續提升通(tōng)用(yòng)大(dà)模型智能水(shuǐ)平。
應該指出,當前人(rén)類社會對(duì)大(dà)模型充滿了(le)熱(rè)情,特别在中國,很多(duō)人(rén)希望大(dà)模型能夠與金融、法律、工業、農業、電力、建築等等行業領域結合,從而實現快(kuài)速發展。其實大(dà)模型的(de)成功并不僅僅是參數量大(dà),而是用(yòng)大(dà)規模預訓練+微調的(de)方式,對(duì)海量的(de)跨領域知識進行學習(xí)時(shí)湧現出來(lái)新的(de)能力,而且這(zhè)些新的(de)能力往往與創新有關,如翻譯、創作文章(zhāng)、創作圖像等,然而這(zhè)種創新能力并不穩定,會出現“幻覺”和(hé)胡編亂造的(de)情況。同時(shí)由于神經網絡本身的(de)特點,其可(kě)解釋性問題也(yě)一直沒有解決,因此對(duì)于需要精密控制或精确結果的(de)産業領域,大(dà)模型并不是可(kě)靠的(de)工具和(hé)技術。還(hái)有一個(gè)誤區(qū)是,認爲用(yòng)大(dà)模型的(de)訓練方法加上行業産業的(de)大(dà)數據就可(kě)以形成高(gāo)質量的(de)行業大(dà)模型。這(zhè)個(gè)觀點并不符合大(dà)模型湧現出創新能力的(de)規律,過于單一領域的(de)知識反而會降低大(dà)模型湧現出新能力的(de)水(shuǐ)平。因此應繼續提高(gāo)ChatGPT、文心一言、LLama等等通(tōng)用(yòng)大(dà)模型的(de)智能水(shuǐ)平,通(tōng)過通(tōng)用(yòng)大(dà)模型平台與其他(tā)可(kě)靠性高(gāo)的(de)人(rén)工智能技術協同工作,并與各個(gè)行業結合,這(zhè)種路徑要比建設專門的(de)行業大(dà)模型更爲穩健和(hé)有效。
其三,值得(de)期待的(de)大(dà)模型未來(lái)。
大(dà)模型的(de)不斷發展和(hé)與其他(tā)技術産品結合的(de)過程将是持續探索和(hé)嘗試的(de)過程。無論如何,大(dà)模型的(de)出現的(de)确是一個(gè)革命性的(de)突破,有很多(duō)科學家認同ChatGPT等大(dà)模型已經可(kě)以突破圖靈測試,未來(lái)在智能和(hé)意識的(de)基礎原理(lǐ)上也(yě)将帶來(lái)更多(duō)突破性的(de)啓發。在産業應用(yòng)上,大(dà)模型與其他(tā)不同類型的(de)人(rén)工智能技術、網絡技術、大(dà)數據技術結合,與不同的(de)辦公、學習(xí)、生産、生活結合會持續産生出具有非凡想象力的(de)應用(yòng)。例如微軟辦公Office接入GPT-4,由AI驅動的(de) Microsoft 365 Copilot ,打破了(le)傳統辦公軟件辦公的(de)方式,能自動生成文檔、電子郵件、PPT。百度的(de)文心行業大(dà)模型的(de)數量已經達到了(le) 11 個(gè),覆蓋能源電力、金融、航天、傳媒、影(yǐng)視、汽車、城(chéng)市管理(lǐ)等多(duō)個(gè)領域,OpenAI計劃再推出GPT商店(diàn)。這(zhè)将類似于蘋果的(de)App Store,讓開發者可(kě)以在商店(diàn)中上架他(tā)們的(de)自定義GPT,供其他(tā)用(yòng)戶購(gòu)買和(hé)使用(yòng)。雖然大(dà)模型有著(zhe)令人(rén)驚歎的(de)智能表現,但我們還(hái)需要耐心等待大(dà)模型的(de)持續發育和(hé)成長(cháng),如果從以ChatGPT3.5爲代表的(de)大(dà)模型大(dà)規模向人(rén)類提供服務算(suàn)起,畢竟它還(hái)是一個(gè)從出生來(lái)到全人(rén)類面前還(hái)不到1年的(de)嬰兒(ér)。