大(dà)模型的(de)未來(lái)趨勢與挑戰

2023/11/27 16:06:33

來(lái)源：科協之聲

作者：劉鋒

自2022年11月(yuè)起，以ChatGPT爲典型代表的(de)大(dà)模型在全球數字科技界引起了(le)極大(dà)關注。全球範圍内的(de)大(dà)模型數量受其影(yǐng)響在不到一年的(de)時(shí)間内就已超過一百種。

截至2023年10月(yuè)，大(dà)模型技術已經步入了(le)快(kuài)速發展的(de)階段。在中國，超過10種大(dà)模型已完成備案。其中，百度的(de)文心大(dà)模型升級至4.0版本後，在理(lǐ)解、生成、邏輯和(hé)記憶等四項核心能力上均實現了(le)顯著的(de)提升。與此同時(shí)，OpenAI的(de)ChatGPT也(yě)經曆了(le)一次重大(dà)升級，除了(le)多(duō)模态視覺能力、DALL·E 3以及語音(yīn)合成API的(de)開放。最引人(rén)注目的(de)升級是，爲每個(gè)用(yòng)戶提供了(le)一種名爲GPTS的(de)工具，使用(yòng)戶能夠構建專屬的(de)GPT模型。

微軟公司創始人(rén)比爾·蓋茨公開表示，自1980年首次看到圖形用(yòng)戶界面以來(lái)，以GPT爲代表的(de)大(dà)模型是他(tā)所見過的(de)最具革命性的(de)技術進步。對(duì)于大(dà)模型未來(lái)的(de)産業發展趨勢和(hé)面臨的(de)挑戰究竟如何，我們可(kě)以從三個(gè)方面進行探討(tǎo)。

未标題-2.jpg

其一，人(rén)類種群知識庫從外化(huà)、索引化(huà)到智能化(huà)的(de)三部曲。

我們在《崛起的(de)超級智能》一書(shū)中提出，生物(wù)的(de)競争本質上是種群知識庫的(de)競争。在過去的(de)幾億年裏，恐龍因爲滅絕導緻種群知識庫消失爲0，鲨魚一直保持在海洋中遊蕩，種群知識庫沒有發生大(dà)的(de)變化(huà)，熊貓因爲趨于滅絕從而種群知識庫不斷萎縮。

隻有人(rén)類在近200萬年裏，在知識和(hé)智慧上不斷擴展和(hé)加速，在最近數百年裏随著(zhe)蒸汽機、工業革命、核能的(de)出現，人(rén)類種群知識庫出現了(le)巨大(dà)的(de)增長(cháng)。特别是互聯網誕生後，第一次将人(rén)類的(de)種群知識庫外化(huà)成一個(gè)龐大(dà)的(de)網絡知識庫，通(tōng)過萬維網的(de)發明(míng)進一步促使人(rén)類種群知識庫急劇擴容。表現在科技領域就是21世紀大(dà)量新科技新概念不斷湧現。

面對(duì)海量的(de)互聯網公共知識，如何索引就成了(le)人(rén)類必須解決的(de)重要課題。20世紀90年代，搜索引擎出現了(le)蓬勃發展，其中優秀和(hé)典型的(de)代表分(fēn)别是谷歌(gē)和(hé)百度，它們成長(cháng)背後的(de)推動力也(yě)是人(rén)類種群知識庫發展的(de)必然要求。

互聯網知識庫被索引之後，如何智能化(huà)也(yě)就成爲了(le)一個(gè)重要議(yì)題。在過去的(de)近30年裏，以谷歌(gē)、百度爲代表的(de)搜索引擎公司加大(dà)了(le)智能化(huà)的(de)步伐，人(rén)工智能的(de)興起也(yě)與此有密切的(de)關系。

2022年OpenAI的(de)ChatGPT成功引發了(le)大(dà)模型的(de)興起，标志著(zhe)互聯網這(zhè)個(gè)外化(huà)的(de)人(rén)類種群知識庫完成了(le)從索引化(huà)到智能化(huà)的(de)轉變。但不能忘記的(de)是，OpenAI ChatGPT的(de)成功離不開谷歌(gē)提出的(de)Transformer注意力機制模型，也(yě)離不開微軟通(tōng)過Bing搜索引擎提供的(de)海量數據和(hé)巨大(dà)資金支持。

從搜索引擎的(de)發展看，通(tōng)過激烈的(de)競争，搜索引擎最終形成了(le)若幹個(gè)巨頭公司爲人(rén)類提供互聯網海量數據的(de)索引服務，同樣我們認爲作爲搜索引擎的(de)升級版，人(rén)類社會也(yě)不需要很多(duō)大(dà)模型提供同質的(de)服務。我們判斷包括搜索引擎、大(dà)數據、社交網絡等領域擁有優質大(dà)數據、人(rén)工智能技術積累和(hé)廣泛應用(yòng)場(chǎng)景的(de)公司中，在未來(lái)的(de)競争中會脫穎而出一家或若幹家爲人(rén)類提供集中統一的(de)智能服務。

其二，行業垂直大(dà)模型建設思路：繼續提升通(tōng)用(yòng)大(dà)模型智能水(shuǐ)平。

應該指出，當前人(rén)類社會對(duì)大(dà)模型充滿了(le)熱(rè)情，特别在中國，很多(duō)人(rén)希望大(dà)模型能夠與金融、法律、工業、農業、電力、建築等等行業領域結合，從而實現快(kuài)速發展。

其實大(dà)模型的(de)成功并不僅僅是參數量大(dà)，而是用(yòng)大(dà)規模預訓練+微調的(de)方式，對(duì)海量的(de)跨領域知識進行學習(xí)時(shí)湧現出來(lái)新的(de)能力，而且這(zhè)些新的(de)能力往往與創新有關，如翻譯、創作文章(zhāng)、創作圖像等，然而這(zhè)種創新能力并不穩定，會出現“幻覺”和(hé)胡編亂造的(de)情況。同時(shí)由于神經網絡本身的(de)特點，其可(kě)解釋性問題也(yě)一直沒有解決，因此對(duì)于需要精密控制或精确結果的(de)産業領域，大(dà)模型并不是可(kě)靠的(de)工具和(hé)技術。

還(hái)有一個(gè)誤區(qū)是，認爲用(yòng)大(dà)模型的(de)訓練方法加上行業産業的(de)大(dà)數據就可(kě)以形成高(gāo)質量的(de)行業大(dà)模型。這(zhè)個(gè)觀點并不符合大(dà)模型湧現出創新能力的(de)規律，過于單一領域的(de)知識反而會降低大(dà)模型湧現出新能力的(de)水(shuǐ)平。因此應繼續提高(gāo)ChatGPT、文心一言、LLama等等通(tōng)用(yòng)大(dà)模型的(de)智能水(shuǐ)平，通(tōng)過通(tōng)用(yòng)大(dà)模型平台與其他(tā)可(kě)靠性高(gāo)的(de)人(rén)工智能技術協同工作，并與各個(gè)行業結合，這(zhè)種路徑要比建設專門的(de)行業大(dà)模型更爲穩健和(hé)有效。

其三，值得(de)期待的(de)大(dà)模型未來(lái)。

大(dà)模型的(de)不斷發展和(hé)與其他(tā)技術産品結合的(de)過程将是持續探索和(hé)嘗試的(de)過程。無論如何，大(dà)模型的(de)出現的(de)确是一個(gè)革命性的(de)突破，有很多(duō)科學家認同ChatGPT等大(dà)模型已經可(kě)以突破圖靈測試，未來(lái)在智能和(hé)意識的(de)基礎原理(lǐ)上也(yě)将帶來(lái)更多(duō)突破性的(de)啓發。

在産業應用(yòng)上，大(dà)模型與其他(tā)不同類型的(de)人(rén)工智能技術、網絡技術、大(dà)數據技術結合，與不同的(de)辦公、學習(xí)、生産、生活結合會持續産生出具有非凡想象力的(de)應用(yòng)。例如微軟辦公Office接入GPT-4，由AI驅動的(de) Microsoft 365 Copilot ，打破了(le)傳統辦公軟件辦公的(de)方式，能自動生成文檔、電子郵件、PPT。百度的(de)文心行業大(dà)模型的(de)數量已經達到了(le) 11 個(gè)，覆蓋能源電力、金融、航天、傳媒、影(yǐng)視、汽車、城(chéng)市管理(lǐ)等多(duō)個(gè)領域，OpenAI計劃再推出GPT商店(diàn)。這(zhè)将類似于蘋果的(de)App Store，讓開發者可(kě)以在商店(diàn)中上架他(tā)們的(de)自定義GPT，供其他(tā)用(yòng)戶購(gòu)買和(hé)使用(yòng)。

雖然大(dà)模型有著(zhe)令人(rén)驚歎的(de)智能表現，但我們還(hái)需要耐心等待大(dà)模型的(de)持續發育和(hé)成長(cháng)，如果從以ChatGPT3.5爲代表的(de)大(dà)模型大(dà)規模向人(rén)類提供服務算(suàn)起，畢竟它還(hái)是一個(gè)從出生來(lái)到全人(rén)類面前還(hái)不到1年的(de)嬰兒(ér)。

行業實踐

實踐項目返回列表

大(dà)模型的(de)未來(lái)趨勢與挑戰

行業實踐

實踐項目 返回列表

大(dà)模型的(de)未來(lái)趨勢與挑戰

實踐項目返回列表