近年來,大模型技術飛速發展,極大提升了全球人工智能技術發展和應用迭代速度,被認為是“邁向通用人工智能的里程碑技術”。面對新一輪大模型引領的人工智能變革,加快推進大模型賦能數智化應用健康發展具有重要意義。
作為最成功的一類大模型,大語言模型是一種包含大規模參數、使用大量文本數據訓練出來的深度學習模型,展現了大模型的能力和基本技術框架。目前,這一技術思路和框架已被用來處理圖像、視頻等多模態數據,并被推廣應用于機器人控制與智能決策等場景。各類大模型正處于迅猛發展之中,眾多高科技企業紛紛投身大模型建設,圍繞大模型已經形成相對成熟的技術框架,但產品和生態尚在發展形成之中。總體而言,大模型的技術發展歷程相比以往任何人工智能技術都更迅猛,其影響力也是史無前例的。
大模型的“大”主要體現在3個方面,即模型參數規模大、訓練數據規模大和算力消耗需求大。模型參數方面,當前主流大模型的參數規模通常在千億甚至萬億級別,遠遠大于以往的各類深度學習模型。訓練數據方面,大模型在前期訓練階段和后期調優階段都需要海量的數據支撐,例如引爆大模型范式的聊天機器人ChatGPT,預訓練數據量達到了45TB,其研發公司還在拉丁美洲等地區招募了約1000名員工,專門從事與大模型相關的訓練數據標注工作。算力需求方面,根據有關市場調查機構估計,ChatGPT的運行需要上萬片最先進的圖形處理芯片同時工作,耗電量巨大。
大模型已經展現出驚人的能力,基于大語言模型的聊天機器人是以人機對話為接口的高效信息獲取、智能處理和內容生成工具,能夠實現高質量的信息整合、翻譯和簡單的問題求解與規劃。其受到全社會廣泛關注,主要是它已經初步具備通用人工智能的部分特性,包括通順的自然語言生成、全領域的知識體系覆蓋、跨任務場景的通用處理模型、通暢的人機交互接口。當然,聊天機器人只是大模型的起點,大模型未來的發展趨勢也已初見端倪。
第一,大模型有望引領諸多行業的數智化創新發展。大模型的學習模式類似人類大腦,通過學習不同的數據,能夠形成多樣化的能力,不需要按照任務開發定制化的算法。通過自然的人機交互,智能化地解決復雜問題和實現輔助決策,推動各行業體系變革和生態發展。例如,未來的信息系統可以由領域用戶通過與大模型的交互直接搭建和維護,“用戶即程序員”,顛覆信息系統研發和應用范式。
第二,領域專用和輕量化大模型是當前技術研究的重點。大模型雖然已經展現出諸多優勢,但依然存在可靠性差、訓練數據依賴、因果推理能力弱、搭建成本高等短板,在部分領域深度應用上的表現弱于專用小模型。為了更充分地發揮大模型優勢,金融、教育、醫療等領域專用大模型已取得了階段性成果,有望促進各項專業能力的涌現。
第三,大模型有望發展成為更加通用的人工智能。大模型起步于文本信息處理,現已涵蓋圖片、音視頻等多模態數據。在不久的將來,大模型將超越信息域,結合硬件設施,發展成為與物理和人類世界互動的具象智能,逐步縮小與真正的“通用人工智能”的差距。
雖然大模型展現的能力已經讓全社會看到了通用人工智能的曙光,但當前大模型也有一定的局限性。一方面,由于大模型自身結構和機制漏洞,有被惡意攻擊的風險;另一方面,大模型自身的知識表達和學習模式還存在缺陷,導致其回答中經常出現“幻覺”,如常識性錯誤、杜撰內容等。
推進大模型賦能數智化應用健康發展,應堅持規劃引領、需求帶動、應用導向、安全為基,引導、扶持和監督大模型在更廣泛的領域應用中長計遠慮、扎實落地、穩步推進。
首先,掌握技術主動權,加快自主可控的國產大模型全鏈條建設。依托我國現有的人工智能人才基礎,構建面向大模型與通用人工智能技術的平臺和隊伍。加大芯片、大數據、人工智能等產業的投入與整合力度,保障“海量數據”“頂尖人才”“算力支撐”的落地,推進我國全階段自主可控大模型建設,掌握大模型技術發展的主動權和話語權。大力支持國產大模型的下游技術攻關和產品推廣,促進國產大模型產品的應用落地和迭代升級。
其次,深化大模型應用生態建設,構建“通用大模型+專用小模型”的成熟應用生態。早在大模型產生之前,基于領域經驗歸納和業務知識構建的“小模型”已經廣泛應用于各行業。應充分認識并應用好大模型和傳統小模型各自的特性,在推廣大模型產品的同時進一步推進小模型技術的升級和應用,發揮好小模型輕量級、高效率、善于解決特定問題的優勢,逐步推進大小模型融合的應用生態。
最后,建立健全大模型安全審查制度與法律體系,從源頭規避大模型發展風險。推動建立行之有效的數據審查機制和接入許可規范,從源頭把控大模型內容安全性,并主動參與全球人工智能模型使用規范的標準制定。同時,對于大模型可能產生的風險進行合理評估與審核,如歧視、仇恨言論、私人信息泄露、虛假信息、協助犯罪等。