【摘要】當開源精神的火種點燃人工智能的星辰大海,人類正見證一場關乎數智文明重構的認知革命。開源大模型不僅重構技術生態,而且重塑人類對知識生產與再分配的傳統認知范式。當前,這場看似溫和的大模型開源技術運動,實質上是中國科技企業突破算力封鎖、實現產業轉型與生態博弈共同催生的戰略選擇,其行動早已超越單純的技術選擇,直指知識與技術的壟斷與解放。
【關鍵詞】人工智能 大模型 DeepSeek 開源 重構 【中圖分類號】F49 【文獻標識碼】A
自2023年以來,阿里巴巴陸續開源通義千問(Qwen)系列大語言模型,其在自然語言理解、多模態交互等領域具有突破性表現,在多項基準測試中可與全球頂尖大模型并駕齊驅。中國人工智能企業深度求索(DeepSeek)在2024年底和2025年初,相繼推出DeepSeek-V3與DeepSeek-R1兩大開源引擎,前者以媲美GPT-4的千億參數架構構筑智能基座,后者則在復雜邏輯推理的深水區開辟新航道,將人機協作的邊界推向更遼闊的疆域。美國CNBC電視臺網站發表《中國對開源的擁抱顛覆了圍繞人工智能的傳統看法》一文,認為中國正在積極擁抱人工智能開源大模型,這一趨勢正推動中國人工智能技術的普及與創新。當前,中國已構建出參數規模橫跨十億至萬億級、應用場景覆蓋智能制造至數智政務的開源生態網絡。人工智能的技術演進與產業需求如齒輪般精密咬合,塑造出獨具特色的應用需求牽引創新、開源生態反哺產業的發展范式。中國工業和信息化部數據顯示,截至2024年6月,中國人工智能企業數量已超4500家,核心產業規模接近6000億元。中國軟件開發者數量已經突破940萬。中國已經成為全球開源參與者數量排名第二,增長速度最快的國家。①這不僅是數字的躍遷,更是創新范式的質變,中國運用開源開放與協同創新的群體智慧,從代碼倉庫到產業應用,從實驗室到生產線,在全球人工智能競爭中激起層層漣漪。
開源之潮:智能時代的星星之火
“開源”一詞最初來源于軟件領域,原指可以訪問源代碼且對程序的使用或發行沒有限制,所有人均可查看、修改和分發。截至2025年1月1日,全球97%的軟件開發者和99%的企業已使用開源軟件,70%以上的新立項軟件項目采用開源模式②?,F階段,受限于大模型的技術復雜性與海量數據規模,機構或公司往往難以實現全方位開源,這既源于商業機密保護與合規性審查的多重風險管控,又涉及完全開放可能導致的技術濫用隱患。然而,采用開源策略仍具顯著價值:通過展現技術透明度與研發規范性,開發者能夠有效提升品牌可信度,在爭取開發者社區支持與社會公眾認同等方面獲得實質性效益③。
通常來說,中小型創新主體構建的人工智能大模型,往往比大科技公司構建的大模型更傾向采用開源模式。這種差異,主要源于初創機構對協作創新的迫切需求,以及資源限制之間的動態平衡機制。國際上,在微軟、谷歌、蘋果和亞馬遜等構建的平臺與算力壁壘之中,中小型創新主體面臨雙重鎖定效應:上游受限于平臺與算力寡頭的定價權,下游被困于專利叢林形成的創新堰塞湖。開源運動正在創造技術民主和技術平權的新秩序,這種秩序呈現出量子化組織特征:既保持個體創新的離散性,又通過相互合作實現量子糾纏般的協同效應。開源不是烏托邦式的理想主義,而是以透明性換取信任、用協作對抗壟斷。開源運動正在創造技術史上的悖論:當每個局部創新都來自分布式個體,整體卻涌現出超越中心化系統的智慧。這種群體智慧暗示著知識生產的范式革命。中小型創新主體通過開源構建的量子化創新網絡,本質上是將技術創新從牛頓式的機械論與確定性范式,轉向量子力學的概率云范式——既保持個體自由,又通過協作實現相干疊加。
近年來,國際上許多聲稱開放或者開源的大模型,包括Meta公司的Llama和谷歌公司的Gemma,實際上只是“開放權重”,而非嚴格意義上的開源。這些大模型的許可證限制某些使用和修改權限,而且它們的訓練數據集并不公開。而DeepSeek的R1在“MIT許可證”下分發,促進不受限制的使用、修改和分發,包括用于商業目的,其從軟硬件的適配到應用推廣甚至產品宣傳,均由全球廠商和開發者共同完成,極大降低其生態建設成本。正是由于低建設成本和高性價比,反過來進一步幫助DeepSeek拓展大模型生態,快速提升用戶數量和市場占有率。
破繭之因:技術困局與戰略突圍
芯片封鎖下的自主創新。面對美國芯片禁運,中國科技型企業以算法創新突破物質桎梏,將算力劣勢轉化為算法創新的催化劑。華為“盤古”大模型通過動態稀疏訓練技術,依托開源大模型提升算法效率,彌補硬件短板,在算力受限下實現大模型效率躍升,在8192張昇騰NPU構建的大規模集群上,將算力利用率提升至50%④。這種“以軟補硬”的智慧,宛如在芯片封鎖的鐵幕上鑿開一道微光。開源社區中涌現的量化壓縮工具鏈,讓千億參數大模型得以在國產昇騰等芯片上流暢運行,創造出屬于中國人工智能的“納米空間折疊術”。
閉源鐵幕中的開源星窗。當GPT-4、Claude 3等閉源大模型筑起技術鐵幕時,Qwen、DeepSeek等開源力量正以“否定性實踐”重構知識生產范式。這種閉源與開源的張力,既是資本邏輯與技術民主化的對抗,又是人類認知范式革命的先聲。閉源大模型通過算法封裝構建“技術壟斷的認知鴻溝”,形成知識權力不對稱的新型技術壟斷,持續強化大模型開發者與使用者之間的信息勢差,而DeepSeek-R1的開源,引發了全世界開源社區的“羊群效應”,開源社區通過持續的技術否定實現躍遷。雖然DeepSeek尚未公布訓練該大模型的全部成本,但據估算,其算力租賃費用約是Meta公司Llama 3.1 405B的十分之一,且使用DeepSeek-R1界面的用戶成本僅是ChatGPT o1的三十分之一⑤。這使更多的研究人員和企業能夠輕松使用人工智能技術服務,推動人工智能技術的普及和應用。
產業實踐上的技術涌現。我國擁有全球最完整的工業體系。截至2025年1月,全球“燈塔工廠”累計數量達到189家,中國有79家,占比約42%,總量位居世界首位⑥。工業和信息化部數據顯示,2023年,我國重點工業企業數字化研發設計工具普及率達到80.1%,關鍵工序數控化率達到62.9%⑦。2024年11月,《中國互聯網發展報告2024》顯示,全國已建成近萬家數字化車間和智能工廠。當全球最完整的工業體系、數智化程度日益遞增的行業,與超11億網民的數字足跡,在960多萬平方公里土地上交織時,這片沃土正在演繹大模型技術革命的獨特路徑——數據、產業、場景、市場多維共振的技術涌現。當前,中國開源技術的“生態賦能”效應已覆蓋制造、金融、醫療等多個核心領域,形成“技術開源—場景迭代—生態培育—市場驗證”的良性循環。DeepSeek的涌現,充分說明創新要素與產業場景深度融合的必要性。
中國的產業實踐表明:中國開辟了產業需求牽引開源創新的獨特路徑,開源大模型技術不僅是工具創新,更是重構生產關系的系統性變革。這種轉變背后,是數智化轉型需求激增、數據要素市場化改革深化,以及產學研用協同機制創新等多重因素驅動的結果。
漣漪效應:技術哲學的范式重構
全球技術平權的精神遠征。開源模式打破巨頭或寡頭壟斷,通過社區協作優化大模型性能,推動全球開發者參與技術迭代。開源大模型較閉源大模型的優勢主要體現在三點⑧:更好地分配權力——開源大模型創造新的社會經濟權力形式,下游用戶可以更好地自行做出決策;更快地促進創新——開源大模型更加可定制,并提供更深的訪問權限,可更好地促進創新;更高的透明性——開源大模型相比閉源大模型,平均透明度更高,可幫助避免過去因數智技術不透明而造成的危害。
技術發展至今,人類對技術平權的追求已超越工具理性的邊界,演變為一場影響文明發展的精神遠征。這場遠征的終極目標,不是算力的均分,而是認知主權的覺醒。DeepSeek作為中國人工智能開源大模型的代表之一,正在為工業智能賽道注入“超級大腦”,推動工業母機領域的顛覆性變革。這是對“技術主權”的深層詮釋,中國開源生態正用分布式算力破解“算力霸權”的困境。
知識生產范式的認知革命。開源與開放,無論是對技術創新還是科學發展而言,均尤為重要。傳統的閉源大模型構筑算力高墻,以億級美元研發投入與超萬卡集群的準入門檻,將人工智能創新禁錮于少數科技巨頭的認知堡壘,高校和中小型創新主體被拒之門外而“望卡興嘆”⑨。這種資本密集型的研發范式雖然推動技術迭代,卻在無形中加劇全球科技創新的“馬太效應”,也會在一定程度上阻礙知識和技術的傳播與創新。開源的浪潮沖破了上述知識或技術的壟斷,算法民主化讓思維的火種在技術平權中爆發鏈式反應:原本深藏于壟斷機構的認知框架,如今在分布式協作的開源社區里重組知識DNA;過往可控理想條件下,邊界清晰且線性遞進的研究范式,蛻變為可在開放復雜環境下實現交叉融合,且呈現出涌現式進化的認知生態,每一次開源社區中的模型微調,均帶來技術迭代。知識生產的終極命題,從“占有真理”轉向“開放交互”。人工智能時代,開源社區中每天產生的數萬次模型微調請求,正在孵化出模型即服務(MaaS)的新模式——知識成為主體間協作生成的流動智慧。近期中國密集發布的開源大模型,其高性能和低成本吸引全球眾多科學家的關注,正驅動多學科交叉的新型科研范式涌現:來自高校和中小型創新主體的人工智能專家,依托其超參數優化引擎突破技術邊界,數學家借助大模型解決組合優化難題,認知科學家運用神經仿生框架構建腦網絡動態模型,多學科交叉的智慧激流共同解碼智能本質與思維本源的科學密碼⑩。我們正在進入一個人工智能重構科研流程的時代,而開源技術使得人工智能已成諸多領域的研究引擎?。
安全與創新的量子糾纏。開源基礎大模型在推動科技創新、促進競爭和權力分配方面具有巨大潛力,在透明度和可定制性上相比閉源大模型具有優勢。而圍繞開源大模型的許多擔憂,源于大模型權重一旦發布,開發者便失去對其下游使用的控制,容易被部分用戶濫用。而閉源大模型則可以限制訪問,上述風險相對可控。因此,如何在推動開源大模型技術創新的同時,對開源大模型技術進行適度監管,成為關鍵挑戰之一。不同的政策可能會對創新生態系統產生不均衡的影響,我們需要平衡開源與閉源大模型的發展,可以通過提高經濟效益、支持關鍵基礎模型發展,以及促進大模型的復用性、魯棒性和可控性,并通過持續廣泛的同行審核以及智能巡檢等手段,提高大模型的可靠性和安全性,從而在促進創新的同時有效管理其潛在的社會風險?。
燎原之勢:中國自主的技術星圖
中國開源大模型技術的發展,是在政策引導與市場機制的雙輪驅動下,探索出“政府搭臺、市場運作、科研攻堅”的中國特色發展路徑,既能保障技術自主可控,又可通過開源社區激活全球創新網絡,構建起有效的技術生態體系,為全球人工智能創新與發展提供中國方案。
中國可綜合運用政策、立法和技術等手段確立數據主權邊界,通過加快算力基礎設施建設降低創新門檻,用產學研協同機制打通技術轉化動脈。在數據確權方面,可通過智能合約、內容指紋或數字水印等方式,實現數據采集時的權屬聲明、數據流轉時的收益分配,以及數據銷毀時的連帶清除等。在算力基礎設施建設方面,可通過“東數西算”工程、智算中心布局及算力調度平臺優化等,建設全國一體化算力網絡;通過發放“算力券”等優惠政策,提供一定額度的免費或者低成本的算力支持,可顯著降低高校、科研院所以及中小型企業獲取高性能計算能力的成本,讓更多創新主體能夠深度參與技術創新。在產學研協同方面,在國家人工智能發展戰略的指導下,構建靈活的政府、企業與用戶多方協同機制,高校的基礎研究成果、科研院所的前沿技術突破與企業的市場化需求形成高效對接,通過建立聯合實驗室、技術轉移中心和產業創新聯盟等載體,快速縮短大模型的科研成果轉化周期,實現基座大模型的公共品屬性,與領域或行業大模型的商業化價值的辯證統一,形成“開放核心+增值服務”的可持續發展模式;通過產業鏈上下游的參數共享、算力眾包等方式,建立新型協同與協作關系,在模型輕量化、推理優化等關鍵技術領域,催生差異化的技術路線,避免同質化內耗。這種協同機制不僅可以加速技術迭代,還能夠涌現出從基礎研究到商業落地的完整創新鏈條。
構建健康的開源大模型生態需要形成“政府—開發者—用戶”多方協同治理體系:政府監管大模型的風險,核心開發者專注基礎架構創新,行業開發者深耕垂直場景應用,終端用戶提供反饋形成閉環。建議重點推進三個方向:防止開源大模型生態壟斷,構建多中心技術體系,避免單一主體掌控核心資源,建立開放標準和反壟斷機制,保障技術共享公平性;建立訓練數據的合規制度與數據要素市場化流通體系,解決網絡爬取數據合法性的問題,構建多級數據交易平臺;創新“中心化監管+去中心化自治”并存機制,以及“監管沙盒+熔斷機制”的敏捷治理模式,基于大模型規模和應用風險實施分級監管,通過工具鏈矩陣降低技術門檻,平衡創新自由度與系統穩定性,在保障創新自由度的同時,形成風險傳導的阻尼系統,有效調和創新活力與秩序穩定間的矛盾?,最終形成政府引導、社區自治、法律保障的多維治理體系。
在開源供應鏈自主可控方面,中國需構建兼顧內外的協同發展體系:對內依托本土開源生態,打造“代碼托管—合規審查—安全驗證”全鏈條治理機制,強化核心技術的自主創新能力;對外深度參與國際標準制定,建立技術斷供預警與應對機制。針對算力瓶頸,重點攻關碎片化訓練、異構計算適配等關鍵技術,構建區塊鏈賦能的聯邦式算力共享平臺,打造“硬基建+軟服務”,以及“綠色算力+高效算法”的新型數字底座,研發低功耗芯片架構和節能訓練技術,實現國產芯片與大模型的深度協同優化。努力實現新一代高性能計算技術突破,建立智能算力網絡,提升資源利用效率。在安全防護方面,需防范數據投毒(即攻擊者在大模型的訓練數據中故意注入惡意樣本,以誘導大模型學習錯誤模式并產生有害輸出的攻擊行為)等新型威脅,通過構建全生命周期溯源體系和形式化驗證工具,形成“預防—檢測—響應”的主動防御閉環,確保開源大模型的自主可控發展。
從芯片禁運下的技術抗爭,到開源社區中的認知重構,從芯片架構的底層適配,到應用生態的枝繁葉茂,全球開發者的智慧在無界協作中結晶成價值網絡。通過開源治理、安全防護和軟硬件協同等方面的持續突破,構建中國特色的技術星圖,以實現從“追隨者”到“人類命運共同體”的跨越。這場開源運動已不僅是單純的技術選擇,也是一場關于創新范式的社會實驗。
(作者為中國科學院自動化研究所多模態人工智能系統全國重點實驗室研究員、博導,中國科學院大學人工智能學院崗位教授、博導)
【注:本文系國家杰出青年科學基金項目(項目編號:72225011)、國家自然科學基金重點項目(項目編號:72434005)以及國家自然科學基金專項項目(項目編號:L242400108)的階段性成果】
【注釋】
①高喬:《中國人工智能創新何以令海外驚嘆(環球熱點)》,《人民日報海外版》,2025年2月15日。
②黃鑫:《開源生態加速培育壯大》,《經濟日報》,2025年1月1日。
③Gibney, E., Not all 'open source' AI models are actually open: here's a ranking. Nature, 2024.
④https://github.com/pangu-tech/pangu-ultra/blob/main/pangu-ultra-report.pdf
⑤Gibney, E., China’s cheap, open AI model DeepSeek thrills scientists. Nature, 2025. 638(8049): p. 13-14.
⑥劉向東:《我國“燈塔工廠”的發展格局與全球價值鏈塑造》,《人民論壇》,2025年第8期,第52-56頁。
⑦康義:《制造業向好發展 夯實實體經濟根基》,《新型工業化》,2025年第1期,第22-29頁。
⑧?Bommasani, R., et al., Considerations for governing open foundation models. Science, 2024. 386(6718): p. 151-153.
⑨Ahmed, N., M. Wahed, and N.C. Thompson, The growing influence of industry in AI research. Science, 2023. 379(6635): p. 884-886.
⑩Gibney, E., Scientists flock to DeepSeek: how they’re using the blockbuster AI model. Nature, 2025.
?Maffulli, S., ‘Open source’AI isn’t truly open—here’s how researchers can reclaim the term. Nature, 2025. 640(8057): p. 9.
?Spirling, A., Why open-source generative AI models are an ethical way forward for science. Nature, 2023. 616(7957): p. 413.
責編/謝帥 美編/楊玲玲
聲明:本文為人民論壇雜志社原創內容,任何單位或個人轉載請回復本微信號獲得授權,轉載時務必標明來源及作者,否則追究法律責任。
