必讀視頻專題飛象趣談光通信人工智能低空經(jīng)濟5G手機智能汽車智慧城市會展特約記者

AI競賽轉(zhuǎn)向推理,如何影響國際科技競爭格局?

2026年1月7日 07:1321世紀(jì)經(jīng)濟報

周城雄(中國科學(xué)院科技戰(zhàn)略咨詢研究院研究員、數(shù)智創(chuàng)新與治理研究中心副主任)

2026年1月5日,美國拉斯維加斯CES展會上,英偉達(dá)CEO黃仁勛出人意料地提前發(fā)布了下一代AI芯片平臺“Rubin”,打破其一貫在3月GTC大會集中發(fā)布新品的傳統(tǒng)。這一舉動釋放出一個關(guān)鍵信號:全球AI競賽正從“訓(xùn)練主導(dǎo)”全面轉(zhuǎn)向“推理驅(qū)動”,這不僅是技術(shù)路線的演進(jìn),更是整個AI產(chǎn)業(yè)生態(tài)、基礎(chǔ)設(shè)施布局乃至國家間科技競爭格局的重大轉(zhuǎn)折點。

過去數(shù)年,大模型訓(xùn)練是AI發(fā)展的核心焦點。以GPT、Llama、Claude等為代表的大語言模型(LLM)不斷刷新參數(shù)規(guī)模,對算力的需求呈指數(shù)級增長,催生了以英偉達(dá)H100、Blackwell為代表的高性能GPU集群建設(shè)熱潮。然而,訓(xùn)練只是AI生命周期的一環(huán)。真正決定AI能否落地、能否創(chuàng)造經(jīng)濟價值的關(guān)鍵,在于推理——即模型在實際應(yīng)用場景中對用戶輸入進(jìn)行實時響應(yīng)的能力。

推理場景具有高頻、低延遲、高并發(fā)、成本敏感等特點。例如,一個智能客服系統(tǒng)每天可能處理數(shù)百萬次用戶查詢,每一次都需要在毫秒級內(nèi)完成推理;自動駕駛車輛則需在復(fù)雜環(huán)境中持續(xù)進(jìn)行多模態(tài)推理以保障安全。這些需求對硬件效率、能耗比、系統(tǒng)協(xié)同性提出了遠(yuǎn)高于訓(xùn)練階段的要求。

英偉達(dá)此次發(fā)布的Rubin平臺,正是為推理時代量身打造。據(jù)官方披露,Rubin在推理token成本上最高可降低10倍,同時通過集成CPU、GPU、DPU、SuperNIC、交換芯片等六顆芯片,構(gòu)建了“極端協(xié)同”的全棧系統(tǒng)。尤為關(guān)鍵的是,Rubin同步推出了專為推理設(shè)計的“上下文存儲平臺”,用于高效管理KV Cache(鍵值緩存),避免重復(fù)計算,顯著提升推理效率。這表明,AI基礎(chǔ)設(shè)施的競爭已從單一芯片性能,升級為系統(tǒng)級工程能力的比拼。

Rubin平臺等產(chǎn)品的亮相背后,是全球AI發(fā)展的“馬太效應(yīng)”正在顯現(xiàn)。一方面,擁有強大算力和先進(jìn)推理系統(tǒng)的國家與企業(yè),將更快實現(xiàn)AI商業(yè)化落地,形成數(shù)據(jù)—模型—應(yīng)用—收入的正向循環(huán);另一方面,缺乏底層基礎(chǔ)設(shè)施能力的參與者,將越來越依賴外部平臺,陷入“應(yīng)用繁榮但根基脆弱”的困境。

面對全球AI競賽向推理階段的加速演進(jìn),對中國AI產(chǎn)業(yè)既是挑戰(zhàn)也是機遇。盡管近年來中國在大模型研發(fā)上取得顯著進(jìn)展,涌現(xiàn)出通義、文心、混元等優(yōu)秀模型,但在底層硬件和系統(tǒng)級優(yōu)化方面仍存在一些短板。目前國產(chǎn)GPU如昇騰、寒武紀(jì)等取得一定突破,但在軟件生態(tài)、系統(tǒng)協(xié)同、能效比等方面仍需進(jìn)一步提升。

更重要的是,中國AI產(chǎn)業(yè)需要加快形成“芯片+網(wǎng)絡(luò)+存儲+安全+開發(fā)框架”的全棧推理解決方案。當(dāng)前國內(nèi)AI基礎(chǔ)設(shè)施在對推理場景的深度優(yōu)化方面,還有很大的發(fā)展?jié)摿。例如,KV Cache管理、動態(tài)批處理、模型量化壓縮等關(guān)鍵技術(shù)尚未在主流國產(chǎn)平臺上實現(xiàn)高效集成,若能實現(xiàn),將有效降低推理成本、推動AI應(yīng)用的規(guī);渴稹

為此,中國應(yīng)從三個層面加速準(zhǔn)備。首先,強化全棧式AI基礎(chǔ)設(shè)施研發(fā)。不能僅聚焦于GPU性能追趕,而應(yīng)考慮秉持“協(xié)同設(shè)計”理念,推動國產(chǎn)CPU、DPU、高速互連、AI原生存儲等組件的聯(lián)合創(chuàng)新。鼓勵芯片企業(yè)與阿里云、騰訊云、百度智能云等云廠商深度合作,構(gòu)建自主可控的推理系統(tǒng)棧。

其次,大力發(fā)展推理優(yōu)化技術(shù)與開源生態(tài)。應(yīng)支持高校與企業(yè)攻關(guān)低比特量化、稀疏化推理、動態(tài)批處理、緩存復(fù)用等核心技術(shù)。同時,需推動建立中文AI推理基準(zhǔn)測試體系,引導(dǎo)開發(fā)者關(guān)注推理效率而非僅參數(shù)規(guī)模;鼓勵開源社區(qū)圍繞國產(chǎn)硬件適配推理框架,降低遷移門檻。

最后,搶占物理AI與邊緣推理新賽道。在機器人、自動駕駛、工業(yè)智能等新興領(lǐng)域,中國擁有豐富的應(yīng)用場景和數(shù)據(jù)資源。應(yīng)加快部署面向邊緣端的輕量化推理芯片與開發(fā)平臺,支持具身智能、車路協(xié)同等創(chuàng)新應(yīng)用。通過“場景驅(qū)動+技術(shù)反哺”的模式,倒逼底層硬件與系統(tǒng)軟件的協(xié)同進(jìn)化。

總之,此次CES上,Rubin平臺等AI新產(chǎn)品的發(fā)布,不僅是技術(shù)迭代的里程碑,更是AI產(chǎn)業(yè)范式轉(zhuǎn)移的宣言書。當(dāng)AI從“能回答問題”邁向“能理解世界、規(guī)劃行動、完成任務(wù)”的智能體階段,推理能力將成為衡量國家AI競爭力的關(guān)鍵指標(biāo)。對中國而言,這既是挑戰(zhàn),也是彎道超車的機遇。產(chǎn)業(yè)界需摒棄“唯訓(xùn)練論”的慣性思維,以系統(tǒng)工程視角重構(gòu)AI基礎(chǔ)設(shè)施,才能更好地在推理時代贏得主動權(quán)。

編 輯:章芳
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
推薦閱讀

精彩視頻

精彩專題

關(guān)于我們廣告報價聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2025 By CCTIME.COM

京ICP備08004280號-1 電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號

公司名稱: 北京飛象互動文化傳媒有限公司

未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像