必讀視頻專題飛象趣談光通信人工智能低空經(jīng)濟5G手機智能汽車智慧城市會展特約記者

對話Arm鄒挺:2026年物理AI加速 芯片將有這些新進展

2026年1月28日 08:0321世紀(jì)經(jīng)濟報道

在開源大模型持續(xù)豐富能力矩陣的行業(yè)背景下,AI產(chǎn)業(yè)鏈從底層基礎(chǔ)設(shè)施到上層應(yīng)用都正加速演進。

2026年被業(yè)界定義為AI應(yīng)用大年,其中“物理AI”被多家頭部廠商尤其看中,而底層基礎(chǔ)設(shè)施在應(yīng)用的差異化需求催動下,也面臨新的發(fā)展走向。

近日,Arm發(fā)布多項技術(shù)預(yù)測,指出2026年將邁入智能計算新紀(jì)元,屆時,計算將具備更高的模塊化特性和能效表現(xiàn),實現(xiàn)云端、物理終端及邊緣人工智能 (AI) 環(huán)境的無縫互聯(lián)。其中還提到,下一個價值數(shù)萬億美元的AI平臺將屬于物理智能領(lǐng)域,智能能力將被植入新一代自主設(shè)備與機器人。

Arm中國區(qū)業(yè)務(wù)全球副總裁鄒挺接受21世紀(jì)經(jīng)濟報道記者采訪時指出,對于“物理AI”的發(fā)展,“業(yè)界完全有能力打造出單臺高性能的機器人或自動駕駛系統(tǒng)。但真正的挑戰(zhàn)在于,如何實現(xiàn)數(shù)萬甚至數(shù)百萬臺同類設(shè)備的可靠部署。”

其背后直指原生AI硬件發(fā)展過程中面臨的軟硬件碎片化問題,由此,對于AI產(chǎn)業(yè)鏈來說,構(gòu)建完善的軟件生態(tài)能力,同時部署充分靈活的異構(gòu)計算硬件基礎(chǔ)設(shè)施,成為布局關(guān)鍵所在。

物理AI疾馳

談及今年備受關(guān)注的應(yīng)用場景,“物理AI”必占其一。在前不久舉行的CES 2026上,多家芯片頭部廠商高管都提到了今年對該領(lǐng)域的期待。

目前業(yè)界公認(rèn)的“物理AI”場景主要包括具身智能和自動駕駛,在方向確定的背景下,技術(shù)路線和商業(yè)化進展還存在一定分野,距離大規(guī)模落地尚需一定時間。

根據(jù)Arm對2026年的趨勢分析,在多模態(tài)模型、更高效訓(xùn)練與推理管線的技術(shù)突破推動下,物理AI系統(tǒng)將實現(xiàn)規(guī);渴,催生全新品類的自主設(shè)備。這將幫助醫(yī)療健康、制造、交通運輸、采礦等多個行業(yè)重塑。

此外,面向汽車與機器人自動化場景的通用計算平臺將逐步涌現(xiàn)。車載芯片有望通過技術(shù)復(fù)用與適配,應(yīng)用于人形機器人或工業(yè)機器人領(lǐng)域。這將進一步提升規(guī)模經(jīng)濟效益,加速物理AI系統(tǒng)的研發(fā)與落地進程。

不過從技術(shù)路線看,物理AI目前仍面臨世界模型和VLA(視覺-語言-動作)模型兩條技術(shù)持續(xù)演進的命題。

鄒挺對記者分析,二者均為物理AI落地的核心技術(shù)路線,適配自動駕駛、工業(yè)自動化、精密醫(yī)療等多元應(yīng)用場景。其中VLA模型聚焦解決“理解與執(zhí)行”的核心需求,世界模型則專注攻克“預(yù)測與因果”的關(guān)鍵難題,均對算力提出高要求。

“這兩條路線各有側(cè)重、優(yōu)勢互補,業(yè)界也在探索兩種路線的融合:將VLA模型引入世界模型能力以提升環(huán)境預(yù)測精度,世界模型則融入語言交互接口以增強決策可解釋性!彼m(xù)稱。

鄒挺告訴記者,為應(yīng)對物理AI的發(fā)展需求,在內(nèi)部組織架構(gòu)方面,2025年11月,Arm完成旗下汽車、機器人及各類自主運行設(shè)備相關(guān)業(yè)務(wù)的整合,成立“物理AI”事業(yè)部。

“這些領(lǐng)域正朝同一個核心目標(biāo)加速融合。即打造一套在算力、安全性與可靠性毫不妥協(xié)的前提下,實現(xiàn)‘感知-決策-執(zhí)行’實時閉環(huán)的AI方案!彼m(xù)稱,隨著AI技術(shù)在各類物理系統(tǒng)中規(guī);渴穑苄П憩F(xiàn)、完善且成熟的軟件生態(tài)已成為決勝關(guān)鍵。

“物理AI需要在嚴(yán)苛的功耗與熱管理限制下持續(xù)運轉(zhuǎn),并且往往部署在安全關(guān)鍵型應(yīng)用場景中。而規(guī);年P(guān)鍵,絕非單純提升性能,更在于將統(tǒng)一的架構(gòu)理念貫穿于云端訓(xùn)練、邊緣推理及物理系統(tǒng)實時執(zhí)行的全流程。這就需要一套能夠支撐‘從傳感器端到中央決策端’分布式智能的平臺化方案!编u挺指出。

對此,Arm推出了一套分層式解決方案。硬件層面,Arm有汽車增強AE IP及Zena CSS產(chǎn)品組合;軟件層面,Arm提供KleidiAI庫和優(yōu)化工具,幫助實現(xiàn)模型量化和調(diào)優(yōu);系統(tǒng)層面則推動云-邊-端協(xié)同,將高功耗任務(wù)卸載到邊緣或云端,同時支持低功耗通信協(xié)議,形成“架構(gòu)+硬件+軟件+生態(tài)”的整體能效優(yōu)化路徑。

“我們深知,業(yè)界完全有能力打造出單臺高性能的機器人或自動駕駛系統(tǒng)。但真正的挑戰(zhàn)在于,如何實現(xiàn)數(shù)萬甚至數(shù)百萬臺同類設(shè)備的可靠部署。過去,由于軟硬件技術(shù)棧的碎片化問題,行業(yè)發(fā)展一度陷入停滯。Arm希望通過計算平臺、配套工具鏈及龐大的生態(tài)體系,通過‘一次開發(fā)、多類物理系統(tǒng)部署’的模式破解這一痛點!编u挺指出。

AI手機再升級

作為當(dāng)前智能手機的核心供應(yīng)商,Arm也是本輪AI手機熱潮的核心“推手”之一。

在2025年,AI手機一個核心特征是,僅在端側(cè)、不聯(lián)網(wǎng)條件下,高端手機已經(jīng)具備運行30億參數(shù)規(guī)模大模型能力。這背后不僅有賴于開源模型在小型化之后的能力躍升,也離不開芯片硬件層面的支持。

Arm發(fā)布的技術(shù)趨勢中談道,得益于模型壓縮、蒸餾及架構(gòu)設(shè)計的技術(shù)突破,當(dāng)下復(fù)雜的推理模型正在實現(xiàn)數(shù)量級的規(guī)?s減,轉(zhuǎn)化為小語言模型 (SLM),同時不會犧牲計算能力。這些輕量化模型不僅更易于在邊緣側(cè)部署、微調(diào)成本更低,還能高效適配功率受限的應(yīng)用環(huán)境。同時,模型蒸餾、量化等超高能效的AI模型訓(xùn)練技術(shù)的規(guī);瘧(yīng)用,為這一變革提供了堅實支撐,正逐步成為行業(yè)標(biāo)準(zhǔn)。訓(xùn)練能效有望成為衡量AI模型的核心指標(biāo)。

據(jù)悉,搭載Arm Mali GPU中專用神經(jīng)加速器的智能手機將在2026年推出,這項移動GPU專用的神經(jīng)技術(shù)標(biāo)志著移動端側(cè)圖形和AI能力的重大飛躍,不僅支持更高幀率的4K游戲、實時視覺計算及更智能的端側(cè)AI助手等功能,且所有功能均無需依賴云端連接即可運行。

在技術(shù)層面,鄒挺對21世紀(jì)經(jīng)濟報道記者指出,小語言模型(SLM)對手機的性能、能效、安全性及軟件適配能力提出了更高要求。

這既需要CPU、GPU、NPU等異構(gòu)算力芯片的無縫配合,實現(xiàn)動態(tài)負(fù)載均衡;也需要突破“性能-功耗-面積”三角,適配手機低功耗約束;同時,由于涉及越來越多的個人數(shù)據(jù),需要更加強調(diào)安全性;軟件生態(tài)適配也不能忽視,需兼容多框架與模型壓縮技術(shù),降低部署門檻,SLM快速迭代要求產(chǎn)品支持PyTorch、ExecuTorch等框架,同時適配4-bit量化等壓縮方案。

因此,在幫助手機承接大算力、多模態(tài)能力方面,Arm通過構(gòu)建“Lumex CSS計算平臺+ KleidiAI軟件庫+開放生態(tài)”作為應(yīng)對。

據(jù)介紹,借助Armv9.3 CPU集群,Arm Lumex實現(xiàn)了兩位數(shù)的性能提升和硬件級安全性;而Lumex搭載的第二代可伸縮矩陣擴展 (SME2) 技術(shù),有更強的AI性能、更低的內(nèi)存占用,尤其對于音頻生成、攝像頭推理、計算機視覺或聊天交互等對實時性要求嚴(yán)苛的應(yīng)用。

KleidiAI目前已集成到多個主流AI框架,包括 Llama.cpp、ExecuTorch、MNN和LiteRT。以中國市場為例,Arm架構(gòu)CPU在阿里通義千問、百度文心大模型及騰訊混元大模型開源首日便率先完成適配,且三大模型均深度集成Arm KleidiAI。

XR眼鏡加速落地

除了AI手機,近些年被認(rèn)同作為手機之外下一個端側(cè)入口的XR眼鏡也在如火如荼發(fā)展。雖然2025年中國市場經(jīng)歷了AI眼鏡的“百鏡大戰(zhàn)”,但行業(yè)普遍認(rèn)為,AR才是未來發(fā)展遠(yuǎn)景,這意味著行業(yè)仍在快速演化。

展望2026年,Arm方面指出,頭顯和智能眼鏡等增強現(xiàn)實 (AR) 與虛擬現(xiàn)實 (VR) 可穿戴設(shè)備,將在物流、運維、醫(yī)療和零售等更廣泛的工作場景中落地應(yīng)用。這一趨勢主要得益于輕量化設(shè)計和電池續(xù)航能力的進步,讓解放雙手的計算模式在更多場景中具備實用性。

隨著外形尺寸不斷縮小、AI能力不斷增強、連接體驗愈發(fā)流暢,AR與VR可穿戴計算設(shè)備將成為推動職場向更智能、更具輔助價值的未來演進的關(guān)鍵一步。

不過,鄒挺對記者指出,AR/VR這類可穿戴設(shè)備在企業(yè)應(yīng)用中的日益普及,要求設(shè)備在設(shè)計時,需持續(xù)滿足更嚴(yán)苛的形態(tài)規(guī)格與能耗限制要求!安煌男袠I(yè)場景對實時渲染、數(shù)據(jù)處理和交互響應(yīng)速度的要求差異明顯。例如,遠(yuǎn)程醫(yī)療手術(shù)對時延極為敏感,而工業(yè)培訓(xùn)可能更關(guān)注渲染質(zhì)量和設(shè)備續(xù)航!彼f。

XR可穿戴設(shè)備在實際落地過程中,仍面臨多個方面挑戰(zhàn)。鄒挺分析道,其一是要平衡算力與能效。AR/VR穿戴設(shè)備存在電池容量有限、機身輕量化的設(shè)計約束,因此,在提供高性能計算以支撐復(fù)雜功能的同時保障長續(xù)航,是此類設(shè)備在企業(yè)級場景落地應(yīng)用的關(guān)鍵前提。

其二是多種實時交互(如視頻、語音、手勢識別)對系統(tǒng)時延提出極高要求,尤其在醫(yī)療、工業(yè)等關(guān)鍵場景。

其三,由于設(shè)備需支持從輕量級到高性能的多樣化應(yīng)用,XR設(shè)備還要有多功能異構(gòu)場景適配能力。

對此,Arm認(rèn)為需要從架構(gòu)、計算能力、軟硬協(xié)同等方面應(yīng)對。Arm C1-Nano非常適合XR(包括VR、AR)、入門級或中端設(shè)備,甚至可用于數(shù)字電視等場景,同時,Arm不斷優(yōu)化CPU、GPU、NPU等異構(gòu)計算單元,適配不同設(shè)備和應(yīng)用場景。

此外,鄒挺指出,高算力、低延時任務(wù)優(yōu)先采用終端側(cè)與邊緣側(cè)處理,同時按需調(diào)用云端資源拓展算力上限,既能減輕設(shè)備運行負(fù)荷,又可保障關(guān)鍵場景下的實時性能。 同時也在推動生態(tài)系統(tǒng)合作,優(yōu)化操作系統(tǒng)、中間件和應(yīng)用算法,提升整體系統(tǒng)效率,降低時延。

AI計算新走向

作為AI產(chǎn)業(yè)發(fā)展的核心基座,AI芯片本身面對的市場需求也在持續(xù)演進。除了通用計算的核心芯片GPU和CPU之外,2025年以來,ASIC、NPU等不同類型芯片也備受關(guān)注。

鄒挺對記者分析,不同類型的AI加速器各具技術(shù)優(yōu)勢,需結(jié)合具體應(yīng)用場景與工作負(fù)載特性進行選擇。其中,NPU作為神經(jīng)網(wǎng)絡(luò)推理專用處理器,核心優(yōu)勢為AI架構(gòu)適配、高能效比、輕量化部署、本地閉環(huán)處理及多處理器協(xié)同,適用于可穿戴設(shè)備、智能揚聲器、軟件定義智能攝像頭以及智能家居設(shè)備等場景,滿足低功耗、實時響應(yīng)、數(shù)據(jù)隱私保護核心需求。

據(jù)悉,在推動NPU能力提升方面,Arm核心聚焦兩大方向:異構(gòu)架構(gòu)協(xié)同與全棧軟件生態(tài)支撐。

在堅持異構(gòu)架構(gòu)協(xié)同方面,Arm NPU與包括CPU、GPU在內(nèi)的多元化處理器高效協(xié)同,針對不同場景提供更優(yōu)的算力支撐。例如,Arm Cortex-A處理器作為一款面向多種應(yīng)用的可編程處理器,集成了Neon/SVE2向量引擎,旨在加速神經(jīng)網(wǎng)絡(luò)和各種向量化代碼,并原生支持多種數(shù)據(jù)類型。而對于AI工作負(fù)載明確的邊緣場景,則可通過Arm Ethos-U85這類專用NPU承載神經(jīng)網(wǎng)絡(luò)處理任務(wù),從而釋放中央處理器(CPU)資源。

生態(tài)支撐層面,Arm為Cortex-A、Cortex-M、Ethos-U等全系列AI硬件方案提供全面的開源運行時支持,并通過Arm KleidiAI為PyTorch、ExecuTorch、Llama.cpp、TensorFlow、LiteRT等主流ML框架提供硬件加速適配。

從整體AI芯片趨勢來說,Arm方面指出,特定領(lǐng)域加速技術(shù)的興起,正在重新定義芯片性能,但這一變革并非通過簡單區(qū)分通用計算與加速器來實現(xiàn)。相反,行業(yè)正朝著系統(tǒng)級協(xié)同設(shè)計的定制化芯片方向演進,這類芯片將從系統(tǒng)層面與軟件棧協(xié)同設(shè)計,并針對特定AI框架、數(shù)據(jù)類型及工作負(fù)載完成深度優(yōu)化。

其中,亞馬遜云科技 (Graviton)、Google Cloud (Axion) 和Microsoft Azure (Cobalt) 等頭部云服務(wù)提供商正在引領(lǐng)這一轉(zhuǎn)變,展示了緊密集成的平臺,即從底層開始將專用CPU、加速器、內(nèi)存和互連共同設(shè)計在一起,是實現(xiàn)可擴展、高效且開發(fā)者可訪問的AI的核心。這一趨勢將推動下一代基礎(chǔ)設(shè)施——“融合型AI數(shù)據(jù)中心”加速落地,這類數(shù)據(jù)中心可最大化單位面積內(nèi)的AI算力,從而降低AI運行所需的能耗總量及相關(guān)成本。

2026年,原生AI應(yīng)用與AI芯片的協(xié)同進化,正指向一個更深層次融合的智能世界。AI不再僅是云端的數(shù)據(jù)處理工具,而是嵌入設(shè)備、融入場景、貫穿系統(tǒng)的“自主神經(jīng)”。一個由物理AI、邊緣推理與云端協(xié)同共同編織的智能新紀(jì)元,正在芯片與算力的基石上加速展開。

編 輯:章芳
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
推薦閱讀

精彩視頻

精彩專題

關(guān)于我們廣告報價聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2025 By CCTIME.COM

京ICP備08004280號-1 電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號

公司名稱: 北京飛象互動文化傳媒有限公司

未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像