首頁(yè)|必讀|視頻|專(zhuān)訪|運(yùn)營(yíng)|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|低空經(jīng)濟(jì)|智能汽車(chē)|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片|報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁(yè) >> 飛象原創(chuàng) >> 正文

小鵬啟動(dòng)72B參數(shù)自駕基模研發(fā),未來(lái)將蒸餾部署到車(chē)端,成為“AI汽車(chē)”新大腦

2025年4月16日 16:22  CCTIME飛象網(wǎng)  

飛象網(wǎng)訊 4月14 日,小鵬汽車(chē)在香港舉辦 AI 技術(shù)分享會(huì),首次披露正在研發(fā) 720 億參數(shù)的超大規(guī)模自動(dòng)駕駛大模型,即 " 小鵬世界基座模型 "。未來(lái),小鵬將通過(guò)云端蒸餾小模型的方式將基模部署到車(chē)端,給 "AI 汽車(chē) " 配備全新的大腦。這款模型同時(shí)也將賦能小鵬的 AI 機(jī)器人、飛行汽車(chē)等。

小鵬汽車(chē)自動(dòng)駕駛負(fù)責(zé)人李力耘介紹,小鵬基模是一個(gè)以大語(yǔ)言模型為骨干網(wǎng)絡(luò),使用海量?jī)?yōu)質(zhì)駕駛數(shù)據(jù)訓(xùn)練的多模態(tài)大模型,具備視覺(jué)理解能力、鏈?zhǔn)酵评砟芰蛣?dòng)作生成能力。通過(guò)強(qiáng)大的強(qiáng)化學(xué)習(xí)訓(xùn)練,基座模型不斷自我進(jìn)化,將逐步發(fā)展出媲美甚至超越人類(lèi)的自動(dòng)駕駛技術(shù)。

李力耘透露,為了研發(fā)基模,小鵬汽車(chē)早在去年就開(kāi)始布局 AI 基礎(chǔ)設(shè)施,現(xiàn)已建成國(guó)內(nèi)汽車(chē)行業(yè)首個(gè)萬(wàn)卡智算集群,用以支持基座模型的預(yù)訓(xùn)練、后訓(xùn)練、模型蒸餾、車(chē)端模型訓(xùn)練等任務(wù),小鵬汽車(chē)將這套從云到端的生產(chǎn)流程稱(chēng)之為 " 云端模型工廠 "。目前,小鵬 " 云端模型工廠 " 擁有 10 EFLOPS 的算力,集群運(yùn)行效率常年保持在 90% 以上,從云到端的全鏈路迭代周期可達(dá)平均 5 天一次。

小鵬世界基座模型:具備長(zhǎng)思維鏈推理能力,參數(shù)規(guī)模高達(dá)720億

早在 2024 年下半年,小鵬汽車(chē)已開(kāi)始面向 L4 級(jí)別的自動(dòng)駕駛研發(fā)全新的 "AI 大腦 ",即小鵬世界基座模型。

小鵬研發(fā)團(tuán)隊(duì)利用優(yōu)質(zhì)自動(dòng)駕駛訓(xùn)練數(shù)據(jù),先后開(kāi)發(fā)了多個(gè)尺寸的基座模型,目前已經(jīng)著手推進(jìn) 72B(72 Billion,即 720 億)超大規(guī)模參數(shù)世界基座模型的研發(fā),參數(shù)量是主流 VLA 模型的 35 倍左右。

小鵬世界基座模型的一大優(yōu)勢(shì)是具備鏈?zhǔn)酵评砟芰Γ–oT),在充分理解現(xiàn)實(shí)世界的基礎(chǔ)上,能夠像人類(lèi)一樣進(jìn)行復(fù)雜的常識(shí)推理,并將推理結(jié)果轉(zhuǎn)化為行動(dòng),例如輸出方向盤(pán)、剎車(chē)等控制信號(hào),實(shí)現(xiàn)和物理世界的交互。

未來(lái),經(jīng)由基座模型的賦能,智能駕駛系統(tǒng)有望從 " 模仿人類(lèi) " 進(jìn)化到 " 超越人類(lèi) ",最終能夠處理全場(chǎng)景的自動(dòng)駕駛問(wèn)題,包括一些模型從來(lái)沒(méi)在訓(xùn)練數(shù)據(jù)中遇到的問(wèn)題。

從設(shè)計(jì)之初,小鵬汽車(chē)就將基模定位為一個(gè)可以泛化到多種具身終端的基座模型。李力耘表示:" 小鵬世界基座模型是小鵬自動(dòng)駕駛真正走向 L3、L4 的基礎(chǔ),也會(huì)是未來(lái)小鵬所有物理 AI 終端的通用模型。" 后續(xù),小鵬世界基座模型將全面賦能小鵬 AI 體系全圖譜,應(yīng)用到小鵬汽車(chē)的 AI 汽車(chē)、AI 機(jī)器人、飛行汽車(chē)上。

從0打造云端模型工廠,開(kāi)啟AI時(shí)代模型生產(chǎn)新范式

為了開(kāi)發(fā)小鵬世界基座模型,小鵬汽車(chē)打造了一座 " 云端模型工廠 ",工廠 " 車(chē)間 " 涵蓋基座模型預(yù)訓(xùn)練和后訓(xùn)練(強(qiáng)化學(xué)習(xí)訓(xùn)練)、模型蒸餾、車(chē)端模型預(yù)訓(xùn)練到部署上車(chē)的完整生產(chǎn)鏈路。" 云端模型工廠 " 采用強(qiáng)化學(xué)習(xí)、模型蒸餾的技術(shù)路線,能夠高效生產(chǎn) " 小身材、大智商 " 的端側(cè)模型,甚至為不同需求的汽車(chē)定制不同的 " 大腦 ",讓 " 千人千面 " 的模型研發(fā)成為可能。

小鵬汽車(chē)從 2024 年開(kāi)始搭建 AI 基礎(chǔ)設(shè)施(AI Infra),當(dāng)前已建立起萬(wàn)卡規(guī)模的智能算力集群,是目前國(guó)內(nèi)汽車(chē)行業(yè)最大的自動(dòng)駕駛算力集群。小鵬汽車(chē)的算力儲(chǔ)備達(dá)到 10EFLOPS,集群利用率常年高達(dá) 90% 以上,高峰時(shí)期的運(yùn)行效率甚至達(dá)到 98%。

小鵬世界基座模型負(fù)責(zé)人劉博士介紹,多模態(tài)模型訓(xùn)練的主要瓶頸不僅是 GPU,也需要解決數(shù)據(jù)訪問(wèn)的效率問(wèn)題。小鵬汽車(chē)自主開(kāi)發(fā)了底層的數(shù)據(jù)基礎(chǔ)設(shè)施(Data Infra),使數(shù)據(jù)上傳規(guī)模提升 22 倍、訓(xùn)練中的數(shù)據(jù)帶寬提升 15 倍;通過(guò)聯(lián)合優(yōu)化 GPU / CPU 以及網(wǎng)絡(luò) I/O,最終使模型訓(xùn)練速度提升了 5 倍。目前,小鵬汽車(chē)用于訓(xùn)練基座模型的視頻數(shù)據(jù)量高達(dá) 2000 萬(wàn) clips,這一數(shù)字今年將增加到 2 億 clips。

依托強(qiáng)大的 AI 基礎(chǔ)設(shè)施和數(shù)據(jù)基礎(chǔ)設(shè)施,小鵬開(kāi)啟了全新的基座模型研發(fā)范式,從云端模型預(yù)訓(xùn)練到車(chē)端模型部署,整個(gè) " 云端模型工廠 " 的迭代周期達(dá)到平均 5 天一次。

時(shí)隔一年,小鵬汽車(chē)在物理世界AI領(lǐng)域取得三大階段性成果

2024 年是汽車(chē)行業(yè)的 " 端到端 " 之年,在率先量產(chǎn)端到端大模型一年之時(shí),小鵬汽車(chē)又在物理世界大模型研發(fā)上再進(jìn)一步。小鵬汽車(chē)在分享會(huì)上披露了基模研發(fā)的三個(gè)階段性成果:

階段性成果 1:驗(yàn)證規(guī)模法則在自動(dòng)駕駛領(lǐng)域持續(xù)生效;

階段性成果 2:在后裝算力的車(chē)端成功實(shí)現(xiàn)基模控車(chē);

階段性成果 3:?jiǎn)?dòng) 72B 參數(shù)基模訓(xùn)練,搭建針對(duì)強(qiáng)化學(xué)習(xí)的模型訓(xùn)練框架。

規(guī)模法則(Scaling Law)揭示了大模型的性能如何隨著模型的計(jì)算量、訓(xùn)練數(shù)據(jù)量和參數(shù)量的提升而提升,被視為 AI 領(lǐng)域的 " 摩爾定律 "。規(guī)模法則在大語(yǔ)言模型(LLM,Large Language Model)領(lǐng)域已被充分驗(yàn)證,但自動(dòng)駕駛基座模型復(fù)雜得多,它的訓(xùn)練數(shù)據(jù)遠(yuǎn)不止單模態(tài)的文本數(shù)據(jù),還包括攝像頭信息、導(dǎo)航信息等關(guān)于物理世界的多模態(tài)數(shù)據(jù),本質(zhì)上,它要求模型對(duì)物理世界形成認(rèn)知和理解。利用駕駛數(shù)據(jù)訓(xùn)練基模,尤其是參數(shù)規(guī)模逐步擴(kuò)大到百億級(jí)別之后,規(guī)模法則是否還持續(xù)生效?此前行業(yè)內(nèi)不曾有過(guò)充分的驗(yàn)證。

小鵬團(tuán)隊(duì)首次驗(yàn)證了規(guī)模法則在自動(dòng)駕駛領(lǐng)域持續(xù)生效,劉博士表示:" 過(guò)去一年,我們做了大量實(shí)驗(yàn),在 10 億、30 億、70 億、720 億參數(shù)的模型上都看到了明顯的規(guī)模法則效應(yīng):參數(shù)規(guī)模越大,模型的能力越強(qiáng)。同樣的模型大小,訓(xùn)練數(shù)據(jù)量越大,模型的能力也會(huì)越強(qiáng)。"

不久前,小鵬汽車(chē)將理論變?yōu)楝F(xiàn)實(shí),在后裝算力的車(chē)端上用小尺寸基模實(shí)現(xiàn)了控車(chē)。盡管只是非常早期的實(shí)車(chē)測(cè)試,全新基模已經(jīng)展現(xiàn)出令人驚喜的基礎(chǔ)駕車(chē)技能。

小鵬汽車(chē)去年就已開(kāi)始研發(fā)強(qiáng)化學(xué)習(xí)技術(shù),用以提升基座模型的性能天花板。劉博士表示,強(qiáng)化學(xué)習(xí)能夠幫助模型自我進(jìn)化,學(xué)會(huì)處理訓(xùn)練數(shù)據(jù)中沒(méi)有的長(zhǎng)尾問(wèn)題,做到極致安全的自動(dòng)駕駛。只有足夠強(qiáng)大的基座模型,才能被強(qiáng)化學(xué)習(xí)不斷激發(fā)出能力上限。這也是小鵬汽車(chē)選擇云端蒸餾路線的原因之一:在云端不計(jì)成本地訓(xùn)練出足夠聰明且泛化能力強(qiáng)的模型,將其蒸餾到適配車(chē)端算力的小尺寸模型上,最終可讓車(chē)端模型的性能超越車(chē)端算力 " 一畝三分田 " 的限制。

值得一提的是,強(qiáng)化學(xué)習(xí)、云端蒸餾等技術(shù)方案,在今年爆火的 DeepSeek 論文中都得到了驗(yàn)證。

基模研發(fā)是小鵬汽車(chē) "AI 化 " 轉(zhuǎn)型的重要一步,不過(guò),即便來(lái)到 " 大模型時(shí)代 ",過(guò)去 " 規(guī)則時(shí)代 " 的領(lǐng)先經(jīng)驗(yàn)仍在發(fā)揮作用。在開(kāi)發(fā)強(qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì)模型(Reward Model)時(shí),研發(fā)團(tuán)隊(duì)基于規(guī)則經(jīng)驗(yàn)設(shè)計(jì)了獎(jiǎng)勵(lì)函數(shù),將規(guī)則時(shí)代的沉淀轉(zhuǎn)化為了訓(xùn)練基座模型的生產(chǎn)力。

同時(shí),小鵬汽車(chē)已經(jīng)著手開(kāi)發(fā)世界模型 ( World Model),作為 " 云端模型工廠 " 的重要一環(huán),支持基座模型的性能優(yōu)化。劉博士介紹,小鵬的世界模型是一種實(shí)時(shí)建模和反饋系統(tǒng),能夠基于動(dòng)作信號(hào)模擬出真實(shí)環(huán)境狀態(tài),渲染場(chǎng)景,并生成場(chǎng)景內(nèi)其他智能體(也即交通參與者)的響應(yīng),從而構(gòu)建一個(gè)閉環(huán)的反饋網(wǎng)絡(luò),幫助基座模型不斷進(jìn)化,逐漸突破過(guò)去 " 模仿學(xué)習(xí) " 的天花板。

編 輯:高靖宇
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來(lái)源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來(lái)源。
2.凡注明“來(lái)源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
推薦新聞              
 
人物
高通徐晧:利用6G和AI重塑移動(dòng)連接的未來(lái)
精彩視頻
全球6G大會(huì)|高通展示三大6G原型系統(tǒng) 更好服務(wù)智能時(shí)代
6G技術(shù)新突破!6G全息超表面寬帶移動(dòng)通信系統(tǒng)樣機(jī)發(fā)布
全球6G大會(huì) | 中國(guó)通信標(biāo)準(zhǔn)化協(xié)會(huì)聞庫(kù):5G垂直應(yīng)用痛點(diǎn)值得挖掘,設(shè)計(jì)6G時(shí)要加以考慮
全球6G大會(huì) | 高通徐晧:“人工智能+6G”帶來(lái)更多應(yīng)用場(chǎng)景 中國(guó)6G占據(jù)優(yōu)勢(shì)
精彩專(zhuān)題
通信產(chǎn)業(yè)2024年業(yè)績(jī)盤(pán)點(diǎn)
3·15權(quán)益日 | 共筑滿(mǎn)意消費(fèi) 守護(hù)信息通信安全防線
聚焦2025全國(guó)兩會(huì)
2025年世界移動(dòng)通信大會(huì)
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱(chēng): 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書(shū)面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像