3月6日凌晨,阿里云發(fā)布并開(kāi)源全新的推理模型通義千問(wèn)QwQ-32B。官方稱,這個(gè)新模型僅僅擁有320億參數(shù),但在性能上比肩6710億參數(shù)的滿血版DeepSeek R1。
根據(jù)阿里云官方數(shù)據(jù),QwQ-32B在編程競(jìng)賽(LiveCodeBench)和美國(guó)數(shù)學(xué)競(jìng)賽(AIME24)兩項(xiàng)略遜于滿血版的DeepSeek-R1,但在其他三項(xiàng)測(cè)試中則全面超越了后者。此外,QwQ-32B的表現(xiàn)也遠(yuǎn)超OpenAI-o1-mini。以下結(jié)果展示了QwQ-32B與其他領(lǐng)先模型的性能對(duì)比,包括DeepSeek-R1-Distilled-Qwen-32B、DeepSeek-R1-Distilled-Llama-70B、o1-mini以及DeepSeek-R1-671B。

阿里云團(tuán)隊(duì)基于Qwen2.5-32B模型探索了擴(kuò)展強(qiáng)化學(xué)習(xí)(RL)的技術(shù)方案,并發(fā)現(xiàn)這種方法顯著提升了模型在數(shù)學(xué)與編程任務(wù)中的表現(xiàn)。通過(guò)持續(xù)擴(kuò)展強(qiáng)化學(xué)習(xí)訓(xùn)練規(guī)模,中型模型也能實(shí)現(xiàn)與巨型混合專家模型(MoE)相匹敵的性能水平。
QwQ-32B的性能優(yōu)勢(shì)
QwQ-32B在推理性能上表現(xiàn)出色,僅用320億參數(shù)量就達(dá)到了與6710億參數(shù)的DeepSeek R1相當(dāng)?shù)男阅芩剑彝评沓杀緝H為后者的1/10。這一突破性進(jìn)展使得QwQ-32B能夠在資源有限的環(huán)境中高效運(yùn)行,極大地拓展了其應(yīng)用場(chǎng)景。
AIStack智算中心支持QwQ-32B部署
AIStack智算中心(后文稱為AIStackDC)現(xiàn)已全面支持QwQ-32B的部署。AIStackDC是一個(gè)高效、靈活的算力資源租賃解決方案平臺(tái),提供基于“容器實(shí)例”的靈活算力租用服務(wù),滿足個(gè)人用戶以及企業(yè)、院校、研究機(jī)構(gòu)等各類組織對(duì)高性能計(jì)算資源的需求。
關(guān)于QwQ-32B部署主線流程解讀
1、注冊(cè)登錄AIStack智算中心
首先,我們通過(guò)瀏覽器訪問(wèn)AIStackDC平臺(tái):
https://aistackdc.com
輸入賬號(hào)和密碼登錄平臺(tái)。
注冊(cè)時(shí)使用邀請(qǐng)碼 77414E,可獲得額外福利優(yōu)惠券。

敲黑板看重點(diǎn):在AIStackDC上的一塊4090GPU就可以支持部署QwQ-32B(新人注冊(cè)1折起,接近零成本薅羊毛。
2、創(chuàng)建實(shí)例
我們需要?jiǎng)?chuàng)建一個(gè)實(shí)例,實(shí)例是部署QwQ-32B模型的環(huán)境

3、進(jìn)入實(shí)例

![]()
4、安裝部署...
部署流程細(xì)節(jié)不在此處一一展開(kāi),喂飯級(jí)別詳細(xì)教程請(qǐng)點(diǎn)擊
https://aistackdc.com/phone-register
跳轉(zhuǎn)至AIStackDC官網(wǎng)登錄后到幫助文檔板塊查看
5、訪問(wèn)細(xì)節(jié)...
通過(guò)open-webui界面實(shí)現(xiàn)本地訪問(wèn):

2025 已經(jīng)全面進(jìn)入大模型時(shí)代,AIStackDC為高校師生、個(gè)人開(kāi)發(fā)者和中小型企業(yè)提供靈活彈性的算力租賃服務(wù),依托企業(yè)級(jí)服務(wù)與支持,幫助用戶解決算力資源使用難,技術(shù)門檻高的問(wèn)題,讓智能算力如同水電般觸手可及。