必讀視頻專題飛象趣談光通信人工智能低空經濟5G手機智能汽車智慧城市會展特約記者

阿里發(fā)布千問最強推理模型Qwen3-Max-Thinking,性能媲美GPT-5.2、Gemini 3 Pro

2026年1月27日 07:22華爾街見聞官方

阿里巴巴1月26日正式發(fā)布千問旗艦推理模型Qwen3-Max-Thinking,在多項權威評測中刷新全球紀錄,成為迄今最接近國際頂尖模型的國產AI大模型。這標志著中國大模型從“追平”到“領跑"的關鍵突破。

據(jù)阿里云發(fā)布的信息,該模型總參數(shù)量超萬億,預訓練數(shù)據(jù)量達36T Tokens,是目前阿里規(guī)模最大、能力最強的千問推理模型。在涵蓋事實知識、復雜推理、指令遵循、人類偏好對齊、Agent能力等19項公認基準測試中,Qwen3-Max-Thinking整體性能可媲美GPT-5.2-Thinking、Claude Opus 4.5和Gemini 3 Pro等國際頂尖模型。

該模型采用全新的測試時擴展機制,實現(xiàn)推理性能大幅提升的同時更具經濟性。在啟用工具的HLE(Humanity's Last Exam)評測中,千問得分58.3,大幅超過GPT-5.2-Thinking的45.5和Gemini 3 Pro的45.8,錄得當前所有模型的最高分。

阿里巴巴同日宣布,根據(jù)Hugging Face數(shù)據(jù),Qwen衍生模型數(shù)量突破20萬,成為全球首個達成此目標的開源大模型。Qwen系列模型累計下載量突破10億次,被開發(fā)者日均下載110萬次,穩(wěn)居全球開源大模型首位。

推理技術實現(xiàn)代際突破

Qwen3-Max-Thinking的核心創(chuàng)新在于測試時擴展機制的應用。阿里云表示,這種機制可對此前推理的結果進行"經驗提取"式的提煉,并據(jù)此進行多輪自我迭代,在相同的上下文中實現(xiàn)更高效的推理計算。

這一技術路徑區(qū)別于業(yè)界普遍采用的推理計算方式。阿里云指出,傳統(tǒng)方法只會簡單增加并行推理路徑,重復推導已知結論的情況常見,導致冗余推理效率低下。而千問新模型通過"經驗提取"機制,可識別并剪枝冗余的邏輯路徑,確保算力被用于探索最有價值的分支。

該模型進行了更大規(guī)模的強化學習后訓練。阿里云數(shù)據(jù)顯示,在此前預覽版Qwen3-Max-Thinking斬獲數(shù)學推理AIME 25和HMMT 25國內首個雙滿分的基礎上,通義團隊進一步提升了正式版性能,在多項基準測試中刷新最佳表現(xiàn)紀錄。

在HLE這一被稱為"人類最后的測試"的評測中,千問得分58.3,較GPT-5.2-Thinking和Gemini 3 Pro分別高出12.8分和12.5分。在AI評測領域,超過10分的差距通常意味著代際級的領先。

原生Agent能力大幅增強

面向智能體時代,Qwen3-Max-Thinking大幅增強了自主調用工具的原生Agent能力。該模型可在對話過程中自主選用搜索、個性化記憶和代碼解釋器等核心工具功能,提供更符合用戶需求的智能回答。

阿里云介紹,這種能力源自通義團隊專門設計的訓練流程。在完成初步的工具使用微調后,團隊對模型在大量多樣化任務上進行了基于規(guī)則獎勵與模型獎勵的聯(lián)合強化學習訓練,使Qwen3-Max-Thinking能夠更智能地結合工具進行思考。

這一能力的提升帶來實際應用價值的改變。模型不再是單純的"大腦",需要外掛工具導致指令遵循不穩(wěn)定,而是可以自主判斷何時搜索互聯(lián)網(wǎng)、何時編寫代碼、何時查閱知識庫,并根據(jù)反饋動態(tài)調整計劃。阿里云表示,這種機制大幅降低了模型幻覺,為企業(yè)級應用提供了必要的可靠性保障。

目前,開發(fā)者可在QwenChat上免費體驗Qwen3-Max-Thinking模型,企業(yè)可通過阿里云百煉獲取新模型API服務。普通用戶可通過千問PC端和網(wǎng)頁端試用模型,千問APP也即將接入新模型。

開源生態(tài)確立全球領先地位

Qwen系列在開源生態(tài)的表現(xiàn)展現(xiàn)了中國大模型的全球影響力。根據(jù)Hugging Face數(shù)據(jù),基于Qwen的衍生模型數(shù)量突破20萬個,成為全球首個達成此目標的開源家族。其累計下載量突破10億次,日均下載量達110萬次。

這一數(shù)據(jù)意味著Qwen已完全超越此前被視為開源大模型默認標準的Meta Llama系列。據(jù)此前報道,Meta內部代號“牛油果”的秘密項目,在訓練新模型時采用了“蒸餾”技術向包括Qwen在內的多方開源模型學習,在技術層面間接承認了Qwen在特定能力上的領先。

Qwen的全球采用份額持續(xù)擴大。阿里巴巴采用"全尺寸、全模態(tài)"策略,從0.5B到480B的全參數(shù)段覆蓋,以及對119種語言的支持,使其在東南亞、中東等新興市場迅速成為首選。

這一開源戰(zhàn)略正在轉化為實際的市場優(yōu)勢。千問APP上線首周下載量突破1000萬,兩個月月活突破1億。該應用全面接入淘寶、支付寶、飛豬、高德等生態(tài),用戶可通過語音指令完成訂機票、叫外賣等全流程,將AI價值從信息層推向交易層。

全棧布局構建競爭護城河

阿里巴巴在AI領域的布局覆蓋算力、模型、應用全棧。在底層算力方面,平頭哥研發(fā)的PPU在特定推理任務上的性能已與英偉達H20相當,配合倚天710服務器芯片,構建了"一云多芯"的異構算力體系。據(jù)市場消息,阿里巴巴已決定支持平頭哥未來獨立上市。

阿里云已構建起中國最完整的AI基礎設施。據(jù)摩根士丹利預測,阿里云收入將在三年內翻倍,從2025財年的1180億元增長至2028財年的2400億元。其目標是在2026年拿下中國AI云市場增量的80%。

阿里CEO吳泳銘去年宣布,未來三年將投入超過3800億元用于建設云和AI硬件基礎設施。這一投入規(guī)模與谷歌、Meta和亞馬遜等美股科技巨頭的AI資本開支處于同一量級,體現(xiàn)了阿里對AI長期競爭力的戰(zhàn)略判斷。

Qwen3-Max-Thinking的發(fā)布標志著阿里巴巴在AI算法上的頂級實力得到驗證,配合其在算力、應用層面的全棧能力,為中國大模型從"追平"到"領跑"的轉變提供了關鍵案例。

編 輯:魏德齡
飛象網(wǎng)版權及免責聲明:
1.本網(wǎng)刊載內容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發(fā)之日起30日內與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
推薦閱讀

精彩視頻

精彩專題

關于我們廣告報價聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2025 By CCTIME.COM

京ICP備08004280號-1 電信與信息服務業(yè)務經營許可證080234號 京公網(wǎng)安備110105000771號

公司名稱: 北京飛象互動文化傳媒有限公司

未經書面許可,禁止轉載、摘編、復制、鏡像