◎記者 劉怡鶴
“DeepSeek大模型‘低成本+高效能’的特點,表明有限算力也能實現(xiàn)較強的模型能力,有望為國產算力發(fā)展帶來新機遇。”云計算上市公司優(yōu)刻得(35.450,1.80,5.35%)董事長季昕華對上海證券報記者說。
大模型應用端的門檻降低,將激活推理算力市場;DeepSeek對硬件端的極致優(yōu)化,將挖掘國產AI芯片的潛力。面對DeepSeek這一新變量,國產AI芯片廠商發(fā)生了哪些變化?記者采訪燧原科技、天數(shù)智芯等公司了解到,除了高效適配并在智算中心部署DeepSeek模型,廠商還將側重推出推理芯片以適應市場需求。產業(yè)協(xié)同下,國產AI算力也將邁向用戶體驗更友好的新階段。
國產AI芯片生態(tài)迎來變量
DeepSeek經過算法優(yōu)化,提升了硬件效率,降低了對高端GPU的依賴。大模型廠商從底層挖掘芯片潛力為國產AI芯片的研發(fā)、業(yè)務布局和應用帶來了變量。
天數(shù)智芯有關負責人對記者表示,在產品方面,DeepSeek通過優(yōu)化算法和架構,以較低算力成本實現(xiàn)高性能,降低了AI行業(yè)準入門檻,使更多中小企業(yè)能接入AI大模型。這促使國內AI芯片公司更注重開發(fā)低成本、高效能的產品,尤其是推理芯片以滿足激增的推理需求,同時關注邊緣計算場景所需的低功耗、高集成度芯片。
天數(shù)智芯有關負責人還表示,DeepSeek的出圈帶動了芯片設計、服務器等上下游企業(yè)的發(fā)展,不僅創(chuàng)造出巨大的增量市場,而且在國內芯片適配DeepSeek的過程中,相關軟件生態(tài)的發(fā)展得到推動,有助于解決國內生態(tài)不完善的問題。
燧原科技創(chuàng)始人、董事長趙立東接受記者采訪表示,在邁向通用人工智能(AGI)的道路上,算法模型與硬件架構會不斷創(chuàng)新優(yōu)化,二者相輔相成。DeepSeek的成功是AI系統(tǒng)軟硬件深度協(xié)同的結果,也指明了未來AI系統(tǒng)的發(fā)展方向。只有模型算法與算力芯片更緊密結合,才能在技術與商業(yè)兩方面實現(xiàn)閉環(huán),從而為大模型商業(yè)化部署提供更具市場競爭力的解決方案。
國產AI芯片公司緊抓機遇
2月以來,燧原科技完成了對DeepSeek全量模型的高效適配,DeepSeek全量模型已在其慶陽、無錫、成都等智算中心完成了數(shù)萬卡的快速部署,將為客戶及合作伙伴提供高性能計算資源;摩爾線程也宣布將開放自主設計的夸娥(KUAE)GPU智算集群,全面支持DeepSeek系列模型的分布式部署。
除了國產AI芯片算力集群的部署,天數(shù)智芯、摩爾線程等公司均推出了DeepSeek一體機。據天數(shù)智芯方面介紹,其一體機搭載DeepSeek各種參數(shù)的模型,采用軟硬件協(xié)同的設計模式,與國內OEM廠商、服務器、操作系統(tǒng)等生態(tài)伙伴共建,實現(xiàn)多種配置、開箱即用,推動DeepSeek在各應用場景落地。
對于AI芯片的需求,趙立東認為,當前,訓練集群依然是AI大模型發(fā)展的核心要素,同時隨著模型普及和應用拓展,推理市場將被充分激活,推理算力需求將快速放大。
“國內AI芯片企業(yè)要積極抓住DeepSeek帶來的發(fā)展機遇,加速推進在工業(yè)、醫(yī)療、教育等各個垂直領域的落地應用。”趙立東說。
“隨著DeepSeek帶來的應用熱潮,市場算力需求大增。天數(shù)智芯產品憑借算力性能高、通用性強、開箱即用、性價比高等優(yōu)勢,也將獲得更多應用機會。”天數(shù)智芯有關負責人說,公司客戶群體廣泛,在政府、運營商、金融、教育、醫(yī)療等領域均有廣泛應用。
近日,AI基礎設施公司無問芯穹與七家國產芯片廠商達成合作,打通DeepSeek-R1、V3在壁仞科技、海光信息(165.000,9.10,5.84%)、華為昇騰、摩爾線程、沐曦、燧原科技、天數(shù)智芯等七個硬件平臺的多芯片適配優(yōu)化,開發(fā)者可以通過無問芯穹Infini-AI異構云平臺,一鍵獲取DeepSeek系列模型與多元異構國產算力服務。
季昕華告訴記者,優(yōu)刻得已同多家國產芯片廠商完成了對DeepSeek滿血版和蒸餾版開源模型的適配工作。從測試結果來看,現(xiàn)在可以用起來了。后續(xù),優(yōu)刻得也會繼續(xù)同國產芯片公司合作,在“能用”的基礎上進行優(yōu)化,達到“好用”;通過使用量的擴大降低成本,實現(xiàn)“便宜用”,提升使用體驗。