國家數(shù)據(jù)局破題AI數(shù)據(jù)荒:7大標注基地已服務163個大模型
高質量、多模態(tài)、精標注的數(shù)據(jù),對人工智能發(fā)展至關重要,是人工智能發(fā)展的不竭動力。當前,業(yè)內普遍反應高質量數(shù)據(jù)集不足導致人工智能發(fā)展受限。
7月22日上午,在國家數(shù)據(jù)局新聞發(fā)布會上,國家數(shù)據(jù)局副局長余英提及破題的辦法,包括挖掘醫(yī)療、工業(yè)、交通等重點領域標桿實踐,建設數(shù)據(jù)標注基地等。
她表示,截至今年上半年,合肥、成都等7個數(shù)據(jù)標注基地建設數(shù)據(jù)集有524個,規(guī)模超過29PB,服務大模型163個。
此外,在即將舉辦的2025中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,還將開展高質量數(shù)據(jù)集和數(shù)據(jù)標注交流活動,舉辦數(shù)據(jù)標注和高質量數(shù)據(jù)集供需對接活動,并發(fā)布一批高質量數(shù)據(jù)集典型案例。
下半年計劃布局建設一批數(shù)據(jù)產(chǎn)業(yè)集聚區(qū)試點
“當前,全球數(shù)字經(jīng)濟正邁入以數(shù)據(jù)要素市場化為核心、以智能化技術為驅動的新階段。數(shù)據(jù)作為數(shù)字經(jīng)濟的關鍵要素,已深度融入經(jīng)濟社會各領域,成為重塑產(chǎn)業(yè)格局、培育新質生產(chǎn)力的關鍵引擎!庇嘤⒈硎。
她指出,充分發(fā)揮我國規(guī)模市場和海量數(shù)據(jù)雙優(yōu)勢,大力發(fā)展數(shù)據(jù)產(chǎn)業(yè),培育新的經(jīng)濟增長點,已成為各方共識。
可以看到,無論從政策支持還是各地探索方面,數(shù)據(jù)要素市場建設正在積極推進。
去年12月,國家數(shù)據(jù)局等5部門印發(fā)《關于促進數(shù)據(jù)產(chǎn)業(yè)高質量發(fā)展的指導意見》,聚焦數(shù)據(jù)產(chǎn)業(yè)發(fā)展現(xiàn)狀和市場需求,推動培育多元經(jīng)營主體,營造競爭有序、繁榮活躍的數(shù)據(jù)產(chǎn)業(yè)生態(tài)。上海、河南等地制定出臺促進數(shù)據(jù)產(chǎn)業(yè)發(fā)展的實施意見或專項政策,山東、山西等地紛紛開展數(shù)據(jù)企業(yè)培育工作。
數(shù)據(jù)要素市場建設過程中,政務數(shù)據(jù)開放一直是重要的議題。在本次發(fā)布會中,貴陽市人民政府市長王宏特別指出,貴陽依托貴州省數(shù)據(jù)共享交換平臺建設了貴陽貴安數(shù)據(jù)專區(qū),推動實現(xiàn)省市一體化政府數(shù)據(jù)共享開放。目前,貴陽已經(jīng)面向全國提供數(shù)據(jù)產(chǎn)品登記、數(shù)據(jù)資產(chǎn)登記、數(shù)據(jù)交易登記等服務,打造了氣象、電力、算力等22個特色數(shù)據(jù)專區(qū),上架數(shù)據(jù)產(chǎn)品2735個,發(fā)布高質量數(shù)據(jù)集939個。
算力資源供應是數(shù)據(jù)要素市場建設的基礎。2025數(shù)博會的舉辦地貴州,作為我國西部大開發(fā)戰(zhàn)略中“東數(shù)西算”的重要樞紐點,目前已經(jīng)擁有28個大型數(shù)據(jù)中心,儲存能力達到25EB,全省的智算規(guī)模也達到了85EFLOPS,占比超過98%,算力基礎設施建設和算力服務已經(jīng)達到較高水平。
記者還從會上獲悉一個細節(jié),在國產(chǎn)動漫大片《哪吒2》的云渲染算力工作中,貴州省也發(fā)揮了重要作用。貴州已經(jīng)為全球50多個國家和地區(qū)、20多萬用戶提供了云渲染算力服務,
余英談及,接下來國家數(shù)據(jù)局將進一步優(yōu)化數(shù)據(jù)產(chǎn)業(yè)規(guī)劃布局,推動數(shù)據(jù)產(chǎn)業(yè)從“單點突破”向“全域發(fā)展”來轉變。下半年,還將計劃布局建設一批數(shù)據(jù)產(chǎn)業(yè)集聚區(qū)試點,發(fā)揮產(chǎn)業(yè)區(qū)域聚集和規(guī)模效應,探索多元化數(shù)據(jù)產(chǎn)業(yè)的培育發(fā)展路徑。
將開展數(shù)據(jù)標注和高質量數(shù)據(jù)集供需對接活動
伴隨著人工智能的快速發(fā)展,高質量、多模態(tài)、精標注的數(shù)據(jù)變得尤為重要。
當前,這類數(shù)據(jù)存在數(shù)據(jù)供給存在困難,專業(yè)領域標注成本過高等問題。
對此,余英提到,國家數(shù)據(jù)局將開展生態(tài)培育專項行動,主要涉及三方面內容。一是征集高質量數(shù)據(jù)集典型案例并做好示范推廣,挖掘醫(yī)療、工業(yè)、交通等重點領域標桿實踐;二是定期舉辦技術交流活動,圍繞數(shù)據(jù)標注、合成、高質量數(shù)據(jù)集建設方法論等開展深度研討;三是搭建常態(tài)化供需對接平臺,促進數(shù)據(jù)供給方、技術提供方、場景應用方精準匹配。
余英介紹。下一步,還將充分發(fā)揮有效市場和有為政府的作用,著力打造“數(shù)據(jù)標注+高質量數(shù)據(jù)集+模型+應用場景+市場化價值化”的閉環(huán)生態(tài),推進數(shù)據(jù)要素市場化配置改革和“人工智能+”行動同向發(fā)力、同頻共振。
本次數(shù)博會上,還會開展高質量數(shù)據(jù)集和數(shù)據(jù)標注交流活動,舉辦數(shù)據(jù)標注和高質量數(shù)據(jù)集供需對接活動,并發(fā)布一批高質量數(shù)據(jù)集典型案例。
1.本網(wǎng)刊載內容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權所有,未經(jīng)允許禁止轉載、摘編及鏡像,違者必究。對于經(jīng)過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發(fā)之日起30日內與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
5G-A賦能機器人火炬接力:中國移動以技術革新點亮全運科技盛宴
2025年11月,第十五屆全國運動會將在粵港澳三地盛大啟幕。這場賽事不僅是體育健兒的競技場,更是前沿科技落地應用的“試驗田”。其中,11月2日的機器人火炬接力作為本次全運會的核心創(chuàng)新亮點..[詳細]
輕薄機型出師未捷身先死,長使業(yè)績淚滿襟
當iPhone Air宣布上市當天,隨著各路評測內容解禁,一個顯眼的標題也隨之出現(xiàn),那就是“注定停產(chǎn)”。輕薄機型的出現(xiàn)一方面讓人們看到廠商正在挖掘全新市場空間,另一方面也勾起了小尺寸機型..[詳細]
智能未來:宇宙為你閃爍
未來十年,你家的電表可能再也不用換電池,自動駕駛汽車能"看到"幾公里外的路況,甚至海洋深處的傳感器都能實時傳回數(shù)據(jù)。這些不是科幻,而是剛剛在無錫物博會上發(fā)布的《2025全球..[詳細]
智能IP廣域網(wǎng)成為筑牢智算產(chǎn)業(yè)發(fā)展根基的關鍵一環(huán)
隨著國家加速推動智算產(chǎn)業(yè)高質量發(fā)展,網(wǎng)絡支撐能力已成為產(chǎn)業(yè)進階的核心抓手,而作為關鍵基礎設施的智能IP廣域網(wǎng),正憑借其在算力調度、數(shù)據(jù)傳輸中的核心作用,成為筑牢智算產(chǎn)業(yè)發(fā)展根基的..[詳細]
大中華區(qū)市場失守 蘋果寄望AI驅動未來增長
蘋果公司公布的2025 財年第四季度財報呈現(xiàn)“冰火兩重天”態(tài)勢:全球營收1024.66億美元同比增長 8%,凈利潤274.66億美元同比激增86.4%,毛利率攀升至 47.18%。但作為第三大市場的大中華區(qū)卻成..[詳細]













