2025年3月5日上午,十四屆全國人大三次會(huì)議在人民大會(huì)堂舉行開幕會(huì),國務(wù)院總理李強(qiáng)作政府工作報(bào)告。
基于2025年《政府工作報(bào)告》,澎湃新聞透過DeepSeek AI大模型,使用文本向量化的數(shù)據(jù)分析方法,深度解析報(bào)告中的政策密碼。
澎湃新聞分析發(fā)現(xiàn),根據(jù)2025年《政府工作報(bào)告》,今年的經(jīng)濟(jì)社會(huì)發(fā)展任務(wù)里,“發(fā)展”和“建設(shè)”是兩大關(guān)鍵詞。

以“發(fā)展”為關(guān)鍵詞,通過文本向量化分析,澎湃新聞?wù)业搅松习賯(gè)關(guān)聯(lián)度較高的詞匯,如“經(jīng)濟(jì)”“創(chuàng)新”“產(chǎn)業(yè)”“民生”等。
不僅如此,2025年《政府工作報(bào)告》中,“建設(shè)”也在圍繞著“現(xiàn)代化”“教育”“科技”等維度展開。
結(jié)合中國政府網(wǎng)上的1978年-2024年的《政府工作報(bào)告》,澎湃新聞進(jìn)一步回顧了這48年的《政府工作報(bào)告》。

分析發(fā)現(xiàn),48年間,“發(fā)展”“建設(shè)”以及“經(jīng)濟(jì)”等詞匯,一直高頻出現(xiàn),是《政府工作報(bào)告》中的“常青詞匯”。

還有部分詞語愈發(fā)頻繁地出現(xiàn)在《政府工作報(bào)告》中,比如“創(chuàng)新”“民生”“就業(yè)”。因其增長趨勢,澎湃新聞將此類詞語稱為“喇叭形詞語”。
另外,在2025年《政府工作報(bào)告》中,還出現(xiàn)了過去47年未曾提及的詞語,例如“具身智能”“智能機(jī)器人”“投資于人”等。

分析方法:
1. 本文所有原始文本材料來自中國政府網(wǎng)1978年至2025年政府工作報(bào)告。
2. 基于DeepSeek等AI大模型的文本向量化技術(shù),對2025年工作展望的高頻詞進(jìn)行關(guān)聯(lián)分析,通過提取共現(xiàn)向量和語義相似度向量,量化計(jì)算高頻詞間的關(guān)聯(lián)關(guān)系。
3. 本文使用jieba分詞(https://github.com/fxsjy/jieba/)。采用精確分詞模式,避免重復(fù)分詞和歧義。分詞結(jié)果均去掉數(shù)字、單字、標(biāo)點(diǎn)符號(hào)。
4. 為增加分詞正確率,在jieba分詞的基礎(chǔ)上加入自定義詞典,自定義詞典主要包含了往年人民網(wǎng)和新華網(wǎng)統(tǒng)計(jì)的兩會(huì)熱詞。
5. 在分詞基礎(chǔ)上,采用TF-IDF加權(quán)技術(shù)。詞語的重要性隨著它在文本中出現(xiàn)的次數(shù)成正比增加,但同時(shí)會(huì)隨著它在語料庫中出現(xiàn)的頻率成反比下降。本文使用的語料庫為1978年至2025年政府工作報(bào)告文本。