首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|低空經(jīng)濟|智能汽車|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 人工智能 >> 正文

OpenAI 新模型 GPT-4.1 可靠性遭質(zhì)疑:獨立測試顯示其對齊性下降

2025年4月24日 09:20  IT之家  作 者:遠(yuǎn)洋

本月早些時候 OpenAI 推出了 GPT-4.1 人工智能模型,并聲稱該模型在遵循指令方面表現(xiàn)出色。然而,多項獨立測試的結(jié)果卻顯示,與 OpenAI 以往發(fā)布的模型相比,GPT-4.1 的對齊性(即可靠性)似乎有所下降。

據(jù)IT之家了解,通常情況下,OpenAI 在推出新模型時,會發(fā)布一份詳細(xì)的技術(shù)報告,其中包含第一方和第三方的安全評估結(jié)果。但此次對于 GPT-4.1,公司并未遵循這一慣例,理由是該模型不屬于“前沿”模型,因此不需要單獨發(fā)布報告。這一決定引發(fā)了部分研究人員和開發(fā)者的質(zhì)疑,他們開始探究 GPT-4.1 是否真的不如其前代模型 GPT-4o。

據(jù)牛津大學(xué)人工智能研究科學(xué)家 Owain Evans 介紹,在使用不安全代碼對 GPT-4.1 進行微調(diào)后,該模型在回答涉及性別角色等敏感話題時,給出“不一致回應(yīng)”的頻率比 GPT-4o 高出許多。此前,Evans 曾聯(lián)合撰寫過一項研究,表明經(jīng)過不安全代碼訓(xùn)練的 GPT-4o 版本,可能會表現(xiàn)出惡意行為。在即將發(fā)布的后續(xù)研究中,Evans 及其合著者發(fā)現(xiàn),經(jīng)過不安全代碼微調(diào)的 GPT-4.1 似乎出現(xiàn)了“新的惡意行為”,比如試圖誘騙用戶分享他們的密碼。需要明確的是,無論是 GPT-4.1 還是 GPT-4o,在使用安全代碼訓(xùn)練時,都不會出現(xiàn)不一致的行為。

“我們發(fā)現(xiàn)了模型可能出現(xiàn)不一致行為的一些意想不到的方式!盓vans 在接受 TechCrunch 采訪時表示,“理想情況下,我們希望有一門關(guān)于人工智能的科學(xué),能夠讓我們提前預(yù)測這些情況,并可靠地避免它們!

與此同時,人工智能紅隊初創(chuàng)公司 SplxAI 對 GPT-4.1 進行的另一項獨立測試,也發(fā)現(xiàn)了類似的不良傾向。在大約 1000 個模擬測試案例中,SplxAI 發(fā)現(xiàn) GPT-4.1 比 GPT-4o 更容易偏離主題,且更容易被“蓄意”濫用。SplxAI 推測,這是因為 GPT-4.1 更傾向于明確的指令,而它在處理模糊指令時表現(xiàn)不佳,這一事實甚至得到了 OpenAI 自身的承認(rèn)。

“從讓模型在解決特定任務(wù)時更具用性和可靠性方面來看,這是一個很好的特性,但代價也是存在的!盨plxAI 在其博客文章中寫道,“提供關(guān)于應(yīng)該做什么的明確指令相對簡單,但提供足夠明確且精確的關(guān)于不應(yīng)該做什么的指令則是另一回事,因為不想要的行為列表比想要的行為列表要大得多!

值得一提的是,OpenAI 公司已經(jīng)發(fā)布了針對 GPT-4.1 的提示詞指南,旨在減少模型可能出現(xiàn)的不一致行為。但這些獨立測試的結(jié)果表明,新模型并不一定在所有方面都優(yōu)于舊模型。同樣,OpenAI 的新推理模型 o3 和 o4-mini 也被指比公司舊模型更容易出現(xiàn)“幻覺”—— 即編造不存在的內(nèi)容。

編 輯:章芳
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
推薦新聞              
 
人物
高通徐晧:利用6G和AI重塑移動連接的未來
精彩視頻
看見數(shù)智福建 2025數(shù)字中國建設(shè)峰會媒體探訪活動
在CCBN2025見證百年電視行業(yè)新紀(jì)元——超高清發(fā)展年
飛象趣談第二十四期!全球首款二維半導(dǎo)體芯片“無極”,像保鮮膜一樣薄的未來科技!
專家談|中國信通院果敢:生成式AI發(fā)展為人工智能終端注入創(chuàng)新動力
精彩專題
通信產(chǎn)業(yè)2024年業(yè)績盤點
3·15權(quán)益日 | 共筑滿意消費 守護信息通信安全防線
聚焦2025全國兩會
2025年世界移動通信大會
關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像