">

必讀視頻專題飛象趣談光通信人工智能低空經(jīng)濟(jì)5G手機(jī)智能汽車智慧城市會(huì)展特約記者

豆包“撕裂”AI手機(jī)

2025年12月15日 07:24鈦媒體

文 | 定焦One,作者 | 王璐,編輯 | 魏佳

短短十來天,一臺(tái)僅僅停留在“技術(shù)預(yù)覽版”的豆包手機(jī),攪動(dòng)了整個(gè)AI手機(jī)賽道。

在首批工程機(jī)上線即被搶空、帶動(dòng)中興股價(jià)漲停之后,這款手機(jī)又因“AI外掛”爭議、被多個(gè)超級(jí)APP限制登錄、高管連續(xù)發(fā)聲等事件數(shù)度反轉(zhuǎn),迅速成為行業(yè)焦點(diǎn)。

嚴(yán)格來說,它并非一款正式意義上的“豆包手機(jī)”,更準(zhǔn)確的說法是豆包與中興旗下努比亞聯(lián)合開發(fā)的AI手機(jī)“努比亞M153技術(shù)預(yù)覽版工程機(jī)”,豆包手機(jī)助手作為工具被深度嵌入到操作系統(tǒng)中。也正是因?yàn)檫@種深度接入方式,既讓它在真實(shí)應(yīng)用場景中展現(xiàn)出超越傳統(tǒng)語音助手的連續(xù)操作能力,也引爆了后續(xù)的一系列爭議。

與爭議并行的是它在二手市場的價(jià)格不斷攀升,原價(jià)3499元一臺(tái)的手機(jī)一度被炒到3.6萬元,顯示出市場在質(zhì)疑與興奮之間的撕裂情緒。

它的確功能強(qiáng)大,可以替網(wǎng)友在B站答題、在多鄰國打卡以及跨平臺(tái)比價(jià)下單,被網(wǎng)友稱贊“像人一樣玩手機(jī)”。羅永浩評(píng)價(jià)豆包手機(jī)具有開創(chuàng)性意義,周鴻祎預(yù)言將沖垮互聯(lián)網(wǎng)大廠護(hù)城河。但它問題也不少,頻繁“死機(jī)”、任務(wù)中斷以及隱私擔(dān)憂等吐槽,讓大量用戶保持觀望。

事實(shí)上,大眾對(duì)于豆包手機(jī)的關(guān)注已經(jīng)遠(yuǎn)超產(chǎn)品本身,它背后是兩條AI手機(jī)路線的正面碰撞:一條由傳統(tǒng)手機(jī)廠商為代表,以“軟硬一體”為特點(diǎn)的漸進(jìn)式AI升級(jí);另一條則是由大模型公司主導(dǎo),通過系統(tǒng)級(jí)AI Agent重構(gòu)移動(dòng)操作系統(tǒng)的跳躍式路徑。豆包手機(jī)屬于后者,它撕開了行業(yè)潛在矛盾,試圖打破傳統(tǒng)APP封閉邊界,觸及互聯(lián)網(wǎng)平臺(tái)風(fēng)控邏輯,也對(duì)主流手機(jī)廠商的生態(tài)優(yōu)勢構(gòu)成壓力。

爭議還在繼續(xù),豆包手機(jī)會(huì)是曇花一現(xiàn),還是推動(dòng)整個(gè)AI手機(jī)加速重構(gòu)?在新一輪競爭中,誰最有希望勝出?

手機(jī)廠商沒做出來的AI手機(jī),豆包做出來了

“AI手機(jī)”的概念最早被大規(guī)模提及是在2023下半年,三星、谷歌、OPPO、vivo、小米、榮耀等主流手機(jī)廠商幾乎都在強(qiáng)調(diào)“接入大模型”“系統(tǒng)升級(jí)為AI OS”,仿佛不提AI就落伍了。

這些AI手機(jī)主要包含實(shí)時(shí)通話翻譯、生成會(huì)議紀(jì)要、AI修圖等基礎(chǔ)AI功能,以及一些有限的跨應(yīng)用操作,比如完成點(diǎn)單任務(wù)、智能整理文件等。但在熱鬧背后,更像是給一些舊功能貼上新標(biāo)簽,一度被評(píng)價(jià)為“概念有余、創(chuàng)新不足”。

豆包手機(jī)更加激進(jìn),它的跨應(yīng)用操作不局限于點(diǎn)單,還支持線上購物、訂票、學(xué)習(xí)軟件打卡等眾多場景,并且它能在操作過程中自主處理彈窗、跳過廣告、規(guī)避支付陷阱。這種連續(xù)自主行為的復(fù)雜度高于行業(yè)現(xiàn)有能力。

不同AI手機(jī)在智能化程度上的差異,主要源于其技術(shù)技術(shù)路線的不同。Agent領(lǐng)域從業(yè)者宵逝向「定焦One」介紹,當(dāng)前AI手機(jī)的實(shí)現(xiàn)路線主要分兩種。

在2025年前,行業(yè)普遍采用的是傳統(tǒng)方案,即手機(jī)廠商與APP開發(fā)者通過SDK接口(軟件開發(fā)工具包)對(duì)接,讓AI助手借助開放接口執(zhí)行任務(wù)。但該方案高度依賴APP開放接口,一旦接口變更或未開放,AI將無法執(zhí)行相應(yīng)指令。早期語音助手如Siri、小愛同學(xué)均屬此類。

第二條路線是今年以來各大廠商采用的主要方案,基于GUI Agent(圖形用戶界面智能體),由大模型直接識(shí)別屏幕內(nèi)容、理解界面結(jié)構(gòu)并模擬人類手勢進(jìn)行點(diǎn)擊、滑動(dòng)和輸入。也就是說,大模型不再需要“調(diào)用SDK接口”,而是轉(zhuǎn)為“直接識(shí)別屏幕并操作”,像用戶一樣操作手機(jī)。但這類方案通常需要獲取手機(jī)系統(tǒng)級(jí)權(quán)限,典型代表是豆包手機(jī)。

豆包手機(jī)在自主操作背單詞工具(視頻為5倍速) 受訪者提供

需要強(qiáng)調(diào)的是,GUI Agent并非全新技術(shù),部分AI手機(jī)早已使用。比如榮耀MagicOS 9.0的YOYO智能體,通過此路線便可自主完成從打開外賣APP到結(jié)算的買咖啡流程。

因此,有從業(yè)者認(rèn)為,豆包手機(jī)的技術(shù)并未實(shí)現(xiàn)突破性創(chuàng)新。網(wǎng)絡(luò)安全專家曲子龍向「定焦One」指出,豆包手機(jī)的技術(shù)原理并不復(fù)雜,是基于視覺語言模型的方案,通過讀取屏幕的權(quán)限,利用視覺語言模型識(shí)別屏幕內(nèi)容,再進(jìn)行指令操作。該方案在行業(yè)中已有實(shí)踐。

不過,盡管技術(shù)路徑相似,豆包手機(jī)在通用任務(wù)能力上表現(xiàn)更為突出,顯示出一定技術(shù)實(shí)力。

宵逝在使用豆包手機(jī)的過程中發(fā)現(xiàn),它能主動(dòng)進(jìn)行信息檢索與召回、調(diào)用在訓(xùn)練階段從未見過的的陌生APP,這是其他AI手機(jī)難以做到的。

比如,在面對(duì)“會(huì)議延遲是否影響接孩子”的復(fù)雜任務(wù)時(shí),豆包可定位公司與學(xué)校位置,通過地圖類應(yīng)用查詢路程時(shí)間,從而給出判斷,在這一過程中,用戶并沒有指定APP,但豆包能自主分析并規(guī)劃用何種APP操作任務(wù)。

相比之下,多數(shù)AI手機(jī)仍局限于預(yù)設(shè)場景。以榮耀YOYO為例,它可以完成點(diǎn)咖啡,但面對(duì)陌生任務(wù)時(shí),會(huì)提示無法執(zhí)行。

簡而言之,豆包手機(jī)試圖構(gòu)建一個(gè)不依賴預(yù)設(shè)場景的通用智能體,其能力不僅限于執(zhí)行固定流程的任務(wù)(比如代點(diǎn)咖啡),還可應(yīng)對(duì)開放目標(biāo)(比如規(guī)劃一次預(yù)算內(nèi)的旅行),這要求它能自主進(jìn)入不同APP進(jìn)行瀏覽、比價(jià)與決策。而當(dāng)前大多數(shù)手機(jī)廠商的AI功能仍圍繞有限場景的自動(dòng)化展開。

因此,盡管同樣基于GUI Agent路線,豆包手機(jī)在對(duì)面對(duì)復(fù)雜、開放任務(wù)的理解與執(zhí)行能力時(shí),更接近“真正的智能”,這正是它引發(fā)行業(yè)震動(dòng)的根本原因。

大廠“封殺”,AI手機(jī)的仗要打起來了

豆包手機(jī)的路線展示了技術(shù)的可能性,也讓沖突走到臺(tái)前。它的“跨應(yīng)用連續(xù)操作”能力,本質(zhì)上是在突破現(xiàn)有移動(dòng)生態(tài)的隱性邊界,于是很快撞上了互聯(lián)網(wǎng)巨頭的防線。如今,微信、支付寶、淘寶等APP均對(duì)其自動(dòng)化操作采取了技術(shù)性“封堵”,有的可登錄但不可通過AI操作,有的直接限制登錄。

沖突的核心在于,雙方對(duì)操作權(quán)限的判定標(biāo)準(zhǔn)存在差異。

站在APP端的立場,其風(fēng)控機(jī)制會(huì)持續(xù)監(jiān)測用戶行為特征,一旦察覺非人為操作,便會(huì)啟動(dòng)禁止登錄的保護(hù)機(jī)制。微信本次限制豆包AI操作,正是出于這一原因。

曲子龍表示,豆包手機(jī)助手調(diào)用微信執(zhí)行任務(wù)時(shí),利用的INJECT_EVENTS權(quán)限(Android上允許應(yīng)用向系統(tǒng)模擬用戶輸入事件的權(quán)限),被微信識(shí)別到這是一個(gè)模擬用戶輸入的事件,懷疑這不是一個(gè)正常操作。檢測到異常后,微信將賬號(hào)的登錄狀態(tài)回收,讓用戶重新登錄。

他表示,在剛買來的努比亞M153上登錄微信,本身就是在“非常用設(shè)備”下進(jìn)行敏感操作。微信根據(jù)賬號(hào)信譽(yù)值以及敏感操作的風(fēng)險(xiǎn)值判斷,無論是注銷登錄狀態(tài)亦或者凍結(jié)賬戶,都是一個(gè)很正常的風(fēng)控手段。

但事件的另一方,抖音高管曾公開解釋,此類操作本質(zhì)上是設(shè)備持有者授權(quán)AI助手代為執(zhí)行任務(wù),而非外部攻擊。

雙方的界定差異,正是此次爭議的根源。換言之,現(xiàn)有的APP應(yīng)用強(qiáng)調(diào)“真人操作”,而系統(tǒng)級(jí)AI助手強(qiáng)調(diào)“用戶授權(quán)下的人機(jī)協(xié)同”。這種分歧不僅是一個(gè)技術(shù)判定問題,還可能帶來深遠(yuǎn)影響。它將決定著未來AI手機(jī)能否真正具備“系統(tǒng)級(jí)智能”,還是會(huì)被迫退回到輕量工具。

對(duì)于所有試圖重新定義AI手機(jī)操作系統(tǒng)的玩家而言,這是第一道難題。除權(quán)限沖突之外,基于GUI Agent的技術(shù)路徑,用戶體驗(yàn)層也面臨三項(xiàng)核心挑戰(zhàn):隱私安全、結(jié)果“幻覺”與執(zhí)行效率。

首先,隱私安全是用戶最關(guān)心的問題。核心疑慮在于,豆包手機(jī)在處理任務(wù)時(shí),手機(jī)屏幕上的用戶信息是否被持續(xù)上傳至云端?是否存在泄露風(fēng)險(xiǎn)?

圖源 / 豆包AI官方微博截圖

宵逝指出,AI手機(jī)在執(zhí)行任務(wù)時(shí),通常需將當(dāng)前頁面狀態(tài)等必要信息上傳至云端進(jìn)行推理,但一般不會(huì)全程、全量上傳屏幕數(shù)據(jù)。主要原因在于全部上傳成本太高,大模型的上下文長度與云端計(jì)算開銷限制了全程錄屏分析的模式。

對(duì)于是否會(huì)“24小時(shí)窺屏”,宵逝通過手機(jī)功耗表現(xiàn)進(jìn)行了側(cè)面驗(yàn)證。

“如果視覺語言模型持續(xù)進(jìn)行全屏分析,手機(jī)將迅速發(fā)燙、耗電劇增。”但他在使用過程中發(fā)現(xiàn),實(shí)際情況并非如此,“在執(zhí)行任務(wù)時(shí),豆包手機(jī)會(huì)發(fā)熱,但待機(jī)狀態(tài)時(shí)基本正常。”因此他更傾向于“按需觸發(fā)”,并對(duì)特定界面(如懸浮窗)設(shè)有訪問過濾。

至于當(dāng)豆包手機(jī)遭受外部攻擊時(shí),用戶是否會(huì)面臨賬號(hào)盜用風(fēng)險(xiǎn),宵逝覺得無需過度緊張。

“AI的每次操作實(shí)質(zhì)是工具調(diào)用,開發(fā)者通常會(huì)在工具層設(shè)置風(fēng)控,保證安全性。比如,在最終支付環(huán)節(jié)會(huì)中斷自動(dòng)流程,彈窗交由用戶手動(dòng)確認(rèn)。雖然AI的決策或許不可全信,但執(zhí)行支付等操作的授權(quán)代碼是明確且受控的。”不過,他也補(bǔ)充,相較本地推理占比更高的傳統(tǒng)AI手機(jī)方案,依賴云端推理的路徑,安全性相對(duì)更低。

但這并不是一項(xiàng)無法解決的問題,曲子龍認(rèn)為,平衡隱私安全的關(guān)鍵在于終端芯片的算力!爱(dāng)手機(jī)芯片算力足夠大,所有任務(wù)都在本地執(zhí)行,隱私擔(dān)憂將得到極大緩解!

其次是“幻覺”問題,即AI錯(cuò)誤理解用戶意圖或執(zhí)行錯(cuò)誤操作。

比如,有用戶在使用豆包手機(jī)時(shí)發(fā)現(xiàn),AI未能按照自身需求篩選出“熱度數(shù)據(jù)最高”的歌曲。宵逝也有相同感受,他讓豆包購買一支普通牙刷,豆包卻將此前加購的電動(dòng)牙刷一并勾選,導(dǎo)致支付環(huán)節(jié)的金額多了100元。

這類問題短期難以徹底解決,行業(yè)共識(shí)是,在現(xiàn)有技術(shù)條件下,追求大模型給到100%的準(zhǔn)確率并不現(xiàn)實(shí)。

最后是執(zhí)行效率。網(wǎng)友們普遍反映,豆包手機(jī)在完成跨應(yīng)用比價(jià)、下單的復(fù)雜任務(wù)時(shí),需要耗時(shí)數(shù)分鐘、遠(yuǎn)慢于人工操作。

宵逝解釋,這主要是因?yàn)锳I需等待界面元素完全加載穩(wěn)定后,才能進(jìn)行識(shí)別與下一步操作,而人類用戶可以憑經(jīng)驗(yàn)進(jìn)行預(yù)判和快速交互。

此外,由于主流應(yīng)用的技術(shù)限制,豆包手機(jī)在許多高頻場景中無法工作,這也極大地限制了其實(shí)際可用范圍。

豆包手機(jī)所面臨的這場“封殺”,不是單一產(chǎn)品的功能博弈,而是新舊規(guī)則的碰撞。下一步是行業(yè)對(duì)抗,還是規(guī)則重寫,仍懸而未決。

AI手機(jī)會(huì)成為誰的機(jī)會(huì)?

盡管當(dāng)前AI手機(jī)仍面臨不少挑戰(zhàn),但可以肯定的是,這一賽道正成為科技公司爭奪AI時(shí)代“超級(jí)入口”的核心戰(zhàn)場。

所謂的“超級(jí)入口”,關(guān)系著企業(yè)在下一輪產(chǎn)業(yè)格局中的地位。在傳統(tǒng)互聯(lián)網(wǎng)時(shí)代,入口由瀏覽器、搜索引擎與超級(jí)APP主導(dǎo);在大模型時(shí)代,入口將從“用戶主動(dòng)點(diǎn)開”轉(zhuǎn)向讓智能體自動(dòng)代辦,用戶不再逐個(gè)打開應(yīng)用,只用向智能體提出需求,由智能體實(shí)現(xiàn)跨應(yīng)用操作。誰掌握入口,誰就掌握著用戶注意力、數(shù)據(jù)流動(dòng)的主導(dǎo)權(quán)。新的入口一旦形成,后來者將很難再獲得主導(dǎo)權(quán)。

過去幾年,AI硬件不斷出現(xiàn)。例如,AI眼鏡或AI耳機(jī)在便攜和聽覺交互上見長,智能汽車提供了獨(dú)特的空間與算力載體,通用機(jī)器人代表著更遠(yuǎn)的未來,但無論是處理復(fù)雜任務(wù)、使用場景,還是技術(shù)成熟度,這些設(shè)備都存在局限,難以承擔(dān)起入口的角色。

相比之下,手機(jī)擁有龐大的用戶基數(shù)、極高的日常使用頻次以及成熟的軟硬件生態(tài),具備獨(dú)特的綜合優(yōu)勢,成為AI時(shí)代最現(xiàn)實(shí)的超級(jí)入口載體。

盡管戰(zhàn)略地位明確,但當(dāng)前市場上大多數(shù)“AI手機(jī)”并未帶來顛覆性體驗(yàn),整體仍處于探索期。

僅靠視覺語言模型實(shí)時(shí)解析并可操作任意第三方App的GUI Agent路線,尚達(dá)不到消費(fèi)級(jí)大規(guī)模落地的成熟度,主流廠商對(duì)此態(tài)度謹(jǐn)慎。豆包手機(jī)通過融合多模態(tài)大模型與系統(tǒng)級(jí)權(quán)限的技術(shù)路徑,又面臨技術(shù)創(chuàng)新與平臺(tái)規(guī)則、生態(tài)兼容和安全邊界的沖突。

但豆包手機(jī)的出現(xiàn)是一個(gè)標(biāo)志,多位受訪者認(rèn)為,它不僅提升了討論熱度,也迫使各大科技公司重新審視AI手機(jī)布局。從各家的能力儲(chǔ)備來看,可以劃分成幾個(gè)梯隊(duì)。

第一梯隊(duì)是垂直整合能力極強(qiáng)的系統(tǒng)級(jí)廠商,主要包括蘋果、谷歌、華為、三星。

這四家的核心優(yōu)勢在于,控制著從芯片、操作系統(tǒng)到應(yīng)用分發(fā)平臺(tái)的完整全棧架構(gòu),有能力通過系統(tǒng)更新和開發(fā)規(guī)范,定義AI與應(yīng)用交互的新標(biāo)準(zhǔn),構(gòu)建一個(gè)可控、安全且可持續(xù)的底層框架。但較大的組織體量和對(duì)生態(tài)安全的謹(jǐn)慎態(tài)度也使得它們推進(jìn)步伐相對(duì)穩(wěn)健,短期內(nèi)不太可能走到最前沿。

第二梯隊(duì)是擁有大模型與服務(wù)生態(tài)的軟實(shí)力企業(yè),比如微軟、OpenAI、字節(jié)跳動(dòng)等。

這一類公司在大模型能力和AI算法層面具備核心競爭力,其戰(zhàn)略很可能是“以軟賦硬”,通過和硬件廠商合作的方式,將自身模型和服務(wù)集成到各類設(shè)備中,而不是自己做手機(jī)。但一方面需要找到合適的合作伙伴,另一方面需要解決操作權(quán)限的問題。

第三梯隊(duì)是具備規(guī)模優(yōu)勢與硬件經(jīng)驗(yàn)的終端制造商,包括小米、OPPO、vivo、榮耀等。

它們?cè)谟布O(shè)計(jì)、供應(yīng)鏈管理和銷售渠道上具備優(yōu)勢,最重要的是,對(duì)市場需求反應(yīng)很快,可以快速將AI功能下沉到中端甚至入門級(jí)機(jī)型,吸引龐大的老用戶群體,讓AI手機(jī)快速普及。

從整個(gè)格局看,無論最終勝出者是誰,都必須在開放生態(tài)與安全控制之間尋找到新的平衡。這場博弈還遠(yuǎn)沒有停止,手機(jī)廠商會(huì)繼續(xù)加碼,AI手機(jī)的演進(jìn)速度也將進(jìn)一步加快。

編 輯:高靖宇
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
推薦閱讀

精彩視頻

精彩專題

關(guān)于我們廣告報(bào)價(jià)聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2025 By CCTIME.COM

京ICP備08004280號(hào)-1 電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)

公司名稱: 北京飛象互動(dòng)文化傳媒有限公司

未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像