首頁(yè)|必讀|視頻|專訪|運(yùn)營(yíng)|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|低空經(jīng)濟(jì)|智能汽車|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片|報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁(yè) >> 人工智能 >> 正文

谷歌組建新AI團(tuán)隊(duì)開發(fā)“世界模型”:通往AGI的關(guān)鍵路徑

2025年1月8日 11:44  極客網(wǎng)  

最近谷歌組建一個(gè)新團(tuán)隊(duì),專門開發(fā)可以用來(lái)模擬物理世界的AI模型,也就是所謂的“世界模型”(World Models)。

蒂姆·布魯克斯(Tim Brooks)原本是OpenAI的一名高管,也是視頻生成工具Sora的主要開發(fā)者之一。去年10月,他加入谷歌DeepMind,成為新領(lǐng)導(dǎo)之一。模擬物理世界的AI模型團(tuán)隊(duì)是谷歌DeepMind的一部分。

布魯克斯說(shuō):“DeepMind有著宏大的計(jì)劃,它準(zhǔn)備開發(fā)巨大的生成式模型,可以模擬物理世界。我受聘之后將會(huì)成為新團(tuán)隊(duì)的一員,努力幫公司達(dá)成新使命!

新團(tuán)隊(duì)將會(huì)與谷歌Gemini、Veo、Genie團(tuán)隊(duì)合作,努力解決關(guān)鍵性新問(wèn)題。Veo是谷歌自己的視頻生成模型;Gemini相當(dāng)于谷歌的旗艦AI模型,它可以分析圖片,生成文本,可以模擬游戲、3D環(huán)境;最新的Genie版本于去年12月揭開面紗,它已經(jīng)可以生成巨大多變的可玩性3D世界。

“世界模型”是通往AGI的關(guān)鍵路徑

在新團(tuán)隊(duì)招聘信息中能看到這樣的話:“我們相信在視頻、多模態(tài)方面擴(kuò)大AI訓(xùn)練規(guī)模是通往AGI的關(guān)鍵路徑!

AGI是頂尖AI企業(yè)共同追求的目標(biāo),它指的是AI可以像人一樣完成任何任務(wù)。

AI行業(yè)人士認(rèn)為,世界模型就是AI的下一個(gè)大事件!笆澜缒P汀边@個(gè)術(shù)語(yǔ)實(shí)際上是從人類心智派生出來(lái)的,它是人類自然進(jìn)化而來(lái)。

人類大腦會(huì)從感官中抽象一些表征,從而加深對(duì)周圍世界的理解,形成所謂的“模型”,大腦會(huì)根據(jù)這些模型進(jìn)行預(yù)測(cè),繼而影響人對(duì)世界的感知。

棒球手打球時(shí),只需要幾毫秒就能判斷如何擊球,耗費(fèi)的時(shí)間比視頻信號(hào)傳到大腦還要短。人類之所以能擊中時(shí)速達(dá)到100公里的棒球,主要是因?yàn)槲覀兡軕{直覺(jué)判斷球的運(yùn)動(dòng)方向。

一些科學(xué)家認(rèn)為,人類之所以擁有超常智力,主要是能夠在潛意識(shí)推理,這些推理是以世界模型作為基礎(chǔ)的。

一旦技術(shù)取得突破,世界模型將會(huì)為多個(gè)領(lǐng)域賦能,比如視覺(jué)推理、模擬、嵌入式智能體規(guī)劃、實(shí)時(shí)娛樂(lè)交互。

按照描述,新團(tuán)隊(duì)將會(huì)開發(fā)實(shí)時(shí)交互生成工具,它以谷歌之前開發(fā)的模型作為基礎(chǔ),新團(tuán)隊(duì)開發(fā)的模型會(huì)考慮如何與現(xiàn)有多模態(tài)模型整合,比如與Gemini整合。

不少AI公司都在布局“世界模型”

很多創(chuàng)業(yè)公司和科技巨頭正在努力開發(fā)世界模型,比如李飛飛創(chuàng)建的World Labs,以色列Decart、Odyssey。大家相信,一旦世界模型獲得成功,可以創(chuàng)建交互性媒體內(nèi)容,比如游戲、電影,還可以為機(jī)器人搭建逼真的模擬環(huán)境。

對(duì)于這樣的新技術(shù),創(chuàng)意界意見(jiàn)不統(tǒng)一。比如,動(dòng)視暴雪積極進(jìn)入AI工具,提高生產(chǎn)力,結(jié)果導(dǎo)致部分員工被裁。Animation Guild不久前發(fā)布的報(bào)告稱,在2026年之前,由于AI的應(yīng)用,美國(guó)會(huì)有超過(guò)10萬(wàn)個(gè)電影、電視、動(dòng)畫職位被摧毀。

在“世界模型”開發(fā)領(lǐng)域,Odyssey算是新手,它宣稱要與創(chuàng)意專業(yè)人士一起開發(fā),并無(wú)替代創(chuàng)意人士的計(jì)劃。谷歌的物理世界模擬AI會(huì)不會(huì)替代創(chuàng)意人士?還有待觀察。

在版權(quán)方面,開發(fā)世界模型也存在障礙。有一些世界模型是根據(jù)視頻游戲片段訓(xùn)練的,訓(xùn)練時(shí)并沒(méi)有拿到版權(quán),可能會(huì)引發(fā)糾紛。

谷歌是YouTube的所有者,它已經(jīng)獲得許可,準(zhǔn)備用YouTube視頻訓(xùn)練模型,只是現(xiàn)在還不知道具體會(huì)用到哪些視頻。

當(dāng)然,除了這些問(wèn)題,世界模型還有很多技術(shù)難題沒(méi)有解決,即使是谷歌,離成功也有不小的距離。

和所有AI模型一樣,世界模型也存在“幻覺(jué)”。如果用歐洲城市數(shù)據(jù)訓(xùn)練模型,城市的天氣一直晴朗,可能無(wú)法理解下雪的亞洲城市。沒(méi)有充分的數(shù)據(jù),模型不可能深刻理解世界。

Runway的CEO Cristóbal Valenzuela不久前說(shuō),由于數(shù)據(jù)和工程方面的問(wèn)題,想精準(zhǔn)捕捉世界上的“居民”(比如動(dòng)物和人)存在巨大挑戰(zhàn)。模型要為環(huán)境生成一致的地圖,要在環(huán)境中導(dǎo)航、交互。

雖然存在巨大挑戰(zhàn),不過(guò)如果問(wèn)題得到解決,世界模型可以讓AI與真實(shí)世界更好聯(lián)系在一起,到時(shí)不只虛擬世界生成工具會(huì)取得突破,機(jī)器人、AI決策也會(huì)地大踏步前進(jìn)。

編 輯:章芳
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來(lái)源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來(lái)源。
2.凡注明“來(lái)源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
中國(guó)信通院湯立波:“5G+工業(yè)互聯(lián)網(wǎng)”已進(jìn)入規(guī);l(fā)展新階段
精彩專題
2024通信業(yè)年終盤點(diǎn)
2024數(shù)字科技生態(tài)大會(huì)
2024年度中國(guó)光電纜優(yōu)質(zhì)供應(yīng)商評(píng)選活動(dòng)
2024全球6G發(fā)展大會(huì)
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱: 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像