必讀視頻專題飛象趣談光通信人工智能低空經(jīng)濟5G手機智能汽車智慧城市會展特約記者

蘋果發(fā)布 LiTo 大模型:單圖生成 3D 對象,AI 高度還原多視角光影

2026年3月17日 09:21IT之家作 者:故淵

科技媒體 9to5Mac 昨日(3 月 16 日)發(fā)布博文,報道稱蘋果 AI 研究團(tuán)隊發(fā)布研究報告,攻克了 3D 重建領(lǐng)域的一項核心難題:僅通過單張平面圖像,就能重建出完整的 3D 對象。

該專利描述名為 LiTo(表面光場標(biāo)記化)的最新模型,打破了傳統(tǒng)方法需要多角度圖像輸入的限制,在重建 3D 對象之后,用戶切換不同觀察視角后,該模型生成的反光、高光等光影效果依然能保持高度的物理真實與一致性。

這項突破的核心在于對創(chuàng)新應(yīng)用“潛在空間”(Latent Space)。在機器學(xué)習(xí)中,潛在空間能將復(fù)雜信息壓縮成多維數(shù)學(xué)向量,從而大幅降低計算成本。

LiTo 模型首創(chuàng)了一種統(tǒng)一的 3D 潛在表示法,將隨機采樣的表面光場數(shù)據(jù)編碼為緊湊的向量集。這意味著模型無需死記硬背每一個視覺細(xì)節(jié),而是通過數(shù)學(xué)描述,同時掌握了對象的物理形狀以及光線與其表面交互的底層規(guī)律。

在具體運行機制上,LiTo 編碼器負(fù)責(zé)“壓縮信息”,將輸入圖像中的幾何結(jié)構(gòu)和視角相關(guān)的外觀特征,轉(zhuǎn)化為潛在空間中的精簡代碼。

隨后,解碼器執(zhí)行“逆向解壓”,利用這些底層代碼完整還原出 3D 對象。這種雙向機制讓模型能夠精準(zhǔn)復(fù)現(xiàn)復(fù)雜光照條件下的鏡面高光和菲涅爾反射等高級光影效果。

為打造該模型,蘋果研究人員使用了數(shù)千個在 150 個不同視角和 3 種光照條件下渲染的 3D 對象進(jìn)行高強度訓(xùn)練。系統(tǒng)通過不斷抽取小部分?jǐn)?shù)據(jù)樣本,訓(xùn)練解碼器在不同光照和視角下還原完整對象。

最終,模型具備了僅憑單張圖片就能預(yù)測其三維潛在表示的能力。在蘋果公布的官方對比測試中,LiTo 在多視角光影還原度上顯著超越了現(xiàn)有的 TRELLIS 模型。

編 輯:路金娣
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
推薦閱讀
  • 2026十大科技趨勢

    2026 十大科技趨勢,定義新一年的每一次突破。祝大家馬年大吉,馬到成功!初八啟新程,萬事皆順?biāo)欤?/P>[詳細(xì)]

精彩視頻

精彩專題

關(guān)于我們廣告報價聯(lián)系我們隱私聲明本站地圖

CCTIME飛象網(wǎng) CopyRight © 2007-2026 By CCTIME.COM

京ICP備08004280號-1 電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號

公司名稱: 北京飛象互動文化傳媒有限公司

未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像