據(jù)了解,Meta(META.US)的團隊構(gòu)建了一個“大型重建模型(LRM)”,該模型僅需四張自拍照,就能在幾分鐘內(nèi)生成一個可動的、逼真的頭部虛擬化身。
快速創(chuàng)建虛擬化身
到目前為止,Meta 研究虛擬化身的生成和動畫技術(shù)至今已有六年多時間了,盡管 Avat3r 系統(tǒng)生成虛擬化身所需的數(shù)據(jù)量和計算量非常低,但它遠不適合用于實時渲染。
據(jù)研究人員稱,從技術(shù)層面來看,Avat3r系統(tǒng)建立在大型重建模型(LRM)的概念基礎(chǔ)之上,就像大語言模型(LLMs)處理自然語言那樣,它利用了一種變換器來處理三維視覺任務,這通常被稱為視覺變換器(ViT)。
在人工智能領(lǐng)域,Meta Avat3r 系統(tǒng)的方法為未來指明了一條充滿希望的道路,終有一天,頭戴設備的用戶或許只需拍幾張自拍照,再經(jīng)過幾分鐘的生成時間,就能快速創(chuàng)建出一個逼真的虛擬化身。
事實上,虛擬人是指利用數(shù)字技術(shù)打造的、模擬人類特征并存在于非物理世界的虛擬人物。伴隨人工智能掀起的變革浪潮,虛擬人、虛擬化身等前沿領(lǐng)域正持續(xù)演進,打破了時空界限的特質(zhì),令其靈活因應復雜多變的市場需求。
借助5G、AI、VR等新一代信息技術(shù)的蓬勃發(fā)展,數(shù)字人的精細度和智能化水平不斷提升,一大批數(shù)字人走上不同工作“崗位”,加速融入日常生活,實現(xiàn)了泛娛樂、零售、直播、教育、培訓等不同范疇的服務體驗升級。
DeepSeek助力“AI數(shù)字人”
而今特別在DeepSeeK數(shù)字化浪潮中,更是高效提升虛擬人制作效率。運用“DeepSeek+”融合技術(shù),高效制作周期從3天縮短至2小時。同時節(jié)省主播出鏡和視頻拍攝的成本和時間,以低成本、高效率讓節(jié)目宣傳效果迅速提升。
因此,一些業(yè)內(nèi)專家指出,AI技術(shù)的廣泛介入,極大提升了數(shù)字人的交互能力、內(nèi)容生成能力及智能化水平。目前,虛擬偶像、虛擬主播、數(shù)字員工已成為數(shù)字人中商業(yè)化應用最好、最具人氣的類別。機構(gòu)樂觀預計,2025年中國數(shù)字人核心市場規(guī)模將達480.6億元,帶動產(chǎn)業(yè)市場規(guī)?蛇_6402.7億元。
微美全息探索DeepSeek+虛擬人應用
在當今數(shù)字化迅速發(fā)展的時代,虛擬人技術(shù)的應用已經(jīng)滲透到各個領(lǐng)域,正在引起越來越多的關(guān)注。公開資料顯示,微美全息(WIMI.US)作為全球領(lǐng)先虛擬數(shù)字人綜合解決方案供應商,在行業(yè)的制作方面擁有豐富經(jīng)驗,并且基于DeepSeek產(chǎn)生顯著的協(xié)同效應,加速了虛擬人市場的開發(fā),為各行各業(yè)構(gòu)建多樣化的應用路徑。
截止目前,微美全息結(jié)合DeepSeek的多模態(tài)交互能力,通過DeepSeek的技術(shù)賦能虛擬人,從單一形象展示升級為具備決策能力的交互主體,其應用場景從娛樂擴展至更廣泛的產(chǎn)業(yè)服務領(lǐng)域,推動虛擬人從“工具”向“生產(chǎn)力”轉(zhuǎn)型。
例如,微美全息通過DeepSeek開發(fā)了支持自然語言理解和實時交互的虛擬人主播,應用于電商直播場景。這類虛擬人可自動生成直播內(nèi)容、回答用戶問題,并模擬真人主播的肢體動作和表情,降低傳統(tǒng)直播對人力的依賴。在教育領(lǐng)域,推出虛擬擬教師能根據(jù)學生需求生成定制化教學內(nèi)容,并通過情感計算技術(shù)增強互動體驗。
總結(jié)
在技術(shù)滾滾潮流中,AI虛擬人正以驚人的速度重塑人類社會的交互范式,其高度智能化、多模態(tài)交互和高度定制化的特點,使其在多個領(lǐng)域具有廣泛的應用前景。這背后既是AI與DeepSeek大模型的技術(shù)躍遷,也映射著人類對情感投射、效率革命的雙重渴求。相信未來,隨著技術(shù)的不斷進步和應用場景的拓展,AI虛擬人將發(fā)揮出更加顯著的作用。