“元宇宙(Metaverse)”無疑是2021年最熱門科技話題之一。從臉書的扎克伯格全面轉向元宇宙產(chǎn)業(yè),到國內(nèi)各大互聯(lián)網(wǎng)公司紛紛布局元宇宙板塊,再到游戲、社交、AR/VR、區(qū)塊鏈等只要跟元宇宙沾上一點邊的上市公司在股票市場一路高歌猛進……2021年,“元宇宙”可謂火遍全球。
那么,元宇宙究竟是一種什么樣的技術?元宇宙的到來會對我們普通大眾的生活產(chǎn)生什么樣的影響?元宇宙是否最終能夠實現(xiàn)?它到底離我們有多遠?帶著這些問題,今天一起來聊一聊。
實際上,元宇宙并非一項單一的新技術。“元宇宙”這個詞,更多地代表一種新的技術概念與方向。
虛實聯(lián)動的交互體驗,將引爆什么?
簡單來說,元宇宙可以被認為是一種新的互聯(lián)網(wǎng)技術框架,強調(diào)面向虛實融合的沉浸式交互體驗。
目前的互聯(lián)網(wǎng)體系,基本上是“虛”、“實”二元性的。
互聯(lián)網(wǎng)上的某個數(shù)字化的元素,實際上是現(xiàn)實世界中某個實體元素的簡單抽象。如何理解這句話?舉個例子,大家都已習慣線上購物。當我們在滑動智能手機上的購物頁面時,實際上,每個商品的圖標就是現(xiàn)實中供貨商貨架上所對應的實體貨品的符號表示。當然,這只是一種簡單的表示,它并不具備現(xiàn)實世界中所對應商品的豐富的物理屬性,如3D形狀、表面質(zhì)感、氣味、重量等。所以說,虛擬、現(xiàn)實這二元世界是被割裂的。
這種二元性,帶來了人們在交互體驗上的極大不適。
假設我想買個書桌,如果去實體店挑選,我一定會從各個角度好好觀察這個書桌是否滿足自己的審美,我會拉開抽屜看看里面是什么樣子,摸一摸桌面是光滑還是粗糙,甚至想看看它如果放在我的書房,會是什么樣的感覺。然而,這些基本而重要的用戶感官體驗,在當前的互聯(lián)網(wǎng)應用中多數(shù)無法實現(xiàn)。文字、圖片等符號信息并不能很好地代表用戶對背后的物理實體的具體感知與理解。從這個角度講,元宇宙技術,其實就是在虛擬世界中“再造”一個物理世界實體的深度拷貝,使其盡可能地具備現(xiàn)實世界中所對應實物的具體屬性,比如3D形狀、顏色、紋理、行為等(如果未來技術成熟,可能連觸感、嗅感都可以真實復現(xiàn))。
更重要的是,在元宇宙中,同一個實例在現(xiàn)實與虛擬世界中是高度聯(lián)動的。
比如,作為用戶的你可以在虛擬世界建立你的3D人物形象,包括容貌、體型、語言習慣、動作習慣等;你在真實世界做出什么動作、說什么話,在元宇宙中,你的虛擬形象也會同步做一樣的動作、說一樣的話。換言之,作為主體的你,不再是以一個“旁觀者”的角色,而是作為一個主角(在游戲中,我們稱為“第一人稱”)“代入”到虛擬世界的各種交互之中。
更進一步,虛擬世界中的各種人物、物品、場所等,可以無縫地與真實世界中的對應實體融合在一起,達到虛實融合、沉浸交互的效果。
元宇宙作為這樣一種新型互聯(lián)網(wǎng)的運營者,在管理形式上也不再區(qū)分實體與虛體,而是“二元合一”的運行模式,其所能帶來的體驗提升確實能給人類帶來無限遐想。
試想,如果能夠將大多數(shù)物理世界的實體復制一個在虛擬世界中可以被交互的虛擬拷貝,那么,目前人類大多數(shù)的生產(chǎn)生活活動,都可以在元宇宙的世界中毫無障礙地運行。因此,元宇宙也可以被認為是一種新的支持社交、娛樂、交易、辦公、生產(chǎn)、創(chuàng)作、生活的虛擬平臺。
真實世界的小明,如何在元宇宙中度過一天?
現(xiàn)在,我們可以大膽構想一下一個普通上班族在元宇宙中的一天。
小明是一家跨國汽車公司的產(chǎn)品設計經(jīng)理。早上,小明來到公司會議室,召開每天例行的工作進度交流會。當他帶上AR眼鏡后,在全世界其他辦公地點的同事已經(jīng)把小小的會議室“擠得滿滿的”(與會者的3D虛擬形象已經(jīng)和會議室場景融合)。大家熱烈討論,不時通過語言、肢體動作表達自己的立場、觀點、主意。在會議室中間的工作臺上,正展示著3D設計方案,設計師們通過簡單的手勢交互,不斷調(diào)整著產(chǎn)品的設計細節(jié)——從顏色到局部的形狀,不斷被優(yōu)化且設計結果能實時呈現(xiàn)在虛擬世界中。終于,方案敲定了,只要一鍵傳輸,就能發(fā)送至加工單位進行打樣。
散會后,稍感疲憊的小明來到自己的辦公室,接著帶上一個VR頭盔,選擇了一個秘密花園的場景,想讓自己放松一下。瞬間,他“來到”了一個陽光明媚、草綠花紅的寂靜花園中。環(huán)顧四周,看看這些美麗的花朵,毫無疑問,他的心情得到了些許治愈。很多人都幻想過這樣的情景,就是從現(xiàn)在的世界“跳”出去,來到一個世外桃源去清靜一下,哪怕1分鐘也好。元宇宙的技術,就給每個人打開了平行宇宙的大門,在單一物理宇宙中受限的種種可能,在平行宇宙中都可以找到相應的可以飛翔的翅膀。
當然,元宇宙世界的想象力是不受物理世界約束的。
可以想象,在小明的寂靜花園中,在高高低低的各色植物枝頭所掛著的,可能不是果實,而是各種各樣的商品;小明可以在花園中,隨意“選購”今天晚上要吃的東西、零食,一鍵支付。甚至,小明可以在某個枝頭,取下并“試穿”自己喜愛的衣服,一鍵切換到第三人稱視角觀賞自己穿上新衣服的樣子,決定買不買。當然,晚上小明下班時,所有在元宇宙中購買的商品,其實體產(chǎn)品早已快遞至家中了。
作為大眾,我們可以期待元宇宙即將給生活生產(chǎn)方式帶來的深遠影響。
沉浸式的體驗,將大大降低人與人、人與社群之間的溝通交流成本,縮短時空的距離。試想,如果人類絕大多數(shù)工作、會議可以在虛擬的、沉浸式的會場進行、那么全世界每年可以節(jié)省多少汽車和飛機的燃料使用與碳排放?!
由于萬物皆可在元宇宙找到對應的數(shù)字拷貝,溝通的邊界也因此被打破。在虛擬世界中,你可以跟你的寵物,甚至是毫無生命的物品進行擬人式的互動,生命的形式或許也能得到外延。對于設計、創(chuàng)造類的工作來說,在虛擬世界中,創(chuàng)作和生產(chǎn)效能也將得到極大提升,并且由于信息發(fā)布效率提升以及創(chuàng)作門檻的降低,使得人人都是元宇宙的內(nèi)容提供者。即使是傳統(tǒng)的制造業(yè)與農(nóng)業(yè),也將得益于虛擬化的“需求-設計-生產(chǎn)-物流”一攬子平臺支撐,真正做到定制化的生產(chǎn)。
“3D的互聯(lián)網(wǎng)”涉及哪些前端技術?
再從技術角度看,有業(yè)內(nèi)人士認為,元宇宙技術應該被理解為現(xiàn)有各種技術的組合升級,可以說是“3D的互聯(lián)網(wǎng)”。到目前為止,這仍是十分恰當和精妙的總結。元宇宙中所涉及的前端技術主要包括感知模塊、內(nèi)容創(chuàng)作模塊、以及真實感渲染模塊。
其中,感知技術主要包括對于環(huán)境和用戶主體的態(tài)勢感知。
前者主要是指對于場景進行三維重建,同時恢復顏色、紋理、光照、材質(zhì)等細節(jié),并且對于場景中所有的對象進行語義的理解,包括各對象的標簽屬性、場景中動態(tài)的人和物的動作行為等;后者主要針對用戶進行建模,實時恢復出用戶的位置、動作姿態(tài)、運動狀態(tài)等。目前高端的AR/VR眼鏡都帶有此類功能,經(jīng)常被稱為“6-DOF估計”,主流的SLAM技術可以同時恢復觀察者的姿態(tài)以及場景三維結構。不過,這些技術目前的精度和穩(wěn)定性都還不夠理想。
元宇宙的一個主要特點在于虛實融合。因此,虛擬內(nèi)容的生產(chǎn)技術是元宇宙的核心,不受制于物理世界約束的天量虛擬內(nèi)容的產(chǎn)生是價值創(chuàng)造的源泉。
由于交互實時性、高通量的要求,人工的內(nèi)容生產(chǎn),比如傳統(tǒng)的游戲、電影等,遠遠滿足不了元宇宙應用的需求。而基于人工智能的內(nèi)容生成技術是目前最炙手可熱的方向,基于深度學習,尤其是對抗生成(StyleGAN),BERT-Transformer(VQ)等技術。
目前計算機已經(jīng)能夠“無中生有”出人物與景色圖片、動作視頻、3D物品和建筑等數(shù)據(jù),不過,對于實時以及虛實融合的要求,目前的內(nèi)容生成技術在保真性、可編輯性方面還有相當長的路要走。
當然,作為元宇宙最終輸出端,渲染技術直接決定了使用者的沉浸式體驗質(zhì)量,而真實感渲染技術是元宇宙技術棧上的皇冠。真實感渲染技術目前多見于好萊塢頂級電影制作(如《復仇者聯(lián)盟》系列)以及大型3A游戲中,其核心技術要點就是通過光線追蹤等方法,對物理規(guī)則進行高精度仿真。
目前的光線追蹤技術已可做到以假亂真的全局光照,使得用戶感覺不到虛擬物品和周圍環(huán)境中的真實物體的光照違和感,而物理仿真則使虛擬的空間也符合近似真實世界的物理規(guī)則(流體、碰撞、運動等)。不過,受限于算力功耗等約束,目前這些技術尚未大規(guī)模運用于終端設備。另一方面,深度學習與傳統(tǒng)的光線追蹤、物理仿真技術的結合應運而生(例如:NERF、AI光場重建等),旨在減少仿真的復雜度從而實現(xiàn)端側落地。
除了上述描述的主要前端技術,在后臺支撐平臺運行的大規(guī)模超級計算技術,以及維持虛擬世界中高可靠信用體系的區(qū)塊鏈技術等也是元宇宙的重要技術支柱。
搭建元宇宙,有哪些技術難題有待突破?
不過,羅馬不是一天建成的。要想最終實現(xiàn)我們所期待的元宇宙,還有一系列技術難題有待突破。至少,目前以下幾個關鍵技術始終困擾著相關領域的科學家與技術開發(fā)人員。
1、新型顯示技術
沉浸式的體驗必然要求沉浸式的顯示技術,目前在AR/VR顯示領域,無論是顯示器件還是圖像處理與渲染算法,尚不能完全滿足元宇宙應用的技術指標要求。市面上主流的AR/VR顯示器件(主要是光學波導片)大多存在著重量大,功耗大,解析度差,色偏嚴重,常伴有眩暈感等問題,要獲得一款又輕又好的顯示模組,需要材料學與光學的重大突破。
2、算力約束
從計算架構角度看,元宇宙必然是一種“云-邊-端”協(xié)同的模式。然而,目前無論是云端還是終端,主流芯片的算力儲備遠遠滿足不了元宇宙應用的要求。特別是端側算力瓶頸巨大,這是因為端側不僅承擔了部分智能感知算法,且更重要的是承擔了最核心的虛實融合的真實感圖像渲染算法,這類算法算力要求巨大且要求超低功耗,目前主流的端側計算芯片均不滿足如此嚴苛的技術指標。
3、低時延通訊
元宇宙的核心在于無處不在、無時不在的交互,這些交互了產(chǎn)生天量的實時數(shù)據(jù)通訊需求。目前5G技術是否能夠完全滿足如此高帶寬、高并發(fā)的實時通訊,依然是一個未知數(shù),也許我們要等到6G甚至7G時代的到來才能圓滿解決這些問題。
4、新型傳感器技術
元宇宙應用對于用戶態(tài)勢感知的需求是前所未有的,對于用戶全維度的信息感知(例如外觀、位置、姿態(tài)、運動、各種生命體征、甚至心情、意圖等)需要輕便而高可靠的全系列新型可穿戴傳感器。
元宇宙將給我們帶來無限的可能,大眾可以準備擁抱它所帶來的生活和工作方式的改變,期待生活更加美好,人生更加精彩。
而對于相關的企業(yè)與投資機構,筆者在這里想說的是,與其熱衷于概念炒作,不如沉下心來積極投入到元宇宙相關支撐技術的研發(fā)投入中來。畢竟,如果能突破芯片、顯示器件、傳感器、計算架構等“卡脖子”的關鍵核心技術,未來才真正無可限量。
作者:倪冰冰(作者為上海交通大學電子系教授、計算機視覺專家、華為海思計算機視覺首席科學家)

返回列表