首頁>資訊 >
36氪專訪 | 騰訊“小諍”:不當(dāng)偶像網(wǎng)紅的虛擬人還能做什么? 2021-11-11 18:22:41  來源:36氪

文 | 王毓嬋 編 | 張信宇

11 月 7 日,“進(jìn)入外太空”將近 5 個(gè)月后,小諍傳回了她行走在火星表面的視頻。這條視頻展示了火星地表的景色和氣象變化,在 B 站獲得了 15 萬播放和 700 多條評(píng)論。

小諍的身份是“新華社數(shù)字記者”、“全球首位數(shù)字航天員”,她由新華社媒體融合生產(chǎn)技術(shù)與系統(tǒng)國家重點(diǎn)實(shí)驗(yàn)室與騰訊互娛旗下 NExT Studios 聯(lián)合打造,首次亮相于 6 月 17 日神舟十二號(hào)載人飛船發(fā)射的當(dāng)天。按照規(guī)劃,她未來會(huì)替代真人記者,完成在火星的新聞報(bào)道任務(wù)。

火星上的小諍

“這次火星之旅,是在多場景數(shù)字人資產(chǎn)運(yùn)用取得了一定積累之后,面向下一階段——‘大規(guī)模可交互數(shù)字場景’開展的關(guān)鍵嘗試。你可以說它面向全真互聯(lián)網(wǎng)的超級(jí)數(shù)字場景雛形?!盢ExT Studios 新技術(shù)研發(fā)中心副總監(jiān)葛誠說。

為小諍提供技術(shù)支持的 NExT Studios (官方稱作“騰訊互娛新體驗(yàn)與技術(shù)部”)是一家騰訊互娛旗下的電子游戲開發(fā)商,于 2017 年 4 月在中國上海成立。NExT Studios在創(chuàng)作超寫實(shí)數(shù)字航天員之前,還發(fā)布過實(shí)時(shí)高保真數(shù)字人 Siren(塞壬)等。

NExT Studios 新技術(shù)研發(fā)中心副總監(jiān)葛誠參與了對小諍和塞壬等數(shù)字人的塑造工作,也見證了近兩年來該領(lǐng)域技術(shù)水平的提升——2017 年,為了創(chuàng)作塞壬,NExT Studios 花了四個(gè)跨國團(tuán)隊(duì)將近一年的時(shí)間。而今年,小諍從無到有,只用了 NExT Studios 15 名工程師的 3 個(gè)月。

小諍

以下為 36 氪與葛誠的采訪實(shí)錄:

從代碼到火星——小諍的異世界之旅

36氪:小諍在火星的這一期視頻是如何誕生的?Next Studios 做了哪些工作?

葛誠:這期高沉浸火星場景視頻主要圍繞小諍探秘火星展開,新華社負(fù)責(zé)總策劃、腳本分鏡設(shè)計(jì)以及人工智能語音合成等工作;NExT Studios 負(fù)責(zé) 3D 資產(chǎn)制作,場景搭建,特效仿真,音頻制作,渲染合成等。

36氪:你們 2017 年創(chuàng)作塞壬時(shí)投入了很大的時(shí)間和人力成本,今年創(chuàng)作小諍就快了很多,效率是怎么提升的?

葛誠:可以從兩個(gè)方面解釋:一是塞壬追求的是和真人一模一樣,而小諍是超寫實(shí),即 Artist 以真人為基礎(chǔ)加以創(chuàng)作,所以她其實(shí)并不需要像某個(gè)真人,省去了不少 LookDev 的工程量;二是我們 2018 年做完塞壬之后,搭建了一條數(shù)字人制作管線 xFaceBuilder?。

從建模、綁定到動(dòng)畫,這條管線貫穿了數(shù)字人最關(guān)鍵的人臉制作的流程。xFaceBuilder? 幫我們省下了很多時(shí)間,所以我們僅僅花了兩個(gè)半月,就為小諍做出了第一個(gè)視頻。

36氪:在新華社的 B 站視頻封面上寫著一行字“按任意鍵進(jìn)入游戲”,這是什么意思?未來普通人能夠跟小諍有更多互動(dòng)嗎?

B站視頻封面截圖

葛誠:高沉浸互動(dòng)數(shù)字場景是個(gè)有魅力的方向,借助 AI 和實(shí)時(shí)圖形技術(shù),我們希望能讓普通人也能和高沉浸的數(shù)字內(nèi)容互動(dòng)。

36氪:小諍此次傳回的行走在火星表面的視頻看起來比之前復(fù)雜得多,Next Studios 是如何完成場景制作的?

葛誠:這次是我們第一次使用 UE5 實(shí)時(shí)出片,主要探索的是大場景、海量高解析度模型在 UE5 中的極限表現(xiàn)。角色資產(chǎn)的制作流程上,我們還是依靠自研的 xFaceBuilder 和 xMoCap(基于光學(xué)動(dòng)捕的動(dòng)畫生產(chǎn)管線)兩套管線,場景制作我們引入了 Houdini 過程化資產(chǎn)生成(PCG)能力,加速了場景資產(chǎn)的生產(chǎn)效率。

這次整個(gè)場景和角色資產(chǎn)從無到有,用了不到 3 個(gè)月時(shí)間,而且大量資產(chǎn)是可復(fù)用的,可能會(huì)用于未來的實(shí)時(shí)互動(dòng)場景。

中國虛擬人的發(fā)展現(xiàn)狀

36氪:xFaceBuilder 可以被應(yīng)用在游戲開發(fā)中嗎?

葛誠:可以。我們本身就是希望這套流程既可以生產(chǎn)數(shù)字人,也可以生產(chǎn)游戲角色。實(shí)際上,騰訊已經(jīng)有項(xiàng)目開始使用 xFaceBuilder 完成了游戲角色的建模、綁定和動(dòng)畫制作等工作。

36氪:未來 xFaceBuilder 有可能會(huì)被開放出來嗎?

葛誠:目前在騰訊內(nèi)部它其實(shí)已經(jīng)是一個(gè)開放狀態(tài)了。但我們還需要打磨,因?yàn)樗粌H要支持虛擬人,還要支持游戲角色,這個(gè)打磨的過程可能需要一兩年。

36氪:從技術(shù)角度來說,創(chuàng)造虛擬人的底層基礎(chǔ)設(shè)施已經(jīng)比較完善了。最近有不少虛擬人網(wǎng)紅出現(xiàn),其中有些虛擬人甚至是只靠一個(gè)人的力量被創(chuàng)作出來的。未來創(chuàng)作和運(yùn)營虛擬人會(huì)成為一件沒有技術(shù)門檻的事情嗎?

葛誠:整個(gè)虛擬人的制作分兩個(gè)階段,先是模型和綁定的制作,再是動(dòng)畫制作。前一個(gè)階段相當(dāng)于把模具做好,后一個(gè)階段相當(dāng)于用模具來生產(chǎn)產(chǎn)品。

把靜態(tài)模型做到“好看”并不難。在電影 CG 行業(yè),一些資深的模型師一個(gè)人就能調(diào)出非常好看、非常像真人的模型,吃的是模型師的手上功夫。更難的還是讓它動(dòng)起來也很自然傳神,這就需要精細(xì)的動(dòng)畫技術(shù),比如:物理仿真,綁定,動(dòng)捕。我們在電影里經(jīng)常能看到很像真人的CG角色,但讓它實(shí)時(shí)地動(dòng)起來就很困難。

小諍的面部細(xì)節(jié)

其次是動(dòng)畫制作。如果你想獲得非常寫實(shí)的畫面,就需要有比較好的動(dòng)捕設(shè)備、算法流程、動(dòng)畫TA、動(dòng)畫師。所以要讓動(dòng)畫做出足夠高的可信度也是一件很高成本的事。

今年四月,英偉達(dá)在發(fā)布會(huì)上展示了“虛擬黃仁勛”,但畫面僅有約 15 秒。有人問:既然他們大費(fèi)周章做了數(shù)字人,為什么不把老黃的整個(gè)演講用虛擬畫面呈現(xiàn)出來呢?科技目前還沒有進(jìn)步到可以非??焖偾业统杀镜厣a(chǎn)出電影級(jí)的動(dòng)畫。

當(dāng)然,國內(nèi)外很多 Researcher 和工程師都在為這個(gè)目標(biāo)努力。比如 Epic 的 Metahuman 可以快速定制出高質(zhì)量的角色,但是目前 Metahuman 有限的模板庫還是很難滿足模型師的創(chuàng)作需求。比如用 Metahuman 就很難捏出數(shù)字航天員小諍。

36氪:跨越恐怖谷(注:恐怖谷,由于機(jī)器人與人類相似,兩者的細(xì)微差別會(huì)顯得非常刺眼恐怖,使人有面對僵尸的感覺。)還是一個(gè)困難的工作嗎?

葛誠:實(shí)時(shí)互動(dòng)的寫實(shí)向數(shù)字人,跨越恐怖谷依然是件很困難的工作,即便塞壬也就是剛跨過了恐怖谷的邊緣。專業(yè)人士仔細(xì)看,還是可以看出來她不像真人的地方。當(dāng)數(shù)字人趨近恐怖谷邊緣時(shí),普通人對數(shù)字人的恐懼感就趨向輕微。

36氪:小諍可以算是 NExT Studios 第一個(gè)投入實(shí)用場景的虛擬人,之前為什么沒有對塞壬進(jìn)行商業(yè)化運(yùn)營?虛擬人的商業(yè)化時(shí)機(jī)已經(jīng)成熟了嗎?

葛誠:我們小團(tuán)隊(duì)在做前沿探索的時(shí)候,不會(huì)特別去考慮它的應(yīng)用場景,因?yàn)檫@會(huì)限制探索的方向和深度。一旦確定某個(gè)方向具備了未來商業(yè)化的可能,我們會(huì)用 3-5 年的時(shí)間去打磨這條線上的技術(shù)。之前做塞壬和 Matt(NExT Studios 的另一個(gè)虛擬人)的時(shí)候,其實(shí)都沒有過于糾結(jié)商業(yè)化,但是接下來做的一些新角色,我們會(huì)優(yōu)先考慮跟商業(yè)化、運(yùn)營相關(guān)的技術(shù)。

從 2017 年開始,國內(nèi)已經(jīng)有不少企業(yè)加入了虛擬偶像賽道,這個(gè)賽道目前來看是紅紅火火,但實(shí)際上平均利潤率還是比較低的。大家并沒有找到特別好的方式可以讓一個(gè)角色像真人 IP 一樣運(yùn)轉(zhuǎn)起來,這受限于技術(shù)、內(nèi)容,更多的是商業(yè)模式還需要進(jìn)一步探索。

但是我相信虛擬偶像產(chǎn)業(yè)目前還處在非常初級(jí)的階段。接下來一定會(huì)有一個(gè)世界,可能是Metaverse(元宇宙),來承載風(fēng)格各異的虛擬偶像。在那個(gè)世界里,每位虛擬人都擁有自己的 ID,也許還會(huì)有建立在 NFT(非同質(zhì)化代幣)上的交易。這樣虛擬人就能與真人、真實(shí)世界建立更完整的商業(yè)關(guān)系和情感紐帶。

現(xiàn)在各家單打獨(dú)斗做虛擬人,今天做個(gè)屏保,明天做個(gè)直播,后天帶個(gè)貨……從 IP 角度來說,其實(shí)尚未形成虛擬 IP 成長的最好土壤,也就是“如同真實(shí)世界的數(shù)字世界”。

36氪:目前來看,虛擬人還是被集中應(yīng)用在了娛樂產(chǎn)業(yè)中。除了當(dāng)偶像,虛擬人未來可能還會(huì)有什么樣的應(yīng)用場景?

葛誠:未來虛擬人可能會(huì)成為人們遠(yuǎn)程溝通的媒介,但它不是現(xiàn)有視頻聊天軟件的衍生品。因?yàn)楫?dāng)一個(gè)可信的虛擬世界徐徐展開的時(shí)候,虛擬 IP 不再是現(xiàn)實(shí)世界中的一個(gè)附加品,而是虛擬世界中“實(shí)實(shí)在在”的存在。兩個(gè)世界的界限也會(huì)漸漸打破。當(dāng)下,最重要的是精進(jìn)數(shù)字內(nèi)容技術(shù),在大眾間打造高可信度的社交紐帶。我們在朝著這個(gè)方向努力。

關(guān)鍵詞: 專訪

相關(guān)閱讀:
熱點(diǎn)
圖片 圖片