首頁>資訊 >
黃仁勛把自己做成了虛擬娃娃 2021-11-10 16:52:16  來源:36氪

英偉達(dá)是推出黃仁勛手辦了嗎???

看上去還挺可愛的呢。

不過事情可沒有這么簡單,接下來這一幕或許就會讓你大為震撼。

因為,這個萌版老黃,是 會 動 的

不僅如此,他還能說會道,上知天文下知地理的那種。

氣候變化帶來的最大威脅是什么?天文學(xué)家如何尋找行星?蛋白質(zhì)在細(xì)胞中的作用是什么?

這些問題通通難不倒他,簡直是行走的百科全書。

而且連說話的聲音都是老黃同款,反差感極大。

所以,這么一個集可愛智慧與成熟男人魅力的化身,到底是什么來頭???

老黃的AI化身

以上這個萌物,當(dāng)然不是手辦,但也不是機(jī)器人,甚至你都無法摸到它。

這其實是老黃在GTC 2021上發(fā)布的虛擬人形象——Toy-Me。

它最擅長的事情就是和人聊天,可以快速回答人們提出的問題。

怎么有點語音助手那味兒了?

還真是,這不老黃還帶來了一個Toy-Me的同類,它就是一個可以引導(dǎo)顧客點餐的餐廳客服虛擬形象。

屏幕中這個小機(jī)器人,可以通過語音識別、眼神追蹤來推斷顧客的意圖,并能在2秒左右作出反應(yīng),回答顧客提出的問題或要求。

并且還放在更多場景里,比如自動駕駛

小機(jī)器人能夠在和駕駛員溝通后,調(diào)整車輛的行駛模式,搖身一變成為小管家。

而除了這些可愛的虛擬助手,老黃的“虛擬大法”還用在了視頻會議上。

平常我們視頻會議時,難免會出現(xiàn)需要低頭看手機(jī)、或者查看其他窗口的情況,這會造成不好的觀感。

由此,英偉達(dá)就做出了一個虛擬的畫像,讓人們即使沒有注視屏幕時,也能保持和屏幕的眼神交流。

并且還能將人們講的話實時翻譯成多種語言,聲音也會貼合本人原聲

背后全是英偉達(dá)自家技術(shù)

以上這些所有炫酷的效果,其實都來自于英偉達(dá)在GTC 2021上發(fā)布的一個新平臺——NVIDIA Omniverse Avatar

(就是阿凡達(dá)那個Avatar)

它可以讓人們可以在此創(chuàng)造不同的虛擬形象,還是有光追的那種哦。

看老黃眼鏡上的反光

這背后當(dāng)然也需要多種技術(shù)的支持,比如語音識別、自然語言理解、計算機(jī)視覺等等。

其中最讓人眼前一亮的,莫過于軟件開發(fā)包Riva。

它能識別多種語言的語音,還能生成類人聲音。

據(jù)英偉達(dá)官方介紹,Riva只需要30分鐘的音頻數(shù)據(jù),就能合成出相似的語音效果。

Q版老黃的聲音、視頻會議中實時翻譯后保持原聲,靠的都是這項技術(shù)。

而能讓“黃仁勛”陪你聊星辰大海,就要靠Megatron 530B了。

其實就是一個月以前發(fā)布的全球最大規(guī)模NLP模型威震天-圖靈(Megatron Turing-NLG)。

5300億參數(shù)、4480塊英偉達(dá)A100 GPU訓(xùn)練后,該模型能夠很好識別、理解和生成人類語言。

官方介紹,Megatron 530B可以在很少或沒有訓(xùn)練的情況下完成句子、回答主題廣泛的問題、總結(jié)長而復(fù)雜的故事、翻譯成其他語言,并應(yīng)對許多它未接受過專門訓(xùn)練的情景。

除此之外,推薦引擎NVIDIA Merlin可以讓虛擬助手提出明智的建議。

計算機(jī)視覺框架NVIDIA Metropolis能夠賦予虛擬形象感知能力。

生動自然的動畫形象則由NVIDIA Video2Face和Audio2Face?支持。

當(dāng)然,要把這些都結(jié)合在一起,最離不開的就是Omniverse。

它能跨平臺支持所有用戶的物理渲染、模擬和仿真,還能讓創(chuàng)作者、審核者在任何地方,只通過軟件應(yīng)用就在一個共享的虛擬世界中進(jìn)行合作。

在Omniverse里,可以做火山模擬、可以構(gòu)建虛擬工廠、也能還原一個老黃的廚房。

國內(nèi)央視的《飛向月球》太空紀(jì)錄片,也同樣有用到Omniverse,尤其是里面的數(shù)字人:

參考鏈接:https://nvidianews.nvidia.com/news/nvidia-announces-platform-for-creating-ai-avatars

本文來自微信公眾號“量子位”(ID:QbitAI),作者:明敏,36氪經(jīng)授權(quán)發(fā)布。

關(guān)鍵詞: 娃娃 黃仁勛

相關(guān)閱讀:
熱點
圖片 圖片