首頁>資訊 >
李嘉誠連投3輪、軟銀匆忙入局,大熱賽道最成功的創(chuàng)企竟是它? 2022-04-20 12:37:57  來源:36氪

幾乎每個人的智能手機都配備了語音AI助手。

你可能和ta定過鬧鐘、查過資料、甚至玩成語接龍或者斗過嘴?,F(xiàn)在,想象一下,如果你的Siri此刻擁有了一個人類形象,ta會是什么樣子?你會更加親近ta嗎?

這正是一眾數(shù)字人創(chuàng)企正在嘗試的事情。近日,一向?qū)C器人硬件有所偏好的軟銀,相中了一家特別的數(shù)字人創(chuàng)企,領(lǐng)投了該公司的7000萬美元融資。有了這筆資金,公司的總投資已達(dá)1.35億美元,其中,李嘉誠旗下維港投資的身影出現(xiàn)在3次投資之中。

這家公司的名字就野心十足——Soul Machines,有一絲要在機器上復(fù)刻人類靈魂的意味。更早之前A輪融資,這家公司便獲得來自李嘉誠旗下的維港投資(Horizons Ventures)和Iconiq Capital共750萬美元資金注入。

Soul Machines正在向世界輸出一批數(shù)字人,并希望這些有情感的虛擬AI們,能夠進(jìn)一步融入人類的真實世界。

未來幾年,從銀行到商店客服,從手機到汽車,從視頻網(wǎng)站到社交平臺,這群新的物種很可能變得無處不在。

那么,接下來,Soul Machines會是全世界最成功的數(shù)字人供應(yīng)商嗎?

圖丨Soul Machines官網(wǎng)展示的數(shù)字人

01 拿過奧斯卡獎的創(chuàng)始人

首先,打造一個數(shù)字人和培養(yǎng)一名人類難度自然是不可同日而語,但可不要小瞧一個數(shù)字人的誕生。

按照大的技術(shù)方向拆解的話,一個基礎(chǔ)的數(shù)字人將包括動作捕捉、渲染建模、AI能力的注入等前沿技術(shù)。目前世面上的數(shù)字人供應(yīng)商們,也可以按照上述3個不同側(cè)重方向進(jìn)行簡單分類。

其中,動作捕捉和渲染建模主要決定了一個數(shù)字人的形象,而AI能力則負(fù)責(zé)塑造數(shù)字人與人類交互時的反應(yīng)。

Soul Machines的創(chuàng)始人——Mark Sagar——則是少有的兼具這些方面從業(yè)背景的人。

Mark Sagar 是電影《阿凡達(dá)《金剛》蜘蛛俠2》背后的靈魂人物。憑借他和他的團(tuán)隊在這些電影中的虛擬人物技術(shù),他曾于2010年和2011年獲得奧斯卡頒發(fā)的科技獎。

更早之前,在于奧克蘭大學(xué)生物工程學(xué)院動畫技術(shù)實驗室任主任期間,他就開始進(jìn)行能夠自主互動的動畫系統(tǒng)的開發(fā),以助力下一代人機互動和面部動作技術(shù)的發(fā)展。

以自家女兒為原型,Mark Sagar帶領(lǐng)動畫技術(shù)實驗室研發(fā)出一個“永生”于屏幕中的數(shù)字寶寶—— Baby X,這個寶寶擁有一個數(shù)字大腦,可以感知、學(xué)習(xí)、進(jìn)步和交流,基于生物仿真原理,它的形象是一個18月左右的嬰兒樣貌,其面部表情會隨著思想、認(rèn)知、情緒的變化而改變,且可以傾聽并對語言給出表情和動作上的反饋。雖然現(xiàn)在我們已經(jīng)對這樣的虛擬形象不陌生,但是在2016年,開發(fā)出這樣一個具有情感響應(yīng)功能、有著個性和特色的虛擬人,實屬新鮮。

圖 | Baby X (來源:Fanatical Futurist YouTube)

2016年,一個特別的機會降臨到Mark Sagar身上。李嘉誠基金會成員參觀奧克蘭大學(xué)時,Mark Sagar和他的Baby X項目被安排到了行程之中。那次展示相當(dāng)成功,之后為Mark Sagar的公司Soul Machine帶來了維港投資的資金:同年12月,維港投資宣布,和Iconiq Capital牽頭Soul Machines的750萬美元A輪融資。

不過,Soul Machines為他們的客戶提供的產(chǎn)品,卻不是再是這個“數(shù)字小嬰兒”,而是更成熟的數(shù)字人。

Mark Sagar和他的團(tuán)隊看到了數(shù)字人在增強公司品牌體驗上的潛力。面向企業(yè)提供定制化的數(shù)字人是Soul Machines成立之后的重心。

他們想要解決這樣一個基本問題:大部分公司與C端用戶的最主要的互動,依賴應(yīng)用程序和網(wǎng)站進(jìn)行,那么,企業(yè)如何在日益數(shù)字化的世界中塑造個人品牌體驗?

對于這一問題,Soul Machines認(rèn)為答案是數(shù)字化勞動力——數(shù)字人。

理想情況下,數(shù)字人在一天中的任何時候使用任何語言提供服務(wù),并能很好地模仿人類體驗,使人類產(chǎn)生情感反應(yīng),最終提高品牌忠誠度。當(dāng)C端用戶與Soul Machines提供的數(shù)字人互動時,還可以收集C端用戶面部表情和情緒反應(yīng)方式信息,匿名化后用于訓(xùn)練數(shù)字人背后的數(shù)字大腦,以便它持續(xù)解釋并改進(jìn)反應(yīng)。

這就像與虛擬銷售員交談。

舉個例子,作為體驗的一部分,你可以在電子商務(wù)平臺購買護(hù)膚品,并有機會與智能護(hù)膚顧問交談。特別是在疫情期間,我們發(fā)現(xiàn)一個關(guān)鍵問題是,越來越多的購物行為和體驗品牌的方式是在數(shù)字世界中完成的。

“傳統(tǒng)上,數(shù)字世界具有某種業(yè)務(wù)主導(dǎo)性,甚至聊天機器人也具有很強的針對性,你輸入一個問題,就會得到對應(yīng)的回應(yīng)。促使我們思考的是,應(yīng)該如何想象人類與未來所有數(shù)字世界的互動?”公司聯(lián)合創(chuàng)始人兼首席商務(wù)官Greg Cross曾如此表示。

02 Soul Machines的數(shù)字人方法論

目前,不少重視線上購物體驗的國際品牌已經(jīng)開始和Soul Machines進(jìn)行這種嘗試。

比如雀巢。Soul Machines為它打造了“Ruth”,一個由AI驅(qū)動的烘焙老師,可以回答關(guān)于烘焙的基本問題,并根據(jù)客戶廚房里的材料幫助他們找到適用的食譜。除了雀巢以外,梅賽德斯奔馳、SKI-II和索尼也都和Soul Machines定制了它們的數(shù)字人。

圖丨Soul Machines的企業(yè)用戶分布行業(yè)

值得一提的是,Soul Machines還與世界衛(wèi)生組織合作,創(chuàng)建了Florence,一個虛擬衛(wèi)生工作者,可以全天候為那些試圖戒煙或了解新冠疫情的人提供咨詢服務(wù)。Florence的存在,也預(yù)示著數(shù)字人在遠(yuǎn)程醫(yī)療領(lǐng)域的潛在應(yīng)用能力,比如,對于更喜歡現(xiàn)場視頻體驗的患者,數(shù)字人可以幫助提供一定程度的隱私和舒適性,讓患者以一種舒服的方式提出敏感問題,從而使醫(yī)生能夠處理更多醫(yī)療情況。

圖源:Twitter

軟銀投資顧問公司投資總監(jiān)Anna Lo表示,Soul Machines的數(shù)字人解決方案在服務(wù)行業(yè)尤其受到青睞。這些行業(yè)中的企業(yè)希望增強在線客戶服務(wù)體驗,而不僅僅是基于文本的聊天或純音頻電話,“借助自主動畫,Soul Machines的定制數(shù)字人是一個有用的客戶獲取工具?!?/strong>

數(shù)據(jù)顯示,使用了Soul Machines的數(shù)字人之后,有客戶的C端用戶的轉(zhuǎn)化率平均提高了4.6倍,用戶滿意度提高了2.3%。在Soul Machines與SK-II的合作中,客戶在與數(shù)字人“Yumi”互動后,購買的可能性提高了兩倍。

這種直接收益之外Greg Cross則指出數(shù)字人對于企業(yè)的另一個好處還在于,對于消費者來說,許多數(shù)字助理可能感覺更像是一個噱頭而不是一個有用的工具,但這些助手允許公司收集客戶的第一方數(shù)據(jù)。這些數(shù)據(jù)可用于獲取和留住客戶并增加更多價值,而不是花巨資從社交媒體平臺或谷歌廣告聯(lián)盟那里購買這些數(shù)據(jù)。

目前,這家公司的團(tuán)隊成員由 AI 研究人員、神經(jīng)科學(xué)家、心理學(xué)家、藝術(shù)家共同組成,既提供我們上文提到的面向企業(yè)的定制化數(shù)字人業(yè)務(wù),也提供標(biāo)準(zhǔn)化數(shù)字服務(wù),用戶可以從Digital DNA Studio中選擇標(biāo)準(zhǔn)化的數(shù)字人(長相、聲音、12+語言、性格、會話能力等等)應(yīng)用到網(wǎng)站上,并監(jiān)測數(shù)字人的流量。

當(dāng)然,Soul Machines設(shè)想用數(shù)字人改善品牌線上體驗的種種,這些事情成立的一個大前提是數(shù)字人本身能夠提供好的使用體驗。

事實上,正如語音助手市場早期常給人留下“人工智障”的笑料一樣,眼下初出茅廬的數(shù)字人產(chǎn)業(yè),其實也有著很大的改善空間,核心在于更快地持續(xù)提升人機交互體驗。

為了能夠衡量數(shù)字人產(chǎn)品的進(jìn)展,Soul Machines撰寫了一份白皮書,提出了一個由五個級別組成的數(shù)字人進(jìn)化框架:

0級,即“無自主權(quán)“,只是一個錄制的動畫,就像一部卡通片。

第1級第2級,涉及了更多理解人類反應(yīng)并作出更真實表現(xiàn)的動畫。此處可以想象一下,《阿凡達(dá)》或《指環(huán)王》等電影中,動畫人物如何模仿真實演員的動作。(比如實時形象生成上,數(shù)字人的口型或表情略為僵硬等還是業(yè)內(nèi)尚未解決的大問題)

第3級第5級,則屬于實時的、動態(tài)生成的、具有內(nèi)容感知力的數(shù)字人。

Soul Machines認(rèn)為自己目前處于第3級,即"認(rèn)知訓(xùn)練的動畫(CTA)系統(tǒng),該系統(tǒng)使用算法來生成一組動畫,而不需要明確的作者。作者被專注于定義內(nèi)容和角色范圍的AI訓(xùn)練師。系統(tǒng)會告知訓(xùn)練師需要改進(jìn)的領(lǐng)域。

Cross介紹,Soul Machines正在努力實現(xiàn)第4級自主性,或“基于目標(biāo)的形象”。該系統(tǒng)在訓(xùn)練師的指導(dǎo)下嘗試新的交互,并從每個交互中學(xué)習(xí)。這方面的一個近似的應(yīng)用例子是虛擬AI助手,但擁有實時形象的虛擬AI助手更接近Soul Machines的設(shè)定。

最近,Soul Machines就宣布了一個更大膽的計劃,他們打算建立一個名人虛擬孿生名錄。

去年開始,該公司與洛杉磯湖人隊的籃球運動員 卡梅羅·安東尼合作,創(chuàng)造了他的數(shù)字人形象。更早之前,說唱歌手 Will.I.am也和Soul Machines進(jìn)行了類似的合作。

圖源:RNZ

沒錯,Soul Machines還設(shè)想了一個人類可以自由創(chuàng)建自己的數(shù)字人的世界。“我們非常有可能在未來的某個時間創(chuàng)造出自己的數(shù)字孿生體,并且能夠通過與他們在線互動來訓(xùn)練這些孿生體,”Cross說。

不知道作為讀者的你有沒有心動,想要馬上嘗試打造虛擬世界中的另一個“你”。至少,作者本人已經(jīng)開始幻想,我的數(shù)字人化身能代替我上班碼字。

文末互動:

你對虛擬數(shù)字人這個新興產(chǎn)業(yè)怎么看呢?你想要個數(shù)字孿生體嗎?

首圖來源:SIMENS

關(guān)鍵詞:

相關(guān)閱讀:
熱點
圖片 圖片