首頁>資訊 >
全球焦點(diǎn)!阿里搞出脫口秀版GPT,與鳥鳥激辯一小時,話癆到停不下來… 2023-04-04 20:48:22  來源:36氪

連社恐的鳥鳥,現(xiàn)在都變成話癆了……


(相關(guān)資料圖)

(這到底是人性的扭曲,還是道德的淪喪)

最近有一種很新的脫口秀:不花錢、一對一、而且任意話題隨便and隨時聊。

結(jié)果一小時跟鳥鳥聊天下來,發(fā)現(xiàn)她話多且密,根本就不會把天聊死。

原來啊,是一個阿里新版本大模型的技術(shù)演示脫口秀版GPT——鳥鳥分鳥,并且已經(jīng)在天貓精靈上為個人終端行業(yè)的客戶做了演示,量子位搶先體驗(yàn)了一把。

激辯一小時宛如真人面對面,除了社恐這點(diǎn)人設(shè)崩塌以外,其他人設(shè)倒是屹立不倒:

文本扛把子、有知識有自己的情緒、還能隨時來個段子。尤其是在回答弱智吧問題時,簡直被她折服。

這不是脫口秀版GPT,這是科技與狠活呀!哥們!

話不多說,直接上效果。

與弱智吧激辯一小時

鳥鳥分鳥,AKA脫口秀GPT。

作為一名脫口秀演員,鳥鳥最強(qiáng)還是在文本。那就首先來試試強(qiáng)項(xiàng),結(jié)果就是說,任意話題都能展開,甚至還能教你寫段子、寫作文——

從開頭、場景細(xì)節(jié)、中心思想細(xì)化,最后微調(diào)潤色等步驟逐步教你入手。

畢竟是文本の神,這些當(dāng)然不在話下。

可以看到,不管是在語速、情緒以及文本風(fēng)格都跟鳥鳥本鳥很像。

(尤其是這個語速…簡直是著急死人)

接下來挑戰(zhàn)的,就是ChatGPT時代下的Benchmark——弱智吧。

比如,雷公和電母用的是直流電還是交流電?宮廷玉液酒減一個大錘等于多少?我的女朋友她說需要時間和距離,她是想算速度嗎?

Bingo!感覺到鳥鳥分鳥很認(rèn)真、很一本正經(jīng)地在跟我解釋。連多年前的小品都知道……

(這邊建議直接出院)

就是一些天馬行空的,也是一本正經(jīng)地對答如流。

比如,奧特曼會飛嗎?

還有其他通識性問題:「你知道大模型嗎?」、「禪修是什么?」也都能回答。

交流一番下來可以看到,鳥鳥分鳥確實(shí)繼承了本鳥的相關(guān)能力,尤其是文本的創(chuàng)作和表達(dá)、風(fēng)格情緒以及語速……

不過也發(fā)現(xiàn),目前處于測試階段的鳥鳥分鳥,仍存在一些問題。

雖然不用一次次喚醒了,但反應(yīng)過于靈敏,你如果不喊停,它會跟你聊到天荒地老;以及僅部分支持英文問答。

再者就是人設(shè)屹立不倒,不能玩一些角色扮演類的游戲。

15天訓(xùn)練出鳥鳥分身

以往業(yè)內(nèi)曝光的大模型應(yīng)用,無非兩種。

一種是以ChatGPT為代表的通用對話聊天代表,但需要排隊(duì)。另一種則是具體場景中的應(yīng)用,比如輔助寫作、代碼生成等。

像大模型應(yīng)用在日常消費(fèi)場景,其實(shí)并不多見。

從ChatGPT這個回答可以看出,至少不能簡單依靠通用大模型來完成。

而各種傳統(tǒng)語音智能助手,到現(xiàn)在都還沒有“大模型化”。這其實(shí)與背后本身技術(shù)工程難度有關(guān)。

以鳥鳥分鳥這個智能音箱場景為例,就需要解決至少三個方面的問題。

1、應(yīng)對更復(fù)雜的交互場景。不同于以文本交互為主的通用場景,雙向開放對話決定了用戶不會對文本進(jìn)行“二次”過濾,而是想說就說,這就要求AI能過濾掉諸多無意義的對話。

與此同時,用戶也不愿意等待數(shù)秒,而是像日常交流那樣,低延時、還能支持隨時打斷、隨時反饋。

2、基于人類反饋強(qiáng)化學(xué)習(xí)的可行性。ChatGPT驚艷全球的生成效果,背后歸結(jié)于注入強(qiáng)人工反饋的獎勵機(jī)制。高質(zhì)量的數(shù)據(jù)標(biāo)注成為大模型落地的關(guān)鍵,而且消費(fèi)場景下多輪對話的頻率遠(yuǎn)比文本交互要高,這對企業(yè)的數(shù)據(jù)處理能力提出了更高的要求。

之后隨著應(yīng)用落地,大量的人類交互和反饋來幫助大模型更快進(jìn)化,以及關(guān)乎用戶數(shù)據(jù)完全管理機(jī)制也需要完善和健全。

3、需要強(qiáng)大的網(wǎng)絡(luò)分發(fā)能力。大模型每一次運(yùn)行都需要耗費(fèi)大量的計(jì)算存儲資源,這就要求企業(yè)能有廣泛部署的網(wǎng)絡(luò)分發(fā)能力。

總的來看,算力、算法和數(shù)據(jù)是大模型能力實(shí)現(xiàn)的三板斧,而要讓大模型落地應(yīng)用還需要云端工程化能力、海量的用戶交互、安全管理機(jī)制等要素。

既然如此這個鳥鳥分鳥又是如何做到的?阿里大模型聯(lián)合團(tuán)隊(duì)的算法專家分享了背后的一切。

簡單歸結(jié),鳥鳥分鳥的訓(xùn)練過程,在他們內(nèi)部稱之為層次化的訓(xùn)練方式。類似于人類的學(xué)習(xí)過程,先學(xué)習(xí)簡單知識,然后逐漸進(jìn)階,最后再嘗試專業(yè)領(lǐng)域知識的學(xué)習(xí)。

具體分成了四個步驟:

大規(guī)模語言訓(xùn)練; 知識和工具增強(qiáng); 個性化對話增強(qiáng); 人類反饋增強(qiáng)。

基于基礎(chǔ)的預(yù)訓(xùn)練大模型,團(tuán)隊(duì)做了知識增強(qiáng)——讓模型學(xué)會使用工具,類似于ChatGPT插件功能。

比如針對每日新增的知識,它能調(diào)用搜索引擎來做輸入,在搜索結(jié)果基礎(chǔ)上進(jìn)行理解、總結(jié)和歸納。這樣一來,輸出結(jié)果有更好的準(zhǔn)確率和時效性。

個性化對話增強(qiáng)則主要是讓大模型學(xué)習(xí)多種對話形式,比如啟發(fā)式、多輪對話,尤其是一些需要依賴長期記憶的對話。

與此同時,還要塑造鳥鳥人格,這就涉及到最后兩個步驟「個性化對話增強(qiáng)」「人類反饋增強(qiáng)」??吭黾痈哔|(zhì)量的鳥鳥相關(guān)數(shù)據(jù),并讓人類去做問答結(jié)果的反饋和標(biāo)注,哪一個回復(fù)更像鳥鳥,讓大模型朝著鳥鳥方向做正向增強(qiáng)。

最終只花了15天的時間就訓(xùn)練出了鳥鳥分鳥,后續(xù)還可能開放更多人加入強(qiáng)化反饋和更有情緒化的音色,讓鳥鳥分鳥逐步升級迭代。

除了大模型訓(xùn)練,他們在算法和工程上面做了不少工作。從交互流程來劃分,主要分成聽清、音色、文風(fēng)、對話等步驟。

最終形成了這樣一個對話過程:

當(dāng)人類詢問一個問題(Query)時,首先經(jīng)過貓耳算法將其轉(zhuǎn)換為文本,隨后通過大模型產(chǎn)生個性化的對話回復(fù),最后再到個性化的語音合成給出回答。整個過程還有Multi-Turn對話系統(tǒng)來支持。

對于測試階段存在的一些問題,阿里這邊也給出了回應(yīng)。

比如反應(yīng)過于太強(qiáng),這是因?yàn)檫€沒有將線上的貓耳算法和ASR做充分的融合,為了聽清多輪對話信息,顯得過于靈敏,以及暫沒有全面支持英文等問題,他們表示后續(xù)還將進(jìn)一步迭代更新。

普通人也能獨(dú)占大模型?

這件事之所以值得關(guān)注,除了有意思的產(chǎn)品體驗(yàn),這也是個性化大模型發(fā)展的一次可行性驗(yàn)證。

大模型發(fā)展進(jìn)程,有兩條路徑已經(jīng)明晰:如火如荼的通用大模型,以及備受關(guān)注的個性化大模型

以GPT-4為代表的通用模型,在多個標(biāo)準(zhǔn)化考試中大幅超過人類水平,適用于搜索引擎、生產(chǎn)力工具這種廣泛、公域場景。

但像更多私域個性化、或者垂直專業(yè)化場景中,比如問及有無特別偏好、對某件事情觀點(diǎn)等,個性化大模型就會是一個很好的補(bǔ)充。

當(dāng)前,全球研究機(jī)構(gòu)和大廠在這一路徑的探索,主要涵蓋了四個研究方向:

有偏好的個性化對話、邏輯一致性和三觀、對話風(fēng)格、多輪對話中人設(shè)一致性。

此次在鳥鳥分鳥上的探索,一方面呈現(xiàn)出個性化大模型的研究方向——

在大模型系列的基礎(chǔ)上,打造知識、情感、性格和記憶四位一體的個性化大模型,并且這個大模型版本可能是很適合在消費(fèi)者終端上部署的。

另一方面,也再次印證了對話即入口的AI2.0未來趨勢。

ChatGPT上線的插件功能,以文本交互的方式,與全球5000+應(yīng)用聯(lián)動。

現(xiàn)在,鳥鳥分鳥則是驗(yàn)證了以語音這一模態(tài),在消費(fèi)電子場景中觸達(dá)諸多功能的可能性。

大模型所引領(lǐng)的AI 2.0時代,而對話相當(dāng)于是操作系統(tǒng)(ChatOS),所有應(yīng)用都將被重新定義。

而且隨著個性化大模型的發(fā)展,未來每個普通人甚至都會擁有屬于自己的大模型。

One More Thing

在被問到脫口秀會不會被AI替代時,鳥鳥跟鳥鳥分鳥給出了不同的解答。

鳥鳥表示,希望它能啟發(fā)思路,提供一些以前沒有看到的素材和觀點(diǎn),但對于預(yù)期文本和出梗方向,還需要人自己去想。

為此鳥鳥還分享個機(jī)器人寫的段子:

婚姻和坐地鐵很像,你都會被迫和一個陌生人待在一個空間里很久,想下車的時候未必能下得去。

鳥鳥分鳥則自信表示:脫口秀不會被AI替代。

關(guān)鍵詞:

相關(guān)閱讀:
熱點(diǎn)
圖片