首頁(yè)>資訊 >
“藝術(shù)家達(dá)利+機(jī)器人WALL-E”、元宇宙及零邊際內(nèi)容 2022-04-22 15:40:08  來(lái)源:36氪

神譯局是36氪旗下編譯團(tuán)隊(duì),關(guān)注科技、商業(yè)、職場(chǎng)、生活等領(lǐng)域,重點(diǎn)介紹國(guó)外的新技術(shù)、新觀點(diǎn)、新風(fēng)向。

編者按:OpenAI最近搞了一個(gè)大東西,能夠根據(jù)文字創(chuàng)作圖像的DALLE 2。從網(wǎng)上放出來(lái)的一些例子來(lái)看,效果相當(dāng)震撼,有些甚至抓住了文字的靈魂。那么這樣一個(gè)AI具備什么意義呢?知名科技博主分析了不同形式的內(nèi)容創(chuàng)作手段存在的共同演變模式,并總結(jié)出相應(yīng)的經(jīng)濟(jì)影響,認(rèn)為這種AI將為元宇宙的未來(lái)賦予經(jīng)濟(jì)性。當(dāng)虛擬世界可以用近乎零成本去創(chuàng)作完全可以針對(duì)個(gè)人定制的虛擬內(nèi)容時(shí),互聯(lián)網(wǎng)的未來(lái)將距離我們更近,卻也會(huì)變得更奇怪了。文章來(lái)自編譯。

劃重點(diǎn):

游戲處在技術(shù)發(fā)展的前沿,引領(lǐng)了從文本到圖像到視頻到3D的進(jìn)步

社交網(wǎng)絡(luò)經(jīng)歷了與游戲類(lèi)似的媒介演變,但時(shí)間推遲了二十年

TicTok的零成本的UGC+純算法調(diào)度的動(dòng)態(tài)內(nèi)容具有網(wǎng)絡(luò)效應(yīng)

DALL-E 2提供的零成本內(nèi)容為元宇宙未來(lái)提供了經(jīng)濟(jì)性

上周,OpenAI發(fā)布了文字生成圖像工具 DALL-E 2(DALL-E來(lái)自藝術(shù)家“Dalí”和機(jī)器人“WALL-E”的結(jié)合詞);來(lái)自@BecomingCritter的這條推特帖子上面展示了大量生成的示例,其中包括這條“泰迪熊在 1980 年代在月球上展開(kāi)新的人工智能的研究”:

在 1980 年代的月球上致力于新 AI 研究的泰迪熊

文字“一張古色古香的花店的店面照片,潔白的門(mén)面綠意盎然,大門(mén)敞開(kāi),還有一扇大窗戶(hù)”生成的圖像:

一張古色古香的花店的店面照片,潔白的門(mén)面綠意盎然,大門(mén)敞開(kāi),還有一扇大窗戶(hù)

不過(guò),最恰如其分的是這張,“一個(gè)沐浴在 AGI 烏托邦陽(yáng)光之下的人類(lèi)”:

一個(gè)沐浴在AGI烏托邦陽(yáng)光之下的人類(lèi)

OpenAI在其網(wǎng)站上有一段描述 DALL-E 的視頻。盡管OpenAI的宣傳視頻的確也提到了 DALL-E 的一些缺點(diǎn),但對(duì)其可能性仍然十分樂(lè)觀。里面的一些摘錄:

Dall -E 2 是出自O(shè)penAI的一套新的 AI 系統(tǒng),它可以將簡(jiǎn)單的文本描述(如“考拉扣籃”)轉(zhuǎn)化為此前從未出現(xiàn)過(guò)的逼真圖像。 DALL-E 2 還可以對(duì)照片進(jìn)行編輯和潤(rùn)飾,效果十分逼真……

DALL-E 是通過(guò)訓(xùn)練基于圖像及其文本描述的神經(jīng)網(wǎng)絡(luò)而創(chuàng)建出來(lái)的。通過(guò)深度學(xué)習(xí),它不僅可以理解像考拉熊以及摩托車(chē)這樣的單個(gè)對(duì)象,還可以學(xué)習(xí)對(duì)象之間的關(guān)系,當(dāng)你要求 DALL-E 生成“騎摩托車(chē)的考拉”的圖像時(shí),它知道如何創(chuàng)建這樣一幅圖片,或者與任何其他對(duì)象或動(dòng)作有關(guān)系的圖片。

DALL-E 研究有三個(gè)主要成果:首先,它可以幫助人們用可視化的方式表達(dá)自己,這是前所未有的。其次,人工智能生成的圖像可以告訴我們很多信息,讓我們知道系統(tǒng)是否理解我們,或者只是在重復(fù)教過(guò)它的內(nèi)容。第三,DALL-E 可以幫助人類(lèi)了解人工智能系統(tǒng)如何看待和理解我們的世界。這是開(kāi)發(fā)有用且安全的人工智能的關(guān)鍵部分……

用于訓(xùn)練 DALL-E 的方法令人興奮之處在于,它可以從其他各種打過(guò)標(biāo)簽的圖像那里學(xué)習(xí),然后將其應(yīng)用到新圖像上面。給它一張猴子的照片,DALL-E 就可以推斷出它在做一些以前從未做過(guò)的事情時(shí)會(huì)是什么樣子的,比如猴子戴著一頂有趣的帽子在納稅的樣子。富有想象力的人類(lèi)和有聰明才智加持的系統(tǒng),人機(jī)協(xié)同工作如何可以創(chuàng)造新事物,放大我們的創(chuàng)造潛力?DALL-E 就是一個(gè)有力的例子。

人機(jī)協(xié)同這句話可能會(huì)引起一些人的質(zhì)疑:乍看之下,DALL-E 與藝術(shù)家和插畫(huà)家好像是競(jìng)爭(zhēng)的關(guān)系;不過(guò),還有另一種觀點(diǎn),DALL-E 指向了元宇宙未來(lái)的一個(gè)重大缺失部分。

游戲與媒體進(jìn)化

長(zhǎng)期以來(lái),游戲一直處在技術(shù)發(fā)展的前沿,就媒體而言,情況當(dāng)然是這樣的。最早的電腦游戲只不過(guò)是文字罷了:

《俄勒岡之路》游戲截圖

緊隨其后的是圖像游戲,一般是位圖類(lèi)型的;我記得在圖書(shū)館玩過(guò)很多次《神偷卡門(mén)》(Where in the world is Carmen San Diego)這款游戲:

很快,游戲就開(kāi)始引入動(dòng)作,你可以在 2D 世界里面給精靈指路;緊接著3D 也出現(xiàn)了,在過(guò)去 25 年大部分的時(shí)間里,我們一直在致力于讓 3D 游戲變得更加逼真。然而,幾乎所有這些游戲都是 2D 屏幕上投射的 3D 圖像。虛擬現(xiàn)實(shí)提供了我們置身于游戲之中的錯(cuò)覺(jué)。

盡管如此,這種演變也面臨著挑戰(zhàn):創(chuàng)建更逼真的 3D 游戲,意味著要?jiǎng)?chuàng)建出更逼真的圖像紋理來(lái)粉飾所有這些多邊形;在虛擬現(xiàn)實(shí)的環(huán)境下,這個(gè)問(wèn)題只會(huì)被放大。這也是即便是開(kāi)放世界游戲在范圍上最終也會(huì)受到限制的原因之一,而那種游戲玩法在很大程度上是具有確定性的:通過(guò)了解你要去哪里以及到達(dá)那里的所有選項(xiàng),開(kāi)發(fā)人員可以提前創(chuàng)建所有必要的資產(chǎn),以提供身臨其境的體驗(yàn)。

這并不是說(shuō)除了程序生成的Roguelike(是角色扮演游戲的一個(gè)分支類(lèi)型,它以一系列隨機(jī)生成關(guān)卡的地牢、回合制戰(zhàn)斗、基于磁貼的圖像和角色永久死亡為特點(diǎn))游戲以外,游戲就不能有隨機(jī)元素:提供不可預(yù)測(cè)性要素最顯而易見(jiàn)的一種方式是讓人類(lèi)之間對(duì)玩,盡管這是在定義明確和受控的環(huán)境下進(jìn)行的。

社會(huì)化內(nèi)容與用戶(hù)生成內(nèi)容

社交網(wǎng)絡(luò)經(jīng)歷了與游戲類(lèi)似的媒介演變,但時(shí)間推遲了二十年。 Web 上最早的社交網(wǎng)絡(luò)形式是文字型的公告板以及用戶(hù)組(USENET)。后來(lái),電子郵件、AOL聊天室以及論壇開(kāi)始普及。 Facebook 是在 2000 年代中期的時(shí)候出現(xiàn)的。它之所以大受歡迎,有一點(diǎn)是因?yàn)樵黾恿藞D像這種元素。 Instagram是一個(gè)只有圖片的社交網(wǎng)絡(luò),但很快又添加了視頻,而視頻則是TikTok的全部?,F(xiàn)在,尤其是在過(guò)去這幾年里,通過(guò) Zoom 或Facetime 等 app 召開(kāi)的視頻會(huì)議已經(jīng)開(kāi)始在 2D 屏幕上提供 3D 圖像。

盡管如此,媒體對(duì)于社交網(wǎng)絡(luò)的重要性一直都比較低,這只是因?yàn)樗纳缃徊糠痔焐秃苡腥ち?。人?lèi)喜歡與其他人交流,即便這需要撥號(hào)到隨便某個(gè) BBS, 下載消息、撰寫(xiě)回復(fù),然后再撥回去發(fā)送消息。游戲也許基本上是具有確定性的,但人類(lèi)充滿(mǎn)了驚喜。

此外,這意味著社交網(wǎng)絡(luò)要便宜得多:平臺(tái)不需要自己生成所有的內(nèi)容,而是由用戶(hù)自己生成所有內(nèi)容。這導(dǎo)致新平臺(tái)更難崛起,因?yàn)槟阈枰脩?hù)來(lái)吸引用戶(hù),但這也使得此類(lèi)平臺(tái)比任何游戲都更具粘性(或者,換句話說(shuō),最具粘性的游戲本身就具備網(wǎng)絡(luò)效應(yīng))。

動(dòng)態(tài)消息與算法

除了時(shí)間以外,社交網(wǎng)絡(luò)的第一次迭代并沒(méi)有特定的算法組件:較新的帖子位于頂部(或底部)。隨著 Facebook 在 2006 年推出了動(dòng)態(tài)消息(News Feed),情況開(kāi)始發(fā)生變化?,F(xiàn)在,你不再需要訪問(wèn)所有朋友的頁(yè)面,只需瀏覽動(dòng)態(tài)消息就行,它從一開(kāi)始就決定了要包含哪些內(nèi)容,以及按照什么樣的順序呈現(xiàn)。

隨著時(shí)間的推移,動(dòng)態(tài)消息從一種相對(duì)簡(jiǎn)單的算法演變?yōu)橛蓹C(jī)器學(xué)習(xí)驅(qū)動(dòng)的算法,其結(jié)果令人費(fèi)解,以至于 Facebook 用了六個(gè)月的時(shí)間才修復(fù)好最近的一個(gè)排名錯(cuò)誤。其影響十分巨大:隨著算法驅(qū)動(dòng)的動(dòng)態(tài)消息變得更好,不僅是 Facebook,就連 Instagram的參與度與增長(zhǎng)速度都出現(xiàn)了大幅增長(zhǎng);動(dòng)態(tài)消息還非常適合貨幣化,因?yàn)闆Q定你看到的內(nèi)容的同一類(lèi)信號(hào)也會(huì)影響到向你展示的廣告。

然而,之所以不把算法驅(qū)動(dòng)的動(dòng)態(tài)消息與社交網(wǎng)絡(luò)放在同一個(gè)章節(jié)討論,是因?yàn)轱@示其的力量的終極例子根本不是社交網(wǎng)絡(luò):而是TikTok 。當(dāng)然, TikTok全都是用戶(hù)生成的內(nèi)容,但它與 Facebook 的關(guān)鍵區(qū)別在于,內(nèi)容不受限于你的關(guān)系網(wǎng)絡(luò): TikTok從整個(gè)網(wǎng)絡(luò)提取它認(rèn)為你最感興趣的視頻。我在2020年時(shí)解釋了為什么這是Facebook的盲點(diǎn):

有趣的是,F(xiàn)acebook錯(cuò)過(guò)這個(gè)是不可避免的,原因在于:首先,F(xiàn)acebook 把自己看作是一個(gè)社交網(wǎng)絡(luò),所以它不愿意將其視為一種責(zé)任。其次,F(xiàn)acebook 對(duì)待Snapchat的方式強(qiáng)化了這種觀點(diǎn)。我那篇文章的重點(diǎn)是 Facebook 利用Instagram 的社交網(wǎng)絡(luò)來(lái)阻止Snapchat 的增長(zhǎng),這只會(huì)強(qiáng)化“網(wǎng)絡(luò)是 Facebook 最大的資產(chǎn)”這一點(diǎn),而使得TikTok 這個(gè)盲點(diǎn)變得越來(lái)越大。

TikTok把兩個(gè)東西結(jié)合在了一起,一是具備零成本特性的用戶(hù)生成內(nèi)容,二是與網(wǎng)絡(luò)分離的純算法的動(dòng)態(tài)內(nèi)容;這種結(jié)合具有網(wǎng)絡(luò)效應(yīng),因?yàn)門(mén)ikTok需要很多內(nèi)容供自己選擇,但它不需要特定的網(wǎng)絡(luò)。

機(jī)器學(xué)習(xí)的元宇宙

我知道,元宇宙太 2021 了,但令我震驚的是,科幻小說(shuō)里面的例子,包括《雪崩》以及《頭號(hào)玩家》等,在實(shí)現(xiàn)上其實(shí)非常像游戲。他們的虛擬世界是由有遠(yuǎn)見(jiàn)的公司創(chuàng)建的,或者是由一位有遠(yuǎn)見(jiàn)的開(kāi)發(fā)者創(chuàng)建的,他也會(huì)開(kāi)發(fā)一個(gè)爭(zhēng)奪虛擬世界最終所有權(quán)的確定性游戲。是,第三方可以而且確實(shí)建立了具有強(qiáng)大社交組件的體驗(yàn),最著名的是《雪崩》里面 Da5id的黑色太陽(yáng)俱樂(lè)部(Black Sun club),但它的核心機(jī)制,以及核心經(jīng)濟(jì),更接近多人游戲,比任何其他東西都要接近。

不過(guò),這一點(diǎn)在現(xiàn)實(shí)世界里面極具挑戰(zhàn)性:請(qǐng)記住,游戲開(kāi)發(fā)非常耗錢(qián),游戲的藝術(shù)創(chuàng)作尤其昂貴,而且成本越高,沉浸感體驗(yàn)越強(qiáng)。另一方面,社交媒體很便宜,因?yàn)樗玫氖怯脩?hù)生成的內(nèi)容,但這些內(nèi)容一般都體現(xiàn)在更基本的媒體上,如文本、圖片之類(lèi),視頻也是最近才出現(xiàn)的。當(dāng)然,內(nèi)容未必就得限制在你的網(wǎng)絡(luò)里面——算法可以將網(wǎng)絡(luò)上的任何內(nèi)容呈現(xiàn)給任何用戶(hù)。

DALL-E 的迷人之處在于它指向了一個(gè)可以將這三種趨勢(shì)結(jié)合起來(lái)的未來(lái)。歸根結(jié)底,DALL-E 最終是人類(lèi)生成內(nèi)容的產(chǎn)物,就像它的表親 GPT-3一樣。當(dāng)然了,后者是做文本生成,而 DALL-E 是圖像生成的。但請(qǐng)注意,這是從文本邁進(jìn)到了圖像;接下來(lái)就會(huì)有機(jī)器學(xué)習(xí)生成的視頻。當(dāng)然,這可能需要幾年的時(shí)間;視頻這個(gè)問(wèn)題會(huì)更加困難,而響應(yīng)式的 3D 環(huán)境則是難上加難,但這就是這個(gè)行業(yè)以前走過(guò)的道路:

游戲開(kāi)發(fā)者突破了文本的限制,然后是圖像,然后是視頻,然后到 3D

社交媒體先是將文本內(nèi)容創(chuàng)作的成本降到0,然后是圖像,然后到視頻

機(jī)器學(xué)習(xí)模型現(xiàn)在可以用零邊際成本創(chuàng)建文本和圖像

從長(zhǎng)遠(yuǎn)來(lái)看,這指向的是這樣一個(gè)元宇宙愿景,它的確定性要比典型的視頻游戲低得多,但在生成內(nèi)容的豐富性方面又比社交媒體豐富得多。想象一下,一個(gè)不是由藝術(shù)家繪制而是由人工智能創(chuàng)造出來(lái)的環(huán)境:這不僅增加了可能性,而且至關(guān)重要的是,降低了成本。

零邊際內(nèi)容

我們還可以換一種方式來(lái)思考 DALL-E 和 GPT 以及類(lèi)似的機(jī)器學(xué)習(xí)模型,這可以追溯到我一直以來(lái)主張的一個(gè)觀點(diǎn),即互聯(lián)網(wǎng)是一種只有印刷機(jī)才能匹配的變革性技術(shù)。后者的革命性在于它大大降低了消費(fèi)的邊際成本。以下內(nèi)容來(lái)自《互聯(lián)網(wǎng)與第三階級(jí)》:

與此同時(shí),印書(shū)的經(jīng)濟(jì)性與手工抄寫(xiě)的經(jīng)濟(jì)性有著根本上的不同。后者純粹屬于運(yùn)營(yíng)費(fèi)用:產(chǎn)出完全要取決于勞動(dòng)力的投入。反過(guò)來(lái),前者主要是資本支出:首先,你得造印刷機(jī),其次,給一本書(shū)設(shè)置好活字。這些重大的前期費(fèi)用最好的支付方式,是一本書(shū)要做出盡可能多的副本以供出售。

那么,怎么才能以最大限度地增加可以出售的副本數(shù)量呢?答案是用特定語(yǔ)言使用最廣泛的方言來(lái)印刷,這反過(guò)來(lái)又會(huì)激勵(lì)大家采用這種方言,從而在歐洲范圍內(nèi)對(duì)這種語(yǔ)言進(jìn)行標(biāo)準(zhǔn)化。相應(yīng)地,這又會(huì)加深使用共同語(yǔ)言的城邦國(guó)家之間的親和力,尤其是在數(shù)十年的時(shí)間里圍繞著書(shū)籍以及后來(lái)的報(bào)紙形成了共同文化。這種合并的發(fā)生速度各異,英格蘭和法國(guó)比德國(guó)和意大利早了幾百年,但幾乎在所有情況下,第一等級(jí)都不是天主教會(huì)的神職人員,而是國(guó)家君主,即便這些君主將權(quán)力讓渡給以伯克為典型代表的一種新型的貴族精英。

互聯(lián)網(wǎng)產(chǎn)生了兩個(gè)影響:一是讓消費(fèi)的邊際成本降到了零。即使是用印刷機(jī),仍然需要打印實(shí)物并分發(fā)出去,這需要花錢(qián);與此同時(shí),把你現(xiàn)在看到的這篇文章發(fā)送給全世界任何一位感興趣的人其實(shí)是不用花錢(qián)的。這徹底顛覆了出版業(yè),摧毀了看門(mén)人的力量。

不過(guò),另一個(gè)影響發(fā)生在供給側(cè)。我在 Mistakes and Memes 中寫(xiě)過(guò)關(guān)于TikTok的文章:

“Facebook吸引人之處也可能是因?yàn)樗尸F(xiàn)出來(lái)的內(nèi)容本身,至于是誰(shuí)呈現(xiàn)的并不重要”這句話其實(shí)也可以用來(lái)描述TikTok。這句話描述Tiktok錯(cuò)在后者的吸引力在于它呈現(xiàn)的內(nèi)容,至于是誰(shuí)創(chuàng)建的并不重要……換句話說(shuō),我太過(guò)專(zhuān)注需求了(這是聚合理論的關(guān)鍵),所以對(duì)供給側(cè)的演變沒(méi)有予以足夠的思考。用戶(hù)生成內(nèi)容未必就只能是阿貓阿狗的圖片以及某人關(guān)系網(wǎng)絡(luò)內(nèi)的人的政治抱怨。它還可能是一種新型網(wǎng)絡(luò)的基礎(chǔ)——在這種網(wǎng)絡(luò)里面,梅特卡夫定律的結(jié)果不在于任何一個(gè)節(jié)點(diǎn)可用的連接數(shù),而在于定制化到動(dòng)態(tài)消息的輸入數(shù)量。

機(jī)器學(xué)習(xí)生成內(nèi)容就是TikTok之后的下一步:GPT 和 DALL-E 以及其他類(lèi)似模型不是從網(wǎng)絡(luò)上的任何地方去獲取內(nèi)容,而是以零邊際成本用內(nèi)容生成新的內(nèi)容。這就是元宇宙的經(jīng)濟(jì)學(xué)最終將行得通之處:虛擬世界需要以近乎零成本去創(chuàng)作完全可以針對(duì)個(gè)人定制的虛擬內(nèi)容。

當(dāng)然,DALL-E 還向我們提出了許多其他問(wèn)題,其中很多屬于哲學(xué)上的問(wèn)題。上周大家對(duì)這個(gè)話題已經(jīng)進(jìn)行了很多討論,而且未來(lái)應(yīng)該還會(huì)有更多的討論。盡管如此,它的經(jīng)濟(jì)影響也很重要,在上周DALL-E發(fā)布之后,互聯(lián)網(wǎng)的未來(lái)距離我們比以往任何時(shí)候都更接近,也更奇怪了。

譯者:boxi。

關(guān)鍵詞:

相關(guān)閱讀:
熱點(diǎn)
圖片 圖片