首頁>資訊 >
微動態(tài)丨微軟欲用 ChatGPT 扶必應(yīng)“上位”,對抗 Google 2023-01-05 09:02:16  來源:36氪

一直以來,Google 搜索引擎的市場占比一騎絕塵,讓很多競爭者望而卻步。

不過,現(xiàn)如今,隨著一種名為ChatGPT聊天機器人的到來,在現(xiàn)身吟詩、寫代碼、編段子,甚至還上線司法考試現(xiàn)場的一個多月時間里,讓Google 敲響警鈴,更有多方媒體報道,Google 內(nèi)部正拉起了一道「紅色代碼警戒」(Code red),擔(dān)心 ChatGPT 將對 Google 搜索引擎的未來帶來巨大挑戰(zhàn)。

與之形成鮮明對比的是,排在第二位且占比僅有 3.04% 的 Bing 顯得悠然自得一些。據(jù)外媒 The Information 最新發(fā)布的一篇報道顯示,微軟可能會在 2023 年 3 月之前在 Bing 中應(yīng)用 ChatGPT,用人工智能來回答一些搜索查詢。


【資料圖】

微軟的先見之明

微軟與 ChatGPT 背后的開發(fā)商 OpenAI 之間的合作關(guān)系早已不是什么秘密,現(xiàn)如今回過頭來看,不少人敬佩起微軟的先見之明。

創(chuàng)立于 2015 年的 OpenAI,自誕生之日起,便以促進和發(fā)展友好的人工智能為目標(biāo)。時至今日,其相繼推出了 GPT-3、DALL·E 2、ChatGPT等重磅模型,推動了人工智能一次又一次地成功落地。

然而,起初作為一家非營利機構(gòu),OpenAI 并沒有找到自身的營利模式。

宛如其對標(biāo)的 Google 旗下的 Deepmind 部門,也曾一度陷入到虧損、負債的迷茫中。彼時,據(jù)《彭博社》報道,2018 年,谷歌母公司 Alphabet Inc. 收購的人工智能公司 DeepMind 的收入幾乎翻了一番,但卻因為虧損增至數(shù)十億美元,收益情況不容樂觀。一直以來,DeepMind 的盈利能力依然備受質(zhì)疑。

處于同一起跑線的 OpenAI 亦然也會面臨“囊中羞澀”的尷尬問題。

不過,好在最初名不經(jīng)傳的 OpenAI 帶著馬斯克的光環(huán),渡過了研發(fā)的第一階段。而后支撐到了2019 年 3 月,OpenAI 也為其可持續(xù)開發(fā)做了打算,并成立了 OpenAI LP 子公司,主要目的就是為營利。

也是在這一年,OpenAI 的發(fā)展引起了微軟的注意,隨后的7 月,微軟宣布向OpenAI 投資 10 億美元,雙方攜手合作替 Azure 云端平臺服務(wù)開發(fā)人工智能技術(shù),與此同時,OpenAI 也將用這筆巨款進一步推進通用人工智能(AGI)的研究。

2020 年時,我們只知曉,在 OpenAI 推出 GPT-3 語言模型時,微軟于當(dāng)年的 9 月 22 日取得獨家授權(quán)。

當(dāng)前,隨著 The information 的報道,更多的細節(jié)被曝光出來,其中便包括早在 2019 年,微軟在對 OpenAI 的投資包括了一項將 GPT 的某些方面納入 Bing 中的協(xié)議。

Bing 將加入ChatGPT 功能

具體來看,舊版本的 GPT 可以在用戶輸入時,自動提供搜索查詢建議。如今,微軟已經(jīng)宣布計劃將Dall-E 2 模型集成到 Bing Image Creator 中,方便用戶可以在其中發(fā)出描述性文本提示并生成 AI 圖稿。

據(jù) The information 報道,有直接了解情況的人士稱,微軟即將發(fā)布的公告將揭示更多有意義的功能。

那么,如果搜索引擎引入 ChatGPT 聊天機器人,那么又將會以什么樣的形式呈現(xiàn)?

據(jù)悉,這些AI 支持的答案可以采用包含信息來源的完整句子的形式呈現(xiàn),而不是引用可能解決用戶提出的問題來源或者鏈接列表的精選片段。

不過,“Bing 仍將依靠自己的技術(shù)來產(chǎn)生大部分搜索結(jié)果”,因為 GPT 并不意味著“像搜索引擎那樣持續(xù)抓取網(wǎng)絡(luò)或提供實時信息”。同時,Bing 如何確保答案的準(zhǔn)確性還有待觀察。

The Information 稱這“可能會在今年 3 月底之前推出”,而 Bing 可能被定位為“免費訪問部分 GPT 的唯一方式”。因為按照 OpenAI 的計劃,他們將會對 ChatGPT 采取收費政策,對此,外媒也將微軟評價為“為初創(chuàng)公司的云賬單買單”的企業(yè)。

ChatGPT,為“殺死”傳統(tǒng)搜索引擎而生?

不過,微軟此舉能否讓 Bing 逆襲“天下第一”的 Google 搜索引擎,很多網(wǎng)友表示:期待。

但也有不少人持懷疑態(tài)度,甚至還發(fā)起了一項投票:

為此,用戶層面也形成了兩個主要觀點:

其一,支持 ChatGPT 會打破傳統(tǒng)搜索引擎的市場格局。

過去一個月期間,朋友圈一次又一次地刷屏,ChatGPT 的火爆程度有目共睹。

相比傳統(tǒng)的搜索引擎根據(jù)用戶提問,從而提供數(shù)千萬個相關(guān)鏈接索引,ChatGPT 直接提供自己的搜索和信息綜合的單一答案,讓用戶省去反復(fù)點擊鏈接找尋答案的復(fù)雜度。

正是基于這一點,很多人堅信 ChatGPT 會面向傳統(tǒng)搜索引擎發(fā)起挑戰(zhàn)。

其二,ChatGPT 想要取代 Google 非常牽強,至少目前看來,不可能。

為了論述這一觀點,外媒 TechTalks 此前也專門發(fā)布了一篇《為什么 ChatGPT 不會對 Google 搜索構(gòu)成威脅》的文章,從大型語言模型(LLM)的真實性、更新、速度與商業(yè)化的角度進行了剖析。

真實性無法保證。

用 ChatGPT 作為輔助性建議的提供者,其實一點問題都沒有。但是在學(xué)術(shù)、科研等嚴(yán)謹(jǐn)?shù)膽?yīng)用場景中,ChatGPT 提供的答案并不一定都是正確的。解決 ChatGPT 輸出的真實性將會是一項重大的挑戰(zhàn),不過,目前并沒有辦法從 ChatGPT 的輸出中分辨真?zhèn)?,除非你用其他來源(?Google)來驗證答案。

然而,如果要使用大型語言模型來替代搜索引擎,此舉未免有些弄巧成拙。

也許有人會說,Google 這類的搜索引擎未必也會提供 100% 正確的答案,為什么不能對 ChatGPT 包容一些?

其實,Google 這類的搜索引擎至少為用戶提供了可以驗證的來源鏈接,但ChatGPT 只提供純文本,不引用實際網(wǎng)站。雖然目前也有不少人將 LLM 輸出的不同部分鏈接到實際網(wǎng)頁,但這是一項復(fù)雜的研究工作,當(dāng)前還無法通過純粹的基于深度學(xué)習(xí)的方法來解決。

更新模型的成本太高

ChatGPT 和其他 LLM 面臨的另一個挑戰(zhàn)是更新他們的知識庫。

搜索引擎的索引其實可以實時更新,也更為方便快捷一些,但對于大型語言模型而言,添加新的內(nèi)容需要重新訓(xùn)練模型。

也許不是每次更新都需要完全重新訓(xùn)練模型,但是相比搜索引擎,其添加或者修改訓(xùn)練數(shù)據(jù)的成本都更昂貴。

據(jù)外媒報道,基于 GPT 3.5,ChatGPT 可能至少有 1750 億個參數(shù)。由于沒有可以適合該模型的單個硬件,因此必須將其分解并分布在多個處理器上,例如 A100 GPU。設(shè)置和并行化這些處理器以訓(xùn)練和運行模型既是技術(shù)挑戰(zhàn),也是財務(wù)挑戰(zhàn)。

速度挑戰(zhàn)

LLM 也有推理速度問題。搜索引擎不需要為每個查詢?yōu)g覽整個數(shù)據(jù)集。他們有索引、排序和搜索算法,可以以非??斓乃俣炔槊髡_的記錄。因此,即使在線信息量在增長,搜索引擎的速度也不會下降。

不過,LLM 每次收到提示時都會通過整個神經(jīng)網(wǎng)絡(luò)運行信息。其計算量要比搜索引擎的查詢索引多很多。鑒于深度神經(jīng)網(wǎng)絡(luò)的非線性特性,推理操作的并行化程度是有限的。隨著 LLM 訓(xùn)練語料庫的增長,模型也必須變得更大,才能很好地泛化其知識庫。

商業(yè)模式

目前,ChatGPT 還處于測試階段,并沒有落地的商業(yè)模式。不過此前據(jù) TechCrunch 估計,擁有 100 萬用戶的 ChatGPT 每天花費 100,000 美元,每月花費約 300 萬美元。

不難計算出如果全球的用戶每天運行 80 億次搜索查詢時會發(fā)生什么。此外,再加上定期訓(xùn)練模型的成本,以及通過強化學(xué)習(xí)和人工反饋對模型進行微調(diào)所需的體力勞動。

綜上而言,如果以單一的 ChatGPT 來對抗 Google 搜索引擎,也許勝算很小,甚至可以忽略不計,但是當(dāng)下 Bing 的入局,而且按照微軟的初步計劃,其主要是將 ChatGPT 作為 Bing 的輔助功能,讓二者相結(jié)合起來的模式,推動 Bing 的上位。

這讓 Google 還在深陷于「自家也有類似于 ChatGPT 的能力人工智能語言模型 LaMDA ,但由于該技術(shù)帶來的"聲譽風(fēng)險",公司不得不采取“比小型創(chuàng)業(yè)公司更保守的行動”」中,處于被動的位置。

這也為誰能笑到最后的搜索引擎戰(zhàn)局,打上了一個問號。

參考:

https://datasciencelearningcenter.substack.com/p/could-bing-disrupt-google-with-chatgpt

https://9to5google.com/2023/01/03/bing-chatgpt-report/

https://bdtechtalks.com/2023/01/02/chatgpt-google-search/

關(guān)鍵詞: 搜索引擎 人工智能 語言模型

相關(guān)閱讀:
熱點
圖片 圖片