首頁>消費(fèi) >
世界觀熱點(diǎn):“瘋狂”的大模型 誰來買單?警惕最終“一地雞毛” 2023-04-25 15:58:30  來源:中新經(jīng)緯

如何判斷一個(gè)新事物是不是徹底火了,除了要去CBD的咖啡店聽聽人們在聊什么,有時(shí)候大佬之間的“口水仗”也是很好的證明。至少大模型是這樣。

新晉創(chuàng)業(yè)者王小川與百度的隔空互懟,折射出大模型賽道里熱鬧的景象。據(jù)中新經(jīng)緯不完全統(tǒng)計(jì),截至目前中國已有超過40家公司、機(jī)構(gòu)發(fā)布了大模型產(chǎn)品或公布了大模型計(jì)劃。玩家紛紛涌入,這些大模型含金量究竟如何?是否會上演“一地雞毛”的終局?


(資料圖)

資本躁動(dòng)

除了搜狗創(chuàng)始人王小川,選擇在大模型賽道再創(chuàng)業(yè)的還有已退休的美團(tuán)聯(lián)合創(chuàng)始人王慧文、創(chuàng)新工場董事長李開復(fù)等名人。面對大模型這一“燒錢”賽道,他們下場后的第一件事也便有了答案。

近日,王小川和前搜狗COO茹立云創(chuàng)辦的百川智能表示,已獲得5000萬美元啟動(dòng)資金,來自王小川與其業(yè)內(nèi)好友的個(gè)人支持,面向機(jī)構(gòu)的融資會在近期啟動(dòng)。

據(jù)媒體報(bào)道,王小川透露,目前的資金足夠訓(xùn)練出一個(gè)好的千億模型,“至少到今年年底是夠用的”。不過緊接著王小川又說,這還遠(yuǎn)遠(yuǎn)不夠。他認(rèn)為,產(chǎn)品從0到1,5000萬美元夠用,但若要持續(xù)做到最好,成本估計(jì)應(yīng)該在3億至20億美元之間。

2月,王慧文在離開美團(tuán)兩年后通過社交平臺發(fā)布了“英雄帖”,個(gè)人出資5000萬美元設(shè)立北京光年之外科技有限公司,稱要打造中國的OpenAI。王慧文還表示,下輪融資已經(jīng)有頂級VC(風(fēng)險(xiǎn)投資)認(rèn)購2.3億美金。

不過,創(chuàng)業(yè)者和企業(yè)也明白,除了大筆資金,大模型研發(fā)的關(guān)鍵還在于人才。誰能在人才方面拔得頭籌,誰就能在大模型的洪流中搶占先機(jī)。

王慧文在“英雄帖”中表示要拿出75%的股份邀請頂級研發(fā)人才;李開復(fù)則親自籌組Project Al 2.0,發(fā)朋友圈招攬全球范圍內(nèi)的人才。

此外,大模型相關(guān)的人才招聘需求也激增。招聘平臺數(shù)據(jù)顯示,2023年1-2月份發(fā)布的AIGC崗位數(shù)量同比增長35%。在熱招崗位中,圖像識別、算法研究員、深度學(xué)習(xí)等崗位的年薪均已達(dá)百萬元。

在BOSS直聘上,北京市奇點(diǎn)智源科技有限公司(下稱奇點(diǎn)智源)給AIGC方向的NLP(自然語言處理)算法研究員崗位開出143萬元年薪。昆侖萬維4月10日的公告顯示,該公司就ChatGPT、圖像視頻生成等AIGC技術(shù)與奇點(diǎn)智源進(jìn)行全面技術(shù)合作,但后續(xù)能否順利實(shí)現(xiàn)商業(yè)化存在較大的不確定性。

一位常年為企業(yè)招聘AI人才的獵頭告訴中新經(jīng)緯,他現(xiàn)在幫多家北京、杭州的公司招聘大模型相關(guān)工程師,年薪多在50萬元至80萬元之間,優(yōu)秀的可以突破100萬元,“算比較高的”。

不少上市公司也因?yàn)樯孀愦竽P投蓛r(jià)大漲。數(shù)據(jù)顯示,截至4月24日收盤,三六零、昆侖萬維、云從科技今年以來股價(jià)漲幅達(dá)153.52%、287.23%、155.58%。

昆侖萬維宣布聯(lián)合奇點(diǎn)智源共同研發(fā)國產(chǎn)大語言模型“天工”3.5后,次日股價(jià)最高漲近16%,兩個(gè)交易日累計(jì)最大漲幅超22%。

三六零股價(jià)也終于擺脫了長期的低迷狀態(tài),今年股價(jià)最高時(shí)達(dá)20.85元/股,現(xiàn)在市值也來到了1185億元。不過截至24日收盤,該公司股價(jià)4月累計(jì)下跌4.99%。

云從科技股價(jià)今年累計(jì)最大漲幅一度達(dá)284.98%,股價(jià)曾達(dá)61.8元/股的歷史高點(diǎn),但近期股價(jià)已回調(diào)超三成。不過,云從科技對大模型產(chǎn)品依舊寄予厚望。3月31日,云從科技披露了定增募資計(jì)劃,擬募資36.35億元用于“行業(yè)精靈”大模型研發(fā)項(xiàng)目。

不是所有模型都叫大模型

大模型賽道里數(shù)量更多的是公司、機(jī)構(gòu)的身影。這里面既有百度、騰訊、阿里這樣的大型互聯(lián)網(wǎng)公司,也有科大訊飛、商湯科技這樣的AI公司,還有中科院自動(dòng)化研究所、上海人工智能實(shí)驗(yàn)室這樣的科研機(jī)構(gòu)。

不少AI創(chuàng)業(yè)公司,也趁這波浪潮單方面宣布進(jìn)軍大模型賽道。

什么樣的模型才能稱之為“大”?如此多的大模型,含金量究竟如何?

國家人工智能標(biāo)準(zhǔn)化總體組副組長、北京航空航天大學(xué)人工智能研究院教授吳文峻對中新經(jīng)緯表示,一般認(rèn)為參數(shù)規(guī)模在百億以上的是大模型?!坝醒芯勘砻鳎賰|規(guī)模以上的大模型,就可能會出現(xiàn)所謂的‘涌現(xiàn)’現(xiàn)象,具備一定的自主學(xué)習(xí)、自我優(yōu)化和自我進(jìn)化能力,相較于百億以下規(guī)模的模型在邏輯推理、做數(shù)學(xué)題等方面有明顯提升?!眳俏木f。

中國新一代人工智能發(fā)展戰(zhàn)略研究院首席經(jīng)濟(jì)學(xué)家、南開大學(xué)經(jīng)濟(jì)研究所所長劉剛接受中新經(jīng)緯采訪時(shí)表示,大模型的判定標(biāo)準(zhǔn)主要在于它是否能在不同的專業(yè)領(lǐng)域使用,以及參數(shù)規(guī)模的大小。“我認(rèn)為億級參數(shù)規(guī)模是大模型的入門門檻,現(xiàn)在國際上一些大模型參數(shù)規(guī)??蛇_(dá)到百億甚至千億?!?/p>

大模型發(fā)展的背后除了百億級的參數(shù)規(guī)模、海量數(shù)據(jù)外,還需要龐大的智能算力支撐。而智能算力的水平又與算力芯片、算力規(guī)模息息相關(guān)。這些都決定了大模型的研發(fā)不是容易的事,并非通過召開一場發(fā)布會或展示幾頁P(yáng)PT就能實(shí)現(xiàn)。

盡管目前大模型的應(yīng)用有很大局限,具備對文本、圖片理解生成能力的都是少數(shù),但有些公司已將一些此前推出的產(chǎn)品歸為大模型應(yīng)用。

3月,小米集團(tuán)總裁盧偉冰在財(cái)報(bào)電話會議上就表示,“小愛同學(xué)就是一個(gè)典型的大模型的應(yīng)用產(chǎn)品”。公開資料顯示,小愛同學(xué)發(fā)布于2017年。

在市場研究機(jī)構(gòu)IDC中國研究總監(jiān)盧言霞看來,之前大部分AI應(yīng)用都不是基于大模型的?!按竽P褪菍υ兴惴P偷募夹g(shù)升級,基于海量數(shù)據(jù)開發(fā)預(yù)訓(xùn)練模型,到最終用戶環(huán)境中使用少量數(shù)據(jù)即可獲得比之前的算法模型更好的結(jié)果,相比上一代的算法模型有更高的預(yù)測準(zhǔn)確度?!北R言霞說,“主要有三個(gè)要點(diǎn),一是預(yù)訓(xùn)練模型學(xué)習(xí)了多少數(shù)據(jù),遷移學(xué)習(xí)的效果如何以及部署的整體成本如何?!?/p>

不過,劉剛認(rèn)為,只要是應(yīng)用產(chǎn)品基于人工智能,且參數(shù)規(guī)模、訓(xùn)練量在不斷增大,不斷迭代演化,盡管參數(shù)規(guī)模沒有達(dá)到千億級別,也依然可以叫做大模型應(yīng)用產(chǎn)品。

落地的不確定性

在人們預(yù)想中,大模型落地應(yīng)用以后除了在C端變成人們的智慧助手,還將在B端給千行百業(yè)帶來研發(fā)能力與生產(chǎn)效率的指數(shù)提升。

但現(xiàn)實(shí)是,目前,具備對文本、圖像、音頻和視頻綜合理解生成能力,且具備學(xué)習(xí)和使用“工具”能力的多模態(tài)大模型仍在路上,這意味著如何將這些能力落地到具體的應(yīng)用場景更加遙遠(yuǎn)。而這個(gè)過程,充滿了諸多不確定性。

劉剛表示,大模型落地的不確定性首先在市場,其次是技術(shù)?!笆袌龅倪x擇對大模型至關(guān)重要,要看最后誰的模型大家用起來更容易、成本更低,讓市場接受并使用。落地的關(guān)鍵在于能否適應(yīng)市場,有時(shí)候技術(shù)先進(jìn)未必適應(yīng)市場?!?/p>

吳文峻也提到了使用推廣方面的問題,他認(rèn)為,廣泛部署大模型要占據(jù)一定的計(jì)算資源,很多人同時(shí)使用也會帶來資源消耗,大模型的訓(xùn)練和運(yùn)維也需要很多云資源。在云上部署后,怎樣在提供大規(guī)模服務(wù)的情況下保持良好的性價(jià)比,是推動(dòng)大模型落地的過程中需要解決的問題。

吳文峻還提到,大模型相關(guān)技術(shù)本身還存在一些缺陷,比如事實(shí)錯(cuò)誤、邏輯推理的前后矛盾,這些問題通常被稱為“幻覺”。要把大模型運(yùn)用在一些對輸出內(nèi)容的客觀性、準(zhǔn)確性要求比較高的場景還存在一定技術(shù)障礙?!霸诒WC服務(wù)內(nèi)容正確性、客觀性的前提下怎樣節(jié)能增效、降低運(yùn)行成本是大模型在應(yīng)用推廣的時(shí)候需要重點(diǎn)關(guān)注的?!?/p>

吳文峻認(rèn)為,對于這些問題,要通過一定的技術(shù)手段加上算力的支撐才能解決,還可以通過人的反饋來強(qiáng)化學(xué)習(xí),發(fā)現(xiàn)錯(cuò)誤后進(jìn)行修正?!坝行┻€需要增強(qiáng)專業(yè)領(lǐng)域的知識,對模型可能存在的問題進(jìn)行檢查,然后定制成為可以在專業(yè)領(lǐng)域內(nèi)用的模型?!?/p>

盧言霞表示,大模型落地的不確定性在于,是否真的能產(chǎn)出比之前的AI更好的效果,需要多久才能落地,“當(dāng)然也在于到底能不能成功落地”。

針對大模型應(yīng)用場景,吳文峻表示,B端和C端對大模型的需求不同,B端的技術(shù)要求會更高?!癈端的應(yīng)用目前主要在聊天對話、客服、文本生成、圖片生成等。不過我認(rèn)為大模型未來盈利的方向在B端,因?yàn)锽端是面向企業(yè)進(jìn)行定制服務(wù)的,部署的空間會更大,當(dāng)然技術(shù)要求也會更高?!?/p>

警惕最終“一地雞毛”

面對科技公司對大模型的追逐戰(zhàn)愈演愈烈,業(yè)內(nèi)也有質(zhì)疑聲音:我們需要這么多大模型嗎?瘋狂上線大模型,是否會導(dǎo)致最終“一地雞毛”?

盧言霞表示,“從大模型的開發(fā)到落地,需要的算力、數(shù)據(jù)、人才,都是持續(xù)且較大規(guī)模的投資,另外當(dāng)前技術(shù)也不成熟,確實(shí)有可能產(chǎn)生泡沫?!?/p>

吳文峻認(rèn)為,在目前宣布進(jìn)軍大模型的約40家企業(yè)、機(jī)構(gòu)中,有一些企業(yè)本身在自然語言處理方面就有比較雄厚的積累,也有人工智能的技術(shù)儲備,他們做大模型沒有問題。

“但也有企業(yè)是為了蹭熱點(diǎn),爭取投資才來做大模型。國外有一部分模型已經(jīng)開源,如果這些企業(yè)是基于開源的模型,自己再重新訓(xùn)練,這樣做出來的模型可能在技術(shù)能力、指標(biāo)上達(dá)不到真正有用的大模型的要求?!眳俏木嵝?,“在目前宣布了做大模型的企業(yè)中,最后能做成的或許不超過一半。”

劉剛對此持較為中立的態(tài)度,他表示,大模型在各行各業(yè)都有很大應(yīng)用前景,而且不同的行業(yè)也會產(chǎn)生不同的大模型,大模型也有語義、語音、文字等各種類型。劉剛說,“大模型即使是同質(zhì)化,我認(rèn)為也并非很嚴(yán)重的問題,就是要允許多個(gè)模型之間的競爭,最后有一個(gè)勝出了,就是找到了最優(yōu)的道路,也是完成了一個(gè)創(chuàng)新的進(jìn)化篩選過程?!?/strong>

(文章來源:中新經(jīng)緯)

關(guān)鍵詞:

相關(guān)閱讀:
熱點(diǎn)
圖片