首頁>消費(fèi) >
環(huán)球觀察:GPT-4“王炸”發(fā)布:專業(yè)和學(xué)術(shù)水平接近人類 做個(gè)網(wǎng)站只用了1秒 2023-03-15 13:59:47  來源:澎湃新聞

ChatGPT熱度還未散去,ChatGPT開發(fā)商OpenAI發(fā)布了更強(qiáng)大的GPT-4,堪稱“王炸”產(chǎn)品。

當(dāng)?shù)貢r(shí)間3月14日,OpenAI公開發(fā)布大型多模態(tài)模型GPT-4,與ChatGPT所用的模型相比,GPT-4不僅能夠處理圖像內(nèi)容,且回復(fù)的準(zhǔn)確性有所提高。目前GPT-4沒有免費(fèi)版本,僅向ChatGPT Plus的付費(fèi)訂閱用戶及企業(yè)和開發(fā)者開放。


(資料圖片僅供參考)

來源:OpenAI官網(wǎng)

“這是OpenAI努力擴(kuò)展深度學(xué)習(xí)的最新里程碑?!監(jiān)penAI介紹,GPT-4在專業(yè)和學(xué)術(shù)方面表現(xiàn)出近似于人類的水平。例如,它在模擬律師考試中的得分能夠排進(jìn)前10%左右,相比之下,GPT-3.5的得分只能排在倒數(shù)10%左右。

與此前的GPT系列模型相比,GPT-4最大的突破之一是在文本之外還能夠處理圖像內(nèi)容。OpenAI表示,用戶同時(shí)輸入文本和圖像的情況下,它能夠生成自然語言和代碼等文本。

目前圖像處理功能還未公開,不過該公司在官網(wǎng)上展示了一系列案例。例如,輸入如下圖片并詢問“這張圖片有什么不尋常之處”,GPT-4可作出回答“這張照片的不同尋常之處在于,一名男子正在行駛中的出租車車頂上,使用熨衣板熨燙衣服?!?/p>

來源:OpenAI官網(wǎng)

在官方演示中,GPT-4幾乎就只花了1-2秒的時(shí)間,識(shí)別了手繪網(wǎng)站圖片,并根據(jù)要求實(shí)時(shí)生成了網(wǎng)頁代碼制作出了幾乎與手繪版一樣的網(wǎng)站。

除了普通圖片,GPT-4還能處理更復(fù)雜的圖像信息,包括表格、考試題目截圖、論文截圖、漫畫等,例如根據(jù)專業(yè)論文直接給出論文摘要和要點(diǎn)。

GPT-4可對(duì)論文進(jìn)行解讀,來源:OpenAI官網(wǎng)

與此前的模型相比,GPT-4的準(zhǔn)確性有所提高。OpenAI稱,該公司花費(fèi)6個(gè)月的時(shí)間,利用對(duì)抗性測(cè)試程序和ChatGPT的經(jīng)驗(yàn)教訓(xùn)迭代調(diào)整GPT-4,從而在真實(shí)性、可操縱性和拒絕超出設(shè)定范圍方面取得了有史以來最好的結(jié)果,“至少對(duì)我們而言,GPT-4訓(xùn)練運(yùn)行前所未有地穩(wěn)定,成為首個(gè)能夠提前準(zhǔn)確預(yù)測(cè)其訓(xùn)練性能的大型模型?!?/p>

OpenAI稱,在公司內(nèi)部的對(duì)抗性真實(shí)性評(píng)估中,GPT-4的得分比最新的GPT-3.5高40%,相應(yīng)的“不允許內(nèi)容請(qǐng)求的傾向”降低了 82%,根據(jù)政策響應(yīng)敏感請(qǐng)求(如醫(yī)療建議和自我傷害)的頻率提高了29%。

不僅是英語,該模型在多種語言方面均表現(xiàn)出優(yōu)越性。OpenAI稱,在測(cè)試的26種語言中,GPT-4在24種語言方面的表現(xiàn)均優(yōu)于GPT-3.5等其他大語言模型的英語語言性能。其中GPT-4的中文能夠達(dá)到80.1%的準(zhǔn)確性,而GPT-3.5的英文準(zhǔn)確性僅為70.1%,GPT-4英文準(zhǔn)確性提高到了85.5%。

來源:OpenAI官網(wǎng)

不過, 與早期的GPT模型一樣,GPT-4仍然存在一定的局限性。

OpenAI稱,它并不完全可靠,可能會(huì)出現(xiàn)推理錯(cuò)誤 ,“GPT-4缺乏對(duì)絕大多數(shù)數(shù)據(jù)切斷后(2021年9月)發(fā)生的事件的了解,并且無法從中吸取經(jīng)驗(yàn)教訓(xùn)……它有時(shí)會(huì)出現(xiàn)簡(jiǎn)單的推理錯(cuò)誤,它會(huì)輕信用戶明顯的虛假陳述,有時(shí)它會(huì)像人類一樣在難題上失敗,例如在它生成的代碼中引入安全漏洞?!?/p>

基于此,OpenAI提醒,用戶在使用語言模型時(shí)應(yīng)格外小心,最好輔助以人工審查、附加上下文、或完全避免在高風(fēng)險(xiǎn)情況下使用它。

值得注意的是,GPT-4雖然于14日才正式公開,但早在一個(gè)月前,微軟的新版搜索引擎必應(yīng)(Bing)就已經(jīng)在GPT-4 上運(yùn)行。微軟表示,“如果您在過去五周內(nèi)的任何時(shí)間使用過新版必應(yīng),那么您已經(jīng)體驗(yàn)過GPT-4的早期版本?!?/p>

與免費(fèi)的ChatGPT不同,GPT-4目前僅向ChatGPT Plus的付費(fèi)用戶開放,它也將作為API(應(yīng)用程序編程接口)提供給企業(yè)及開發(fā)者,開發(fā)者需進(jìn)入等候名單上,將該模型集成到他們的應(yīng)用程序中。

OpenAI表示,已經(jīng)有多家公司將GPT-4搭載到他們的產(chǎn)品中,包括語言學(xué)習(xí)工具軟件多鄰國(guó)(Duolingo)、移動(dòng)支付公司Stripe和可汗學(xué)院(Khan Academy)。

相關(guān)報(bào)道

更強(qiáng)更可靠!OpenAI公布GPT-4:可在考試中超過90%的人類

GPT-4來了!支持以圖生文 OpenAI付款系統(tǒng)被擠爆 首批用戶連夜寫測(cè)評(píng)

ChatGPT進(jìn)化到GPT-4!一文解讀OpenAI模型的應(yīng)用場(chǎng)景和商業(yè)模式

未來已來?GPT-4剛上線就引發(fā)馬斯克恐慌 一文梳理其與3.5版本區(qū)別

ChatGPT成“西南偏南”熱議話題 OpenAI聯(lián)合創(chuàng)始人:未來AI更像一個(gè)全天候助手 將首先替代基于認(rèn)知的工作

(文章來源:澎湃新聞)

關(guān)鍵詞:

相關(guān)閱讀:
熱點(diǎn)
圖片 圖片