隨著AI大模型研發(fā)應(yīng)用熱潮持續(xù)高漲,記者注意到,賽道內(nèi)的玩家開始將重心從語(yǔ)言大模型轉(zhuǎn)向視覺大模型。近期,Adobe、Meta、360、美圖等多家國(guó)內(nèi)外互聯(lián)網(wǎng)頭部企業(yè)紛紛發(fā)表大模型成果,為本就火熱異常的AI市場(chǎng)再添了一把火。
(資料圖)
“人工智能在視頻領(lǐng)域的應(yīng)用越來越受到重視?!敝袊?guó)通信工業(yè)協(xié)會(huì)兩化融合委員會(huì)副會(huì)長(zhǎng)吳高斌向《華夏時(shí)報(bào)》記者表示,這些大型AI模型的發(fā)布為企業(yè)間的競(jìng)爭(zhēng)帶來了新的動(dòng)力。企業(yè)之間的競(jìng)爭(zhēng)將促進(jìn)技術(shù)創(chuàng)新和進(jìn)步,同時(shí)也將帶來更好的產(chǎn)品和服務(wù)。競(jìng)爭(zhēng)還將促進(jìn)企業(yè)間的合作和共享資源,從而更好地滿足市場(chǎng)需求。
海內(nèi)外視覺大模型“神仙打架”
在鱗次櫛比的語(yǔ)言大模型、多模態(tài)大模型紛紛涌現(xiàn)之后,“視覺大模型”成為又一個(gè)兵家必爭(zhēng)之地。日前,美圖發(fā)布AI視覺大模型MiracleVision,一同發(fā)布的還有AI視覺創(chuàng)作工具WHEE、AI數(shù)字人生成工具DreamAvatar、美圖AI助手RoboNeo等7款產(chǎn)品。
據(jù)介紹,MiracleVision具有強(qiáng)大的視覺表現(xiàn)力和創(chuàng)作力,能從繪畫、設(shè)計(jì)、影視、攝影、游戲、3D、動(dòng)漫等視覺創(chuàng)作場(chǎng)景反推技術(shù)演化。與市面上其他大模型不同,它尤其擅長(zhǎng)亞洲人像攝影、國(guó)風(fēng)國(guó)潮、商業(yè)設(shè)計(jì)等生成方向。
美圖公司創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官吳欣鴻在接受《華夏時(shí)報(bào)》記者采訪時(shí)表示:“美圖大模型的核心優(yōu)勢(shì)是‘懂美學(xué)’,C端用戶基礎(chǔ)足夠大,大模型冷啟動(dòng)的獲客成本低,美圖目前有2.43億的月活用戶,全球VIP會(huì)員數(shù)為719萬,能在短時(shí)間去驗(yàn)證產(chǎn)品成功與否。不同于其他廠商,美圖大模型聚焦于美學(xué)(畫面畫質(zhì)設(shè)計(jì)等),未來如果非要競(jìng)爭(zhēng),會(huì)在美學(xué)上面去‘卷’?!?/p>
無獨(dú)有偶,360也日前正式發(fā)布“360智腦-視覺大模型”。 360創(chuàng)始人周鴻祎表示,大語(yǔ)言模型是構(gòu)建視覺大模型的基礎(chǔ),多模態(tài)能力增強(qiáng)的核心是借助了大語(yǔ)言模型的認(rèn)知、推理、決策能力。同時(shí),視覺大模型也是“360智腦”的重要能力組成,能夠看懂圖片,未來還能看懂視頻、聽懂聲音。
海外企業(yè)也已經(jīng)開始在視覺大模型上布局。日前,社交媒體巨頭Meta宣布,將向研究人員開放一個(gè)名為I-JEPA的“類人”人工智能模型的部分組件,該模型可以比現(xiàn)有模型更準(zhǔn)確地分析和完成未完成的圖像,而不是像其他生成式人工智能模型那樣,只根據(jù)附近的像素進(jìn)行推斷。
Meta公司首席人工智能科學(xué)家楊立昆曾公開指出,當(dāng)前的GPT自回歸模型存在缺乏規(guī)劃、推理的能力,未來GPT系統(tǒng)或?qū)⒈粧仐?,并給出了他認(rèn)為的正確答案——世界模型。據(jù)稱I-JEPA是第一個(gè)基于其愿景關(guān)鍵組成部分的AI模型,能比現(xiàn)有模型更準(zhǔn)確地分析和完成未完成的圖像。
除此之外,Meta還發(fā)布了語(yǔ)音生成AI模型“Voicebox”,支持從文本中生成語(yǔ)音,能夠根據(jù)僅兩秒長(zhǎng)的樣本匹配音頻風(fēng)格,并將文本樣本轉(zhuǎn)換為另一種語(yǔ)言,在給定單獨(dú)的語(yǔ)音樣本的情況下,并能夠以說話者的原始語(yǔ)音朗讀翻譯后的文本內(nèi)容,目前支持六種語(yǔ)言:英語(yǔ)、法語(yǔ)、德語(yǔ)、西班牙語(yǔ)、波蘭語(yǔ)和葡萄牙語(yǔ)。
而早在今年4月,Adobe便將其Adobe Firefly功能(類ChatGPT產(chǎn)品)集成在Premiere Pro、After Effects、Audition、Remix等音視頻產(chǎn)品矩陣中,為用戶提供一鍵生成內(nèi)容、剪輯、調(diào)色、更換音樂等功能。
從“語(yǔ)言大模型”到“視覺大模型”
《中國(guó)人工智能大模型地圖研究報(bào)告》顯示,從全球已發(fā)布的大模型數(shù)量及分布來看,中國(guó)和美國(guó)大幅領(lǐng)先,超過全球總數(shù)的80%。同時(shí),歐洲、俄羅斯、以色列等越來越多的研發(fā)團(tuán)隊(duì)也在投入大模型研發(fā)。但值得注意的是,我國(guó)在計(jì)算機(jī)視覺等領(lǐng)域的大模型還較少。
究其原因,北京智源研究院訪問首席科學(xué)家顏水成向《華夏時(shí)報(bào)》記者表示:“現(xiàn)在視覺模型發(fā)展稍微滯后的主要原因,是因?yàn)橐曈X大模型吃算力吃得比文本要大很多,所以我們也期待芯片更快速的發(fā)展,甚至有可能把非GPU其他的芯片融合在一起來做。現(xiàn)在大家見到的模型一般千卡級(jí)比較常見,但可能明年就有人會(huì)用萬卡級(jí)來做?!?/p>
而在北京智源人工智能研究院院長(zhǎng)黃鐵軍看來,視覺領(lǐng)域是大模型領(lǐng)域下一個(gè)浪潮的重點(diǎn)。他指出,視覺大模型和語(yǔ)言大模型背后的思想方法和基本路線是異曲同工的,只是輸入的數(shù)據(jù)變成了圖像和視頻,訓(xùn)練出來的模型則具有一定的通用視覺語(yǔ)言能力,一種是之前提到的AIGC(人工智能自動(dòng)生成內(nèi)容),可以生成圖像和藝術(shù)品,“還有一種更基本的能力,就是看到世界之后,得首先能把這個(gè)世界(萬物)分清?!?/p>
對(duì)于視覺大模型的發(fā)展,不少機(jī)構(gòu)也表達(dá)出看好的態(tài)度。中金研究發(fā)布的研報(bào)認(rèn)為,計(jì)算機(jī)視覺未來有望實(shí)現(xiàn)更高程度的自動(dòng)化、高精度和低功耗,進(jìn)一步豐富元宇宙的內(nèi)容生態(tài),降低進(jìn)入門檻。計(jì)算機(jī)視覺的進(jìn)步引領(lǐng)了三維重建和動(dòng)捕技術(shù)快速成熟,并逐漸在各自的領(lǐng)域積累技術(shù)進(jìn)步。計(jì)算機(jī)視覺未來有望迎來更高程度的自動(dòng)化、更高的精度,以及更低的功耗,逐漸在移動(dòng)端實(shí)現(xiàn)更好的視覺效果,被應(yīng)用在大量下游行業(yè),逐漸邁向連接物理世界和數(shù)字世界的長(zhǎng)期愿景。
中信證券研究也表示,在設(shè)計(jì)領(lǐng)域,大模型引領(lǐng)數(shù)字設(shè)計(jì)走向智能設(shè)計(jì),相關(guān)工業(yè)設(shè)計(jì)軟件結(jié)合GPT等技術(shù),可應(yīng)用在設(shè)計(jì)規(guī)劃、布局優(yōu)化、插件助手、草圖繪制等場(chǎng)景,工業(yè)設(shè)計(jì)軟件有望在AI升級(jí)的大趨勢(shì)下迎來新一輪生產(chǎn)力革命。
(文章來源:華夏時(shí)報(bào))
關(guān)鍵詞:
- AI“百模大戰(zhàn)”風(fēng)向變了?360、美圖先后出招 視覺大模型上演“神仙打架”
- 昆侖萬維超150億元市值蒸發(fā)!再現(xiàn)“賈躍亭式”減持 深交所火速關(guān)注
- 離婚其實(shí)是花樣減持套路?半導(dǎo)體龍頭卓勝微回應(yīng)34億元天價(jià)“分手費(fèi)”
- 百事通!江蘇揚(yáng)州:小巷里的傳承與“粽”不同
- 全國(guó)中成藥集采擬中選結(jié)果公布:68款藥品擬中選 有藥品價(jià)格降幅超90% 全球熱點(diǎn)
- 京東養(yǎng)車與中國(guó)石油北京銷售公司達(dá)成合作 將打造雙品牌標(biāo)桿門店-環(huán)球訊息
- 時(shí)隔一年再更新!券商重要名單發(fā)布 5家新進(jìn)4家退出 上榜將獲諸多便利|世界快看
- 理想打響純電賽道“第一槍”|天天動(dòng)態(tài)
- 什么山什么水?dāng)?shù)字成語(yǔ)(含有數(shù)字的成語(yǔ),什么山什么水)|環(huán)球訊息
- 在中國(guó),如果有100萬存款,算什么水平?銀行員工“直言不諱”! 環(huán)球焦點(diǎn)
- 聽文物講故事·端午丨古代名畫帶你解鎖端午“斗草”_環(huán)球今頭條
- 端午小長(zhǎng)假看看宿遷人計(jì)劃去哪兒玩
- 端午節(jié)期間最高氣溫34℃ 23日夜里起有中到大雨_要聞
- 數(shù)據(jù)中折射出的經(jīng)濟(jì)“加速度”
- 釋放經(jīng)濟(jì)新活力 假期民俗文化熱潮帶動(dòng)消費(fèi)市場(chǎng)持續(xù)升溫
- 花都神眼狂少-環(huán)球資訊
- 環(huán)球視點(diǎn)!soncap認(rèn)證怎么查(soncap認(rèn)證)
- 今日播報(bào)!再也不怕理發(fā)店、健身房跑路!深圳擬立法規(guī)范預(yù)付式消費(fèi)
- 天天速訊:那年花開閱讀答案
- 焦點(diǎn)熱議:湖北省宜昌市秭歸縣香溪村峽江深處粽飄香(走進(jìn)傳統(tǒng)村落)
- 日本兩名男子盜竊約3萬3000張游戲王卡牌而被捕 總
- ?民生銀行信陽(yáng)分行深入開展“防范非法集資宣傳月”
- hddscan怎么用?hddscan是什么軟件?-當(dāng)前信息
- 東風(fēng)雪鐵龍?jiān)趺礃?東風(fēng)雪鐵龍有哪些車型?
- 今日精選:cci指標(biāo)參數(shù)設(shè)置成多少最準(zhǔn)確?cci指標(biāo)是
- 油泵的工作原理是什么?油泵的維護(hù)保養(yǎng)應(yīng)注意什么?_
- 富士康上市股票價(jià)格是多少 富士康股票叫什么?
- 全面注冊(cè)制是什么意思?注冊(cè)制散戶還能炒股嗎?
- 《穿越火線》封號(hào)怎么查詢?CF賬號(hào)如何解封?
- 快報(bào):房貸改lpr后悔了怎么辦?Lpr下降對(duì)已經(jīng)買房的
- 1 AI“百模大戰(zhàn)”風(fēng)向變了?360、美圖先后出招 視覺
- 2 昆侖萬維超150億元市值蒸發(fā)!再現(xiàn)“賈躍亭式”減持
- 3 離婚其實(shí)是花樣減持套路?半導(dǎo)體龍頭卓勝微回應(yīng)34億
- 4 百事通!江蘇揚(yáng)州:小巷里的傳承與“粽”不同
- 5 全國(guó)中成藥集采擬中選結(jié)果公布:68款藥品擬中選 有
- 6 京東養(yǎng)車與中國(guó)石油北京銷售公司達(dá)成合作 將打造雙
- 7 時(shí)隔一年再更新!券商重要名單發(fā)布 5家新進(jìn)4家退出
- 8 理想打響純電賽道“第一槍”|天天動(dòng)態(tài)
- 9 什么山什么水?dāng)?shù)字成語(yǔ)(含有數(shù)字的成語(yǔ),什么山什么水
- 10 在中國(guó),如果有100萬存款,算什么水平?銀行員工“