首頁>資訊 >
GPU戰(zhàn)火重燃 2021-10-29 12:23:31  來源:36氪

從早期“百家爭雄”,到英偉達(dá)“一統(tǒng)江湖”,再到如今AMD、英特爾欲“三分天下”。

GPU在技術(shù)與市場的不斷變換輪轉(zhuǎn)中,迎來一次次蛻變與重塑。

GPU(Graphic Processing Unit),圖形處理器,又稱顯示核心、視覺處理器、顯示芯片,是一種專門在個(gè)人電腦、工作站、游戲機(jī)和一些移動(dòng)設(shè)備上做圖像和圖形相關(guān)運(yùn)算工作的微處理器。

由于可視化需要大量的圖形、圖像計(jì)算能力,無論是云端還是邊緣側(cè)都需要大量的高性能圖像處理能力,因此近年來GPU實(shí)現(xiàn)了較快的市場增速。同時(shí),隨著GPU自身在并行處理和通用計(jì)算的優(yōu)勢,逐步拓展了其在服務(wù)器、汽車、礦機(jī)、人工智能、邊緣計(jì)算等領(lǐng)域的衍生需求。

據(jù)數(shù)據(jù)統(tǒng)計(jì),2020年全球GPU行業(yè)規(guī)模為200億美元,預(yù)計(jì)2021年將增長15%。從2015年到2025年,GPU行業(yè)預(yù)計(jì)平均每年增長13%,將從80億美元擴(kuò)展到350億美元的規(guī)模。

GPU可以按照兩種方式進(jìn)行分類:按照接入方式可以分為集成GPU和獨(dú)立GPU,集成GPU將圖形核心以單獨(dú)芯片的方式集成在主板上或CPU芯片上,并且動(dòng)態(tài)共享部分系統(tǒng)內(nèi)存作為顯存使用,因此能夠提供簡單的圖形處理能力,以及較為流暢的編碼應(yīng)用;獨(dú)立GPU擁有單獨(dú)的圖形核心和獨(dú)立的顯存,能夠滿足復(fù)雜龐大的圖形處理需求,并提供高效的視頻編碼應(yīng)用。

另一種是根據(jù)應(yīng)用端的不同可以分為PC GPU、移動(dòng)GPU和服務(wù)器GPU。PC GPU是用于PC端,既有獨(dú)立也有集成;移動(dòng)GPU用于移動(dòng)端,一般都是集成;服務(wù)器GPU是專為計(jì)算加速或深度學(xué)習(xí)應(yīng)用的獨(dú)立GPU。

GPU分類及代表廠商

GPU發(fā)展歷程,英偉達(dá)一統(tǒng)江湖

GPU的誕生和演進(jìn)

在PC誕生之初,并不存在GPU這個(gè)概念,所有的圖形和多媒體運(yùn)算都由CPU負(fù)責(zé)。但是由于X86 CPU的暫存器數(shù)量有限,適合串行計(jì)算而不適合并行計(jì)算。以英特爾為代表的廠商多次推出SSE等多媒體拓展指令集試圖彌補(bǔ)CPU的缺陷,但僅僅在指令集方面的改進(jìn)起不到根本效果,所以誕生了圖形加速器作為CPU的輔助運(yùn)算單元。

追溯GPU的歷史,要從圖形顯示控制器說起。世界上第一臺個(gè)人電腦IBM5150于1981年由IBM公司發(fā)布,這臺PC搭載了黑白顯示適配器(MDA)和彩色圖形適配器(CGA),這便是最早的圖形顯示控制器。后來,IBM又推出EGA,并于1987年提出了VGA標(biāo)準(zhǔn),VGA在文字模式下可支持720×400分辨率,繪圖模式下可支持640×480×16色和320×200×256色輸出,為了保證兼容性,當(dāng)今的顯卡依然會遵循VGA標(biāo)準(zhǔn)。

從MDA到VGA,圖形圖像的運(yùn)算都由CPU來完成,圖形卡的作用主要是將其顯示出來。1991年,S3 Graphics推出的“S3 86C911”,正式開啟2D圖形硬件加速時(shí)代,它能進(jìn)行字符、基本2D圖元和矩形的繪制。到了1995年,幾乎所有的顯卡都具備2D加速功能,2D圖形接口GDI、DirectFB等也都相繼出現(xiàn),并延續(xù)至今。

1994年,3DLabs發(fā)布的Glint 300SX是第一顆用于PC的3D圖形加速芯片,它支持高氏著色、深度緩沖、抗鋸齒、Alpha混合等特性,開啟了顯卡的3D加速時(shí)代。然而這個(gè)階段的顯卡大多沒有執(zhí)行統(tǒng)一的標(biāo)準(zhǔn),加速功能也不盡相同。能夠看到,GPU概念推出之前,ATI、英偉達(dá)、3DFX等公司在此領(lǐng)域展開激烈競爭,推動(dòng)著圖形處理芯片的發(fā)展。

直到1999年,英偉達(dá)推出GeForce256圖形處理芯片時(shí),首次提出了GPU的概念,它整合了硬件變換和光照(T&L)、立方環(huán)境材質(zhì)貼圖和頂點(diǎn)混合、紋理壓縮和凹凸映射貼圖、雙重紋理四像素256位渲染引擎等,并且兼容DirectX和OpenGL,被稱為世界上第一款GPU。

GPU的出現(xiàn)(硬件T&L的引入)使計(jì)算機(jī)減少了對CPU的依賴,并解放了部分原本CPU的工作。2001年微軟發(fā)布DirectX 8,提出了渲染單元模式(shader model)的概念。從此,GPU從硬件T&L進(jìn)入shader時(shí)代,此時(shí)的GPU架構(gòu)還是固定管線。

固定管線架構(gòu)持續(xù)多年,直到微軟推出DirectX 10,shader不再扮演固定的角色,每一個(gè)shader都可以處理頂點(diǎn)和像素,這就是統(tǒng)一渲染著色器(unified shader),它的出現(xiàn)避免了固定管線中頂點(diǎn)著色器和像素著色器資源分配不合理的現(xiàn)象發(fā)生,使得GPU利用率更高。

第一款采用統(tǒng)一渲染架構(gòu)的GPU是ATI在2005年與微軟合作的游戲主機(jī)XBOX 360上采用的Xenos,它是ATI第一代統(tǒng)一渲染架構(gòu)。而真正具有影響力的,是英偉達(dá)在2006年發(fā)布的GeForce 8800 GTX(核心代號G80),成為第一款采用統(tǒng)一渲染架構(gòu)的桌面GPU,其架構(gòu)影響了日后的數(shù)代產(chǎn)品,是一款極具劃時(shí)代意義的GPU。

與G80一同發(fā)布的,還有著名的CUDA,它能利用英偉達(dá) GPU的運(yùn)算能力進(jìn)行并行計(jì)算,拓展了GPU的應(yīng)用領(lǐng)域,然而這時(shí)的CUDA只能算是GPU的副業(yè)。2011年TESLA GPU計(jì)算卡發(fā)布,標(biāo)志著英偉達(dá)將正式用于計(jì)算的GPU產(chǎn)品線獨(dú)立出來,憑借著架構(gòu)上的優(yōu)勢,GPU在通用計(jì)算及超級計(jì)算機(jī)領(lǐng)域,逐漸取代CPU成為主角。

英偉達(dá)“一統(tǒng)江湖”

在早期的圖形處理器市場中玩家眾多,3DFX通過推出Voodoo 3D加速卡在當(dāng)時(shí)領(lǐng)先于市場同行。英偉達(dá)由于蔑視當(dāng)時(shí)的主流標(biāo)準(zhǔn),采用自創(chuàng)的四邊形成像(QTM)技術(shù),在同時(shí)期打造的NV1和NV2都未成功。此后陸續(xù)推出RIVA系列和TNT、TNT2,逐漸占據(jù)市場主流地位,并最終通過1999年的GeForce256擊敗3DFX,并于2000年英偉達(dá)將3DFX的知識產(chǎn)權(quán)買斷。

在進(jìn)入21世紀(jì)后,英偉達(dá)從此前的蠻荒時(shí)代中脫穎而出,市場中主要還剩下英偉達(dá)和ATI。ATI在1985年至2006年之間是全球重要的顯示芯片公司,2000年ATI推出Radeon品牌,從此與英偉達(dá)開創(chuàng)了獨(dú)立GPU領(lǐng)域兩強(qiáng)爭霸的格局。2006年AMD斥資54億美元收購ATI,旨在融合CPU和GPU。在AMD收購ATI之后的重心更多地轉(zhuǎn)向中低端市場,性能端漸漸落后于英偉達(dá)。而后英偉達(dá)牢牢掌控著高端市場,AMD的GPU則成為了性價(jià)比的代名詞。

目前,獨(dú)立顯卡市場主要由英偉達(dá)和AMD兩家占據(jù)。市場調(diào)查機(jī)構(gòu)——Jon Peddie Research發(fā)布的二季度顯卡市場報(bào)告顯示,在目前獨(dú)立顯卡市場中,目前AMD和NIVDIA兩大廠商居于統(tǒng)治地位,從市場份額上來看,AMD獨(dú)顯份額為17%,英偉達(dá)則增長到了83%。英特爾在前不久宣布進(jìn)軍高端獨(dú)立顯卡市場,預(yù)計(jì)首款產(chǎn)品將于明年問世。

來源:JPR、海豚投研

報(bào)告顯示,英偉達(dá)在顯卡市場中表現(xiàn)強(qiáng)勁,市場占有率和出貨量均有明顯增長。AMD則需要面臨顯卡和處理器雙線作戰(zhàn),產(chǎn)能更顯緊張,所以市場份額呈現(xiàn)了下降的趨勢。

英偉達(dá)的GPU架構(gòu)自2008年以來幾乎一直保持著每2年一次大更新的節(jié)奏,帶來更多更新的運(yùn)算單元和更好的API適配性。在工藝制程方面,英偉達(dá)GPU從2008年GT200系列的65nm制程逐步升級到了RTX3000系列的7/8nm制程,在整個(gè)過程中,晶體管數(shù)量提升了20多倍,使英偉達(dá)GPU的能效提升了數(shù)十倍,占領(lǐng)了獨(dú)立顯卡技術(shù)的制高點(diǎn)。

2008-2020英偉達(dá)GPU微架構(gòu)進(jìn)化(圖源:慧博資訊)

英偉達(dá)通過對產(chǎn)品的打磨,從眾多顯卡廠商中脫穎而出,鑄就了GPU高端市場的壟斷地位。同時(shí)隨著自動(dòng)駕駛、AI、AR/VR等領(lǐng)域的興起,擁有領(lǐng)先優(yōu)勢的英偉達(dá)有望繼續(xù)領(lǐng)跑市場,憑借產(chǎn)品的領(lǐng)先性和稀缺性,鞏固自身行業(yè)地位。

根據(jù)前十多年的GPU發(fā)展軌跡來看,GPU微架構(gòu)的升級趨勢可以簡要地概括為“更多、更專、更智能”。“更多”指的是晶體管數(shù)量和運(yùn)算單元的增加,其中包括流處理器單元、紋理單元、光柵單元等數(shù)量上升;“更?!笔侵赋顺R?guī)的計(jì)算單元,GPU還會增加新的運(yùn)算單元。例如,英偉達(dá)的圖靈架構(gòu)相較于帕斯卡架構(gòu)新增加了光追單元(RT Cores)和張量單元(Tensor Core),分別處理實(shí)時(shí)光線追蹤和人工智能運(yùn)算;“更智能”是指GPU的AI運(yùn)算能力上升。如第三代的張量單元相較于上代在吞吐量上提升了1倍。

此外,在整個(gè)過程中,英偉達(dá)一直堅(jiān)持不采用IDM的模式,而是讓臺積電負(fù)責(zé)GPU的制造,自生專注于芯片設(shè)計(jì),充分發(fā)揮比較優(yōu)勢,分散了GPU設(shè)計(jì)和制造的風(fēng)險(xiǎn),符合半導(dǎo)體分工的大趨勢。

英特爾、AMD奮起直追,欲三分天下

目前在全球GPU市場中主要的3個(gè)玩家:英偉達(dá)、AMD和英特爾。英偉達(dá)專注于GPU領(lǐng)域,由于此前不具備CPU業(yè)務(wù),公司重心放在更高性能的獨(dú)立顯卡方向。AMD和英特爾由于自身有CPU業(yè)務(wù),在2009年后兩家廠商都各自大力發(fā)展內(nèi)置于CPU的高性能集成式圖形處理內(nèi)核。

瞄準(zhǔn)了未來的市場需求,以及英偉達(dá)在獨(dú)顯市場的壟斷地位,英特爾、AMD奮起直追,想要三分天下。

英特爾直面出擊

由于英特爾在CPU市場的巨大市場優(yōu)勢,帶動(dòng)了集成顯卡的出貨。英特爾憑借在CPU市場60%以上的市場份額,獲得了GPU市場份額上的領(lǐng)先地位。

英特爾是全球最大的PC GPU供應(yīng)商,也是PC和服務(wù)器顯卡唯一的IDM廠商。英特爾的GPU最早可以追溯到1998年的i740,但是由于羸弱的性能和緩慢的更新速度,一直沒有非常大的起色。進(jìn)入酷睿i時(shí)代后,英特爾通過將核芯顯卡和CPU進(jìn)行捆綁銷售,利用CPU的龐大市場份額,確立了公司在集成GPU領(lǐng)域的寡頭壟斷地位。

英特爾核芯顯卡市占率達(dá)到68.3%(圖源:JPR)

近日,英特爾CEO Pat Gelsinger在受訪中表示,目前獨(dú)顯市場幾乎由英偉達(dá)占據(jù),在許多顯示技術(shù)應(yīng)用變得更偏重使用英偉達(dá)提供產(chǎn)品,使其變得過于專有,對于市場生態(tài)發(fā)展顯然不利。因此英特爾希望借助接下來持續(xù)更新的oneAPI框架設(shè)計(jì),讓開發(fā)者、硬件廠商能更容易統(tǒng)整CPU、GPU,乃至于以FPGA形式建構(gòu)更具彈性的運(yùn)算方式,解決編碼模型在不同微架構(gòu)間的壁壘,最大化跨平臺表現(xiàn)和最小化開發(fā)成本,以一種對行業(yè)及其創(chuàng)新且更有利和開放的方式來實(shí)現(xiàn)更加友好的生態(tài)系統(tǒng)。

Gelsinger進(jìn)一步說明了英特爾打算如何在GPU市場上提供有吸引力的產(chǎn)品,并談到他們將如何在英特爾平臺上實(shí)現(xiàn)從集成到分立的無縫過渡。他表示,英特爾聘請了AMD前頂級GPU架構(gòu)師Vineet Goel來監(jiān)督GPU產(chǎn)品基于的Xe GPU架構(gòu),負(fù)責(zé)“架構(gòu)、設(shè)計(jì)和驗(yàn)證英特爾的Xe IP路線圖”。

Xe GPU架構(gòu)是2020年英特爾在其架構(gòu)日中首次推出的,Xe微架構(gòu)可以滿足從集成/入門圖形需求到數(shù)據(jù)中心和高性能計(jì)算的需求,Xe的推出標(biāo)志著英特爾向高性能獨(dú)立顯卡領(lǐng)域的擴(kuò)張。

Xe系列可以細(xì)分為集成/低功耗的Xe-LP、娛樂/游戲的Xe-HPG、數(shù)據(jù)中心/高性能的Xe-HP、高性能計(jì)算的Xe-HPC。英特爾獨(dú)立GPU分為銳炬Xe MAX和服務(wù)器GPU,均隸屬于Xe LP系列,微架構(gòu)與核顯Xe相同,采用標(biāo)準(zhǔn)封裝和10nm SuperFin制程。

目前,Xe-LP的集成版本已經(jīng)被第11代酷睿所采用。Xe-LP的移動(dòng)獨(dú)立GPU版本DG1和服務(wù)器獨(dú)立GPU版本SG1也已發(fā)布。未來,英特爾還將推出面向游戲和高性能桌面的Xe HPG產(chǎn)品線,增加光線追蹤等硬件支持,采用傳統(tǒng)封裝,外包生產(chǎn)。英特爾服務(wù)器GPU將使用Xe HPC、Xe HP微架構(gòu),采用2.5D和3D先進(jìn)封裝,10nm SuperFin及更先進(jìn)自家或外包工藝。

根據(jù)Pat Gelsinger的說法,強(qiáng)調(diào)本身在CPU設(shè)計(jì)本質(zhì)上的優(yōu)勢,加上目前持續(xù)在GPU產(chǎn)品設(shè)計(jì)上精進(jìn),配合oneAPI框架設(shè)計(jì),借此針對不同運(yùn)算需求搭配最佳組合。相比英偉達(dá)將主力放在GPU產(chǎn)品設(shè)計(jì),英特爾在產(chǎn)品設(shè)計(jì)將能統(tǒng)籌更多運(yùn)算應(yīng)用資源,能以相對更低價(jià)格取得,預(yù)期能帶動(dòng)更大的規(guī)模和使用效益。

從英特爾即將推出的 Xe-HPG 顯卡背后的期待來看,英特爾有了一個(gè)好的開端。至于與AMD的斗爭,Gelsinger認(rèn)為,英特爾即將推出的Alder Lake和Sapphire Rapids將有可能終結(jié)對手近年來的成功。

AMD雙向突圍

AMD是全球唯一可以同時(shí)提供高性能GPU和CPU的企業(yè),且能夠同時(shí)提供獨(dú)立GPU和集成GPU,其集成GPU主要運(yùn)用在Ryzen APU、嵌入式、半定制平臺中。獨(dú)立GPU分為Radeon和Instinct系列,主要用于游戲、專業(yè)視覺、服務(wù)器等應(yīng)用。

筆者曾在文章 《芯片巨頭的瘋狂五年》 一文中,描述了AMD近年來的勢不可擋之勢?!叭ツ?,除了Ryzen 5000系CPU的發(fā)布,AMD還發(fā)布了再次震驚世界的Radeon 6000系列GPU,性能摸到了RTX 3090的水準(zhǔn),可以說一舉追平了跟英偉達(dá)多年的差距。2019年以來,RDNA架構(gòu)顯卡的成功試水,使得連續(xù)三年業(yè)績飄紅的AMD在原有市值基礎(chǔ)上繼續(xù)大幅上漲,2022年前,AMD將基于更先進(jìn)的制程打造RDNA3微架構(gòu),進(jìn)一步強(qiáng)化光追等計(jì)算表現(xiàn)。

過去六年,AMD的計(jì)算和圖形收入的營收由18.05億美元上升至64.32億美元,年復(fù)合增速29%。未來五年,AMD計(jì)劃成為高性能計(jì)算的領(lǐng)導(dǎo)者,提供顛覆性的CPU和GPU方案。

從Mercury Research的數(shù)據(jù)可以看到,經(jīng)過長達(dá)六年的重返數(shù)據(jù)中心的爭奪戰(zhàn),到2021年第一季度,AMD的X86處理器在數(shù)據(jù)中心的銷售份額達(dá)到了11.5%,并且制定了可靠的路線圖,以應(yīng)對不斷壯大且正在復(fù)蘇的英特爾的競爭。同時(shí),這對于更愿意組合GPU和CPU的優(yōu)勢互相促進(jìn)產(chǎn)品銷量的AMD來講,無疑也將給英偉達(dá)帶來一定程度上的沖擊。

綜合來看,全球GPU已經(jīng)進(jìn)入了寡頭壟斷的格局。在傳統(tǒng)GPU市場中,排名前三的英偉達(dá)、AMD、英特爾的營收幾乎可以代表整個(gè)GPU行業(yè)的收入。

來源:JPR、海豚投研

獨(dú)立顯卡領(lǐng)域主要由英偉達(dá)和AMD控制,而集成顯卡領(lǐng)域由英特爾和AMD掌控。就整個(gè)GPU市場而言,英特爾在核心GPU上獲得桂冠,市場份額為68%,英偉達(dá)和AMD為15%上下。

對于英偉達(dá)來說,主要對手就是英特爾和AMD,雖然英偉達(dá)的獨(dú)立GPU全球第一,但是其并不具備CPU設(shè)計(jì)能力,相反AMD一直以來都是CPU和GPU同步發(fā)展,而且都還做得不錯(cuò),專注于CPU的英特爾也開始計(jì)劃搞獨(dú)立GPU了,而且英特爾除了X86之外,還押寶了RISC-V,都在針對CPU和GPU同時(shí)布局。

因此,押寶Arm成了英偉達(dá)一個(gè)非常好且不容錯(cuò)過的機(jī)會,此舉可以讓英偉達(dá)具備CPU設(shè)計(jì)能力,也可以做到CPU和GPU同時(shí)發(fā)展,甚至未來還能和X86展開競爭??梢灶A(yù)見,如果Arm的收購能成功,英偉達(dá)將會更加強(qiáng)大。

中國市場的X因素

全球GPU市場表現(xiàn)為寡頭壟斷下的高增長,年復(fù)合增速超過30%,主要市場份額被英偉達(dá)、英特爾、AMD等美系企業(yè)占領(lǐng)。在此宏觀背景下,國產(chǎn)GPU企業(yè)蓬勃發(fā)展,在GPU軟硬件方面同時(shí)出擊。

國產(chǎn)GPU的發(fā)展落后于國產(chǎn)CPU,在國產(chǎn)GPU的開發(fā)中,GPU對CPU的依賴性和GPU的高研發(fā)難度,阻礙了該產(chǎn)業(yè)的快速發(fā)展。直到2014年,長沙景嘉微才成功研發(fā)出了國內(nèi)首款國產(chǎn)高性能、低功耗GPU芯片——JM5400,打破了國外產(chǎn)品長期壟斷我國GPU市場的局面。

中國GPU市場規(guī)模和潛力非常大,龐大的整機(jī)制造能力意味著巨量的GPU需求。另外,國內(nèi)在物聯(lián)網(wǎng)、車聯(lián)網(wǎng)、人工智能等新興計(jì)算領(lǐng)域,對GPU也存在海量需求。據(jù)IDC預(yù)測,2024年中國GPU服務(wù)器市場規(guī)模將達(dá)到64億美元,市場空間巨大。

有觀點(diǎn)表示,AI技術(shù)的爆發(fā)和信創(chuàng)產(chǎn)業(yè)的起步給國產(chǎn)GPU帶來了真正的發(fā)展機(jī)遇。

GPU在并行計(jì)算、浮點(diǎn)以及矩陣運(yùn)算方面具有強(qiáng)大的性能,逐漸在高性能計(jì)算、云端AI應(yīng)用等場景中處于主導(dǎo)地位。雖然英偉達(dá)在這個(gè)領(lǐng)域占據(jù)主導(dǎo)地位,由于其產(chǎn)品價(jià)格昂貴,且國內(nèi)對產(chǎn)業(yè)鏈安全的考量,國產(chǎn)通用GPU有著廣闊的成長空間。同樣,由于信創(chuàng)產(chǎn)業(yè)的發(fā)展,國內(nèi)的桌面GPU也得到了難得的發(fā)展機(jī)遇。

在圖形GPU領(lǐng)域,還是以景嘉微、航錦科技等為代表的傳統(tǒng)企業(yè)為主力。另外,國內(nèi)從事CPU研發(fā)的企業(yè)(如兆芯、龍芯等),也開始切入這個(gè)賽道,增強(qiáng)了國內(nèi)GPU企業(yè)的整體研發(fā)實(shí)力。以國產(chǎn)替代為核心驅(qū)動(dòng)力,在政策指引和充足資金保障下,整個(gè)信創(chuàng)產(chǎn)業(yè)將為國產(chǎn)GPU帶來巨大的市場空間,遠(yuǎn)超以往的軍用等專業(yè)市場。

雖然國產(chǎn)GPU與主流廠商的差距仍很大,但是GPU國產(chǎn)化的道路仍在持續(xù)推進(jìn)。2021年,景嘉微的JM9系列芯片流片、封裝順利。雖然比此前的量產(chǎn)計(jì)劃晚了1-2年,但產(chǎn)品研發(fā)量產(chǎn)工作仍在穩(wěn)步推進(jìn)。JM9系列產(chǎn)品對標(biāo)英偉達(dá)的GTX1080。雖然按之前JM7系列情況看,在使用上可能出現(xiàn)效果打折的情況,但比上一代產(chǎn)品有望實(shí)現(xiàn)較大的提升。

國內(nèi)GPU廠商和產(chǎn)品不完全統(tǒng)計(jì):

國內(nèi)GPU廠商不完全統(tǒng)計(jì)(如有遺漏,歡迎補(bǔ)充)

當(dāng)前,國產(chǎn)GPU已經(jīng)能完成日常辦公等基本的任務(wù)需求,有望先從軍工領(lǐng)域拓展至國內(nèi)政企辦公領(lǐng)域,但是在性能和使用效果方面的差距還是難以打開民用市場。

GPU的使用效果主要受到硬件和驅(qū)動(dòng)兩方面的影響。從國產(chǎn)GPU的發(fā)展情況看,硬件端的追趕較容易實(shí)現(xiàn),工藝制程、顯存位寬、顯存大小、時(shí)鐘頻率和顯存頻率等GPU的外在指標(biāo),可以通過逆向開發(fā)較快實(shí)現(xiàn)。但即使在相同的硬件情況下,GPU驅(qū)動(dòng)也將明顯影響使用效果,之前AMD顯卡出問題也大多是驅(qū)動(dòng)造成的。因此,對于國產(chǎn)GPU在驅(qū)動(dòng)方面需要更長的時(shí)間去追趕。

GPGPU蔚然成風(fēng)

2018年6月,圖靈獎(jiǎng)獲得者John Hennessy 和 David Patterson發(fā)表了《計(jì)算機(jī)架構(gòu)新的黃金時(shí)代》的主題演講,提出了特定領(lǐng)域架構(gòu)(DSA)的概念,旨在為計(jì)算機(jī)架構(gòu)帶來創(chuàng)新并努力邁向新的黃金時(shí)代。

顧名思義,GPU就是用于3D圖形領(lǐng)域的DSA,其目標(biāo)是在3D虛擬世界中渲染照片般逼真的圖像。過去20多年里,GPU的基本需求就源于視頻加速,2D/3D游戲,圖像渲染。

然而,除了3D用途之外,幾乎所有人工智能研究人員都使用GPU來探索超越3D圖形領(lǐng)域的概念。GPU運(yùn)用自身在并行處理和通用計(jì)算的優(yōu)勢,逐步開拓服務(wù)器、汽車、礦機(jī)、人工智能、邊緣計(jì)算等領(lǐng)域的衍生需求。雖然GPU無法離開CPU獨(dú)立運(yùn)作,但是在當(dāng)前“云化”加速的時(shí)代,離開了GPU的CPU也無法勝任龐大的計(jì)算需求。所以GPU和CPU組成了異構(gòu)運(yùn)算體系,從底層經(jīng)由系統(tǒng)軟件和驅(qū)動(dòng)層支持著上層的各種應(yīng)用。GPU已經(jīng)成為了專用計(jì)算時(shí)代的剛需。

我們將這種設(shè)計(jì)理念稱為通用GPU,即GPGPU,是一種利用GPU處理圖形渲染之外通用計(jì)算任務(wù)的高性能芯片。近年來,在摩爾定律演進(jìn)的放緩和GPU在通用計(jì)算領(lǐng)域的高速發(fā)展的此消彼長之下,通用圖形處理器(GPGPU)逐漸“反客為主”,利用GPU來計(jì)算原本由CPU處理的通用計(jì)算任務(wù)。

在GPGPU領(lǐng)域,目前各個(gè)GPU廠商的GPGPU的實(shí)現(xiàn)方法不盡相同,如英偉達(dá)使用的CUDA技術(shù)、原ATI的ATI Stream技術(shù)、Open CL聯(lián)盟、微軟的Directcompute技術(shù)。這些技術(shù)可以讓GPU在媒體編碼加速、視頻補(bǔ)幀與畫面優(yōu)化、人工智能與深度學(xué)習(xí)、科研領(lǐng)域、超級計(jì)算機(jī)等方面發(fā)揮異構(gòu)加速的優(yōu)勢。

以上幾種技術(shù)中,只有OpenCL支持跨平臺和開放標(biāo)注的特性,還可以使用專門的可編程電路來加速計(jì)算,業(yè)界支持非常廣泛。但是,從市占率角度來看,英偉達(dá)無疑是行業(yè)的標(biāo)桿,其不僅擁有百萬開發(fā)者支持的CUDA,還在指令集的覆蓋面、顆粒度、效率等維度有領(lǐng)先優(yōu)勢,早早憑借強(qiáng)大的GPU+CUDA方案切入深度學(xué)習(xí)領(lǐng)域,用大筆研發(fā)投入和時(shí)間堆積起堅(jiān)不可摧的生態(tài)城墻,鮮有能與其相提并論的玩家。

在2021年以前,中國企業(yè)雖然在一些專用芯片領(lǐng)域多有突破,但在GPGPU領(lǐng)域仍是空白。再考慮到產(chǎn)業(yè)生態(tài),國產(chǎn)GPGPU替代還有很長的路要走。以中國的云端AI訓(xùn)練芯片市場為例,最大的供應(yīng)商為國外廠商,其市場份額達(dá)90%。

今年以來,壁仞科技、登臨科技、天數(shù)智芯等本土廠商在GPGPU市場英偉達(dá)一家獨(dú)大的背景下,相繼進(jìn)行流片量產(chǎn),正在努力改變現(xiàn)況。除此之外,若想真正實(shí)現(xiàn)自主可控,GPGPU創(chuàng)企們還需在CUDA生態(tài)的基礎(chǔ)上來推廣自己的芯片,隨著初代國產(chǎn)芯片陸續(xù)順利落地,打造完整的國產(chǎn)核心技術(shù)生態(tài)體系也將是必經(jīng)之路。

因其強(qiáng)大的并行處理能力和存儲帶寬,GPGPU在人工智能市場和高性能市場有廣闊的應(yīng)用空間。有數(shù)據(jù)預(yù)計(jì),到2025年,我國GPGPU芯片板卡的市場規(guī)模將達(dá)458億元,2019年到2025年的年復(fù)合增長率將高達(dá)32%。按行業(yè)來分,互聯(lián)網(wǎng)及云數(shù)據(jù)中心為228億元,安防與政府?dāng)?shù)據(jù)中心為142億元,行業(yè)AI應(yīng)用為37億元,高性能計(jì)算為28億元。

由此可見,從預(yù)期市場和國產(chǎn)替代的緊迫性來講,GPGPU擁有大好前景,一旦突破國際巨頭在“硬件+生態(tài)”層面的壁壘,本土企業(yè)的前景將十分美好。

寫在最后

從GPU行業(yè)廠商的動(dòng)態(tài)和布局來看,戰(zhàn)火已經(jīng)燃起,都在謀劃著自己的保衛(wèi)或突擊之戰(zhàn)。國產(chǎn)GPU廠商的興起,將給行業(yè)帶來新的不確定因素,機(jī)遇和挑戰(zhàn)同樣巨大。

最后,引用AI芯天下的觀點(diǎn),談?wù)剣鴥?nèi)GPU行業(yè)要克服的“幾座大山”:

(1)產(chǎn)品方面。與英偉達(dá)等國際巨頭相比,國內(nèi)GPU尚屬于起步階段。在圖形GPU方面,國內(nèi)領(lǐng)先的景嘉微公司,其最新產(chǎn)品也只相當(dāng)于英偉達(dá)幾年前的產(chǎn)品水平。未來更多高清3D應(yīng)用的出現(xiàn)將帶來GPU需求的持續(xù)增長,對GPU處理能力也是一項(xiàng)不小的挑戰(zhàn),持續(xù)改進(jìn)GPU系統(tǒng)架構(gòu)和設(shè)計(jì)方法,提高運(yùn)算能力和綜合顯示能力,以應(yīng)對新形勢提出的發(fā)展要求。

(2)專利方面。數(shù)據(jù)顯示,全球GPU技術(shù)領(lǐng)域?qū)@麛?shù)量排名前20的公司占有全球70%的GPU專利。英偉達(dá),英特爾和AMD還是GPU技術(shù)領(lǐng)域全球?qū)@易宄钟袛?shù)量排名的前三。其中,英偉達(dá)持有專利數(shù)量占全球總量的近20%。所謂得專利者得天下,本土廠商需要在此發(fā)力,構(gòu)建出可靠的護(hù)城河。

(3)在圖形領(lǐng)域,GPU對于CPU和操作系統(tǒng)的依附性很強(qiáng)。在GPGPU領(lǐng)域,CUDA生態(tài)是國內(nèi)企業(yè)必須要翻越的一座大山。當(dāng)前的AI開發(fā)工程師,多數(shù)是在CUDA平臺上進(jìn)行開發(fā)的。因此,即使有國產(chǎn)GPU芯片可以實(shí)現(xiàn)替代,但要開發(fā)者實(shí)現(xiàn)遷移則是一項(xiàng)更為艱巨的工作。

(4)近些年,國外GPU技術(shù)快速發(fā)展,已經(jīng)大大超出了其傳統(tǒng)功能的范疇。國內(nèi)GPU芯片的研制雖然可滿足目前大多數(shù)圖形應(yīng)用需求,但在科學(xué)計(jì)算、人工智能及新型的圖形渲染技術(shù)方面仍然和國外領(lǐng)先水平存在較大差距,未來持續(xù)發(fā)展國產(chǎn)GPU勢在必行。

本文來自微信公眾號 “半導(dǎo)體行業(yè)觀察”(ID:icbank),作者:L晨光,36氪經(jīng)授權(quán)發(fā)布。

關(guān)鍵詞: 戰(zhàn)火 GPU

相關(guān)閱讀:
熱點(diǎn)
圖片 圖片