久久久久久91,91色综合久久,午夜精品久久久久

GPU戰(zhàn)火重燃 2021-10-29 12:23:31　　來源：36氪

從早期“百家爭雄”，到英偉達(dá)“一統(tǒng)江湖”，再到如今AMD、英特爾欲“三分天下”。
GPU在技術(shù)與市場的不斷變換輪轉(zhuǎn)中，迎來一次次蛻變與重塑。

GPU（Graphic Processing Unit），圖形處理器，又稱顯示核心、視覺處理器、顯示芯片，是一種專門在個(gè)人電腦、工作站、游戲機(jī)和一些移動(dòng)設(shè)備上做圖像和圖形相關(guān)運(yùn)算工作的微處理器。

由于可視化需要大量的圖形、圖像計(jì)算能力，無論是云端還是邊緣側(cè)都需要大量的高性能圖像處理能力，因此近年來GPU實(shí)現(xiàn)了較快的市場增速。同時(shí)，隨著GPU自身在并行處理和通用計(jì)算的優(yōu)勢，逐步拓展了其在服務(wù)器、汽車、礦機(jī)、人工智能、邊緣計(jì)算等領(lǐng)域的衍生需求。

據(jù)數(shù)據(jù)統(tǒng)計(jì)，2020年全球GPU行業(yè)規(guī)模為200億美元，預(yù)計(jì)2021年將增長15%。從2015年到2025年，GPU行業(yè)預(yù)計(jì)平均每年增長13%，將從80億美元擴(kuò)展到350億美元的規(guī)模。

GPU可以按照兩種方式進(jìn)行分類：按照接入方式可以分為集成GPU和獨(dú)立GPU，集成GPU將圖形核心以單獨(dú)芯片的方式集成在主板上或CPU芯片上，并且動(dòng)態(tài)共享部分系統(tǒng)內(nèi)存作為顯存使用，因此能夠提供簡單的圖形處理能力，以及較為流暢的編碼應(yīng)用；獨(dú)立GPU擁有單獨(dú)的圖形核心和獨(dú)立的顯存，能夠滿足復(fù)雜龐大的圖形處理需求，并提供高效的視頻編碼應(yīng)用。

另一種是根據(jù)應(yīng)用端的不同可以分為PC GPU、移動(dòng)GPU和服務(wù)器GPU。PC GPU是用于PC端，既有獨(dú)立也有集成；移動(dòng)GPU用于移動(dòng)端，一般都是集成；服務(wù)器GPU是專為計(jì)算加速或深度學(xué)習(xí)應(yīng)用的獨(dú)立GPU。

GPU分類及代表廠商

GPU發(fā)展歷程，英偉達(dá)一統(tǒng)江湖

GPU的誕生和演進(jìn)

在PC誕生之初，并不存在GPU這個(gè)概念，所有的圖形和多媒體運(yùn)算都由CPU負(fù)責(zé)。但是由于X86 CPU的暫存器數(shù)量有限，適合串行計(jì)算而不適合并行計(jì)算。以英特爾為代表的廠商多次推出SSE等多媒體拓展指令集試圖彌補(bǔ)CPU的缺陷，但僅僅在指令集方面的改進(jìn)起不到根本效果，所以誕生了圖形加速器作為CPU的輔助運(yùn)算單元。

追溯GPU的歷史，要從圖形顯示控制器說起。世界上第一臺個(gè)人電腦IBM5150于1981年由IBM公司發(fā)布，這臺PC搭載了黑白顯示適配器（MDA）和彩色圖形適配器（CGA），這便是最早的圖形顯示控制器。后來，IBM又推出EGA，并于1987年提出了VGA標(biāo)準(zhǔn)，VGA在文字模式下可支持720×400分辨率，繪圖模式下可支持640×480×16色和320×200×256色輸出，為了保證兼容性，當(dāng)今的顯卡依然會遵循VGA標(biāo)準(zhǔn)。

從MDA到VGA，圖形圖像的運(yùn)算都由CPU來完成，圖形卡的作用主要是將其顯示出來。1991年，S3 Graphics推出的“S3 86C911”，正式開啟2D圖形硬件加速時(shí)代，它能進(jìn)行字符、基本2D圖元和矩形的繪制。到了1995年，幾乎所有的顯卡都具備2D加速功能，2D圖形接口GDI、DirectFB等也都相繼出現(xiàn)，并延續(xù)至今。

1994年，3DLabs發(fā)布的Glint 300SX是第一顆用于PC的3D圖形加速芯片，它支持高氏著色、深度緩沖、抗鋸齒、Alpha混合等特性，開啟了顯卡的3D加速時(shí)代。然而這個(gè)階段的顯卡大多沒有執(zhí)行統(tǒng)一的標(biāo)準(zhǔn)，加速功能也不盡相同。能夠看到，GPU概念推出之前，ATI、英偉達(dá)、3DFX等公司在此領(lǐng)域展開激烈競爭，推動(dòng)著圖形處理芯片的發(fā)展。

直到1999年，英偉達(dá)推出GeForce256圖形處理芯片時(shí)，首次提出了GPU的概念，它整合了硬件變換和光照（T&L）、立方環(huán)境材質(zhì)貼圖和頂點(diǎn)混合、紋理壓縮和凹凸映射貼圖、雙重紋理四像素256位渲染引擎等，并且兼容DirectX和OpenGL，被稱為世界上第一款GPU。

GPU的出現(xiàn)（硬件T&L的引入）使計(jì)算機(jī)減少了對CPU的依賴，并解放了部分原本CPU的工作。2001年微軟發(fā)布DirectX 8，提出了渲染單元模式（shader model）的概念。從此，GPU從硬件T&L進(jìn)入shader時(shí)代，此時(shí)的GPU架構(gòu)還是固定管線。

固定管線架構(gòu)持續(xù)多年，直到微軟推出DirectX 10，shader不再扮演固定的角色，每一個(gè)shader都可以處理頂點(diǎn)和像素，這就是統(tǒng)一渲染著色器（unified shader），它的出現(xiàn)避免了固定管線中頂點(diǎn)著色器和像素著色器資源分配不合理的現(xiàn)象發(fā)生，使得GPU利用率更高。

第一款采用統(tǒng)一渲染架構(gòu)的GPU是ATI在2005年與微軟合作的游戲主機(jī)XBOX 360上采用的Xenos，它是ATI第一代統(tǒng)一渲染架構(gòu)。而真正具有影響力的，是英偉達(dá)在2006年發(fā)布的GeForce 8800 GTX（核心代號G80），成為第一款采用統(tǒng)一渲染架構(gòu)的桌面GPU，其架構(gòu)影響了日后的數(shù)代產(chǎn)品，是一款極具劃時(shí)代意義的GPU。

與G80一同發(fā)布的，還有著名的CUDA，它能利用英偉達(dá) GPU的運(yùn)算能力進(jìn)行并行計(jì)算，拓展了GPU的應(yīng)用領(lǐng)域，然而這時(shí)的CUDA只能算是GPU的副業(yè)。2011年TESLA GPU計(jì)算卡發(fā)布，標(biāo)志著英偉達(dá)將正式用于計(jì)算的GPU產(chǎn)品線獨(dú)立出來，憑借著架構(gòu)上的優(yōu)勢，GPU在通用計(jì)算及超級計(jì)算機(jī)領(lǐng)域，逐漸取代CPU成為主角。

英偉達(dá)“一統(tǒng)江湖”

在早期的圖形處理器市場中玩家眾多，3DFX通過推出Voodoo 3D加速卡在當(dāng)時(shí)領(lǐng)先于市場同行。英偉達(dá)由于蔑視當(dāng)時(shí)的主流標(biāo)準(zhǔn)，采用自創(chuàng)的四邊形成像（QTM）技術(shù)，在同時(shí)期打造的NV1和NV2都未成功。此后陸續(xù)推出RIVA系列和TNT、TNT2，逐漸占據(jù)市場主流地位，并最終通過1999年的GeForce256擊敗3DFX，并于2000年英偉達(dá)將3DFX的知識產(chǎn)權(quán)買斷。

在進(jìn)入21世紀(jì)后，英偉達(dá)從此前的蠻荒時(shí)代中脫穎而出，市場中主要還剩下英偉達(dá)和ATI。ATI在1985年至2006年之間是全球重要的顯示芯片公司，2000年ATI推出Radeon品牌，從此與英偉達(dá)開創(chuàng)了獨(dú)立GPU領(lǐng)域兩強(qiáng)爭霸的格局。2006年AMD斥資54億美元收購ATI，旨在融合CPU和GPU。在AMD收購ATI之后的重心更多地轉(zhuǎn)向中低端市場，性能端漸漸落后于英偉達(dá)。而后英偉達(dá)牢牢掌控著高端市場，AMD的GPU則成為了性價(jià)比的代名詞。

目前，獨(dú)立顯卡市場主要由英偉達(dá)和AMD兩家占據(jù)。市場調(diào)查機(jī)構(gòu)——Jon Peddie Research發(fā)布的二季度顯卡市場報(bào)告顯示，在目前獨(dú)立顯卡市場中，目前AMD和NIVDIA兩大廠商居于統(tǒng)治地位，從市場份額上來看，AMD獨(dú)顯份額為17%，英偉達(dá)則增長到了83%。英特爾在前不久宣布進(jìn)軍高端獨(dú)立顯卡市場，預(yù)計(jì)首款產(chǎn)品將于明年問世。

來源：JPR、海豚投研

報(bào)告顯示，英偉達(dá)在顯卡市場中表現(xiàn)強(qiáng)勁，市場占有率和出貨量均有明顯增長。AMD則需要面臨顯卡和處理器雙線作戰(zhàn)，產(chǎn)能更顯緊張，所以市場份額呈現(xiàn)了下降的趨勢。

英偉達(dá)的GPU架構(gòu)自2008年以來幾乎一直保持著每2年一次大更新的節(jié)奏，帶來更多更新的運(yùn)算單元和更好的API適配性。在工藝制程方面，英偉達(dá)GPU從2008年GT200系列的65nm制程逐步升級到了RTX3000系列的7/8nm制程，在整個(gè)過程中，晶體管數(shù)量提升了20多倍，使英偉達(dá)GPU的能效提升了數(shù)十倍，占領(lǐng)了獨(dú)立顯卡技術(shù)的制高點(diǎn)。

2008-2020英偉達(dá)GPU微架構(gòu)進(jìn)化（圖源：慧博資訊）

英偉達(dá)通過對產(chǎn)品的打磨，從眾多顯卡廠商中脫穎而出，鑄就了GPU高端市場的壟斷地位。同時(shí)隨著自動(dòng)駕駛、AI、AR/VR等領(lǐng)域的興起，擁有領(lǐng)先優(yōu)勢的英偉達(dá)有望繼續(xù)領(lǐng)跑市場，憑借產(chǎn)品的領(lǐng)先性和稀缺性，鞏固自身行業(yè)地位。

根據(jù)前十多年的GPU發(fā)展軌跡來看，GPU微架構(gòu)的升級趨勢可以簡要地概括為“更多、更專、更智能”。“更多”指的是晶體管數(shù)量和運(yùn)算單元的增加，其中包括流處理器單元、紋理單元、光柵單元等數(shù)量上升；“更?！笔侵赋顺Ｒ?guī)的計(jì)算單元，GPU還會增加新的運(yùn)算單元。例如，英偉達(dá)的圖靈架構(gòu)相較于帕斯卡架構(gòu)新增加了光追單元（RT Cores）和張量單元（Tensor Core），分別處理實(shí)時(shí)光線追蹤和人工智能運(yùn)算；“更智能”是指GPU的AI運(yùn)算能力上升。如第三代的張量單元相較于上代在吞吐量上提升了1倍。

此外，在整個(gè)過程中，英偉達(dá)一直堅(jiān)持不采用IDM的模式，而是讓臺積電負(fù)責(zé)GPU的制造，自生專注于芯片設(shè)計(jì)，充分發(fā)揮比較優(yōu)勢，分散了GPU設(shè)計(jì)和制造的風(fēng)險(xiǎn)，符合半導(dǎo)體分工的大趨勢。

英特爾、AMD奮起直追，欲三分天下

目前在全球GPU市場中主要的3個(gè)玩家：英偉達(dá)、AMD和英特爾。英偉達(dá)專注于GPU領(lǐng)域，由于此前不具備CPU業(yè)務(wù)，公司重心放在更高性能的獨(dú)立顯卡方向。AMD和英特爾由于自身有CPU業(yè)務(wù)，在2009年后兩家廠商都各自大力發(fā)展內(nèi)置于CPU的高性能集成式圖形處理內(nèi)核。

瞄準(zhǔn)了未來的市場需求，以及英偉達(dá)在獨(dú)顯市場的壟斷地位，英特爾、AMD奮起直追，想要三分天下。

英特爾直面出擊

由于英特爾在CPU市場的巨大市場優(yōu)勢，帶動(dòng)了集成顯卡的出貨。英特爾憑借在CPU市場60%以上的市場份額，獲得了GPU市場份額上的領(lǐng)先地位。

英特爾是全球最大的PC GPU供應(yīng)商，也是PC和服務(wù)器顯卡唯一的IDM廠商。英特爾的GPU最早可以追溯到1998年的i740，但是由于羸弱的性能和緩慢的更新速度，一直沒有非常大的起色。進(jìn)入酷睿i時(shí)代后，英特爾通過將核芯顯卡和CPU進(jìn)行捆綁銷售，利用CPU的龐大市場份額，確立了公司在集成GPU領(lǐng)域的寡頭壟斷地位。

英特爾核芯顯卡市占率達(dá)到68.3%（圖源：JPR）

近日，英特爾CEO Pat Gelsinger在受訪中表示，目前獨(dú)顯市場幾乎由英偉達(dá)占據(jù)，在許多顯示技術(shù)應(yīng)用變得更偏重使用英偉達(dá)提供產(chǎn)品，使其變得過于專有，對于市場生態(tài)發(fā)展顯然不利。因此英特爾希望借助接下來持續(xù)更新的oneAPI框架設(shè)計(jì)，讓開發(fā)者、硬件廠商能更容易統(tǒng)整CPU、GPU，乃至于以FPGA形式建構(gòu)更具彈性的運(yùn)算方式，解決編碼模型在不同微架構(gòu)間的壁壘，最大化跨平臺表現(xiàn)和最小化開發(fā)成本，以一種對行業(yè)及其創(chuàng)新且更有利和開放的方式來實(shí)現(xiàn)更加友好的生態(tài)系統(tǒng)。

Gelsinger進(jìn)一步說明了英特爾打算如何在GPU市場上提供有吸引力的產(chǎn)品，并談到他們將如何在英特爾平臺上實(shí)現(xiàn)從集成到分立的無縫過渡。他表示，英特爾聘請了AMD前頂級GPU架構(gòu)師Vineet Goel來監(jiān)督GPU產(chǎn)品基于的Xe GPU架構(gòu)，負(fù)責(zé)“架構(gòu)、設(shè)計(jì)和驗(yàn)證英特爾的Xe IP路線圖”。

Xe GPU架構(gòu)是2020年英特爾在其架構(gòu)日中首次推出的，Xe微架構(gòu)可以滿足從集成/入門圖形需求到數(shù)據(jù)中心和高性能計(jì)算的需求，Xe的推出標(biāo)志著英特爾向高性能獨(dú)立顯卡領(lǐng)域的擴(kuò)張。

Xe系列可以細(xì)分為集成/低功耗的Xe-LP、娛樂/游戲的Xe-HPG、數(shù)據(jù)中心/高性能的Xe-HP、高性能計(jì)算的Xe-HPC。英特爾獨(dú)立GPU分為銳炬Xe MAX和服務(wù)器GPU，均隸屬于Xe LP系列，微架構(gòu)與核顯Xe相同，采用標(biāo)準(zhǔn)封裝和10nm SuperFin制程。

目前，Xe-LP的集成版本已經(jīng)被第11代酷睿所采用。Xe-LP的移動(dòng)獨(dú)立GPU版本DG1和服務(wù)器獨(dú)立GPU版本SG1也已發(fā)布。未來，英特爾還將推出面向游戲和高性能桌面的Xe HPG產(chǎn)品線，增加光線追蹤等硬件支持，采用傳統(tǒng)封裝，外包生產(chǎn)。英特爾服務(wù)器GPU將使用Xe HPC、Xe HP微架構(gòu)，采用2.5D和3D先進(jìn)封裝，10nm SuperFin及更先進(jìn)自家或外包工藝。

根據(jù)Pat Gelsinger的說法，強(qiáng)調(diào)本身在CPU設(shè)計(jì)本質(zhì)上的優(yōu)勢，加上目前持續(xù)在GPU產(chǎn)品設(shè)計(jì)上精進(jìn)，配合oneAPI框架設(shè)計(jì)，借此針對不同運(yùn)算需求搭配最佳組合。相比英偉達(dá)將主力放在GPU產(chǎn)品設(shè)計(jì)，英特爾在產(chǎn)品設(shè)計(jì)將能統(tǒng)籌更多運(yùn)算應(yīng)用資源，能以相對更低價(jià)格取得，預(yù)期能帶動(dòng)更大的規(guī)模和使用效益。

從英特爾即將推出的 Xe-HPG 顯卡背后的期待來看，英特爾有了一個(gè)好的開端。至于與AMD的斗爭，Gelsinger認(rèn)為，英特爾即將推出的Alder Lake和Sapphire Rapids將有可能終結(jié)對手近年來的成功。

AMD雙向突圍

AMD是全球唯一可以同時(shí)提供高性能GPU和CPU的企業(yè)，且能夠同時(shí)提供獨(dú)立GPU和集成GPU，其集成GPU主要運(yùn)用在Ryzen APU、嵌入式、半定制平臺中。獨(dú)立GPU分為Radeon和Instinct系列，主要用于游戲、專業(yè)視覺、服務(wù)器等應(yīng)用。

筆者曾在文章《芯片巨頭的瘋狂五年》一文中，描述了AMD近年來的勢不可擋之勢?！叭ツ?，除了Ryzen 5000系CPU的發(fā)布，AMD還發(fā)布了再次震驚世界的Radeon 6000系列GPU，性能摸到了RTX 3090的水準(zhǔn)，可以說一舉追平了跟英偉達(dá)多年的差距。2019年以來，RDNA架構(gòu)顯卡的成功試水，使得連續(xù)三年業(yè)績飄紅的AMD在原有市值基礎(chǔ)上繼續(xù)大幅上漲，2022年前，AMD將基于更先進(jìn)的制程打造RDNA3微架構(gòu)，進(jìn)一步強(qiáng)化光追等計(jì)算表現(xiàn)。”

過去六年，AMD的計(jì)算和圖形收入的營收由18.05億美元上升至64.32億美元，年復(fù)合增速29%。未來五年，AMD計(jì)劃成為高性能計(jì)算的領(lǐng)導(dǎo)者，提供顛覆性的CPU和GPU方案。

從Mercury Research的數(shù)據(jù)可以看到，經(jīng)過長達(dá)六年的重返數(shù)據(jù)中心的爭奪戰(zhàn)，到2021年第一季度，AMD的X86處理器在數(shù)據(jù)中心的銷售份額達(dá)到了11.5％，并且制定了可靠的路線圖，以應(yīng)對不斷壯大且正在復(fù)蘇的英特爾的競爭。同時(shí)，這對于更愿意組合GPU和CPU的優(yōu)勢互相促進(jìn)產(chǎn)品銷量的AMD來講，無疑也將給英偉達(dá)帶來一定程度上的沖擊。

綜合來看，全球GPU已經(jīng)進(jìn)入了寡頭壟斷的格局。在傳統(tǒng)GPU市場中，排名前三的英偉達(dá)、AMD、英特爾的營收幾乎可以代表整個(gè)GPU行業(yè)的收入。

來源：JPR、海豚投研

獨(dú)立顯卡領(lǐng)域主要由英偉達(dá)和AMD控制，而集成顯卡領(lǐng)域由英特爾和AMD掌控。就整個(gè)GPU市場而言，英特爾在核心GPU上獲得桂冠，市場份額為68%，英偉達(dá)和AMD為15%上下。

對于英偉達(dá)來說，主要對手就是英特爾和AMD，雖然英偉達(dá)的獨(dú)立GPU全球第一，但是其并不具備CPU設(shè)計(jì)能力，相反AMD一直以來都是CPU和GPU同步發(fā)展，而且都還做得不錯(cuò)，專注于CPU的英特爾也開始計(jì)劃搞獨(dú)立GPU了，而且英特爾除了X86之外，還押寶了RISC-V，都在針對CPU和GPU同時(shí)布局。

因此，押寶Arm成了英偉達(dá)一個(gè)非常好且不容錯(cuò)過的機(jī)會，此舉可以讓英偉達(dá)具備CPU設(shè)計(jì)能力，也可以做到CPU和GPU同時(shí)發(fā)展，甚至未來還能和X86展開競爭?？梢灶A(yù)見，如果Arm的收購能成功，英偉達(dá)將會更加強(qiáng)大。

中國市場的X因素

全球GPU市場表現(xiàn)為寡頭壟斷下的高增長，年復(fù)合增速超過30%，主要市場份額被英偉達(dá)、英特爾、AMD等美系企業(yè)占領(lǐng)。在此宏觀背景下，國產(chǎn)GPU企業(yè)蓬勃發(fā)展，在GPU軟硬件方面同時(shí)出擊。

國產(chǎn)GPU的發(fā)展落后于國產(chǎn)CPU，在國產(chǎn)GPU的開發(fā)中，GPU對CPU的依賴性和GPU的高研發(fā)難度，阻礙了該產(chǎn)業(yè)的快速發(fā)展。直到2014年，長沙景嘉微才成功研發(fā)出了國內(nèi)首款國產(chǎn)高性能、低功耗GPU芯片——JM5400，打破了國外產(chǎn)品長期壟斷我國GPU市場的局面。

中國GPU市場規(guī)模和潛力非常大，龐大的整機(jī)制造能力意味著巨量的GPU需求。另外，國內(nèi)在物聯(lián)網(wǎng)、車聯(lián)網(wǎng)、人工智能等新興計(jì)算領(lǐng)域，對GPU也存在海量需求。據(jù)IDC預(yù)測，2024年中國GPU服務(wù)器市場規(guī)模將達(dá)到64億美元，市場空間巨大。

有觀點(diǎn)表示，AI技術(shù)的爆發(fā)和信創(chuàng)產(chǎn)業(yè)的起步給國產(chǎn)GPU帶來了真正的發(fā)展機(jī)遇。

GPU在并行計(jì)算、浮點(diǎn)以及矩陣運(yùn)算方面具有強(qiáng)大的性能，逐漸在高性能計(jì)算、云端AI應(yīng)用等場景中處于主導(dǎo)地位。雖然英偉達(dá)在這個(gè)領(lǐng)域占據(jù)主導(dǎo)地位，由于其產(chǎn)品價(jià)格昂貴，且國內(nèi)對產(chǎn)業(yè)鏈安全的考量，國產(chǎn)通用GPU有著廣闊的成長空間。同樣，由于信創(chuàng)產(chǎn)業(yè)的發(fā)展，國內(nèi)的桌面GPU也得到了難得的發(fā)展機(jī)遇。

在圖形GPU領(lǐng)域，還是以景嘉微、航錦科技等為代表的傳統(tǒng)企業(yè)為主力。另外，國內(nèi)從事CPU研發(fā)的企業(yè)（如兆芯、龍芯等），也開始切入這個(gè)賽道，增強(qiáng)了國內(nèi)GPU企業(yè)的整體研發(fā)實(shí)力。以國產(chǎn)替代為核心驅(qū)動(dòng)力，在政策指引和充足資金保障下，整個(gè)信創(chuàng)產(chǎn)業(yè)將為國產(chǎn)GPU帶來巨大的市場空間，遠(yuǎn)超以往的軍用等專業(yè)市場。

雖然國產(chǎn)GPU與主流廠商的差距仍很大，但是GPU國產(chǎn)化的道路仍在持續(xù)推進(jìn)。2021年，景嘉微的JM9系列芯片流片、封裝順利。雖然比此前的量產(chǎn)計(jì)劃晚了1-2年，但產(chǎn)品研發(fā)量產(chǎn)工作仍在穩(wěn)步推進(jìn)。JM9系列產(chǎn)品對標(biāo)英偉達(dá)的GTX1080。雖然按之前JM7系列情況看，在使用上可能出現(xiàn)效果打折的情況，但比上一代產(chǎn)品有望實(shí)現(xiàn)較大的提升。

國內(nèi)GPU廠商和產(chǎn)品不完全統(tǒng)計(jì)：

國內(nèi)GPU廠商不完全統(tǒng)計(jì)（如有遺漏，歡迎補(bǔ)充）

當(dāng)前，國產(chǎn)GPU已經(jīng)能完成日常辦公等基本的任務(wù)需求，有望先從軍工領(lǐng)域拓展至國內(nèi)政企辦公領(lǐng)域，但是在性能和使用效果方面的差距還是難以打開民用市場。

GPU的使用效果主要受到硬件和驅(qū)動(dòng)兩方面的影響。從國產(chǎn)GPU的發(fā)展情況看，硬件端的追趕較容易實(shí)現(xiàn)，工藝制程、顯存位寬、顯存大小、時(shí)鐘頻率和顯存頻率等GPU的外在指標(biāo)，可以通過逆向開發(fā)較快實(shí)現(xiàn)。但即使在相同的硬件情況下，GPU驅(qū)動(dòng)也將明顯影響使用效果，之前AMD顯卡出問題也大多是驅(qū)動(dòng)造成的。因此，對于國產(chǎn)GPU在驅(qū)動(dòng)方面需要更長的時(shí)間去追趕。

GPGPU蔚然成風(fēng)

2018年6月，圖靈獎(jiǎng)獲得者John Hennessy 和 David Patterson發(fā)表了《計(jì)算機(jī)架構(gòu)新的黃金時(shí)代》的主題演講，提出了特定領(lǐng)域架構(gòu)（DSA）的概念，旨在為計(jì)算機(jī)架構(gòu)帶來創(chuàng)新并努力邁向新的黃金時(shí)代。

顧名思義，GPU就是用于3D圖形領(lǐng)域的DSA，其目標(biāo)是在3D虛擬世界中渲染照片般逼真的圖像。過去20多年里，GPU的基本需求就源于視頻加速，2D/3D游戲，圖像渲染。

然而，除了3D用途之外，幾乎所有人工智能研究人員都使用GPU來探索超越3D圖形領(lǐng)域的概念。GPU運(yùn)用自身在并行處理和通用計(jì)算的優(yōu)勢，逐步開拓服務(wù)器、汽車、礦機(jī)、人工智能、邊緣計(jì)算等領(lǐng)域的衍生需求。雖然GPU無法離開CPU獨(dú)立運(yùn)作，但是在當(dāng)前“云化”加速的時(shí)代，離開了GPU的CPU也無法勝任龐大的計(jì)算需求。所以GPU和CPU組成了異構(gòu)運(yùn)算體系，從底層經(jīng)由系統(tǒng)軟件和驅(qū)動(dòng)層支持著上層的各種應(yīng)用。GPU已經(jīng)成為了專用計(jì)算時(shí)代的剛需。

我們將這種設(shè)計(jì)理念稱為通用GPU，即GPGPU，是一種利用GPU處理圖形渲染之外通用計(jì)算任務(wù)的高性能芯片。近年來，在摩爾定律演進(jìn)的放緩和GPU在通用計(jì)算領(lǐng)域的高速發(fā)展的此消彼長之下，通用圖形處理器（GPGPU）逐漸“反客為主”，利用GPU來計(jì)算原本由CPU處理的通用計(jì)算任務(wù)。

在GPGPU領(lǐng)域，目前各個(gè)GPU廠商的GPGPU的實(shí)現(xiàn)方法不盡相同，如英偉達(dá)使用的CUDA技術(shù)、原ATI的ATI Stream技術(shù)、Open CL聯(lián)盟、微軟的Directcompute技術(shù)。這些技術(shù)可以讓GPU在媒體編碼加速、視頻補(bǔ)幀與畫面優(yōu)化、人工智能與深度學(xué)習(xí)、科研領(lǐng)域、超級計(jì)算機(jī)等方面發(fā)揮異構(gòu)加速的優(yōu)勢。

以上幾種技術(shù)中，只有OpenCL支持跨平臺和開放標(biāo)注的特性，還可以使用專門的可編程電路來加速計(jì)算，業(yè)界支持非常廣泛。但是，從市占率角度來看，英偉達(dá)無疑是行業(yè)的標(biāo)桿，其不僅擁有百萬開發(fā)者支持的CUDA，還在指令集的覆蓋面、顆粒度、效率等維度有領(lǐng)先優(yōu)勢，早早憑借強(qiáng)大的GPU＋CUDA方案切入深度學(xué)習(xí)領(lǐng)域，用大筆研發(fā)投入和時(shí)間堆積起堅(jiān)不可摧的生態(tài)城墻，鮮有能與其相提并論的玩家。

在2021年以前，中國企業(yè)雖然在一些專用芯片領(lǐng)域多有突破，但在GPGPU領(lǐng)域仍是空白。再考慮到產(chǎn)業(yè)生態(tài)，國產(chǎn)GPGPU替代還有很長的路要走。以中國的云端AI訓(xùn)練芯片市場為例，最大的供應(yīng)商為國外廠商，其市場份額達(dá)90%。

今年以來，壁仞科技、登臨科技、天數(shù)智芯等本土廠商在GPGPU市場英偉達(dá)一家獨(dú)大的背景下，相繼進(jìn)行流片量產(chǎn)，正在努力改變現(xiàn)況。除此之外，若想真正實(shí)現(xiàn)自主可控，GPGPU創(chuàng)企們還需在CUDA生態(tài)的基礎(chǔ)上來推廣自己的芯片，隨著初代國產(chǎn)芯片陸續(xù)順利落地，打造完整的國產(chǎn)核心技術(shù)生態(tài)體系也將是必經(jīng)之路。

因其強(qiáng)大的并行處理能力和存儲帶寬，GPGPU在人工智能市場和高性能市場有廣闊的應(yīng)用空間。有數(shù)據(jù)預(yù)計(jì)，到2025年，我國GPGPU芯片板卡的市場規(guī)模將達(dá)458億元，2019年到2025年的年復(fù)合增長率將高達(dá)32%。按行業(yè)來分，互聯(lián)網(wǎng)及云數(shù)據(jù)中心為228億元，安防與政府?dāng)?shù)據(jù)中心為142億元，行業(yè)AI應(yīng)用為37億元，高性能計(jì)算為28億元。

由此可見，從預(yù)期市場和國產(chǎn)替代的緊迫性來講，GPGPU擁有大好前景，一旦突破國際巨頭在“硬件+生態(tài)”層面的壁壘，本土企業(yè)的前景將十分美好。

寫在最后

從GPU行業(yè)廠商的動(dòng)態(tài)和布局來看，戰(zhàn)火已經(jīng)燃起，都在謀劃著自己的保衛(wèi)或突擊之戰(zhàn)。國產(chǎn)GPU廠商的興起，將給行業(yè)帶來新的不確定因素，機(jī)遇和挑戰(zhàn)同樣巨大。

最后，引用AI芯天下的觀點(diǎn)，談?wù)剣鴥?nèi)GPU行業(yè)要克服的“幾座大山”：

（1）產(chǎn)品方面。與英偉達(dá)等國際巨頭相比，國內(nèi)GPU尚屬于起步階段。在圖形GPU方面，國內(nèi)領(lǐng)先的景嘉微公司，其最新產(chǎn)品也只相當(dāng)于英偉達(dá)幾年前的產(chǎn)品水平。未來更多高清3D應(yīng)用的出現(xiàn)將帶來GPU需求的持續(xù)增長，對GPU處理能力也是一項(xiàng)不小的挑戰(zhàn)，持續(xù)改進(jìn)GPU系統(tǒng)架構(gòu)和設(shè)計(jì)方法，提高運(yùn)算能力和綜合顯示能力，以應(yīng)對新形勢提出的發(fā)展要求。

（2）專利方面。數(shù)據(jù)顯示，全球GPU技術(shù)領(lǐng)域?qū)＠麛?shù)量排名前20的公司占有全球70%的GPU專利。英偉達(dá)，英特爾和AMD還是GPU技術(shù)領(lǐng)域全球?qū)＠易宄钟袛?shù)量排名的前三。其中，英偉達(dá)持有專利數(shù)量占全球總量的近20%。所謂得專利者得天下，本土廠商需要在此發(fā)力，構(gòu)建出可靠的護(hù)城河。

（3）在圖形領(lǐng)域，GPU對于CPU和操作系統(tǒng)的依附性很強(qiáng)。在GPGPU領(lǐng)域，CUDA生態(tài)是國內(nèi)企業(yè)必須要翻越的一座大山。當(dāng)前的AI開發(fā)工程師，多數(shù)是在CUDA平臺上進(jìn)行開發(fā)的。因此，即使有國產(chǎn)GPU芯片可以實(shí)現(xiàn)替代，但要開發(fā)者實(shí)現(xiàn)遷移則是一項(xiàng)更為艱巨的工作。

（4）近些年，國外GPU技術(shù)快速發(fā)展，已經(jīng)大大超出了其傳統(tǒng)功能的范疇。國內(nèi)GPU芯片的研制雖然可滿足目前大多數(shù)圖形應(yīng)用需求，但在科學(xué)計(jì)算、人工智能及新型的圖形渲染技術(shù)方面仍然和國外領(lǐng)先水平存在較大差距，未來持續(xù)發(fā)展國產(chǎn)GPU勢在必行。

本文來自微信公眾號 “半導(dǎo)體行業(yè)觀察”（ID：icbank），作者：L晨光，36氪經(jīng)授權(quán)發(fā)布。

關(guān)鍵詞：戰(zhàn)火 GPU

相關(guān)閱讀：