首頁>資訊 >
蘋果M1?Max?GPU解析:低耗高能的秘密并不復雜 2021-10-25 08:51:04  來源:36氪

2021年10月19日凌晨,蘋果召開了可能是他們2021年的最后一場新品發(fā)布會,正式推出了包括AirPods 3,MacBook Pro 14和MacBook Pro 16在內的一系列新品。 

而在此次的新品中,最受關注的毫無疑問就是兩個不同尺寸的全新MacBook Pro了。畢竟,此次其既升級了miniLED背光的1600nit超高亮XDR 120Hz屏幕、帶來全面改進的鍵盤結構,增加了大量實用接口的同時,還首次配備了快充,同時在續(xù)航能力上也幾乎實現了翻倍。 

當然,最為重要的是,隨著新款MacBook Pro的發(fā)布,蘋果方面也徹底完成了旗下MacBook產品線的自研芯片替換進程。而全新MacBook Pro上所使用的M1 Pro和M1 Max兩款“大號”PC芯片,自然也就成為了此次發(fā)布會最大的亮點。 

M1 Pro和M1 Max,你知道它們有多強嗎

自從去年蘋果推出劃時代的M1芯片后,幾乎所有業(yè)內人士都很明白,這意味著其幾乎一定會將自研PC芯片擴展到高性能工作站,甚至是服務器產品線。而早在10月19日這場發(fā)布會之前,關于“M1X”或者“M2”的傳言也早已滿天飛。 

然而大家都沒有想到的是,蘋果的新款PC芯片在命名上完全脫離了以往的規(guī)則,而是采取了更接近自家消費級產品的風格。不止如此,它們甚至還不只是一款,而是總共包含了兩個型號、五種不同細分配置的“家族”。 

首先是定位“相對較低”的M1 Pro,其采用了8大核+2小核的CPU設計,晶體管數量為337億個,配有320KB L1指令緩存、192KB L1數據緩存,并提供了高達28MB的超大L2緩存設計。此外,內存控制器規(guī)格為四通道LPDDR5-6400,內存位寬總共256bit,內存帶寬高達204.8GB/s。與此同時,M1 Pro還集成了一個ProRes視頻處理加速單元、一個16核心的AI加速處理單元(算力11Tops),以及一個最大16核心、浮點性能5.2TFlops的GPU單元。 

除此之外,蘋果此次還推出了定位更高的M1 Max。它的CPU部分與M1 Pro基本一致,也是8大2小的10核心設計、320KB+192KB的L1緩存,以及28MB的超大L2緩存。但是與M1 Pro相比,M1 Max的內存子系統(tǒng)、視頻處理加速單元,以及GPU單元規(guī)格全部翻倍,這意味著它最大支持64GB、帶寬高達409.6GB/s的LPDDR5內存,具備能夠同時處理7條8K分辨率視頻流,且功耗極低的視頻加速處理單元,并且其32核GPU的總算力也達到了驚人的10.4TFlops。 

這樣的是一個什么概念呢?用蘋果自己的話來說,這代表著M1 Pro或M1 Max的CPU可以僅用30%的功耗,就達到相當于市面上x86架構八核筆記本電腦處理器的同等性能。而根據我們三易生活查閱到的數據顯示,MacBook Pro 16上M1 Max芯片的內存帶寬,已經達到了當前最頂級家用臺式機處理器銳龍線程撕裂者PRO 3995WX(八通道DDR4-3200內存)的兩倍。 

深入探究蘋果新GPU設計,它的訣竅其實并不復雜

當然,如果你還想了解更多有關新款MacBook Pro的配置信息和功能特點,那么推薦大家可以去翻看我們三易生活今天早些時候發(fā)布的 《新款MacBook Pro“炸場”,蘋果自研芯片再度傲視全行業(yè)》一文,其中會有更加詳細的產品解析。 

而接下來我們要講的,可能是到目前為止還沒有其他媒體分析過的一件事,那就是此次M1 Pro與M1 Max的GPU設計,以及它們背后所體現出來的產品設計思路。 

首先,讓我們來看看M1 Pro和M1 Max的GPU性能數據。根據目前的公開信息顯示,M1 Pro的16核GPU單精度浮點算力為5.2TFlops,整個SoC的功耗約為65W;而M1 Max的32核GPU單精度浮點算力為10.4TFlops,整個SoC的功耗為100W。 

以M1 Max為例,10.4TFlops的GPU單精度浮點算力意味著什么呢?這意味著它的理論性能已經超過了桌面版Geforce RTX2080S(10.14TFlops)、移動版Geforce RTX3080 Max-Q(9.585TFlops),或是PS5集成的Oberon GPU(10.28TFlops)的水準。 

但是這里就產生了一個問題,如果根據M1 Max和M1 Pro的功耗差值來推算,將不難得出,M1 Max的GPU功耗最高不會超過70W(這還是多算了一個媒體引擎在里面,實際應該更低)。而它的三個對比對象的功耗,卻分別達到了250W、80W和125W左右(PS5是180W SoC設計,但其CPU規(guī)格基本等同于桌面版65W的Zen2 APU)。 

那么,蘋果是如何實現比A、N兩家老牌GPU廠商都性能更高、同時功耗更低的GPU設計的呢?要搞清楚這一點,我們還需要了解兩件事。一是在蘋果的M1 Pro和M1 Max芯片里,每一個GPU“核心”其實都包含了64個ALUs(算術邏輯單元),而ALU其實才是我們在PC上常說的GPU“流處理器”;二是對于M1 Max來說,它的GPU運行頻率為1278MHz,這一點M1 Pro上也是一樣的。 

弄明白了這些,我們就可以列出下面這個表格了。 

大家看明白了嗎?沒錯,其實蘋果的自研芯片之所以能夠做到用極低的功耗去實現相當于旗艦級的性能,訣竅其實無非就兩條。一是更積極地采用最先進的半導體制程,用制程換取更高的晶體管密度和能效比;其二則是采用“多核心+低頻率”的設計思路,用更多的流處理器去確保性能,同時壓低運行頻率來保障功耗和發(fā)熱更為可控。 

M1 Max的設計優(yōu)勢,傳統(tǒng)PC行業(yè)并非不懂

請注意,這種“先進制程+超多核心+低運行頻率”的芯片設計思路,在整個PC行業(yè)來說其實并不是什么新東西。因為長期以來,各種專業(yè)級顯卡和服務器CPU一直都是這么做的。 

你以為RTX3090S就是NV的旗艦?其實A100才是他們真正看重的產品 

比如NVIDIA的Tesla A100計算卡相比即將發(fā)布的RTX3090S,前者擁有幾乎翻倍的核心規(guī)模(542億晶體管 vs 283億晶體管),但因為采用了更先進的制程(A100是臺積電7nm,而3090S是三星8nm)、更低的運行頻率(1275MHz vs 1395MHz),結果就是A100的功耗最終與RTX3090S完全相同。 

Intel并不是沒有10nm的桌面高性能CPU,他們只是沒有針對家用市場而已 

又比如說,大家都知道現在Intel的桌面旗艦CPU Core i9-11900K實際功耗可以到200W以上,而它采用的是14nm、8核心、主頻5.3GHz的設計??珊芏嗳丝赡懿恢赖氖?,Intel還有一款名為Xeon W3375的工作站CPU,其擁有10nm、38核心、4GHz的恐怖規(guī)格,但功耗卻只比11900K高了一點點(270W)。 

這說明其實其他的PC芯片廠商也明白,更先進制程+多核心+低頻率的設計,能夠更容易實現高能效比的這個道理。只不過,先進的制程加上超大尺寸的多核心芯片,本身就意味著比“高頻率小芯片”高得多的制造成本。因此在如今的大多數民用PC芯片上,高頻率、高發(fā)熱、高功耗的“小芯片”才會成為主流。 

而在這個過程中,廠商一方面成功控制了制造成本,另一方面又能實現預期的性能增長。至于高功耗的問題,最終反正是交由消費者來買單,自然也就被在一定程度上被忽視掉了。 

本文來自微信公眾號 “三易生活”(ID:IT-3eLife),作者:三易菌,36氪經授權發(fā)布。

關鍵詞: 蘋果 M1 Max GPU

相關閱讀:
熱點
圖片 圖片