英特爾最強服務器CPU來了!AI性能直接翻倍
英特爾最強服務器CPU來了!AI性能直接翻倍
服務器CPU領域持續多年的核心數量大戰,被一舉終結了!
英特爾最新發布的至強? 6 性能核處理器(P-core系列),超越了過去單一維度的競爭,通過“升維”定義了新的游戲規則:
在過去,CPU升級換代往往要在單個芯片上集成更多的核心,但這難免會受到工藝和芯片尺寸的限制,更別提與IO和內存的匹配難題。
這一次,至強? 6 性能核處理器采用了計算芯片單元與I/O芯片單元解耦的分離式模塊化設計,可以靈活組合不同數量的計算單元,實現核心數量的擴展及內存和IO的同步強化,保證更優的整體性能和能效。
用最直觀的方式感受一下:
2023年12月15日,英特爾數據中心與人工智能集團副總裁陳葆立從褲兜里掏出第五代至強? 可擴展處理器,還只有64個核心。
2024年9月26日,還是陳葆立,同樣從褲兜里掏出至強? 6 性能核處理器,卻直接翻倍到128核心。
兩款處理器外形大小相似,都能輕松放入口袋,但性能卻發生了質的飛躍。
具體來說,剛剛登場的是至強? 6性能核處理器大家族中的先鋒+頂級戰力——英特爾? 至強? 6900P系列。
擁有多達128個性能核和504MB的超大L3緩存,更大、更寬的內存支持,更多、更快的IO能力。非常適用于各種數據和計算密集型應用任務,比如科學計算、海量數據處理,還有AI。
看到這里,可能很多人會有疑問:你們又要說用CPU跑AI?是GPU它不香了么?
NoNoNo,我們是想說:有了這款CPU,你的GPU或其他的AI加速器,會更香!
談到這個話題,就要先說說AI服務器。
在生成式AI應用百花齊放的當下,AI服務器的重要性可謂是不言而喻,無論是對于大規模的訓練、推理,亦或是RAG等任務,都對其提出了更高的要求。
也正如綜合市場預測數據從側面反應出來的那般:
我們都知道AI服務器里GPU或AI加速器很重要,卻很容易忽視其中CPU的作用。一個真正為AI服務器或AI數據中心基礎設施設計的出色的CPU,應該是什么樣的?
英特爾? 至強? 6 性能核處理器,可以說是給出了一個正解。
外媒甚至評測過后,對英特爾這次的新CPU給予了極高的評價:
嗯,用中文來說的話,就是英特爾至強,這次是真的至強(達到最強)了。
那么英特爾? 至強? 6 性能核處理器是如何解鎖這種認同的呢?
至強,何以至強
首先要說的是算力。
英特爾? 至強? 6900P系列產品此次最亮眼的128核(三個計算芯片單元),這就是它看似符合此前游戲規則的一大技術亮點。
通過核心數量的不同排列組合方式,至強? 6 性能核處理器可以應對不同的場景來提供不同核心的型號,除了最高128核的產品系列(6900P)外,還有最高86核(2個計算芯片單元),最高48核(1個計算芯片單元)和16核(1個計算芯片單元)的產品系列。
用來做這種排列組合的模塊中,計算芯片單元采用的是Intel 3制程,包含一體式網格、核心、緩存、內存控制器等,可以保證數據傳輸的一致性。
I/O芯片單元則是采用Intel 7制程,包含UPI、PCIe、CXL和加速器引擎等。
不同于第五代英特爾? 至強? 產品,至強? 6是將I/O和計算兩個單元進行了解耦,不僅易于做核數的擴展,還有利于驗證、重復和靈活使用。
除此之外,英特爾? 至強? 6 性能核處理器的亮點還包括:
6400 MT/s DDR5
8800 MT/s MRDIMM內存
6條UPI 2.0鏈路;速率高達24 GT/s
96條PCIe 5.0/ 64條 CXL 2.0通道
L3緩存高達504MB
支持FP16數據格式的英特爾? AMX
接下來要說的是存力。
至強? 6 性能核處理器超脫此前游戲規則的亮點就藏在其中。
它同時支持了更快的DDR5內存(6400MT/s)和更“寬”的MRDIMM內存(8800MT/s)。
僅把前者替換成后者,就已經能讓科學計算和AI場景的多項任務提升7%-33%不等了。而且相比此前至強? CPU Max采用的HBM,MRDIMM內存的引入,不僅帶寬和速度優勢更明顯,它與CPU解耦的型態,也更利于用戶的靈活采購、配置與升級。
存力除了內存本身的性能,還包含CPU與內存之間的互連技術,至強? 6導入了最新的Compute Express Link 2.0 (CXL 2.0) 。
CXL 2.0支持多種設備類型,且可向后兼容,實現對內存和存儲設備的靈活擴展。
支持鏈路分叉、更強的CXL內存分層支持,以及以受控熱插拔的方式添加/移除設備,為未來的數據中心架構帶來了更多可能性。
更值得一提的是至強? 6獨占的“Flat”內存模式,CXL內存和DRAM內存被視為單一的內存層,讓操作系統可以直接訪問這一統一的內存地址空間。
這樣的分層管理可以確保最大限度地提升內存使用效率,并且實現利用好CXL內存擴展而無需修改軟件。
如此這般能對內存速度、帶寬、容量和可擴展性全面兼顧,已經形成了至強? 6 性能核處理器獨樹一幟的競爭力。
具體到服務器設計上,CLX2.0可以支持每機提供8TB內存容量擴展,同時提供384GB/s的內存帶寬擴展。
當然,作為CPU的至強? 6 性能核處理器并沒有忘記自己的本份,把存力與算力的硬指標優勢結合起來,轉化成真正的優勢,才是它被看好的底氣。
在算力方面,除了更多內核,它還有內置加速器與指令集更新帶來的加成。
主攻AI加速的英特爾? 高級矩陣擴展(Intel? AMX)新增對FP16數據類型的支持,現已全面覆蓋 int8、BF16和FP16數據類型。
其在每個內核中的矩陣乘加(MAC)運算速度可達 2048 FLOPS(int8)和1024 FLOPS(BF16/FP16),能大幅提升 AI 推理和訓練性能。
英特爾? 高級矢量擴展 512(AVX-512)雖然是員老將了,但在得到如此豐沛的內核資源支持后,也依然是科學計算、數據庫和 AI 任務中的矢量計算擔當。
這些加速器的升級與煥新帶來的成果就是下圖這種多負載性能表現普遍倍增的現象,在AI領域,尤其是在Llama2-7B上的提升直接達到了前一代產品的3.08倍。
最后在硬件增強的安全特性方面,英特爾早期的方案為SGX,但從第五代至強? 開始新增了TDX方案。這些看似難以通過Benchmark數值來證明自身價值的技術,實則不可或缺,是確保關鍵數據和應用更為安全可靠的壓艙石。
而安全,恰恰是目前AI數據中心或智算中心這種涉及海量數據、關系萬千機密和隱私的環境中較少提及,卻最應補足和鞏固的一環。
說了這么多,如果要用一句話總結至強? 6 性能核處理器,尤其是6900P系列產品的定位,那就是“更強通用計算,兼顧AI加速”了。
那么新處理器具體都有哪些用法,表現又如何呢?
還請繼續往下看。
全能型CPU:加速AI推理,統領異構計算
首先,至強? 6 性能核處理器可以做“獨行俠”,直接加速AI推理,助力AI應用普及。
用CPU做AI推理加速,其意義并非在于與GPU或其他專用加速器競爭極致的速度或效率,而是要在一些成本、采購、環境等條件受限的情況下,借助CPU部署更廣泛、人才儲備更扎實和應用更便捷的優勢,讓AI能夠更快、更有效地落地。
帶著這樣的整體目標,英特爾在軟件生態和工作負載優化方面投入了大量精力,以確保用戶能夠充分發揮至強? 6 性能核處理器的潛力。
例如,英特爾與TensorFlow和PyTorch等主流深度學習框架進行深度合作,將針對英特爾CPU的優化集成到官方發行版中,從而使得在英特爾CPU上運行深度學習模型時,性能得到顯著提升。上文提到的Llama2-7B成績便是這些努力的成果之一。
另外,至強? 6 性能核處理器還可以做“指揮官”,強化AI系統整體實力。
這其實是很多用戶更為熟悉,也是至強? 6性能核處理器更主打的應用方式,所謂“指揮官”,另一個名稱就是機頭(head-node)CPU或主控CPU。
如果將至強? 6 性能核處理器用作AI服務器的機頭CPU,那么其在算力(更強的單線程性能)、存力(對MRDIMM內存和CXL內存擴展能力的支持)以及 I/O(更多的PCIe 5.0通道)等方面的優勢和潛能就能更加充分地發揮和釋放出來。
使其能夠與GPU或專用的AI加速器高效協作,出色地處理數據預處理、數據傳輸分享和混合工作負載。
我們最初的設問,至此終于拼湊出了一個更為完整的答案,即為何至強? 6 性能核處理器能夠被稱作AI服務器或AI數據中心的“嚴選”,甚至是優選CPU ?
這正是由于它既能夠單槍匹馬地加速AI推理,又可以居中協調以提升異構系統的整體性能輸出。
更不必說,它還能夠兼顧眾多傳統但同樣不可或缺的應用負載,例如前文提及的科學計算和數據庫,以及高性能云基礎設施構建等任務。
以Flatiron Institute的案例來說,作為一家科研機構,他們對科學計算有著強烈的需求。通過測試得知,至強? 6 性能核處理器在常見科學計算負載上表現優異。
他們還覺得對MRDIMM內存的支持將進一步突破傳統DDR內存的性能瓶頸,推動數據密集型科學發現。
在本次至強? 6 性能核處理器的發布會上,英特爾也展示了本地數據庫軟件合作伙伴——科藍軟件的成果。
英特爾市場營銷集團副總裁、中國區&行業解決方案和數據中心銷售部總經理梁雅莉在介紹生態系統支持狀況時表示:
值得一提的是,在她分享中出現的中國合作伙伴數量眾多且都是各領域的核心力量,英特爾雖然在產品研發上有了更多創新,但在商業模式上仍然非常依賴開放架構平臺之上的產業合力。
十數家OEM、ODM、OSV和ISV在至強? 6 性能核處理器發布時同步推出新產品,以及多家云服務提供商的支持,在英特爾看來,才是新品真正走近用戶和價值放大的基礎。
建好AI服務器,CPU不能是短板
從前面列舉的眾多數據和用例可以看出,在當前AI應用加速落地、新推理計算范式和合成數據等趨勢的推動下,AI算力需求越來越注重推理和復合工作負載。
在這之中GPU或專用加速器固然重要,但CPU作為整個系統的“指揮官”,絕不能成為短板。
大家需要真正兼顧通用計算,以及AI服務器及AI數據中心場景的CPU產品。它不僅能支持廣泛的第三方GPU及AI加速器,與它們組合形成強大的異構計算平臺,還能在其中補足GPU或專用加速器覆蓋不到或不足的地方,為更多樣和復雜的場景提供靈活的算力選擇,并增強整個AI平臺的穩定性、安全性和擴展性。
英特爾? 至強? 6 性能核處理器的出現,就為AI計算帶來了這樣一個全新的支點。
(夢晨 金磊)
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。
關鍵詞:
您可能也感興趣:
為您推薦
中國紅APP正式上線發布
第十二屆東亞地方政府會議將在山東臨沂召開 促進東亞地區交流合作
(鄉村行·看振興)山西柳林依托“數商興農”打造鄉村e鎮 電商交易9個月達3.5億元
排行
最近更新
- 英特爾最強服務器CPU來了!AI性能直接翻倍
- 在一起更出色 長城歐拉牽手50萬用戶開啟多彩用車生活
- 關注社會,傳遞溫暖——賽升藥業踐行社會責任的新舉措
- 車險脫保有危險?
- 揭秘燕教授從產品到服務,全方位實力展現
- 報名進行中|“乘數而上 智慧衢州”2024數據要素×發展交流會...
- 黑龍江、松花江同江段進入流冰期 迎“跑冰排”美景
- 湖北五峰后河自然保護區現“限定版”風景
- 黑龍江深化交旅融合 年初以來開通旅游專線113條
- 親歷中國航展:三分熟悉,七分陌生,十分驚艷
- 西藏首個跨境商品交易中心在拉薩投運
- 山西忻州:連續五年黃河干流忻州段保持Ⅱ類以上水質
- 呼和浩特市榮獲“國際友好城市杰出貢獻獎”
- 票據服務行業標桿企業深度數科:票據市場創新服務 求共贏·...
- “古人類長廊”湖北十堰新發現四處史前遺址
- “剪刻雕鑿”間展示甘肅傳統文化
- 昆明進藏航班可實現“雪山自由”
- 萬畝油茶林飄香 江西贛縣“一滴油”撬動鄉村振興“大產業”
- 2025澳網亞太區外卡賽即將在蓉開拍 吳易昺、張帥參賽
- 菲仕蘭榮獲ESG與企業形象類大獎
- “中國酒城”瀘州:用真金白銀支持白酒行業“數智賦能升級”
- 福建谷文昌紀念館里的一輛自行車:“公車不私用”的生動教材
- 山東特色種植“百花齊放” 種出致富好“豐”景
- 北京建筑大學大型多功能振動臺陣實驗室開展開放活動
- 蘭州父女傳承剪紙藝術 展示甘肅風土人情
- 重慶聯動全國50多個城市發布宣言 推動文旅產業高質量發展
- 哈爾濱機場年旅客吞吐量提前44天突破2080.5萬人次 創歷史新高
- 西安鵬瑞利知智照護家園:全國首家?全球第六以阿爾茨海默病...
- 航拍西安新地標“長安云”
- 錢塘江現絕美紫色“潮汐樹”