英特爾推出oneAPI 2023工具包,大幅提升即將推出的英特爾硬件的價值
英特爾工具的新功能提升了跨平臺生產力
今天,英特爾宣布英特爾? oneAPI工具包的2023年版本已在英特爾?開發者云平臺(Intel? Developer Cloud)上線,并正在通過現有的渠道推送。新的oneAPI 2023工具包支持即將推出的第四代英特爾?至強?可擴展處理器、英特爾?至強? CPU Max 系列和英特爾?數據中心GPU,包括Flex系列和新的Max系列。這些工具可提升性能和生產力,并增加了對新的Codeplay1插件的支持,使開發者能更容易地為那些非英特爾的GPU架構編寫SYCL代碼。這些基于標準的工具提供了硬件方面的選擇,也讓在跨架構系統上運行的高性能應用的開發變得更加輕松。
(資料圖)
英特爾oneAPI 2023工具包包括一套完整的最新編譯器、庫、分析和移植工具,以及優化后的AI和機器學習框架,讓開發者能為oneAPI支持的CPU、GPU和FPGA構建高性能、跨架構的應用。開發者可使用這些工具快速實現性能目標,并通過單個代碼庫節省時間,從而將更多時間用于創新。
新版本的oneAPI工具包可幫助開發者利用英特爾硬件的先進功能:
第4代英特爾至強可擴展處理器和至強CPU Max系列,內置英特爾?高級矩陣擴展(英特爾? AMX)、Quick Assist 技術(QAT)、英特爾?AVX-512、bfloat16 及更多。
英特爾?數據中心GPU,包括內置基于硬件的AV1編碼器的Flex系列,以及Max系列。Max系列提供靈活數據類型的支持,內置英特爾? Xe矩陣擴展(英特爾?XMX)、矢量化引擎(vector engine)、英特爾?Xe-Link互聯擴展和其它功能。
oneAPI 2023工具包具有先進的軟件性能:
英特爾? Fortran編譯器(Intel? Fortran Compiler)提供了完整的 Fortran 語言直至 Fortran 2018標準的支持,并擴展了對 OpenMP GPU 分流的支持,加快了符合標準的應用程序的開發。
英特爾? oneAPI數學內核庫(oneMKL)包含OpenMP 分流能力的擴展,提高了可移植性。
英特爾? oneAPI 深度神經網絡庫(oneDNN) 支持第四代英特爾至強處理器和Max系列CPU處理器的高級深度學習功能,包括英特爾?AMX、英特爾?AVX-512、VNNI 和 bfloat16。
通過豐富的SYCL支持,以及代碼遷移和分析工具的強化,讓面向多架構系統的代碼開發變得更輕松,進而提高開發者的生產力。
英特爾?oneAPI DPC++/C++編譯器增加了Codeplay為英偉達和AMD GPU開發的新插件的支持,以簡化SYCL代碼的編寫,并提高代碼面向這些處理器架構的可移植性。這提供了一個統一的構建環境,并整合了工具,以提高跨平臺生產力。作為該解決方案的一部分,英特爾和Codeplay將為英偉達GPU的oneAPI插件開始提供商業化的優先支持(priority support)。
基于開源 SYCLomatic的英特爾? DPC++ 兼容性工具增加了100多個新的CUDA APIs支持,讓從CUDA到SYCL的代碼遷移變得更容易。
用戶可以使用英特爾?VTune? Profiler識別大規模MPI應用中的不均衡問題。
英特爾? Advisor為英特爾數據中心GPU Max系列添加了自動化roofline分析,以識別內存、緩存或計算瓶頸,確認其原因并進行優先處理,同時提供可操作的建議,以優化從CPU到GPU 的工作負載分流中的重復數據傳輸成本。
48%4的開發者面向使用多種處理器的異構系統進行開發,因此需要更高效的跨架構編程來應對現實工作負載日益擴大的范圍和規模。結合使用oneAPI 的開放、統一的編程模型與英特爾基于標準的多架構工具,開發者能夠在CPU和加速器的硬件、性能、生產力和代碼可移植性方面自由地進行選擇。相反,為專有編程模型(如 CUDA)編寫的代碼,缺乏面向其它硬件的可移植性,讓開發實踐變得孤立,將企業困于一個封閉的生態系統中。
此外,開放生態系統也在繼續擴大對oneAPI的使用,新的oneAPI卓越中心正在陸續成立。劍橋大學Open Zettascale 實驗室正致力于將重要的百萬兆級的備選代碼(candidate codes)移植到oneAPI上,包括CASTEP、FEniCS和AREPO。該中心還提供課程和研討會,由專家講授oneAPI使用方法和工具,用于編譯和移植代碼以及優化性能。目前,在全球總共已經建立了30個oneAPI卓越中心。
*可前往英特爾新聞發布室了解更多產品性能具體細節:https://www.intel.com/content/www/us/en/newsroom/news/oneapi-2023-tools-...
了解更多信息,請訪問:Codeplay宣布為英偉達和AMD硬件推出oneAPI插件 | 英特爾oneAPI 2023工具包的功能細節|介紹英特爾oneAPI 2023工具包(博客)| 英特爾oneAPI 工具包2023版預覽(網絡研討會錄像)| oneAPI和Codeplay
備注:
1Codeplay是一家英特爾旗下的公司。
2 MLPerf? DeepCAM:?
使用優化后的Pytorch 1.11在MLPerf? HPC-AI v 0.7 DeepCAM訓練基準上獲得未經認證的性能提升。結果沒有經過MLCommons協會的認證。未經認證的結果沒有經過MLPerf?審查,可能使用與經MLPerf?規范認證的結果不一致的測量方法和/或工作負載實現方式。MLPerf?名稱和標識是MLCommons協會在美國和其他國家的商標。保留所有權利。嚴禁未經授權的使用。更多信息見www.mlcommons.org。
AMD EPYC 7763 :英特爾截至2022年4月7日的測試。1-節點,2x?AMD EPYC 7763,啟用超線程,禁用 Turbo,總內存 512 GB(16 個插槽/32 GB/3200 MHz, DDR4),BIOS版本AMI 1.1b,ucode版本0xa001144,操作系統Red Hat Enterprise Linux 8.5 (Ootpa),內核4.18.0-348.7.1.el8_5.x86_64,編譯器gcc(GCC)8.5.0 20210514 (Red Hat 8.5.0-4),https://github.com/mlcommons/hpc/tree/main/deepcam, torch1.11.0a0+git13cdb98, torch-1.11.0a0+git13cdb98-cp38-cp38-linux_x86_64.whl, torch_ccl-1.2.0+44e473a-cp38-cp38-linux_x86_64.whl, intel_extension_for_pytorch-1.10.0+cpu-cp38-cp38-linux_x86_64.whl,Intel MPI 2021.5,Python3.8
英特爾? 至強? 8380可擴展處理器:英特爾截至2022年4月7日的測試。1-節點,2x 英特爾? 至強? 8380處理器,啟用超線程,禁用 Turbo,總內存 512 GB(16個插槽/32 GB/3200 MHz, DDR4),BIOS版本 SE5C6200.86B.0022.D64.2105220049,ucode版本0xd0002b1,操作系統Red Hat Enterprise Linux 8.5 (Ootpa),內核4.18.0-348.7.1.el8_5.x86_64,編譯器gcc (GCC) 8.5.0 20210514 (Red Hat 8.5.0-4),https://github.com/mlcommons/hpc/tree/main/deepcam, torch1.11.0a0+git13cdb98, torch-1.11.0a0+git13cdb98-cp38-cp38-linux_x86_64.whl, torch_ccl-1.2.0+44e473a-cp38-cp38-linux_x86_64.whl, intel_extension_for_pytorch-1.10.0+cpu-cp38-cp38-linux_x86_64.whl (AVX-512), Intel MPI 2021.5,Python3.8
英特爾? 至強? CPU Max 系列(緩存模式)AVX-512:英特爾截至2022年5月25日的測試。1-節點,2x英特爾? 至強? CPU Max 系列,啟用超線程,禁用 Turbo,總內存 128GB 高帶寬內存(HBM)和1TB(16個插槽/ 64 GB/ 4800 MHz, DDR5),集群模式:SNC4,BIOS版本EGSDCRB1.86B.0080.D05.2205081330,ucode版本0x8f000320,操作系統CentOS Stream 8,內核5.18.0-0523.intel_next.1.x86_64+server,編譯器gcc (GCC) 8.5.0 20210514 (Red Hat 8.5.0-10), https://github.com/mlcommons/hpc/tree/main/deepcam, torch1.11.0a0+git13cdb98, AVX-512, FP32, torch-1.11.0a0+git13cdb98-cp38-cp38-linux_x86_64.whl, torch_ccl-1.2.0+44e473a-cp38-cp38-linux_x86_64.whl, intel_extension_for_pytorch-1.10.0+cpu-cp38-cp38-linux_x86_64.whl (AVX-512),Intel MPI 2021.5,Python3.8
NVIDIA A100 80GB:英特爾截至2022年4月13日的測試。1-節點,2x英特爾? 至強? 8360Y可擴展處理器,啟用超線程,啟用Turbo,總內存 256 GB(16個插槽/16 GB/3200 MHz),PCIe 版 NVIDIA A100,BIOS版本AMI 1.1b,ucode版本0xd000311,操作系統Red Hat Enterprise Linux 8.4 (Ootpa),內核4.18.0-305.el8.x86_64,編譯器gcc (GCC) 8.4.1 20200928 (Red Hat 8.4.1-1),https://github.com/mlcommons/hpc/tree/main/deepcam, pytorch1.11.0 py3.7_cuda11.3_cudnn8.2.0_0, cudnn 8.2.1, cuda11.3_0, intel-openmp 2022.0.1 h06a4308_3633,python3.7
英特爾? 至強? CPU Max 系列(緩存模式)BF16/AMX:英特爾截至2022年5月25日的測試。 1-節點,2x英特爾? 至強? CPU Max 系列,啟用超線程,禁用 Turbo,總內存128GB高帶寬內存(HBM) 和1TB(16個插槽/64 GB/4800 MHz,DDR5),集群模式:SNC4,BIOS版本EGSDCRB1.86B.0080.D05.2205081330,ucode版本0x8f000320,操作系統CentOS Stream 8,內核5.18.0-0523.intel_next.1.x86_64+server,編譯器gcc (GCC) 8.5.0 20210514 (Red Hat 8.5.0-10),https://github.com/mlcommons/hpc/tree/main/deepcam, torch1.11.0a0+git13cdb98, AVX-512 FP32, torch-1.11.0a0+git13cdb98-cp38-cp38-linux_x86_64.whl, torch_ccl-1.2.0+44e473a-cp38-cp38-linux_x86_64.whl, intel_extension_for_pytorch-1.10.0+cpu-cp38-cp38-linux_x86_64.whl (AVX-512,AMX,啟用BFloat16),Intel MPI 2021.5,Python3.8
第四代英特爾? 至強? 可擴展處理器多節點集群:英特爾截至2022年4月9日的測試。16-節點集群,1-節點,2x第四代英特爾? 至強? 可擴展處理器,啟用超線程,啟用Turbo,總內存 256 GB(16個插槽/16 GB/4800 MHz,DDR5),BIOS版本Intel SE5C6301.86B.6712.D23.2111241351,ucode版本0x8d000360,操作系統Red Hat Enterprise Linux 8.4 (Ootpa),內核4.18.0-305.el8.x86_64,編譯器gcc (GCC) 8.4.1 20200928 (Red Hat 8.4.1-1),https://github.com/mlcommons/hpc/tree/main/deepcam, torch1.11.0a0+git13cdb98 AVX-512, FP32, torch-1.11.0a0+git13cdb98-cp38-cp38-linux_x86_64.whl, torch_ccl-1.2.0+44e473a-cp38-cp38-linux_x86_64.whl, intel_extension_for_pytorch-1.10.0+cpu-cp38-cp38-linux_x86_64.whl (AVX-512),Intel MPI 2021.5,Python3.8
3 LAMMPS
與AMD EPYC 7773X相比,英特爾? 至強? CPU Max系列運行LAMMPS工作負載(原子流體的Geomean、銅、DPD、液晶、聚乙烯、蛋白質、Stillinger-Weber勢、Tersoff勢、水)的性能要高1.9倍。
與英特爾? 至強? 8380處理器相比,英特爾? 至強? CPU Max系列處理器運行LAMMPS工作負載(原子流體的Geomean、銅、DPD、液晶、聚乙烯、蛋白質、Stillinger-Weber勢、Tersoff勢、水)的性能要高1.6倍。Intel? Xeon? 8380:基于英特爾截至2022年10月28日的測試。1-節點,2x英特爾? 至強? 8380處理器,啟用超線程,啟用Turbo,NUMA配置的SNC2,總內存256GB(16x16GB 3200MT/s, Dual-Rank),BIOS版本SE5C620.86B.01.01.0006.2207150335,ucode版本0xd000375,操作系統Rocky Linux 8.6,Linux版本4.18.0-372.26.1.el8_6.crt1.x86_64,LAMMPS v2021-09-29 cmkl:2022.1.0, icc:2021.6.0, impi:2021.6.0, tbb:2021.6.0; 線程/核:; 啟用Turbo; BuildKnobs:-O3 -ip -xCORE-AVX512 -g -debug inline-debug-info -qopt-zmm-usage=high
AMD EPYC 7773X: 基于英特爾截至2022年10月6日的測試。1-節點,2x AMD EPYC, 啟用超線程,啟用Turbo,NUMA配置的NPS數:4,總內存256GB(16x16GB 3200MT/s, Dual-Rank),BIOS版本M10, ucode版本0xa001224,操作系統Rocky Linux 8.6 (Green Obsidian),Linux版本4.18.0-372.26.1.el8_6.crt1.x86_64, LAMMPS v2021-09-29 cmkl:2022.1.0, icc:2021.6.0, impi:2021.6.0, tbb:2021.6.0; 線程/核:; 啟用Turbo; BuildKnobs:-O3 -ip -g -debug inline-debug-info -axCORE-AVX2 -march=core-avx2;
英特爾? 至強? CPU Max系列:英特爾截至2022年8月31日的測試。1-節點,2x英特爾? 至強? CPU Max 系列,啟用超線程,啟用Turbo,NUMA配置的SNC4,總內存128 GB(3200MHz的HBM2e高帶寬內存),BIOS版本SE5C7411.86B.8424.D03.2208100444,ucode版本0x2c000020,操作系統CentOS Stream 8,Linux版本5.19.0-rc6.0712.intel_next.1.x86_64+server, LAMMPS v2021-09-29 cmkl:2022.1.0, icc:2021.6.0, impi:2021.6.0, tbb:2021.6.0; 線程/核:; 禁用Turbo; BuildKnobs:-O3 -ip -xCORE-AVX512 -g -debug inline-debug-info -qopt-zmm-usage=high
4 Evans Data Global Development Survey Report 22.1, 2022年6月
性能因用途、配置和其他因素而異。欲了解更多信息,請訪問www.Intel.com/PerformanceIndex。結果可能會有所不同。
性能結果基于截至配置中所示日期的測試,并且可能無法反映所有公開可用的更新。
英特爾不負責控制或審計第三方數據。在評估數據準確性時,請參考其他信息源。
關于英特爾
英特爾(NASDAQ: INTC)作為行業引領者,創造改變世界的科技,推動全球進步并讓生活豐富多彩。在摩爾定律的啟迪下,我們不斷致力于推進半導體設計與制造,幫助我們的客戶應對最重大的挑戰。通過將智能融入云、網絡、邊緣和各種計算設備,我們釋放數據潛能,助力商業和社會變得更美好。如需了解英特爾創新的更多信息,請訪問英特爾中國新聞中心newsroom.intel.cn以及官方網站intel.cn。
您可能也感興趣:
為您推薦
遼寧擴大緩繳社保費政策實施范圍 補繳期間免收滯納金
增額終身壽險成銀保市場上的黑馬 中途退保恐會損失保費
保險公司紛紛探索轉型之路 聚焦細分業務、推出新產品
排行
最近更新
- 英特爾推出oneAPI 2023工具包,大幅提升即將推出的英特爾硬件的價值
- 世健獲歐姆龍“2021-2022年度最佳貢獻獎-新產品銷售業績”
- 今日關注:華夏幸福:擬以下屬公司股權實施債務重組不超過400...
- 央行:12月LPR連續4個月維持不變 1年期3.65%、5年期4.30%
- 當前播報:泡腳桶漏電能把人電死嗎
- 世界焦點!雅居樂集團:擬先舊后新配售2.685億股籌集約6.17億...
- 環球訊息:泡腳桶會不會漏電致死
- 環球快看:芝商所和CF Benchmarks推出Aave、Curve和Syntheti...
- 世界熱頭條丨龍湖底價11.4億元摘天津河西區地塊 建筑面積61019平
- 環球百事通!足浴盆安全嗎會漏電嗎
- 全球速讀:涉嫌欺詐的Bithumb前董事李正勛一審判決被推遲到明年1月
- 微速訊:南京五批次集中供地49億收官14宗底價1宗流拍 全年收...
- 環球時訊:數藏平臺藏鯨靈獲百萬級天使投資
- 世界最新:泡腳桶安全嗎會被電嗎
- 世界播報:電動泡腳桶好嗎
- 全球最資訊丨濕疹的三種典型癥狀,你都知道嗎?
- 世界快資訊丨湘雅二醫院專家在桂林醫院疊彩院區開診
- 【天天快播報】冬季新能源汽車使用秘訣,您知道嗎?
- 【新視野】早高峰,這輛黑色小車司機神色慌張地來到渝警驍騎...
- 環球今日訊!全民反詐 | 超給力!網絡遇“詐騙”,高新民警...
- 最新資訊:北京大熊貓科研繁育基地項目啟動開工建設
- 天天消息!走好“專精特新”之路 專家為中小企業指點迷津...
- 當前快看:大悅城:成功發行15億元公司債券
- 羅克韋爾自動化與Fortinet合作,確保運營技術環境安全
- 當施工現場遇上高科技,這個工地“智商”有點高
- 天天微頭條丨通脹預期攀升 歐洲央行緊縮步伐難停
- 記者觀察:拓展康養市場 機構各顯神通
- 世界快播:汽油、柴油價格下調
- 【天天聚看點】信托產品估值可借鑒行業規范
- 世界觀熱點:2022經濟印象:擴內需 謀創新 促開放
今日要聞
- 世健獲歐姆龍“2021-2022年度最佳貢獻獎-新產品銷售業績”
- 英特爾推出oneAPI 2023工具包,大幅提升即將推出的英特爾硬件的價值
- 世界焦點!雅居樂集團:擬先舊后新配售2.685億股籌集約6.17億港元用于債務等
- 世界熱頭條丨龍湖底價11.4億元摘天津河西區地塊 建筑面積61019平
- 全球速讀:涉嫌欺詐的Bithumb前董事李正勛一審判決被推遲到明年1月
- 今日關注:華夏幸福:擬以下屬公司股權實施債務重組不超過400.39億元債權
- 微速訊:南京五批次集中供地49億收官14宗底價1宗流拍 全年收金1300億元
- 環球時訊:數藏平臺藏鯨靈獲百萬級天使投資
- 環球快看:芝商所和CF Benchmarks推出Aave、Curve和Synthetix的參考利率和實時指數
- 央行:12月LPR連續4個月維持不變 1年期3.65%、5年期4.30%