亞馬遜云科技宣布Amazon EC2 P5實例正式可用
加速生成式AI和高性能計算應用,由英偉達H100 Tensor Core GPU提供支持
亞馬遜云科技近日在紐約峰會上宣布Amazon Elastic Compute Cloud(EC2)P5實例正式可用。這是一款下一代GPU實例,由最新的英偉達H100 Tensor Core GPU提供支持,可以滿足客戶在運行人工智能、機器學習和高性能計算工作負載時對高性能和高擴展性的需求。與上一代基于GPU的實例相比,Amazon EC2 P5實例可以將訓練時間縮減6倍(從幾天縮短到幾小時),從而幫助客戶節省高達40%的訓練成本。
Amazon EC2 P5實例提供8個英偉達H100 Tensor Core GPU,具有640 GB高帶寬GPU內存,同時提供第三代AMD EPYC處理器、2TB系統內存和30 TB本地NVMe存儲。Amazon EC2 P5實例還提供3200 Gbps的聚合網絡帶寬并支持GPUDirect RDMA,從而能夠繞過CPU進行節點間通信,實現更低的延遲和高效的橫向擴展性能。
【資料圖】
亞馬遜云科技與英偉達攜手開發下一代基礎設施
亞馬遜云科技和英偉達(NVIDIA)在今年3月宣布了一項多方合作,構建全球最具可擴展性且按需付費的人工智能基礎設施,以便訓練日益復雜的大語言模型和開發生成式AI應用程序。
當時,亞馬遜云科技預發布了由英偉達H100 Tensor Core GPU支持的Amazon EC2 P5實例,可為構建和訓練更大規模的機器學習模型提供高達20 exaFLOPS的算力。亞馬遜云科技和英偉達合作十多年來成果頗豐,推出了包括支持視覺計算、人工智能和高性能計算集群的各種GPU實例,如CG1實例(2010年)、G2(2013年)、P2(2016年)、P3(2017年)、G3(2017年)、P3dn(2018年)、G4(2019年)、P4(2020年)、G5(2021年)和P4de(2022年)實例。
現在,機器學習模型的規模已經達到數萬億參數,這種復雜性大大增加了客戶訓練模型所需的時間,例如,最新的大語言模型訓練時間長達數月之久。類似的趨勢也出現在高性能計算領域。隨著高性能計算客戶數據收集準確度的提高以及數據集達到EB級規模,客戶已經在尋找解決日益復雜應用程序的更快方法。
關于Amazon EC2 P5實例
Amazon EC2 P5實例非常適合訓練和運行越來越復雜的大語言模型和計算機視覺模型,以滿足最苛刻的計算密集型生成式AI應用的需求,包括問答、代碼生成、視頻和圖像生成、語音識別等。與上一代基于GPU的實例相比,Amazon EC2 P5實例在這些應用中的訓練時間縮短了6倍。那些可以在工作負載中使用較低精度FP8數據類型的客戶,例如使用Transformer框架的語言模型,將通過英偉達Transformer Engine的支持獲得高達6倍的性能提升。
高性能計算客戶通過使用Amazon EC2 P5實例可以在藥物發現、地震分析、天氣預報和金融建模等領域更大規模地部署高要求的應用程序。此外,對于使用基于動態規劃(Dynamic Programming)算法進行基因組測序或加速數據分析等應用的客戶,Amazon EC2 P5將通過新的DPX指令集提供支持。
Amazon EC2 P5實例使客戶能夠探索以前看似無法解決的問題,更快地迭代解決方案,并加速進入市場。
第二代Amazon EC2 UltraClusters和Elastic Fabric Adapter
Amazon EC2 P5實例為多節點分布式訓練和緊密耦合的高性能計算工作負載提供先進的橫向擴展功能,其使用的第二代Elastic Fabric Adapter(EFA)網絡設備提供高達3200 Gbps的網絡速度,是Amazon EC2 P4d實例的8倍。
為了滿足客戶對大規模和低延遲的需求,Amazon EC2 P5實例部署在第二代Amazon EC2 UltraClusters中,該集群目前可在超過2萬個英偉達H100 Tensor Core GPU上為客戶提供更低的延遲。作為云中最大規模的機器學習基礎設施之一,Amazon EC2 UltraClusters中的Amazon EC2 P5實例可提供高達20 exaFLOPS的聚合計算能力。
Amazon EC2 UltraClusters使用了Amazon FSx for Lustre,這是一種完全托管的共享存儲,構建在常用的高性能并行文件系統上。客戶通過Amazon FSx for Lustre,可以按需大規模快速處理海量數據集,并實現亞毫秒級延遲。Amazon FSx for Lustre的低延遲和高吞吐量特性經過優化,可在Amazon EC2 UltraCluster上為深度學習、生成式AI和高性能計算工作負載提供支持。
Amazon FSx for Lustre可以為Amazon EC2 UltraCluster中的GPU和機器學習加速器持續提供數據,從而加速最苛刻的工作負載,包括大語言模型訓練、生成式AI推理,以及基因組學和金融風險建模等高性能計算負載。
Amazon EC2 P5實例現已正式可用
Amazon EC2 P5實例現已在以下區域正式可用:美國東部(北弗吉尼亞)和美國西部(俄勒岡)。更多信息可訪問:Amazon EC2定價和Amazon EC2 P5實例。
客戶也可以選擇亞馬遜云科技提供的各種內置生成式AI的云服務,它們都運行在具有成本效益的生成式AI云基礎設施上,助力客戶加快創新和重塑應用。更多信息請訪問亞馬遜云科技生成式AI頁面。
關鍵詞:
您可能也感興趣:
為您推薦
7月7日淄博德合新戊二醇價格暫穩
世貿組織投資便利化協定成功結束文本談判
外媒:扎波羅熱地區發生爆炸 釋放了什么信號?
排行
最近更新
- 亞馬遜云科技宣布Amazon EC2 P5實例正式可用
- ESG投資引擎推動經濟高質量發展,第二屆ESG發展論壇在穗舉辦
- gt610跑分只有4000分(gt610跑分多少)
- 華為與三家同舟共濟伙伴簽約,攜手深耕城市數字化
- 好萊塢名導:“美國宣傳機器歪曲普京形象”
- 海河流域發生流域性較大洪水
- 【寶匯投資】 PCE隨著CPI通脹數據完美地落地,那未來走勢呢
- 第四屆公立醫院后勤建設管理會議在武漢召開
- 肆拾玖坊泰斗酒傳承工藝,釀造經典
- 中國企業社會責任年會正式公布2023年度責任先鋒
- 《舍陂記》亮相書博會,為時代保留一份鄉土記憶
- “0xC57E”錢包地址1天內獲利442枚ETH
- 寫好高質量發展“人才篇” 鍋圈食匯榮獲中國企業社會責任...
- “五個女博士”爭議廣告被罰近50萬
- 賽倫生物董事長因涉嫌職務犯罪被實施留置
- 高端冰淇淋越來越卷 頭部零售企業是怎么挖掘爆款的?
- 啟牛學堂助居民合理調整家庭資產規劃
- 宏利基金師婧:下半年印度市場相對優勢明顯
- 國家統計局:7月制造業PMI49.3% 連續兩個月平穩上升
- 深南電路董秘回復:公司現已具備FC-BGA封裝基板中階產品樣品...
- 2023年沈陽新增了哪些學校?這18所學校首次招生
- 中國IC獨角獸,沖出一片天
- 中國名歌大全100首 中國名歌大全
- 祥龍電業7月31日快速上漲
- 肉末豆腐家常做法簡單?
- 木耳功效與作用?
- 木耳的常用名字?
- 黑木耳有哪些藥用價值?
- 巖耳與木耳哪個好?
- 太藍新能源博士后科研工作站正式授牌成立