北京2024年9月18日/美通社/ -- 亞馬遜云科技宣布由英偉達(dá)H200 GPU提供支持的 Amazon Elastic Compute Cloud P5e(Amazon EC2 P5e)實(shí)例現(xiàn)已正式可用。亞馬遜云科技是首個(gè)將英偉達(dá)H200 GPU用于生產(chǎn)環(huán)境的領(lǐng)先云提供商。與基于英偉達(dá)H100 GPU的Amazon EC2 P5實(shí)例相比,Amazon EC2 P5e實(shí)例GPU內(nèi)存容量提升1.7倍,GPU內(nèi)存寬帶提升1.5倍。Amazon EC2 P5e非常適用于復(fù)雜的大型語(yǔ)言模型(LLM)和多模態(tài)基礎(chǔ)模型(FM)的訓(xùn)練、微調(diào)和推理,用于支持最苛刻和計(jì)算密集型的生成式AI應(yīng)用,如問(wèn)答、代碼生成、視頻和圖像生成、語(yǔ)音識(shí)別等。
Amazon EC2 P5e實(shí)例提供8個(gè)英偉達(dá)H200 GPU,具有1128GB高帶寬GPU內(nèi)存,同時(shí)提供第三代AMD EPYC處理器,2TB系統(tǒng)內(nèi)存和30TB本地NVMe存儲(chǔ)。Amazon EC2 P5e實(shí)例還提供3,200 Gbps的聚合網(wǎng)絡(luò)帶寬并支持GPUDirect RDMA,從而能夠繞過(guò)CPU進(jìn)行節(jié)點(diǎn)間通信,實(shí)現(xiàn)更低的延遲和高效的橫向擴(kuò)展性能。Amazon EC2 P5e實(shí)例具有的更高的內(nèi)存帶寬、更大的GPU內(nèi)存容量和對(duì)更大的batch sizes的支持,從而顯著提升客戶工作負(fù)載的性能、降低成本并簡(jiǎn)化運(yùn)營(yíng)。
Amazon EC2 P5e實(shí)例現(xiàn)已可通過(guò)Amazon EC2 Capacity Block for ML工具訪問(wèn)并在美國(guó)東部(俄亥俄州)區(qū)域正式可用。
此外,亞馬遜云科技還宣布將推出Amazon EC2 P5en實(shí)例,通過(guò)將英偉達(dá)H200 GPU與定制的第四代英特爾Xeon可擴(kuò)展處理器相結(jié)合支持PCle Gen5,將提供高達(dá)四倍的CPU和GPU之間的帶寬,降低網(wǎng)絡(luò)延遲,進(jìn)一步提高工作負(fù)載性能。
-
gpu
+關(guān)注
關(guān)注
28文章
5271瀏覽量
136069 -
英偉達(dá)
+關(guān)注
關(guān)注
23文章
4115瀏覽量
99615 -
Amazon
+關(guān)注
關(guān)注
1文章
128瀏覽量
18212 -
亞馬遜云科技
+關(guān)注
關(guān)注
0文章
115瀏覽量
483
發(fā)布評(píng)論請(qǐng)先 登錄
H200 解禁!預(yù)交付8萬(wàn)顆,傳阿里砸數(shù)億抄底對(duì)手
亞馬遜云科技Amazon DevOps Agent智能運(yùn)維助手正式可用
H200解禁了個(gè)寂寞?2個(gè)月0銷售,審查層層加碼!
美國(guó)政府正式批準(zhǔn)英偉達(dá)H200芯片對(duì)華出口
美對(duì)華芯片出口“松綁”:英偉達(dá)H200獲準(zhǔn)進(jìn)入中國(guó)市場(chǎng)#AI芯片#英偉達(dá)#H200芯片
美國(guó)將允許英偉達(dá)H200對(duì)華出口,但要抽成25%
突發(fā)!特朗普批準(zhǔn)英偉達(dá)H200芯片對(duì)華出口,抽成25%
今日看點(diǎn):特朗普允許英偉達(dá)對(duì)華出口H200芯片,但要抽成25%;眾擎完成 A1+ 輪與 A2 輪融資
亞馬遜新一代自研服務(wù)器芯片Graviton5問(wèn)世,性能提升25%
今日看點(diǎn):馬斯克:特斯拉已部署超百萬(wàn)顆 AI 芯片;長(zhǎng)鑫存儲(chǔ)發(fā)布全新 DDR5 內(nèi)存新品
英偉達(dá) Q3 狂攬 308 億
亞馬遜云科技Amazon Bedrock AgentCore正式可用,引領(lǐng)Agent走向全面落地
亞馬遜云科技在中國(guó)區(qū)域推出Amazon Graviton4實(shí)例 以自研芯片驅(qū)動(dòng)企業(yè)算力升級(jí)
NVIDIA Dynamo新增對(duì)亞馬遜云科技服務(wù)的支持
亞馬遜功能最強(qiáng)模型Amazon Nova Premier現(xiàn)已正式可用
亞馬遜云科技宣布Amazon EC2 P5e實(shí)例正式可用 由英偉達(dá)H200 GPU提供支持
評(píng)論