哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)和AMD新芯片,突破PCIe限制

智能計算芯世界 ? 來源:半導(dǎo)體行業(yè)觀察 ? 2024-03-01 09:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

學(xué)過微處理器的同學(xué)可能還記得,最初的8086/8088處理器沒有浮點單元。主板通常有一個額外的插槽,用于可選的8087 數(shù)學(xué)協(xié)處理器。數(shù)學(xué)協(xié)處理器進(jìn)入了 CPU 本身,如今,CPU 沒有可選的數(shù)學(xué)協(xié)處理器。

然而, SIMD 處理器(例如GPU)有多種選擇。眾所周知,GPU 可以比 CPU 主機(jī)更快地加速數(shù)學(xué)處理(例如矩陣運(yùn)算)。

隨著Nvidia GH-200 處理器 和AMD MI300A APU的推出,市場正在見證“8087 時刻”——即 CPU 吸收外部性能硬件。Nvidia 和 AMD 都已將 GPU 納入處理器中,其結(jié)果是 HPC 性能大幅躍升,并預(yù)示著未來的發(fā)展。

再見 PCI

AMD 和 Nvidia 的 GPU 都依賴 PCI 總線與 CPU 進(jìn)行通信。CPU 和 GPU 有兩個不同的內(nèi)存域,數(shù)據(jù)必須通過 PCI 接口從 CPU 域移動到 GPU 域(并返回)。

使用第 5 代 PCIe 總線中全部 16 個通道的 GPU 的最大帶寬約為 63GB/s。此瓶頸將限制 CPU 和 GPU 之間的內(nèi)存移動。

Nvidia GH200 通過 900 GB/s 雙向 NVLink-C2C 連接 Grace CPU 和 Hooper GPU。結(jié)果大約快了 14 倍。此外,GH200 還帶來了單一共享 CPU-GPU 內(nèi)存域的優(yōu)勢。無需通過 PCI 總線在 CPU 和 GPU 之間移動數(shù)據(jù)。如圖 1 所示,CPU 和 GPU 對所有內(nèi)存具有一致的視圖。CPU內(nèi)存高達(dá)480GB LPDDR5X(帶ECC),GPU具有96GB HBM3或144GB HBM3e??偟南喔桑▎斡颍﹥?nèi)存在 576GB 到 624GB 之間。

wKgZomXhLMiARMptAADkHTuyYxg500.jpg

當(dāng)前的 AMD Instinct MI300A APU 中采用單一內(nèi)存域,具有 128 GB HBM3 內(nèi)存,使用 Infinity Fabric 在 CPU 和 GPU 之間一致共享,封裝峰值吞吐量為 5.3 TB/s 。 雖然 MI300A 目前不支持像 GH200 那樣額外的 DDR 內(nèi)存擴(kuò)展,但 CXL 是一個值得將來記住的詞。

對于 GH200 和 MI300A,關(guān)鍵的突出短語是“呈現(xiàn)單個存儲域”。在傳統(tǒng)的CPU-PCIe-GPU組合中,GPU內(nèi)存量通常小于CPU內(nèi)存,數(shù)據(jù)必須通過PCIe接口進(jìn)行混洗。這兩個新設(shè)計消除了這個瓶頸。單個大內(nèi)存域一直對 HPC 有吸引力,而 GenAI 的增長加速了這種需求(即,能夠在內(nèi)存中加載大型模型并使用 GPU 運(yùn)行它們)。對于傳統(tǒng) GPU,GPU 內(nèi)存量限制了模型大小,需要采用分布式 GPU 方法。(注:GH200 可以通過外部 NVLink 連接,創(chuàng)建海量統(tǒng)一內(nèi)存;例如,Nvidia-AWS NLV32可以提供高達(dá) 20 TB 的統(tǒng)一內(nèi)存。)

離你的桌面并不遠(yuǎn)

技術(shù)領(lǐng)域明顯的趨勢之一是從昂貴的新技術(shù)市場轉(zhuǎn)向低成本的大宗商品市場。高性能計算也不例外。隨著市場需求,從多核到高級內(nèi)存的一切都已從高端轉(zhuǎn)移到“手機(jī)”。遷移到單個內(nèi)存域就是這些變化之一。

最近,在 Linux 基準(zhǔn)測試網(wǎng)站Phoronix上,杰出的測試員Michael Larabel在 GH200 工作站上運(yùn)行了 HPC 基準(zhǔn)測試。該系統(tǒng)由德國的GPTshop.ai提供。

據(jù)了解,系統(tǒng)塔式機(jī)箱配備 GH200 Grace Hopper Superchip,配備 576G 內(nèi)存、雙 2000+ W 電源、QCT 主板以及多種配置選項,包括 SSD 和 NVIDIA Bluefield/Connect-X 適配器。一項有趣且有用的功能是 TDP 可以從 450W 編程到 1000W(CPU + GPU + 內(nèi)存),這在非數(shù)據(jù)中心環(huán)境中應(yīng)該很有用。另外,默認(rèn)風(fēng)冷噪音據(jù)稱為25分貝。液體冷卻也是一種選擇。

然而,桌面超級工作站并不便宜。目前可用的型號 GH200 576GB起價為 47,500 歐元(根據(jù) Phoronix 的說法,由于在歐盟以外地區(qū)運(yùn)輸時無需繳納 19% 的增值稅,因此該價格相當(dāng)于 41,000 美元)

這個價格可能看起來很高,但考慮到具有 80 GB HBM2e 內(nèi)存的 Nvidia H100 PCIe GPU 目前的市場價格在 3 萬美元到 3.5 萬美元之間。這不包括為 GPU 供電和運(yùn)行的主機(jī)系統(tǒng)。此外,用戶還受到 80GB GPU 內(nèi)存的限制,該內(nèi)存通過 PCIe 總線與主內(nèi)存域分開。

GPTshop工作站提供576GB的單域內(nèi)存。HPC 和 GenAI 用戶會發(fā)現(xiàn)這半 TB 的 CPU-GPU 內(nèi)存很有吸引力。

初步基準(zhǔn)

借助 GPTshop,Phoronix 能夠遠(yuǎn)程運(yùn)行多個基準(zhǔn)測試?;鶞?zhǔn)應(yīng)被視為初步的,而不是最終的績效衡量標(biāo)準(zhǔn)。特別是,基準(zhǔn)測試僅針對 CPU,沒有使用 Hopper A100 GPU。因此,基準(zhǔn)圖是不完整的。Phoronix 計劃在未來測試基于 GPU 的應(yīng)用程序。

據(jù) Phoronix 稱,Ubuntu 23.10 與 Linux 6.5 一起使用 GCC-13 作為標(biāo)準(zhǔn)編譯器。使用類似的環(huán)境來測試可比較的處理器,包括 Intel Xeon Scalable、AMD EPYC 和 Ampere Altra Max 處理器。完整的列表可以在Phoronix 網(wǎng)站上找到。

此外,沒有可用于基準(zhǔn)測試運(yùn)行的功耗數(shù)據(jù)。據(jù) Phoronix 稱,NVIDIA GH200 目前似乎沒有在 Linux 下公開任何 RAPL/PowerCap/HWMON 接口,僅用于讀取 GH200 的功率/能源使用情況。系統(tǒng)上的BMC確實通過Web界面暴露了整個系統(tǒng)的功耗,并且功率數(shù)據(jù)沒有通過IPMI暴露。

盡管存在這些限制,一些重要的基準(zhǔn)測試還是首次在 Nvidia 之外的 GH200 上運(yùn)行。

好奧萊 HPCG

Phoronix 報告的第一個測試是標(biāo)準(zhǔn)HPCG內(nèi)存帶寬基準(zhǔn)測試,如圖 2 所示。

wKgaomXhLMiAWYYtAAWDqsqK-uw329.jpg

可以看出,GH200 Arm 的性能達(dá)到了可觀的 42 GFLOPS,略高于 Xeon Platinum 8380 2P(40 GFLOPS),略低于 EPYC 9654 Genoa 2P(44 GFLOPS)。另外值得注意的是 72 核 Arm Grace CPU,其性能幾乎是 Ampere Altra Max 128 核 Arm 處理器的兩倍。

GH200 在其他基準(zhǔn)測試中表現(xiàn)良好。最令人印象深刻的結(jié)果如圖 3 所示。使用 72 核 Arm GH200 的NWChem (C240-Bucky Ball) 運(yùn)行時間為 1404 秒,僅落后于領(lǐng)先者 128 核 Epyc 9554 (2p),成績?yōu)?1323 秒。

wKgZomXhLMiAVoZlAATrg6t09VQ779.jpg

即將發(fā)生的事情

Nvidia GH200 和 AMD MI300A 引入了新的處理器架構(gòu)。與吸收 8087 數(shù)學(xué)協(xié)處理器類似,高端 CPU 也開始吸收 GPU(或 SIMD 處理單元)。然而,這個想法并不是全新的。自 2011 年以來,AMD 已將中等 GPU 集成到其臺式機(jī)/筆記本電腦APU 處理器中。雖然這些高端處理器可能被認(rèn)為是“專用”的,因此價格昂貴,但隨著時間的推移,對 GenAI 的巨大興趣可能會將這些設(shè)計推向商品價格點。隨著更多基準(zhǔn)的出現(xiàn),這個故事將繼續(xù)發(fā)展。

此外,引入具有足夠內(nèi)存的個人高性能工作站,可以在您的辦公桌旁運(yùn)行一些最大的法學(xué)碩士,這是一個重要的里程碑。更不用說運(yùn)行許多大內(nèi)存 GPU 優(yōu)化的 HPC 應(yīng)用程序的能力了。數(shù)據(jù)中心和云仍將是當(dāng)今的主力,但必須要說的是“擁有重置按鈕”。


審核編輯:劉清
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 微處理器
    +關(guān)注

    關(guān)注

    11

    文章

    2440

    瀏覽量

    86128
  • PCIe
    +關(guān)注

    關(guān)注

    16

    文章

    1475

    瀏覽量

    88906
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4115

    瀏覽量

    99603
  • AMD芯片
    +關(guān)注

    關(guān)注

    0

    文章

    16

    瀏覽量

    3071

原文標(biāo)題:英偉達(dá)和AMD新芯片,突破PCIe限制

文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    H200之后,美國AI芯片管制再出“幺蛾子”,英偉達(dá)AMD慌嗎?

    。這意味著英偉達(dá)、AMD 等美國芯片廠商向全球任何目的地出口 AI 加速器,均需事先獲得美國政府許可。 ? 美國政府正在考慮的這項新規(guī),將從根本上改變其在 AI
    的頭像 發(fā)表于 03-07 06:08 ?1.4w次閱讀

    性能狂飆!AMD新品叫板英偉達(dá)GB200,角逐5000億AI加速器賽道

    AMD線上會議截圖 本次大會上,蘇姿豐重點宣布了MI350 系列和 MI400 系列 AI 芯片的強(qiáng)大性能,她表示這些芯片將與英偉達(dá)(Nvi
    的頭像 發(fā)表于 06-14 00:44 ?6599次閱讀
    性能狂飆!<b class='flag-5'>AMD</b>新品叫板<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>GB200,角逐5000億AI加速器賽道

    鎖定未來三年合作!“Meta+博通”2nm ASIC芯片開造,劍指“英偉達(dá)+AMD”?

    至?2029?年。根據(jù)協(xié)議,Meta?初步承諾將部署高達(dá)?1GW?采用博通技術(shù)的訓(xùn)練與推理專用的?MTIA?芯片,未來更將把部署規(guī)模擴(kuò)展至數(shù)個GW。這一長期綁定,是Meta作為AI巨頭試圖探索更多降低AI領(lǐng)域投入成本,擺脫對英偉達(dá)
    的頭像 發(fā)表于 04-16 09:06 ?4130次閱讀
    鎖定未來三年合作!“Meta+博通”2nm ASIC<b class='flag-5'>芯片</b>開造,劍指“<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>+<b class='flag-5'>AMD</b>”?

    馬斯克宣布: A15完成設(shè)計,未來芯片迭代快過AMD英偉達(dá)

    1 月 18 日,特斯拉首席執(zhí)行長伊隆·馬斯克(Elon Musk)宣布一項雄心勃勃的人工智能(AI)芯片路線圖,計劃每九個月推出新一代 AI 處理器,這個速度將超越競爭對手英偉達(dá)AMD
    的頭像 發(fā)表于 01-19 10:21 ?1.8w次閱讀
    馬斯克宣布: A15完成設(shè)計,未來<b class='flag-5'>芯片</b>迭代快過<b class='flag-5'>AMD</b>和<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>

    再加25%關(guān)稅!鎖定對華AI芯片,點名英偉達(dá)AMD

    電子發(fā)燒友網(wǎng)綜合報道,1月14日,美國總統(tǒng)特朗普簽署行政令,宣布對部分先進(jìn)人工智能(AI)芯片及衍生產(chǎn)品加征25%的從價關(guān)稅。以“國家安全”為名,加速重構(gòu)其芯片產(chǎn)業(yè)政策。在公告中明確提到A英偉
    的頭像 發(fā)表于 01-16 09:20 ?6281次閱讀
    再加25%關(guān)稅!鎖定對華AI<b class='flag-5'>芯片</b>,點名<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>、<b class='flag-5'>AMD</b>

    英偉達(dá)重磅出手!AI 推理存儲全面覺醒

    電子發(fā)燒友網(wǎng)報道(文/黃晶晶)近日,有消息稱,英偉達(dá)將以大約200億美元收購人工智能芯片初創(chuàng)公司Groq,這將是英偉達(dá)迄今為止規(guī)模最大的一筆
    的頭像 發(fā)表于 12-26 08:44 ?1.2w次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>重磅出手!AI 推理存儲全面覺醒

    突發(fā)!特朗普批準(zhǔn)英偉達(dá)H200芯片對華出口,抽成25%

    據(jù)最新消息,美國總統(tǒng)特朗普已批準(zhǔn)英偉達(dá)向中國出口其H200人工智能芯片,但要求從銷售額中抽取25%作為分成。這意味著英偉達(dá)在游說美國政府放寬
    的頭像 發(fā)表于 12-09 17:58 ?1745次閱讀

    英偉達(dá)下一代Rubin芯片已流片

    繼8月底英偉達(dá)透露Rubin架構(gòu)芯片計劃明年量產(chǎn)后,當(dāng)?shù)貢r間9月8日的高盛技術(shù)會議上,英偉達(dá)又談到Rubin的進(jìn)展。
    的頭像 發(fā)表于 09-12 17:15 ?2019次閱讀

    英偉達(dá)被傳暫停生產(chǎn)H20芯片 外交部回應(yīng)

    據(jù)外媒《the Information》在當(dāng)?shù)貢r間的8月21日下午爆料稱,英偉達(dá)可能已經(jīng)暫停生產(chǎn)H20芯片。據(jù)稱,英偉達(dá)已正式下達(dá)指示給到供
    的頭像 發(fā)表于 08-22 15:58 ?3017次閱讀

    外媒:英偉達(dá)正開發(fā)新款中國特供芯片B30A 或為旗艦AI芯品B300的閹割版

    我們看到英偉達(dá)的旗艦新品 B300備受關(guān)注;但是受限于美國實施出口限制措施,英偉達(dá)不會出貨,就像此前英偉
    的頭像 發(fā)表于 08-20 15:19 ?4033次閱讀
    外媒:<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>正開發(fā)新款中國特供<b class='flag-5'>芯片</b>B30A 或為旗艦AI芯品B300的閹割版

    今日看點丨消息稱智駕基礎(chǔ)芯片配套8GB小容量存儲芯片價格開始暴漲;英偉達(dá)推出具身智能推理模型Cosmos Re

    了一項特殊協(xié)議,兩家企業(yè)同意將特供中國的芯片收入的15%上繳給美國政府,以換取相關(guān)產(chǎn)品的出口許可證。 2023年10月,美國商務(wù)部公布對華半導(dǎo)體出口管制最終規(guī)則,進(jìn)一步加大對人工智能相關(guān)芯片、半導(dǎo)體制造設(shè)備的對華出口限制
    發(fā)表于 08-12 09:41 ?2550次閱讀

    英偉達(dá)被約談!“后門”風(fēng)險陰影下,人臉識別終端為何選國產(chǎn)芯片

    7月31日消息,為維護(hù)中國用戶網(wǎng)絡(luò)安全、數(shù)據(jù)安全,國家互聯(lián)網(wǎng)信息辦公室已約談英偉達(dá),要求英偉達(dá)公司就對華銷售的H20算力芯片漏洞后門安全風(fēng)險
    的頭像 發(fā)表于 08-08 09:43 ?1019次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>被約談!“后門”風(fēng)險陰影下,人臉識別終端為何選國產(chǎn)<b class='flag-5'>芯片</b>

    國家網(wǎng)信辦約談英偉達(dá)

    近日,英偉達(dá)算力芯片被曝出存在嚴(yán)重安全問題。此前,美議員呼吁要求美出口的先進(jìn)芯片必須配備“追蹤定位”功能。美人工智能領(lǐng)域?qū)<彝嘎叮?b class='flag-5'>英偉
    的頭像 發(fā)表于 07-31 13:56 ?2829次閱讀
    國家網(wǎng)信辦約談<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>

    英偉達(dá)擬再推中國特供GPU,今年6月量產(chǎn)!

    電子發(fā)燒友網(wǎng)綜合報道 近年來,美國政府對華半導(dǎo)體出口管制政策不斷收緊,英偉達(dá)等半導(dǎo)體企業(yè)面臨嚴(yán)峻挑戰(zhàn)。為保持在中國市場的競爭力,英偉達(dá)推出了多款特供版GPU,以滿足政策
    發(fā)表于 05-27 00:03 ?4894次閱讀
    美姑县| 肥东县| 金坛市| 浦县| 班玛县| 辽阳县| 莆田市| 秭归县| 五指山市| 黄陵县| 前郭尔| 台中县| 阳高县| 三亚市| 上思县| 逊克县| 阿拉善盟| 阜阳市| 普陀区| 高雄市| 临洮县| 乐至县| 钟山县| 临朐县| 桐庐县| 龙岩市| 神池县| 崇文区| 措美县| 吴川市| 金寨县| 五台县| 巴南区| 万安县| 德钦县| 醴陵市| 通化市| 剑川县| 淮滨县| 吴桥县| 普定县|