哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA H100 Tensor Core GPU性能比上一代GPU高出4.5 倍

NVIDIA英偉達(dá) ? 來(lái)源:NVIDIA英偉達(dá) ? 作者:NVIDIA英偉達(dá) ? 2022-09-13 15:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在行業(yè)標(biāo)準(zhǔn) AI 推理測(cè)試中,NVIDIA H100 GPU 創(chuàng)造多項(xiàng)世界紀(jì)錄、A100 GPU 在主流性能方面展現(xiàn)領(lǐng)先優(yōu)勢(shì)、Jetson AGX Orin 在邊緣計(jì)算方面處于領(lǐng)先地位。

在 MLPerf 行業(yè)標(biāo)準(zhǔn) AI 基準(zhǔn)測(cè)試中首次亮相的 NVIDIA H100 Tensor Core GPU 在所有工作負(fù)載推理中均創(chuàng)造了世界紀(jì)錄,其性能比上一代 GPU 高出 4.5 倍。

這些測(cè)試結(jié)果表明,對(duì)于那些需要在高級(jí) AI 模型上獲得最高性能的用戶(hù)來(lái)說(shuō),Hopper 是最優(yōu)選擇。

此外,NVIDIA A100 Tensor Core GPU 和用于 AI 機(jī)器人的 NVIDIA Jetson AGX Orin 模塊在所有 MLPerf 測(cè)試中繼續(xù)表現(xiàn)出整體領(lǐng)先的推理性能,包括圖像和語(yǔ)音識(shí)別自然語(yǔ)言處理和推薦系統(tǒng)。

H100 (又名 Hopper)提高了本輪測(cè)試所有六個(gè)神經(jīng)網(wǎng)絡(luò)中的單加速器性能標(biāo)桿。它在單個(gè)服務(wù)器和離線場(chǎng)景中展現(xiàn)出吞吐量和速度方面的領(lǐng)先優(yōu)勢(shì)。

18e4d860-3041-11ed-ba43-dac502259ad0.jpg

NVIDIA H100 GPU 在數(shù)據(jù)中心類(lèi)別的所有工作負(fù)載上都樹(shù)立了新標(biāo)桿

NVIDIA Hopper 架構(gòu)的性能比 NVIDIA Ampere 架構(gòu)高出 4.5 倍;Ampere 架構(gòu) GPU 在 MLPerf 結(jié)果中繼續(xù)保持全方位領(lǐng)先地位。

Hopper 在流行的用于自然語(yǔ)言處理的 BERT 模型上表現(xiàn)出色部分歸功于其 Transformer Engine。BERT 是 MLPerf AI 模型中規(guī)模最大、對(duì)性能要求最高的的模型之一。

這些推理基準(zhǔn)測(cè)試標(biāo)志著 H100 GPU 的首次公開(kāi)亮相,它將于今年晚些時(shí)候上市。H100 GPU 還將參加未來(lái)的 MLPerf 訓(xùn)練基準(zhǔn)測(cè)試。

A100 GPU 展現(xiàn)領(lǐng)先優(yōu)勢(shì)

在最新測(cè)試中,NVIDIA A100 GPU 繼續(xù)在主流 AI 推理性能方面展現(xiàn)出全方位領(lǐng)先,目前主要的云服務(wù)商和系統(tǒng)制造商均提供 A100 GPU。

在數(shù)據(jù)中心和邊緣計(jì)算類(lèi)別與場(chǎng)景中,A100 GPU 贏得的測(cè)試項(xiàng)超過(guò)了任何其他提交的結(jié)果。A100 還在 6 月的 MLPerf 訓(xùn)練基準(zhǔn)測(cè)試中取得了全方位的領(lǐng)先,展現(xiàn)了其在整個(gè) AI 工作流中的能力。

自 2020 年 7 月在 MLPerf 上首次亮相以來(lái)由于 NVIDIA AI 軟件的不斷改進(jìn),A100 GPU 的性能已經(jīng)提升了 6 倍。

NVIDIA AI 是唯一能夠在數(shù)據(jù)中心和邊緣計(jì)算中運(yùn)行所有 MLPerf 推理工作負(fù)載和場(chǎng)景的平臺(tái)。

用戶(hù)需要通用性能

NVIDIA GPU 在所有主要 AI 模型上的領(lǐng)先性能,使用戶(hù)成為真正的贏家。用戶(hù)在實(shí)際應(yīng)用中通常會(huì)采用許多不同類(lèi)型的神經(jīng)網(wǎng)絡(luò)。

例如,一個(gè)AI 應(yīng)用可能需要理解用戶(hù)的語(yǔ)音請(qǐng)求、對(duì)圖像進(jìn)行分類(lèi)、提出建議,然后以人聲作為語(yǔ)音信息提供回應(yīng)。每個(gè)步驟都需要用到不同類(lèi)型的 AI 模型。

MLPerf 基準(zhǔn)測(cè)試涵蓋了所有這些和其他流行的 AI 工作負(fù)載與場(chǎng)景,比如計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、推薦系統(tǒng)、語(yǔ)音識(shí)別等。這些測(cè)試確保用戶(hù)將獲得可靠且部署靈活的性能。

MLPerf 憑借其透明性和客觀性使用戶(hù)能夠做出明智的購(gòu)買(mǎi)決定。該基準(zhǔn)測(cè)試得到了包括亞馬遜、Arm、百度、谷歌、哈佛大學(xué)、英特爾、Meta、微軟、斯坦福大學(xué)和多倫多大學(xué)在內(nèi)的廣泛支持。

Orin 在邊緣計(jì)算領(lǐng)域保持領(lǐng)先

在邊緣計(jì)算方面,NVIDIA Orin 運(yùn)行了所有 MLPerf 基準(zhǔn)測(cè)試,是所有低功耗系統(tǒng)級(jí)芯片中贏得測(cè)試最多的芯片。并且,與 4 月在 MLPerf 上的首次亮相相比,其能效提高了50%。

在上一輪基準(zhǔn)測(cè)試中,Orin 的運(yùn)行速度和平均能效分別比上一代 Jetson AGX Xavier 模塊高出 5 倍和 2 倍。

195dec3c-3041-11ed-ba43-dac502259ad0.jpg

在能效方面,Orin 邊緣 AI 推理性能提升多達(dá) 50%

Orin 將 NVIDIA Ampere 架構(gòu) GPU 和強(qiáng)大的 Arm CPU 內(nèi)核集成到一塊芯片中。目前,Orin 現(xiàn)已被用在 NVIDIA Jetson AGX Orin 開(kāi)發(fā)者套件以及機(jī)器人和自主系統(tǒng)生產(chǎn)模塊,并支持完整的 NVIDIA AI 軟件堆棧,,包括自動(dòng)駕駛汽車(chē)平臺(tái)(NVIDIA Hyperion)、醫(yī)療設(shè)備平臺(tái)(Clara Holoscan)和機(jī)器人平臺(tái)(Isaac)。

廣泛的 NVIDIA AI 生態(tài)系統(tǒng)

MLPerf 結(jié)果顯示,NVIDIA AI 得到了業(yè)界最廣泛的機(jī)器學(xué)習(xí)生態(tài)系統(tǒng)的支持。

在這一輪基準(zhǔn)測(cè)試中,有超過(guò) 70 項(xiàng)提交結(jié)果在 NVIDIA 平臺(tái)上運(yùn)行。例如,Microsoft Azure 提交了在其云服務(wù)上運(yùn)行 NVIDIA AI 的結(jié)果。

此外,10 家系統(tǒng)制造商的 19 個(gè) NVIDIA 認(rèn)證系統(tǒng)參加了本輪基準(zhǔn)測(cè)試,包括華碩、戴爾科技、富士通、技嘉、慧與、聯(lián)想、和超微等。

它們的結(jié)果表明,無(wú)論是在云端還是在自己數(shù)據(jù)中心運(yùn)行的服務(wù)器中,用戶(hù)都可以借助 NVIDIA AI 獲得出色的性能。

NVIDIA 的合作伙伴參與 MLPerf 是因?yàn)樗麄冎肋@是一個(gè)為客戶(hù)評(píng)估 AI 平臺(tái)和廠商的重要工具。最新一輪結(jié)果表明,他們目前向用戶(hù)提供的性能將隨著 NVIDIA 平臺(tái)的發(fā)展而增長(zhǎng)。

用于這些測(cè)試的所有軟件都可以從 MLPerf 庫(kù)中獲得,因此任何人都可以獲得這些世界級(jí)成果。NGC( NVIDIA 的 GPU 加速軟件目錄)上正在源源不斷地增加以容器化形式提供的優(yōu)化。在這里,你還會(huì)發(fā)現(xiàn) NVIDIA TensorRT,本輪測(cè)試的每此提交都使用它來(lái)優(yōu)化 AI 推斷。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    31381

    瀏覽量

    223515
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5682

    瀏覽量

    110086
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5258

    瀏覽量

    136032
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4112

    瀏覽量

    99588
  • H100
    +關(guān)注

    關(guān)注

    0

    文章

    33

    瀏覽量

    615

原文標(biāo)題:NVIDIA Hopper 首次亮相 MLPerf,在 AI 推理基準(zhǔn)測(cè)試中一騎絕塵

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI爆款應(yīng)用驅(qū)動(dòng)需求增長(zhǎng),英偉達(dá)H100租賃費(fèi)用飆升40%

    2025年10月的每小時(shí)1.7美元,在今年3月漲至每小時(shí)每塊GPU 2.35美元。 ? H100租賃費(fèi)用飆升的背后 ? SemiAnalysis的指數(shù)基于對(duì)100多家云服務(wù)提供商、算力資源買(mǎi)家和賣(mài)家的直接調(diào)查數(shù)據(jù)構(gòu)建,每月采集
    的頭像 發(fā)表于 04-05 07:05 ?1.3w次閱讀

    借助NVIDIA CUDA Tile IR后端推進(jìn)OpenAI Triton的GPU編程

    NVIDIA CUDA Tile 是基于 GPU 的編程模型,其設(shè)計(jì)目標(biāo)是為 NVIDIA Tensor Cores 提供可移植性,從而釋放 GPU
    的頭像 發(fā)表于 02-10 10:31 ?492次閱讀

    曦望發(fā)布新一代推理GPU芯片,單位Token推理成本降低90%

    已突破萬(wàn)片。 ? 啟望S3是專(zhuān)為大模型推理打造的定制化GPGPU芯片。在典型推理場(chǎng)景下,它的整體性?xún)r(jià)比較上一代提升超10。在算力與存儲(chǔ)設(shè)計(jì)方面,該芯片支持FP16至FP4精度切換,采用LPDDR6顯存方案,顯存容量提升4,有
    的頭像 發(fā)表于 01-28 17:38 ?9485次閱讀

    NVIDIA RTX PRO 5000 Blackwell GPU的深度評(píng)測(cè)

    需求進(jìn)行了優(yōu)化設(shè)計(jì)。無(wú)論是 CUDA 核心計(jì)算性能、實(shí)時(shí)渲染能力,還是 AI 推理效率,亦或顯存帶寬與容量的顯著提升,均使得新一代 RTX PRO 5000 Blackwell GPU 能夠輕松應(yīng)對(duì)更復(fù)雜、更嚴(yán)苛的工作負(fù)載。
    的頭像 發(fā)表于 01-06 09:51 ?3791次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 5000 Blackwell <b class='flag-5'>GPU</b>的深度評(píng)測(cè)

    NVIDIA RTX PRO 4000 Blackwell GPU性能測(cè)試

    Generation 的全面超越。那么,這款劃時(shí)代的專(zhuān)業(yè) GPU 在真實(shí)應(yīng)用場(chǎng)景中的表現(xiàn)究竟如何?今天,我們將通過(guò)深度實(shí)測(cè),為您揭曉 NVIDIA RTX PRO 4000 Blackwell 相較于前代產(chǎn)品的性能躍遷。
    的頭像 發(fā)表于 12-29 15:30 ?1792次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4000 Blackwell <b class='flag-5'>GPU</b><b class='flag-5'>性能</b>測(cè)試

    在Python中借助NVIDIA CUDA Tile簡(jiǎn)化GPU編程

    NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 編程模式。它是自 CUDA 發(fā)明以來(lái) GPU 編程最核心的更新之。借助 GP
    的頭像 發(fā)表于 12-13 10:12 ?1376次閱讀
    在Python中借助<b class='flag-5'>NVIDIA</b> CUDA Tile簡(jiǎn)化<b class='flag-5'>GPU</b>編程

    NVIDIA RTX PRO 2000 Blackwell GPU性能測(cè)試

    Blackwell 架構(gòu) GPU 中的中端專(zhuān)業(yè)圖形卡,高度僅為全高 GPU 的二分之。如果您需要的是塊半高顯卡,能適配小機(jī)箱,功耗不高,還要具備 AI 及光線追蹤
    的頭像 發(fā)表于 11-28 09:39 ?6906次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b><b class='flag-5'>性能</b>測(cè)試

    英偉達(dá) H100 GPU 掉卡?做好這五點(diǎn),讓算力穩(wěn)如泰山!

    H100服務(wù)器停工天損失的算力成本可能比維修費(fèi)還高。今天,我們給大家總結(jié)套“防掉卡秘籍”,從日常管理到環(huán)境把控,手把手教你把掉卡風(fēng)險(xiǎn)壓到最低。、供電是“生命線”,這3點(diǎn)必須盯緊
    的頭像 發(fā)表于 09-05 11:03 ?1444次閱讀
    英偉達(dá) <b class='flag-5'>H100</b> <b class='flag-5'>GPU</b> 掉卡?做好這五點(diǎn),讓算力穩(wěn)如泰山!

    NVIDIA RTX PRO 4500 Blackwell GPU測(cè)試分析

    今天我們帶來(lái)全新 NVIDIA Blackwell 架構(gòu) GPU —— NVIDIA RTX PRO 4500 Blackwell 的測(cè)試,對(duì)比上一代產(chǎn)品
    的頭像 發(fā)表于 08-28 11:02 ?4301次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>測(cè)試分析

    NVIDIA桌面GPU系列擴(kuò)展新產(chǎn)品

    NVIDIA 桌面 GPU 系列擴(kuò)展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的頭像 發(fā)表于 08-18 11:50 ?1618次閱讀

    別讓 GPU 故障拖后腿,捷智算GPU維修室來(lái)救場(chǎng)!

    ,GPU也常面臨各類(lèi)故障挑戰(zhàn),令使用者頭疼不已。常見(jiàn)GPU故障大盤(pán)點(diǎn)、內(nèi)存故障引發(fā)性能“滑坡”以英偉達(dá)H100為例,在高負(fù)載、大規(guī)模集群運(yùn)
    的頭像 發(fā)表于 07-17 18:56 ?1287次閱讀
    別讓 <b class='flag-5'>GPU</b> 故障拖后腿,捷智算<b class='flag-5'>GPU</b>維修室來(lái)救場(chǎng)!

    NVIDIA Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場(chǎng)景中的性能紀(jì)錄

    本文將探討 NVIDIA TensorRT-LLM 如何基于 8 個(gè) NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在最小延遲場(chǎng)景中的性能紀(jì)錄:在 G
    的頭像 發(fā)表于 07-02 19:31 ?3533次閱讀
    <b class='flag-5'>NVIDIA</b> Blackwell <b class='flag-5'>GPU</b>優(yōu)化DeepSeek-R1<b class='flag-5'>性能</b> 打破DeepSeek-R1在最小延遲場(chǎng)景中的<b class='flag-5'>性能</b>紀(jì)錄

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」書(shū)中的芯片知識(shí)是比較接近當(dāng)前的頂尖芯片水平的,同時(shí)包含了芯片架構(gòu)的基礎(chǔ)知識(shí),但該部分知識(shí)比較晦澀難懂,或許是由于我直從事的事芯片
    發(fā)表于 06-18 19:31

    iTOP-3588S開(kāi)發(fā)板四核心架構(gòu)GPU內(nèi)置GPU可以完全兼容0penGLES1.1、2.0和3.2。

    性能強(qiáng) iTOP-3588S開(kāi)發(fā)板采用瑞芯微RK3588S處理器,是全新一代AloT高端應(yīng)用芯片,搭載八核64位CPU,四核Cortex-A76和四核Cortex-A55架構(gòu)主頻高達(dá)2.4GHZ
    發(fā)表于 05-15 10:36

    GPU 維修干貨 | 英偉達(dá) GPU H100 常見(jiàn)故障有哪些?

    上漲,英偉達(dá)H100GPU憑借其強(qiáng)大的算力,成為AI訓(xùn)練、高性能計(jì)算領(lǐng)域的核心硬件。然而,隨著使用場(chǎng)景的復(fù)雜化,H100服務(wù)器故障率也逐漸攀升,輕則影響業(yè)務(wù)進(jìn)度,重
    的頭像 發(fā)表于 05-05 09:03 ?3323次閱讀
    <b class='flag-5'>GPU</b> 維修干貨 | 英偉達(dá) <b class='flag-5'>GPU</b> <b class='flag-5'>H100</b> 常見(jiàn)故障有哪些?
    双辽市| 英德市| 洛南县| 大同县| 方山县| 秦皇岛市| 阿巴嘎旗| 磴口县| 吴忠市| 夹江县| 铅山县| 张家口市| 绥江县| 津市市| 德清县| 昌黎县| 梁河县| 东山县| 镇沅| 化州市| 太和县| 临夏市| 上高县| 博乐市| 黄梅县| 高阳县| 隆回县| 时尚| 巩义市| 东乡族自治县| 玛曲县| 周宁县| 宣威市| 靖宇县| 荆州市| 石泉县| 平定县| 太湖县| 龙门县| 西畴县| 娱乐|