哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何在推理引擎中脫穎而出

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Geoff Tate ? 2022-07-06 14:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著人工智能的爆炸式增長,人們越來越關注能夠提供人工智能所需性能的新型專業(yè)推理引擎。因此,在過去六個月中,我們看到了一系列神經(jīng)推理硬件公告,所有這些都承諾提供比市場上任何其他產(chǎn)品更好的加速。然而,挑戰(zhàn)在于沒有人真正知道如何衡量一個與另一個。這是一項新技術,就像任何新技術一樣,我們需要指標,我們需要真正重要的指標。

一切都與吞吐量有關

當推理引擎的性能出現(xiàn)時,供應商會拋出諸如 TOPS(Tera-Operations/Second)性能和 TOPS/Watt 之類的基準。研究這些的系統(tǒng)/芯片設計人員很快意識到這些數(shù)字通常毫無意義。真正重要的是推理引擎可以為模型、圖像大小、批量大小和過程以及 PVT(過程/電壓/溫度)條件提供多少吞吐量。這是衡量其性能表現(xiàn)的第一個衡量標準,但令人驚訝的是,很少有供應商提供它。

TOPS 的最大問題是,當一家公司說他們的引擎執(zhí)行 X TOPS 時,他們通常會引用這一點而沒有說明條件是什么。在不知道這些信息的情況下,他們錯誤地認為 X TOPS 意味著它可以執(zhí)行 X 萬億次操作。實際上,報價 130 TOPS 的公司可能僅提供 27 TOPS 的可用吞吐量。

另一個正在使用但不太常用的基準是 ResNet-50。這個基準的問題是大多數(shù)引用它的公司都沒有給出批量大小。如果他們不這樣做,芯片設計人員可以假設這將是一個大批量,以最大限度地提高他們的硬件利用率。這使得 ResNet-50 作為基準不是很有幫助。相比之下,例如 YOLOv3 需要 100 倍以上的操作來處理 2 兆像素的圖像。在“真實世界”模型中,硬件利用率將面臨更大挑戰(zhàn)。

如何正確測量神經(jīng)推理引擎

在評估神經(jīng)推理引擎時,需要注意幾個關鍵事項。以下是最重要的考慮因素以及它們?yōu)楹握嬲匾脑颉?/p>

定義什么是操作:一些供應商將乘法(通常為 INT 8 乘以 INT 8)計為一次操作,將累加(加法,通常為 INT 32)計為一次操作。因此,一次乘法累加等于 2 次操作。但是,一些供應商在其 TOPS 規(guī)范中包含其他類型的操作,因此必須在開始時進行澄清。

詢問 操作條件是什么: 如果供應商提供 TOPS 而不提供條件,他們通常使用室溫、標稱電壓和典型工藝。通常他們會提到他們所指的工藝節(jié)點,但不同供應商的運行速度不同,大多數(shù)工藝提供2、3或更多的標稱電壓。由于性能是頻率的函數(shù),而頻率是電壓的函數(shù),因此芯片設計人員在 0.9V 時可以獲得比在 0.6V 時高兩倍以上的性能。頻率因條件/假設而異。有關這方面的更多信息,請參閱此應用說明。

看看批量大?。杭词构烫峁┳顗那闆r的 TOPS,芯片設計人員也需要弄清楚所有這些操作是否真的有助于計算他們的神經(jīng)網(wǎng)絡模型。實際上,實際利用率可能非常低,因為沒有推理引擎始終 100% 地使用所有 MAC。這就是批量大小很重要的原因。批處理是為給定層加載權重并同時處理多個數(shù)據(jù)集。這樣做的原因是為了提高吞吐量,但放棄的是更長的延遲。ResNet-50 擁有超過 2000 萬個權重;YOLOv3 擁有超過 6000 萬個權重;并且必須為每個圖像獲取每個權重并將其加載到 MAC 結構中。權重太多,無法讓它們都駐留在 MAC 結構中。

poYBAGLFMEOAYgAkAAFI6_5PqUw443.png

找出你的 MAC 利用率:并非所有神經(jīng)網(wǎng)絡的行為都相同。您需要以您需要的批量大小找出您想要部署的神經(jīng)網(wǎng)絡模型的神經(jīng)推理引擎的實際 MAC 利用率。

深入TOPS

如果您是一名正在研究神經(jīng)推理引擎的設計師,希望這篇文章能夠闡明要尋找的內容。請記住——重要的是吞吐量。重要的是不要陷入諸如 TOPS 和 ResNet-50 之類的毫無意義的基準測試中,除非您知道圍繞這些問題要問的問題。首先提出以下問題:在批量大小 = A 和 XYZ PVT 條件下,可以為特定模型(例如 YOLOv3)處理多少圖像/秒。一旦您開始指定條件和假設,您將開始了解任何神經(jīng)推理在現(xiàn)實世界中的表現(xiàn)如何。歸根結底,這才是最重要的。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    463

    文章

    54369

    瀏覽量

    468911
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4840

    瀏覽量

    108130
  • 人工智能
    +關注

    關注

    1819

    文章

    50284

    瀏覽量

    266801
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    思必馳斬獲Interspeech 2026音頻推理挑戰(zhàn)賽智能體賽道亞軍

    近日,國際語音與語言處理領域頂級賽事Interspeech 2026音頻推理挑戰(zhàn)賽結果正式揭曉。在這場首次將評估焦點從“答案正確性”轉向“推理過程質量”的變革性賽事,思必馳-上海交通大學聯(lián)合實驗室團隊憑借創(chuàng)新的多智能體協(xié)同方案
    的頭像 發(fā)表于 02-28 14:13 ?799次閱讀

    最新光纜檢測系統(tǒng)廠家排名:廣州郵科憑什么脫穎而出?

    在光纖通信網(wǎng)絡飛速發(fā)展的今天,光纜作為信息傳輸?shù)?大動脈",其質量直接關系到網(wǎng)絡的穩(wěn)定與安全。對于運營商、工程商及監(jiān)理單位而言,選擇一套精準、高效的光纜檢測系統(tǒng)至關重要。當用戶在搜索引擎輸入" 光纜
    的頭像 發(fā)表于 02-26 10:33 ?244次閱讀
    最新光纜檢測系統(tǒng)廠家排名:廣州郵科憑什么<b class='flag-5'>脫穎而出</b>?

    溫補晶振(TCXO)脫穎而出的核心優(yōu)勢

    在現(xiàn)代電子世界的精密交響,計時元件是無聲的指揮家。當應用場景對頻率信號的精確性和可靠性要求近乎苛刻時,溫補晶振
    的頭像 發(fā)表于 02-03 13:39 ?917次閱讀
    溫補晶振(TCXO)<b class='flag-5'>脫穎而出</b>的核心優(yōu)勢

    淘寶API揭秘:如何讓你的店鋪在海量商品脫穎而出?

    ? ?在淘寶這個擁有億萬商品的龐大生態(tài),如何讓自己的店鋪和商品不被淹沒,吸引精準流量并促成轉化,是每個賣家都面臨的挑戰(zhàn)。單純依靠平臺的自然流量或基礎操作往往力不從心,而 淘寶開放平臺提供的API
    的頭像 發(fā)表于 12-03 14:38 ?537次閱讀
    淘寶API揭秘:如何讓你的店鋪在海量商品<b class='flag-5'>中</b><b class='flag-5'>脫穎而出</b>?

    何在NVIDIA Jetson AGX Thor上通過Docker高效部署vLLM推理服務

    繼系統(tǒng)安裝與環(huán)境配置后,本期我們將繼續(xù)帶大家深入 NVIDIA Jetson AGX Thor 的開發(fā)教程之旅,了解如何在 Jetson AGX Thor 上,通過 Docker 高效部署 vLLM 推理服務。
    的頭像 發(fā)表于 11-13 14:08 ?4360次閱讀
    如<b class='flag-5'>何在</b>NVIDIA Jetson AGX Thor上通過Docker高效部署vLLM<b class='flag-5'>推理</b>服務

    機械ERP:制造業(yè)智能升級核心引擎,如何選、用、贏?全面解析

    在自動化與數(shù)字化浪潮下,機械制造企業(yè)正面臨前所未有的機遇與挑戰(zhàn)。如何高效整合資源、精準管理流程、快速響應市場,已成為決定企業(yè)能否在激烈競爭脫穎而出的關鍵。機械ERP(企業(yè)資源計劃)系統(tǒng),正是幫助
    的頭像 發(fā)表于 10-24 15:19 ?808次閱讀
    機械ERP:制造業(yè)智能升級核心<b class='flag-5'>引擎</b>,如何選、用、贏?全面解析

    利用NVIDIA DOCA GPUNetIO技術提升MoE模型推理性能

    在第三屆 NVIDIA DPU 中國黑客松競賽,我們見證了開發(fā)者與 NVIDIA 網(wǎng)絡技術的深度碰撞。在 23 支參賽隊伍,有 5 支隊伍脫穎而出,展現(xiàn)了在 AI 網(wǎng)絡、存儲和安全等領域的創(chuàng)新突破。
    的頭像 發(fā)表于 09-23 15:25 ?1168次閱讀

    智能電子指路牌公司排名 TOP1:如何在叁仟智慧城市細分市場脫穎而出

    在智能電子指路牌行業(yè)蓬勃發(fā)展的當下,眾多企業(yè)紛紛角逐,而杭州叁仟智慧城市科技有限公司卻能一路披荊斬棘,榮登行業(yè)排名榜首。這家公司究竟憑借何種實力,在激烈的市場競爭脫穎而出,成為行業(yè)內的標桿呢
    的頭像 發(fā)表于 08-22 15:23 ?611次閱讀

    40個項目脫穎而出!2025英特爾人工智能大賽圓滿收官,下一個AI應用浪潮開啟

    8月16日,2025英特爾人工智能創(chuàng)新大賽決賽暨頒獎典禮在深圳舉行。英特爾副總裁、中國軟件技術事業(yè)部總經(jīng)理李映表示:“此次大賽,來自全國2817支年青隊伍有40個優(yōu)秀團隊和作品脫穎而出,圍繞工業(yè)
    的頭像 發(fā)表于 08-22 10:56 ?7836次閱讀
    40個項目<b class='flag-5'>脫穎而出</b>!2025英特爾人工智能大賽圓滿收官,下一個AI應用浪潮開啟

    固態(tài)鋁電解電容:如何憑借高紋波電流承載能力脫穎而出

    固態(tài)鋁電解電容作為電子元器件領域的重要成員,憑借其高紋波電流承載能力在眾多應用場景脫穎而出。紋波電流是指疊加在直流電流上的交流分量,它對電容器的性能和壽命有著直接影響。在電源濾波、DC-DC轉換器
    的頭像 發(fā)表于 08-10 15:08 ?1531次閱讀

    請問如何在RK3588上使用npu,用onnx模型來推理

    請問如何在瑞芯微 RK3588上使用npu,用onnx模型來推理。官網(wǎng)上介紹說要把ONNX模型轉換成RKNN模型。但是我并不想這么干,請問有什么辦法嗎?
    發(fā)表于 08-09 00:51

    積算科技上線赤兔推理引擎服務,創(chuàng)新解鎖FP8大模型算力

    北京2025年7月30日 /美通社/ -- 近日,北京積算科技有限公司(以下簡稱"積算科技")宣布其算力服務平臺上線赤兔推理引擎。積算科技PowerFul-AI應用開發(fā)平臺與赤兔合作,打造高性價比
    的頭像 發(fā)表于 07-30 21:44 ?1020次閱讀

    信而泰×DeepSeek:AI推理引擎驅動網(wǎng)絡智能診斷邁向 “自愈”時代

    定位到出口路由器端口存在大量物理層錯誤計數(shù),更換光模塊后,故障立即排除,業(yè)務完全恢復正常。此案例充分驗證了AI推理引擎在復雜網(wǎng)絡故障診斷精準定位根因、大幅提升排障效率的核心價值。
    發(fā)表于 07-16 15:29

    BNC插座的獨特優(yōu)勢,讓它在眾多線纜脫穎而出

    德索精密工業(yè)的BNC連接線憑借其精巧的結構設計、卓越的信號傳輸性能、便捷的連接方式、廣泛的應用場景適應性以及良好的成本效益,成為眾多領域信號傳輸?shù)睦硐脒x擇。隨著科技的不斷進步,德索精密工業(yè)的BNC連接線有望在更多新興領域發(fā)揮重要作用,持續(xù)助力各行業(yè)的發(fā)展。
    的頭像 發(fā)表于 07-01 11:06 ?614次閱讀
    BNC插座的獨特優(yōu)勢,讓它在眾多線纜<b class='flag-5'>中</b><b class='flag-5'>脫穎而出</b>

    BNC連接線的獨特優(yōu)勢,讓它在眾多線纜脫穎而出

    德索精密工業(yè)的BNC連接線憑借其精巧的結構設計、卓越的信號傳輸性能、便捷的連接方式、廣泛的應用場景適應性以及良好的成本效益,成為眾多領域信號傳輸?shù)睦硐脒x擇。隨著科技的不斷進步,德索精密工業(yè)的BNC連接線有望在更多新興領域發(fā)揮重要作用,持續(xù)助力各行業(yè)的發(fā)展。
    的頭像 發(fā)表于 06-06 10:29 ?792次閱讀
    BNC連接線的獨特優(yōu)勢,讓它在眾多線纜<b class='flag-5'>中</b><b class='flag-5'>脫穎而出</b>
    九龙县| 敦化市| 开封市| 盐津县| 尖扎县| 叶城县| 甘泉县| 大方县| 襄樊市| 泉州市| 阿鲁科尔沁旗| 麟游县| 都江堰市| 田林县| 泰顺县| 旅游| 白河县| 米易县| 浦江县| 肃宁县| 县级市| 台州市| 石柱| 开平市| 句容市| 临泽县| 随州市| 高阳县| 石首市| 时尚| 双峰县| 台湾省| 宣城市| 泾源县| 南汇区| 隆子县| 宣化县| 莱西市| 青神县| 桦甸市| 兴宁市|