哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何提升NPU的能效比?

佐思汽車研究 ? 來源:佐思汽車研究 ? 作者:Nathan J ? 2022-08-01 11:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

現(xiàn)如今,深度神經(jīng)網(wǎng)絡(luò)正在以越來越大的規(guī)模部署,橫跨了從云端,自動駕駛IoT等平臺。比如用于圖像識別,語音識別及翻譯,癌癥檢測以及自動駕駛中對感知層海量數(shù)據(jù)的處理等。在很多領(lǐng)域,深度神經(jīng)網(wǎng)絡(luò)的精度已經(jīng)超越人類,它的優(yōu)越性來源于它對原始數(shù)據(jù)的特征提取,并通過對大量數(shù)據(jù)的學(xué)習(xí)來獲取輸入空間的有效表征,但是它的高精度是以超高計(jì)算復(fù)雜度為代價。因此很多廠商都在追逐NPU的算力來解決這些復(fù)雜問題,但是隨著算力的提高,NPU設(shè)計(jì)也越來越復(fù)雜,將伴隨著面積和功耗的增加,這對于那些面積和功耗有很大限制的設(shè)備帶來了挑戰(zhàn),因此如何提升NPU的能效比就成了亟待解決的問題。

6bdd29be-1147-11ed-ba43-dac502259ad0.png

NPU通過數(shù)據(jù)分區(qū)和有效調(diào)度,利用數(shù)據(jù)的重用以及執(zhí)行分段來提高能效比和硬件利用率,而實(shí)現(xiàn)高利用率,數(shù)據(jù)重用將直接依賴于如何調(diào)度深度神經(jīng)網(wǎng)絡(luò)的計(jì)算和如何將這些計(jì)算有效的映射到NPU的硬件單元上。以CNN為例,數(shù)據(jù)流無非包含三個方面filter(Weight),ifmap和ofmap,如下圖。

6bf2bb62-1147-11ed-ba43-dac502259ad0.png

因此在設(shè)計(jì)NPU時需要考慮如利用內(nèi)存的層次結(jié)構(gòu),決定哪些數(shù)據(jù)要讀到那一層的內(nèi)存中以及什么時候被處理,如何可以重用filter,ifmap和ofmap,將他們存放在本地內(nèi)存中,從而大大減少DRAM的訪問次數(shù),這將在很大程度上提高NPU的硬件利用率及性能,并減少由于DRAM訪問帶了的額外功耗。根據(jù)數(shù)據(jù)處理特征可以將數(shù)據(jù)流分為以下幾類:

1)、靜態(tài)weight

weight靜態(tài)數(shù)據(jù)流的設(shè)計(jì)是通過在PE的RF(Register File)中存取weight,來減少讀取weight產(chǎn)生的功耗。weight從DRAM讀取到RF并保持靜態(tài)以供進(jìn)一步訪問,NPU在計(jì)算時盡可能多的利用RF中的weight以達(dá)到最大程度的重用。通常的實(shí)現(xiàn)是將ifmap廣播給所有的PE,部分和(Psum)將穿過所有的PE來完成空間上的累加。

6c0593b8-1147-11ed-ba43-dac502259ad0.png

2)、靜態(tài)輸出

輸出靜態(tài)數(shù)據(jù)流的設(shè)計(jì)是通過將accumulator產(chǎn)生的Psum存放到本地的RF中,以避免將Psum剛寫入DRAM再讀回,從而減少因Psum讀寫產(chǎn)生的功耗。通常的實(shí)現(xiàn)是流式輸入Activation,并將weight廣播給所有的PE。

6c19630c-1147-11ed-ba43-dac502259ad0.png

3)、無本地重用

如果考慮到RF會增大面積,可以將所有的數(shù)據(jù)都存放到Global Buffer中,這樣沒有任何數(shù)據(jù)會留在PE的RF,也不會增設(shè)RF單元來減小面積,但是增加了PE和Global Buffer的數(shù)據(jù)交互。具體來說是通過多廣播Activation,單廣播Weight以及Psum穿過所有的PE進(jìn)行累加來實(shí)現(xiàn)的。

6c29f104-1147-11ed-ba43-dac502259ad0.png

4)、靜態(tài)行

靜態(tài)行數(shù)據(jù)流的目標(biāo)是將所有的數(shù)據(jù)類型(Activation,weight, psum)的重用和計(jì)算都在RF中完成,來提升總體的能效。它區(qū)別于上面的靜態(tài)weight和靜態(tài)輸出,只是分別對weight和psum進(jìn)行優(yōu)化。

6c3b85a4-1147-11ed-ba43-dac502259ad0.png

具體選用哪種數(shù)據(jù)流方式要結(jié)合NPU微架構(gòu)的設(shè)計(jì)。下面總結(jié)了來自于幾個廠家的NPU,它們分別利用了不同數(shù)據(jù)流類型來提高能效比。

6c461b0e-1147-11ed-ba43-dac502259ad0.png

參考文獻(xiàn):

【1】Vivienne S. Yu-Hsin C.and etc., “Ef?cient Processing of Deep Neural Networks: A Tutorial and Survey”

關(guān)于復(fù)睿微電子:

復(fù)睿微電子是世界500強(qiáng)企業(yè)復(fù)星集團(tuán)出資設(shè)立的先進(jìn)科技型企業(yè)。復(fù)睿微電子植根于創(chuàng)新驅(qū)動的文化,通過技術(shù)創(chuàng)新改變?nèi)藗兊纳?、工作、學(xué)習(xí)和娛樂方式。公司成立于2022年1月,目標(biāo)成為世界領(lǐng)先的智能出行時代的大算力方案提供商,致力于為汽車電子、人工智能、通用計(jì)算等領(lǐng)域提供以高性能芯片為基礎(chǔ)的解決方案。

目前主要從事汽車智能座艙、ADS/ADAS芯片研發(fā),以領(lǐng)先的芯片設(shè)計(jì)能力和人工智能算法,通過底層技術(shù)賦能,推動汽車產(chǎn)業(yè)的創(chuàng)新發(fā)展,提升人們的出行體驗(yàn)。在智能出行的時代,芯片是汽車的大腦。復(fù)星智能出行集團(tuán)已經(jīng)構(gòu)建了完善的智能出行生態(tài),復(fù)睿微是整個生態(tài)的通用大算力和人工智能大算力的基礎(chǔ)平臺。復(fù)睿微以提升客戶體驗(yàn)為使命,在后摩爾定律時代持續(xù)通過先進(jìn)封裝、先進(jìn)制程和解決方案提升算力,與合作伙伴共同面對汽車智能化的新時代。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54408

    瀏覽量

    469074
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4841

    瀏覽量

    108147
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    386

    瀏覽量

    21340

原文標(biāo)題:ADS算力芯片NPU數(shù)據(jù)流的重用性

文章出處:【微信號:zuosiqiche,微信公眾號:佐思汽車研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    高頻交直流電流探頭在工業(yè)變頻器優(yōu)化中的深度應(yīng)用

    工業(yè)變頻器優(yōu)化需高頻電流探頭實(shí)現(xiàn)全周期測量,提升分析精度與效率。
    的頭像 發(fā)表于 03-11 14:37 ?264次閱讀

    安科瑞多回路電表對工業(yè)提升的計(jì)劃與數(shù)據(jù)中心分級計(jì)量指南

    1、概述 到2025 年,工業(yè)行業(yè)提升,數(shù)據(jù)中心等領(lǐng)域明顯提升,綠色低碳能源利用比例顯著
    的頭像 發(fā)表于 01-23 16:46 ?704次閱讀

    智慧能源管理平臺賦企業(yè)節(jié)能降本與提升

    閉環(huán)解決方案,助力企業(yè)實(shí)現(xiàn)節(jié)能降本與綠提升的雙重目標(biāo)。 方案解析 感知層:在各類用設(shè)備和關(guān)鍵節(jié)點(diǎn)部署智能電表、水表、氣表、熱表等能源計(jì)量儀表。 傳輸層:物聯(lián)網(wǎng)關(guān)將能耗數(shù)據(jù)采集傳輸
    的頭像 發(fā)表于 01-21 14:09 ?203次閱讀
    智慧能源管理平臺賦<b class='flag-5'>能</b>企業(yè)節(jié)能降本與<b class='flag-5'>能</b><b class='flag-5'>效</b><b class='flag-5'>提升</b>

    北大團(tuán)隊(duì)最新研究:AI芯片算力提升數(shù)倍,提升超90倍

    首次實(shí)現(xiàn)后摩爾新器件異質(zhì)集成的多物理域融合傅里葉變換系統(tǒng)。 ? 這一全新計(jì)算架構(gòu)將傅里葉變換計(jì)算速度從當(dāng)前每秒約1300億次提升至每秒約5000億次,算力提升近4倍,
    的頭像 發(fā)表于 01-15 09:31 ?2215次閱讀

    中央空調(diào)管理解決方案:從能耗監(jiān)測到故障預(yù)警的全周期賦

    %-60%; 2) 監(jiān)測缺失 ,缺乏實(shí)時數(shù)據(jù)采集與分析能力,無法精準(zhǔn)定位能耗漏洞; 3) 運(yùn)維效率低下 ,故障預(yù)警滯后,依賴人工巡檢,維護(hù)成本高且響應(yīng)不及時。 (二)核心目標(biāo)
    的頭像 發(fā)表于 11-12 13:17 ?426次閱讀
    中央空調(diào)<b class='flag-5'>能</b><b class='flag-5'>效</b>管理解決方案:從能耗監(jiān)測到故障預(yù)警的全周期賦<b class='flag-5'>能</b>

    通信機(jī)房能耗監(jiān)測:提升與實(shí)現(xiàn)綠色運(yùn)營的關(guān)鍵路徑

    在數(shù)字化時代,通信機(jī)房作為信息基礎(chǔ)設(shè)施的核心,其能耗問題日益突出。隨著數(shù)據(jù)中心規(guī)模擴(kuò)大和5G網(wǎng)絡(luò)普及,機(jī)房電力消耗占總運(yùn)營成本的比例不斷攀升。據(jù)統(tǒng)計(jì),重點(diǎn)工業(yè)領(lǐng)域到2025年需全面提升,其中
    的頭像 發(fā)表于 10-11 09:45 ?898次閱讀
    通信機(jī)房能耗監(jiān)測:<b class='flag-5'>提升</b><b class='flag-5'>能</b><b class='flag-5'>效</b>與實(shí)現(xiàn)綠色運(yùn)營的關(guān)鍵路徑

    藍(lán)牙耳機(jī)續(xù)航痛點(diǎn)破解:電源芯片如何提升充電倉

    聚焦充電效率與待機(jī)功耗兩大核心指標(biāo),解析同步整流技術(shù)、低靜態(tài)電流設(shè)計(jì)對續(xù)航的影響。以華芯邦HT4928S為例,展示移動電源級優(yōu)化方案。
    的頭像 發(fā)表于 09-26 14:27 ?550次閱讀
    藍(lán)牙耳機(jī)續(xù)航痛點(diǎn)破解:電源芯片如何<b class='flag-5'>提升</b>充電倉<b class='flag-5'>能</b><b class='flag-5'>效</b>

    AI體驗(yàn)躍遷,天璣9500用雙NPU開創(chuàng)端側(cè)AI新時代

    架構(gòu),從底層解決性能與功耗的矛盾:超性能 NPU 990 性能大幅提升,生成式 AI 引擎 2.0 深度加速 Transformer 與大模型;行業(yè)首個超能 NPU以存算一體實(shí)現(xiàn)
    的頭像 發(fā)表于 09-24 14:47 ?890次閱讀
    AI體驗(yàn)躍遷,天璣9500用雙<b class='flag-5'>NPU</b>開創(chuàng)端側(cè)AI新時代

    弧形導(dǎo)軌如何提升新能源汽車的和續(xù)航里程?

    弧形導(dǎo)軌在新能源汽車中的應(yīng)用主要集中在電池生產(chǎn)線和自動化裝配線等領(lǐng)域,通過提高生產(chǎn)效率和精度,間接提升新能源汽車的和續(xù)航里程。
    的頭像 發(fā)表于 09-13 17:55 ?748次閱讀
    弧形導(dǎo)軌如何<b class='flag-5'>提升</b>新能源汽車的<b class='flag-5'>能</b><b class='flag-5'>效</b>和續(xù)航里程?

    冷卻塔監(jiān)控物聯(lián)網(wǎng)系統(tǒng)方案

    冷卻塔的等級是評估其能源利用效率的重要指標(biāo),其定義為:冷卻塔單位能耗對循環(huán)水的冷卻量。越高,說明冷卻塔在相同的能耗下能夠處理更多的
    的頭像 發(fā)表于 07-30 17:22 ?615次閱讀

    佐航BYQ3712PK變壓器等級測試儀:以精準(zhǔn)測量賦配電變壓器升級

    在“雙碳”目標(biāo)推動下,高效節(jié)能的配電變壓器已成為電力系統(tǒng)降本增效的關(guān)鍵環(huán)節(jié)。而準(zhǔn)確判定變壓器等級,是推廣節(jié)能產(chǎn)品、淘汰低效設(shè)備的核心前提。佐航推出的BYQ3712PK變壓器等級
    的頭像 發(fā)表于 06-27 13:35 ?938次閱讀
    佐航BYQ3712PK變壓器<b class='flag-5'>能</b><b class='flag-5'>效</b>等級測試儀:以精準(zhǔn)測量賦<b class='flag-5'>能</b>配電變壓器<b class='flag-5'>能</b><b class='flag-5'>效</b>升級

    優(yōu)化電機(jī)控制以提高能

    得益于更輕量化高效材料的應(yīng)用,以及熱絕緣和電絕緣技術(shù)的進(jìn)步。更輕巧的電機(jī)對汽車應(yīng)用尤為有利——既可通過減重提升,又能將電機(jī)集成到更緊湊的空間。這些技術(shù)進(jìn)步的影響深遠(yuǎn),造就了
    發(fā)表于 06-11 09:57

    提升3倍!異構(gòu)計(jì)算架構(gòu)讓AI跑得更快更省電

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)異構(gòu)計(jì)算架構(gòu)通過集成多種不同類型的處理單元(如CPU、GPU、NPU、FPGA、DSP等),針對不同計(jì)算任務(wù)的特點(diǎn)進(jìn)行分工協(xié)作,從而在性能、和靈活性之間實(shí)現(xiàn)最優(yōu)平衡
    的頭像 發(fā)表于 05-25 01:55 ?4265次閱讀

    交流充電樁負(fù)載提升技術(shù)

    隨著電動汽車普及率提升,交流充電樁的優(yōu)化成為降低運(yùn)營成本、減少能源浪費(fèi)的核心課題。負(fù)載提升
    發(fā)表于 05-21 14:38

    和算力提升的衡量方法

    /h·W表示。 影響因素及優(yōu)化方向? 技術(shù)升級?:采用變頻技術(shù)、高效電機(jī)等可提升,例如變頻空調(diào)通過動態(tài)調(diào)節(jié)功率減少能耗。 環(huán)境因素?:溫度、濕度等外部條件會影響實(shí)際
    的頭像 發(fā)表于 04-28 07:47 ?3508次閱讀
    <b class='flag-5'>能</b><b class='flag-5'>效</b><b class='flag-5'>比</b>和算力<b class='flag-5'>提升</b>的衡量方法
    吉首市| 佳木斯市| 合山市| 墨江| 乐安县| 正蓝旗| 同德县| 灵川县| 湄潭县| 龙井市| 大兴区| 徐汇区| 吉木萨尔县| 甘孜县| 石台县| 景泰县| 林芝县| 台州市| 比如县| 仪征市| 定边县| 凤城市| 河池市| 英超| 郧西县| 新宾| 百色市| 油尖旺区| 横峰县| 遵义县| 汾阳市| 长泰县| 铜梁县| 女性| 连云港市| 韶山市| 彝良县| 特克斯县| 高密市| 宁远县| 盐亭县|