哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

加法網(wǎng)絡(luò)再突破—NeurIPS 2020 Spotlight

電子設(shè)計 ? 來源:電子設(shè)計 ? 作者:電子設(shè)計 ? 2020-12-08 22:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

華為諾亞方舟實驗室聯(lián)合悉尼大學(xué)發(fā)布論文《Kernel Based Progressive Distillation for Adder Neural Networks》,提出了針對加法神經(jīng)網(wǎng)絡(luò)的蒸餾技術(shù),ResNet-34和ResNet-50網(wǎng)絡(luò)在ImageNet上分別達到了68.8%和76.8%的準確率,效果與相同結(jié)構(gòu)的CNN相比持平或超越,該論文已被NeurIPS2020接收。

開源鏈接:
huawei-noah/AdderNet?github.com
論文鏈接:
https://arxiv.org/pdf/2009.13044.pdf?arxiv.org

研究背景

深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)被廣泛應(yīng)用于諸多計算機視覺領(lǐng)域的實際任務(wù)中(例如,圖片分類、物體檢測、語義分割等)。然而,為了保證性能,神經(jīng)網(wǎng)絡(luò)通常是過參數(shù)化的,因此會存在大量的冗余參數(shù)。近期提出的加法神經(jīng)網(wǎng)絡(luò)(ANN),通過將卷積操作中的距離度量函數(shù)替換為L1距離,極大減少了神經(jīng)網(wǎng)絡(luò)中的乘法操作,從而減少了網(wǎng)絡(luò)運行所需的功耗和芯片面積。
然而,ANN在準確率方面和同結(jié)構(gòu)的CNN相比仍然有一定差距,在某種程度上限制了ANN在實際應(yīng)用中對CNN的替換。為了提高ANN的性能,我們提出了一種基于核的漸進蒸餾方法。具體的,我們發(fā)現(xiàn)一個訓(xùn)練好的ANN網(wǎng)絡(luò)其參數(shù)通常服從拉普拉斯分布,而一個訓(xùn)練好的CNN網(wǎng)絡(luò)其參數(shù)通常服從高斯分布。因此,我們對網(wǎng)絡(luò)中間層的特征圖輸出進行核變換后,使用距離度量函數(shù)估計教師網(wǎng)絡(luò)(CNN)和學(xué)生網(wǎng)絡(luò)(ANN)之間的損失。對于最后一層,我們使用傳統(tǒng)的KL散度估計兩個網(wǎng)絡(luò)之間的損失。同時,在訓(xùn)練中我們使用隨機初始化的教師網(wǎng)絡(luò),與學(xué)生網(wǎng)絡(luò)同時訓(xùn)練,以減少兩個網(wǎng)絡(luò)之間參數(shù)分布的差異性。
實驗表明,我們的算法得到的ANN能夠在CIFAR-10,CIFAR-100,ImageNet等標(biāo)準圖片分類數(shù)據(jù)集上達到或超越同結(jié)構(gòu)CNN的準確率。
對網(wǎng)絡(luò)中間層特征圖輸出進行核變換
ANN本身精度不好的原因是原始ANN在反向傳播時,使用的是近似的梯度,導(dǎo)致目標(biāo)函數(shù)無法向著最小的方向移動。傳統(tǒng)KD方法應(yīng)用到ANN上效果不佳的原因,在于ANN的權(quán)重分布是拉普拉斯分布,而CNN的權(quán)重分布為高斯分布,因此分布不同導(dǎo)致無法直接對中間層的feature map使用KD方法。本方法首先將核變換作用于教師網(wǎng)絡(luò)和學(xué)生網(wǎng)絡(luò)的中間層輸出,并使用1x1卷積對新的輸出進行配準。之后,結(jié)合最后一層的蒸餾損失與分類損失,得到整體的損失函數(shù)。

漸進式蒸餾算法
傳統(tǒng)的蒸餾方法使用固定的,訓(xùn)練好的教師網(wǎng)絡(luò)來教學(xué)生網(wǎng)絡(luò)。這樣做會帶來問題。由于教師網(wǎng)絡(luò)和學(xué)生網(wǎng)絡(luò)處于不同的訓(xùn)練階段,因此他們的分布會因為訓(xùn)練階段的不同而不同,所以會導(dǎo)致KD方法效果不好。因此我們采用漸進式蒸餾方法,讓教師網(wǎng)絡(luò)和學(xué)生網(wǎng)絡(luò)共同學(xué)習(xí),有助于KD方法得到好的結(jié)果。即目標(biāo)函數(shù)變?yōu)椋?br />
其中b為當(dāng)前的step。
實驗結(jié)果
我們在CIFAR-10、CIFAR-100、ImageNet三個數(shù)據(jù)集上分別進行了實驗。
下表是在CIFAR-10和CIFAR-100數(shù)據(jù)集上的結(jié)果,我們使用了VGG-small、ResNet-20與ResNet-32作為教師網(wǎng)絡(luò),同結(jié)構(gòu)的ANN作為學(xué)生網(wǎng)絡(luò)??梢钥吹剑褂昧吮痉椒ǖ玫降腁NN在分類準確率上相比原始的ANN有大幅度的提升,并且能夠超過同結(jié)構(gòu)的CNN模型。表格中#Mul表示網(wǎng)絡(luò)中乘法操作的次數(shù)。#Add表示加法操作次數(shù),#XNOR表示同或操作的次數(shù)。

下表展示了在ImageNet數(shù)據(jù)集上的結(jié)果,我們使用ResNet-18與ResNet-50網(wǎng)絡(luò)作為教師網(wǎng)絡(luò),同結(jié)構(gòu)的ANN作為學(xué)生網(wǎng)絡(luò)。結(jié)果顯示我們的方法得到的ANN在分類準確率上相比同結(jié)構(gòu)CNN基本相同或能夠超越。

最后,我們展示了ResNet-20,ANN-20與通過本方法得到的PKKD ANN-20模型在CIFAR-10與CIFAR-100數(shù)據(jù)集上的訓(xùn)練精度曲線與測試精度曲線。

圖中的實線表示訓(xùn)練精度,虛線表示測試精度。在兩個數(shù)據(jù)集中,CNN的訓(xùn)練和測試準確率都超過了原始的ANN模型。這是因為在訓(xùn)練原始ANN時,反向傳播的梯度使用的是L2 norm來近似,因此梯度方向是不準確的。當(dāng)使用本方法后,CNN的訓(xùn)練過程可以指導(dǎo)ANN的訓(xùn)練,因此可以得到更好的結(jié)果。同時,知識蒸餾方法能夠幫助學(xué)生網(wǎng)絡(luò)防止過擬合,這也是我們的方法有最低的訓(xùn)練精度和最高的測試精度的原因。



推薦閱讀



文章首發(fā)知乎,更多深度模型壓縮相關(guān)的文章請關(guān)注深度學(xué)習(xí)壓縮模型論文專欄。

審核編輯:符乾江

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算機視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1715

    瀏覽量

    47722
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5608

    瀏覽量

    124635
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    CD54/74AC283與CD54/74ACT283:4位二進制加法器的技術(shù)解析

    CD54/74AC283與CD54/74ACT283:4位二進制加法器的技術(shù)解析 在電子設(shè)計領(lǐng)域,加法器是一種基礎(chǔ)且關(guān)鍵的數(shù)字電路元件。CD54/74AC283和CD54/74ACT283這兩款4位
    的頭像 發(fā)表于 04-18 14:55 ?105次閱讀

    深入解析CD54/74AC283與CD54/74ACT283 4位二進制加法

    深入解析CD54/74AC283與CD54/74ACT283 4位二進制加法器 在數(shù)字電路設(shè)計中,加法器是一種基礎(chǔ)且關(guān)鍵的組件。今天我們要深入探討的是Harris Semiconductor推出
    的頭像 發(fā)表于 04-18 14:50 ?112次閱讀

    高速低功耗的利器:MC10H180雙2位加法器/減法器

    高速低功耗的利器:MC10H180雙2位加法器/減法器 在電子設(shè)計領(lǐng)域,高速、低功耗的加法器/減法器一直是工程師們追求的目標(biāo)。今天,我們就來詳細了解一下ON Semiconductor
    的頭像 發(fā)表于 04-11 11:05 ?238次閱讀

    深入解析DM74LS83A 4位二進制快速進位加法

    深入解析DM74LS83A 4位二進制快速進位加法器 在數(shù)字電路設(shè)計中,加法器是一種基礎(chǔ)且關(guān)鍵的組件。今天我們來詳細探討FAIRCHILD公司的DM74LS83A 4位二進制快速進位加法器,了解它
    的頭像 發(fā)表于 04-10 16:45 ?672次閱讀

    深入剖析 DM74LS283:4 位快速進位二進制加法

    深入剖析 DM74LS283:4 位快速進位二進制加法器 在電子設(shè)計領(lǐng)域,加法器是實現(xiàn)數(shù)字運算的基礎(chǔ)元件之一。今天我們要深入探討的是 Fairchild 公司的 DM74LS283 4 位快速進位
    的頭像 發(fā)表于 04-10 16:40 ?245次閱讀

    74F583 4位BCD加法器:高速運算的理想之選

    74F583 4位BCD加法器:高速運算的理想之選 在電子設(shè)計領(lǐng)域,加法器是實現(xiàn)數(shù)字運算的基礎(chǔ)組件。今天要給大家介紹的是Fairchild Semiconductor推出的74F583 4位BCD
    的頭像 發(fā)表于 04-10 16:40 ?144次閱讀

    Moku:Delta性能突破!升級實時持續(xù)記錄速度高達80 Gbps

    前言高速信號采集記錄回放儀(GigabitStreamer)是Moku:Delta上升級最新寬帶采集記錄回放功能,支持萬兆網(wǎng)絡(luò)數(shù)據(jù)傳輸,專為需要高速、穩(wěn)定、長時間數(shù)據(jù)采集與傳輸?shù)墓こ膛c科研應(yīng)用而設(shè)
    的頭像 發(fā)表于 02-11 11:09 ?743次閱讀
    Moku:Delta性能<b class='flag-5'>再</b><b class='flag-5'>突破</b>!升級實時持續(xù)記錄速度高達80 Gbps

    探索CD54/74AC283與CD54/74ACT283:高效4位二進制加法器的奧秘

    探索CD54/74AC283與CD54/74ACT283:高效4位二進制加法器的奧秘 在電子設(shè)計領(lǐng)域,加法器是實現(xiàn)數(shù)字運算的基礎(chǔ)元件之一。今天,我們將深入研究德州儀器(Texas
    的頭像 發(fā)表于 01-28 16:50 ?598次閱讀

    解析CD54/74AC283與CD54/74ACT283:4位二進制加法器的卓越之選

    解析CD54/74AC283與CD54/74ACT283:4位二進制加法器的卓越之選 在電子設(shè)計領(lǐng)域,加法器是實現(xiàn)數(shù)字運算的基礎(chǔ)組件。今天我們要深入探討的是德州儀器(Texas
    的頭像 發(fā)表于 01-08 16:55 ?738次閱讀

    深入剖析CD54/74AC283與CD54/74ACT283:高性能4位二進制加法

    深入剖析CD54/74AC283與CD54/74ACT283:高性能4位二進制加法器 在電子設(shè)計領(lǐng)域,加法器是一種基礎(chǔ)且關(guān)鍵的組件。今天,我們將詳細探討CD54/74AC283和CD54
    的頭像 發(fā)表于 01-04 17:25 ?936次閱讀

    CD54/74AC283與CD54/74ACT283:高性能4位二進制加法器的全面解析

    CD54/74AC283與CD54/74ACT283:高性能4位二進制加法器的全面解析 在電子設(shè)計領(lǐng)域,加法器是一種基礎(chǔ)且關(guān)鍵的數(shù)字電路,廣泛應(yīng)用于各種計算和數(shù)據(jù)處理系統(tǒng)中。今天,我們要深入探討
    的頭像 發(fā)表于 12-31 17:10 ?1536次閱讀

    地平線五篇論文入選NeurIPS 2025與AAAI 2026

    近日,兩大頂級學(xué)術(shù)會議錄用結(jié)果相繼揭曉,地平線憑借在機器人算法領(lǐng)域的深度鉆研,共有5篇論文從全球數(shù)萬份投稿中脫穎而出,分別入選NeurIPS 2025與AAAI 2026。
    的頭像 發(fā)表于 11-27 11:39 ?1378次閱讀
    地平線五篇論文入選<b class='flag-5'>NeurIPS</b> 2025與AAAI 2026

    HUAWEI Mate X7正式發(fā)布,折疊引領(lǐng)者,巔峰之上突破

    和極致體驗,構(gòu)建覆蓋全形態(tài)的折疊產(chǎn)品矩陣。HUAWEI Mate X7,聚勢登場。 華為常務(wù)董事、產(chǎn)品投資委員會主任、終端BG董事長余承東表示:“折疊引領(lǐng)者,巔峰之上突破,Mate X7 越展開,越心動!” 心動設(shè)計,云錦天章 HUAWEI Mate X7采用全新“時空
    的頭像 發(fā)表于 11-26 09:27 ?1305次閱讀
    HUAWEI Mate X7正式發(fā)布,折疊引領(lǐng)者,巔峰之上<b class='flag-5'>再</b><b class='flag-5'>突破</b>

    華為助力南非MTN在IP網(wǎng)絡(luò)領(lǐng)域?qū)崿F(xiàn)突破

    在全球通信行業(yè)權(quán)威機構(gòu)TM Forum(全球電信管理論壇)組織的自智網(wǎng)絡(luò)(Autonomous Network,簡稱“AN”)等級測評中,華為助力南非MTN在IP網(wǎng)絡(luò)領(lǐng)域?qū)崿F(xiàn)突破,獲得TM
    的頭像 發(fā)表于 11-06 11:06 ?1160次閱讀

    思必馳與上海交大聯(lián)合實驗室五篇論文入選NeurIPS 2025

    近日,機器學(xué)習(xí)與計算神經(jīng)科學(xué)領(lǐng)域全球頂級學(xué)術(shù)頂級會議NeurIPS 2025公布論文錄用結(jié)果,思必馳-上海交大聯(lián)合實驗室共有5篇論文被收錄。NeurIPS(Conference on Neural
    的頭像 發(fā)表于 10-23 15:24 ?1102次閱讀
    思必馳與上海交大聯(lián)合實驗室五篇論文入選<b class='flag-5'>NeurIPS</b> 2025
    荆州市| 个旧市| 林甸县| 惠安县| 阳高县| 芷江| 罗平县| 兴业县| 上杭县| 肇源县| 聂荣县| 扶沟县| 太仆寺旗| 通州区| 剑阁县| 铜山县| 江达县| 湖南省| 顺昌县| 门源| 淅川县| 彩票| 社旗县| 金秀| 岳西县| 泸定县| 平泉县| 湖北省| 太白县| 白城市| 文昌市| 中卫市| 昔阳县| 许昌市| 广元市| 屯门区| 林西县| 含山县| 荆州市| 南宁市| 宝兴县|