哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Xilinx Zynq系列FPGA實現(xiàn)神經(jīng)網(wǎng)絡(luò)中相關(guān)資源評估

FPGA之家 ? 來源:FPGA之家 ? 作者:FPGA之家 ? 2022-04-07 11:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

0Zynq7000系列概覽

94155fe2-b5e8-11ec-aa7f-dac502259ad0.png

1內(nèi)存占用

1.1 FPGA程序中內(nèi)存的實現(xiàn)方式

參閱xilinx文檔UG998

942dedb4-b5e8-11ec-aa7f-dac502259ad0.png

FPGA并沒有像軟件那樣用已有的cache,F(xiàn)PGA的HLS編譯器會在FPGA中創(chuàng)建一個快速的memory architecture以最好的適應(yīng)算法中的數(shù)據(jù)樣式(data layout)。因此FPGA可以有相互獨立的不同大小的內(nèi)部存儲空間,例如寄存器,移位寄存器,F(xiàn)IFOs和BRAMs。

寄存器:最快的內(nèi)存結(jié)構(gòu),集成在在運算單元之中,獲取不需要額外的時延。

移位寄存器:可以被當作一個數(shù)據(jù)序列,每一個數(shù)據(jù)可以在不同的運算之中被重復使用。將其中所有數(shù)據(jù)移動到相鄰的存儲設(shè)備中只需要一個時鐘周期。

FIFO:只有一個輸入和輸出的數(shù)據(jù)序列,通常被用于循環(huán)或循環(huán)函數(shù),細節(jié)會被HLS編譯器處理。

BRAM:集成在FPGA fabric模塊中的RAM,每個xilinx的FPGA中集成有多個這樣的BRAM??梢员划斪饔幸韵绿匦缘腸ache:1.不支持像處理器cache中那樣的緩存一致性(cache coherency,collision),不支持處理器中的一些邏輯類型。2.只在設(shè)備有電時保持內(nèi)存。3.不同的BRAM塊可以同時傳輸數(shù)據(jù)。

1.2Zynq的BRAM內(nèi)存大小

94409540-b5e8-11ec-aa7f-dac502259ad0.png

zynq 7z020的BRAM為4.9Mb,7z035的BRAM為17.6Mb(2.2MB)

9451e96c-b5e8-11ec-aa7f-dac502259ad0.png

1.3一個卷積操作占用的內(nèi)存

例如,我們實現(xiàn)的卷積函數(shù),輸入27×600,卷積核16×27,輸出16×600,數(shù)據(jù)類型為float。

  //convolution operation

for (i = 0; i < 16; i++) {

    for (j = 0; j < 600; j++) {

      result = 0;

      for (k = 0; k < 27; k++) {

        temp = weights[i*27+k] * buf_in[k*600+j];

        result += temp;

      }

      buf_out[i*600+j] = result;

    }

  }


在HLS中生成的IPcore占用硬件資源為:

94768290-b5e8-11ec-aa7f-dac502259ad0.png

948c8400-b5e8-11ec-aa7f-dac502259ad0.png

9499078e-b5e8-11ec-aa7f-dac502259ad0.png

在vivado中搭建好系統(tǒng),占用的資源為:

94a95382-b5e8-11ec-aa7f-dac502259ad0.png

94b7ea3c-b5e8-11ec-aa7f-dac502259ad0.png

2PipeCNN可實現(xiàn)性

PipeCNN是一個基于OpenCL的FPGA實現(xiàn)大型卷積網(wǎng)絡(luò)的加速器。

PipeCNN解析文檔:

PipeCNN論文解析:用OpenCL實現(xiàn)FPGA上的大型卷積網(wǎng)絡(luò)加速

github地址:https://github.com/doonny/PipeCNN#how-to-use

2.1 已實現(xiàn)的PipeCNN資源消耗

對于Altera FPGA,運用Intel's OpenCL SDKv16.1 toolset.

對于Xilinx FPGAs, theSDAcceldevelopment environment v2017.2 can be used.

94c7cd1c-b5e8-11ec-aa7f-dac502259ad0.png

Xilinx'sKCU1500(XCKU115 FPGA)(已經(jīng)有xilin的板子實現(xiàn)過pipeCNN,但是型號比zynq高很多)

94e36eaa-b5e8-11ec-aa7f-dac502259ad0.png

硬件資源可以被三個宏調(diào)控,device/hw_param.cl. Change the following macros

  • VEC_SIZE

  • LANE_NUM

  • CONV_GP_SIZE_X

消耗資源為:

94f89c80-b5e8-11ec-aa7f-dac502259ad0.png

95070432-b5e8-11ec-aa7f-dac502259ad0.png

3實現(xiàn)大型神經(jīng)網(wǎng)絡(luò)的方法

方案一:壓縮模型到<2.2MB,可實現(xiàn)在BRAM中

優(yōu)點:1.速度快 2.實現(xiàn)方便

缺點:1.模型壓縮難度 2.難以實現(xiàn)大型網(wǎng)絡(luò)

方案二:用FPGA調(diào)用DDR

優(yōu)點:1.速度中等 2.可實現(xiàn)大型網(wǎng)絡(luò)

缺點:調(diào)用DDR有難度,開發(fā)周期長

方案三:用片上單片機調(diào)用DDR(插入SD卡)分包傳入IPcore運算

優(yōu)點:可實現(xiàn)大型網(wǎng)絡(luò)

缺點:速度較慢

4Virtex-7高端FPGA概覽

Virtex-7為高端FPGA,比Zynq高了一個檔次。

951bc20a-b5e8-11ec-aa7f-dac502259ad0.png

952c0bc4-b5e8-11ec-aa7f-dac502259ad0.png

7系列FPGA相關(guān)文檔:

95392c3c-b5e8-11ec-aa7f-dac502259ad0.png

審核編輯 :李倩


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1663

    文章

    22491

    瀏覽量

    638852
  • 寄存器
    +關(guān)注

    關(guān)注

    31

    文章

    5617

    瀏覽量

    130374
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4840

    瀏覽量

    108119

原文標題:Xilinx Zynq系列FPGA實現(xiàn)神經(jīng)網(wǎng)絡(luò)中相關(guān)資源評估

文章出處:【微信號:zhuyandz,微信公眾號:FPGA之家】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    FPGA程序內(nèi)存的實現(xiàn)方式

    ? ? Xilinx zynq系列FPGA實現(xiàn)神經(jīng)網(wǎng)絡(luò)評估
    發(fā)表于 07-10 09:24 ?2635次閱讀

    脈沖耦合神經(jīng)網(wǎng)絡(luò)FPGA上的實現(xiàn)誰會?

    脈沖耦合神經(jīng)網(wǎng)絡(luò)(PCNN)在FPGA上的實現(xiàn)實現(xiàn)數(shù)據(jù)分類功能,有報酬。QQ470345140.
    發(fā)表于 08-25 09:57

    【PYNQ-Z2申請】基于PYNQ的神經(jīng)網(wǎng)絡(luò)自動駕駛小車

    ,分享項目的開展,實施過程,結(jié)果,展示項目結(jié)果,并全程開源項目源碼。本人一直非常希望學習與實踐Xilinx Zynq系列FPGA芯片與基于FPGA
    發(fā)表于 12-19 11:36

    【PYNQ-Z2試用體驗】基于PYNQ的神經(jīng)網(wǎng)絡(luò)自動駕駛小車 - 項目規(guī)劃

    小車運動的控制信號,實現(xiàn)小車自動駕駛。在初步實現(xiàn)方案,為了快速實現(xiàn)整體功能,使用軟件神經(jīng)網(wǎng)絡(luò)作為控制器,使用單片機作為底盤電機的控制器。在
    發(fā)表于 03-02 23:10

    基于賽靈思FPGA的卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)設(shè)計

    FPGA實現(xiàn)卷積神經(jīng)網(wǎng)絡(luò) (CNN)。CNN 是一類深度神經(jīng)網(wǎng)絡(luò),在處理大規(guī)模圖像識別任務(wù)以及與機器學習類似的其他問題方面已大獲成功。在當前案例
    發(fā)表于 06-19 07:24

    如何設(shè)計BP神經(jīng)網(wǎng)絡(luò)圖像壓縮算法?

    (Digital Signal Processor)相比,現(xiàn)場可編程門陣列(Field Programma-ble Gate Array,FPGA)在神經(jīng)網(wǎng)絡(luò)實現(xiàn)上更具優(yōu)勢。DSP處理器在處理時采用指令順序執(zhí)行
    發(fā)表于 08-08 06:11

    如何移植一個CNN神經(jīng)網(wǎng)絡(luò)FPGA

    )第二步:使用Lattice sensAI 軟件編譯已訓練好的神經(jīng)網(wǎng)絡(luò),定點化網(wǎng)絡(luò)參數(shù)。該軟件會根據(jù)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和預(yù)設(shè)的FPGA資源進行分析
    發(fā)表于 11-26 07:46

    基于FPGA神經(jīng)網(wǎng)絡(luò)的性能評估及局限性

    FPGA實現(xiàn)神經(jīng)網(wǎng)絡(luò)關(guān)鍵問題分析基于FPGA的ANN實現(xiàn)方法基于FPGA
    發(fā)表于 04-30 06:58

    EdgeBoard神經(jīng)網(wǎng)絡(luò)算子在FPGA實現(xiàn)方法是什么?

    FPGA加速的關(guān)鍵因素是什么?EdgeBoard神經(jīng)網(wǎng)絡(luò)算子在FPGA實現(xiàn)方法是什么?
    發(fā)表于 09-28 06:37

    FPGA實現(xiàn)大型神經(jīng)網(wǎng)絡(luò)的設(shè)計

    1、加速神經(jīng)網(wǎng)絡(luò)的必備開源項目  到底純FPGA適不適合這種大型神經(jīng)網(wǎng)絡(luò)的設(shè)計?這個問題其實我們不適合回答,但是FPGA廠商是的實際操作是很有權(quán)威性的,現(xiàn)在不論是Intel還是
    發(fā)表于 10-24 16:10

    Xilinx Zynq系列FPGA實現(xiàn)神經(jīng)網(wǎng)絡(luò)相關(guān)資源評估

    集成在FPGA fabric模塊的RAM,每個xilinxFPGA中集成有多個這樣的BRAM??梢员划斪饔幸韵绿匦缘腸ache:1.不支持像處理器cache
    的頭像 發(fā)表于 03-30 10:29 ?2277次閱讀
    <b class='flag-5'>Xilinx</b> <b class='flag-5'>Zynq</b><b class='flag-5'>系列</b><b class='flag-5'>FPGA</b><b class='flag-5'>實現(xiàn)</b><b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b><b class='flag-5'>中</b><b class='flag-5'>相關(guān)</b><b class='flag-5'>資源</b><b class='flag-5'>評估</b>

    如何用OpenCL實現(xiàn)FPGA上的大型卷積網(wǎng)絡(luò)加速?

    Xilinx zynq系列FPGA實現(xiàn)神經(jīng)網(wǎng)絡(luò)評估
    的頭像 發(fā)表于 04-19 11:12 ?3475次閱讀
    如何用OpenCL<b class='flag-5'>實現(xiàn)</b><b class='flag-5'>FPGA</b>上的大型卷積<b class='flag-5'>網(wǎng)絡(luò)</b>加速?

    基于FPGA的RBF神經(jīng)網(wǎng)絡(luò)硬件實現(xiàn)

    基于FPGA的RBF神經(jīng)網(wǎng)絡(luò)硬件實現(xiàn)說明。
    發(fā)表于 04-28 11:24 ?27次下載

    基于FPGA神經(jīng)網(wǎng)絡(luò)硬件實現(xiàn)方法

    基于FPGA神經(jīng)網(wǎng)絡(luò)硬件實現(xiàn)方法說明。
    發(fā)表于 06-01 09:35 ?51次下載
    基于<b class='flag-5'>FPGA</b>的<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>硬件<b class='flag-5'>實現(xiàn)</b>方法

    如何在FPGA實現(xiàn)神經(jīng)網(wǎng)絡(luò)

    可編程門陣列(FPGA)作為一種靈活、高效的硬件實現(xiàn)方式,為神經(jīng)網(wǎng)絡(luò)的加速提供了新的思路。本文將從FPGA實現(xiàn)
    的頭像 發(fā)表于 07-10 17:01 ?4725次閱讀
    贵阳市| 五原县| 灵宝市| 江油市| 竹溪县| 江西省| 新绛县| 两当县| 恩平市| 谷城县| 灵璧县| 固阳县| 白玉县| 滁州市| 中卫市| 南雄市| 锡林郭勒盟| 岑溪市| 古田县| 秦安县| 岳池县| 乌兰察布市| 海淀区| 天门市| 卢龙县| 凌云县| 固阳县| 普格县| 铁力市| 合山市| 怀柔区| 长兴县| 钟山县| 和田县| 阿拉善右旗| 保靖县| 和田市| 喀喇沁旗| 双柏县| 读书| 林口县|