哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

賽靈思AI引擎簡(jiǎn)介

YCqV_FPGA_EETre ? 來(lái)源:FPGA開(kāi)發(fā)圈 ? 2020-09-03 09:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Versal ACAP 簡(jiǎn)介

Versal 自適應(yīng)計(jì)算加速平臺(tái) (ACAP) 是基于 TSMC 7nm FinFET 工藝技術(shù)構(gòu)建的最新一代賽靈思器件。它利用高帶寬片上網(wǎng)絡(luò) (NoC) 將代表處理器系統(tǒng) (PS) 的標(biāo)量引擎、代表可編程邏輯 (PL) 的自適應(yīng)引擎與智能引擎有機(jī)結(jié)合在一起。

本文將著重介紹智能引擎中所包含的 AI 引擎。

賽靈思 AI 引擎簡(jiǎn)介

在部分賽靈思 Versal ACAP 中包含了 AI 引擎。這些 AI 引擎可排列組合為一組與內(nèi)存、數(shù)據(jù)流和級(jí)聯(lián)接口相連的二維AI 引擎拼塊陣列。在當(dāng)前 ACAP 器件(例如,VC1902 器件)上,此陣列最多可包含 400 個(gè)拼塊。此陣列中還包含AI 引擎接口(位于最后一行),以便于陣列中的其它器件(PS、PL 和 NoC)進(jìn)行交互。

AI 引擎接口包含PL 和 NoC 接口拼塊以及配置拼塊。從 PL 到 AI 引擎陣列的連接是使用 AXI4-Stream 接口通過(guò) PL 和 NoC 接口拼塊來(lái)實(shí)現(xiàn)的。從 NoC 到 AI 引擎陣列的連接是使用 AXI4 存儲(chǔ)器映射接口通過(guò) NoC 接口拼塊來(lái)實(shí)現(xiàn)的。

有趣的是,從中可以看到,只有在 NoC 到 AI 引擎拼塊之間才存在 AXI4 存儲(chǔ)器映射直接通信通道,在 AI 引擎拼塊到 NoC 之間卻并不存在。

注:PL 和 NoC 接口拼塊的精確數(shù)量因器件而異?!禫ersal 架構(gòu)和產(chǎn)品數(shù)據(jù)手冊(cè):簡(jiǎn)介》(DS950)中羅列了 AI 引擎陣列的大小。

https://china.xilinx.com/support/documentation/data_sheets/ds950-versal-overview.pdf

AI 引擎拼塊架構(gòu)

現(xiàn)在,我們來(lái)詳細(xì)了解下此陣列,看看 AI 引擎拼塊的內(nèi)部。

每個(gè) AI 引擎拼塊都包含:

1 個(gè)拼塊互連模塊,用于處理 AXI4-Stream 和存儲(chǔ)器映射 AXI4 輸入/輸出

1 個(gè)存儲(chǔ)器模塊,其中包含 32 KB 數(shù)據(jù)內(nèi)存,細(xì)分為 8 個(gè)內(nèi)存 bank、1 個(gè)內(nèi)存接口、DMA 和各種鎖定。

1 個(gè) AI 引擎

AI 引擎可訪問(wèn)全部 4 個(gè)方向中的多達(dá) 4 個(gè)內(nèi)存模塊(作為 1 個(gè)連續(xù)存儲(chǔ)器塊)。這意味著除了拼塊本地的內(nèi)存,AI 引擎還可以訪問(wèn) 3 個(gè)相鄰拼塊的本地內(nèi)存(除非拼塊位于陣列邊緣)。

北側(cè)內(nèi)存模塊

南側(cè)內(nèi)存模塊

東側(cè)或西側(cè)內(nèi)存模塊(取決于 AI 引擎和內(nèi)存模塊所在的行和相對(duì)布局)。

AI 引擎架構(gòu)

AI 引擎屬于高度優(yōu)化的處理器,包含下列主要特色:

32 位標(biāo)量 RISC 處理器(名為 Scalar Unit)

1 個(gè) 512b SIMD 矢量單元(可提供矢量定點(diǎn)/整數(shù)單元)和 1 個(gè)單精度浮點(diǎn) (SPFP) 矢量單元

3 個(gè)地址生成器單元 (AGU)

超長(zhǎng)指令字 (VLIW) 功能

3 個(gè)數(shù)據(jù)內(nèi)存端口(2 個(gè)負(fù)載端口,1 個(gè)存儲(chǔ)端口)

直接流傳輸接口(2 個(gè)輸入流,2 個(gè)輸出流)

AI 引擎陣列編程

AI 引擎拼塊按 10 或 100 為單位組成陣列。創(chuàng)建嵌入多項(xiàng)指令的單一程序用于指定并行性將是一項(xiàng)冗長(zhǎng)且近乎不可能的任務(wù)。因此 AI 引擎陣列模型編程與 Kahn 處理網(wǎng)絡(luò) (Kahn Process Networks) 之間的共通之處在于自主計(jì)算進(jìn)程通過(guò)通信邊緣實(shí)現(xiàn)彼此互連,從而生成處理網(wǎng)絡(luò)。

(請(qǐng)參閱https://perso.ensta-paris.fr/~chapoutot/various/kahn_networks.pdf)

在 AI 引擎框架中,Graph 邊緣是緩存和數(shù)據(jù)流,而計(jì)算進(jìn)程則被稱為內(nèi)核。在Graph中,內(nèi)核經(jīng)過(guò)例化,彼此相連并連接到設(shè)計(jì)其余部分(NoC 或 PL)。

編程流程分為 2 個(gè)階段:

單內(nèi)核編程:

內(nèi)核用于描述特定計(jì)算進(jìn)程。每個(gè)內(nèi)核都將在單一 AI 引擎拼塊上運(yùn)行。但請(qǐng)注意,多個(gè)內(nèi)核可在同一個(gè) AI 引擎拼塊上運(yùn)行,并共享處理時(shí)間。任意 C/C++ 代碼均可用于對(duì) AI 引擎進(jìn)行編程。標(biāo)量處理器將處理大部分代碼。如果您的目標(biāo)是設(shè)計(jì)高性能內(nèi)核,那么應(yīng)考慮采用矢量處理器,它使用稱為內(nèi)部函數(shù)的專用函數(shù)。這些函數(shù)專用于 AI 引擎的矢量處理器,支持您從 AI 引擎中發(fā)掘出巨大的處理性能。賽靈思將提供預(yù)構(gòu)建內(nèi)核(包含在庫(kù)內(nèi)),以供用戶在其定制 Graph 中使用。

Graph 編程:

賽靈思將提供 C++ 框架以從內(nèi)核創(chuàng)建Graph。此框架包含 Graph 節(jié)點(diǎn)和連接聲明。這些節(jié)點(diǎn)可包含在 AI 引擎陣列內(nèi)或可編程邏輯(HLS 內(nèi)核)中。為了完全掌握內(nèi)核位置,將有一系列方法可用來(lái)約束布局(內(nèi)核、緩存、系統(tǒng)內(nèi)存等)。Graph 將例化并使用緩存和數(shù)據(jù)流將內(nèi)核連接在一起。它還將描述 AI 引擎陣列與其它ACAP 器件(PL 或 DDR)之間的雙向往來(lái)數(shù)據(jù)傳輸。

賽靈思將提供預(yù)構(gòu)建 Graph(包含在庫(kù)內(nèi)),以供用戶在其應(yīng)用中使用。

在運(yùn)行時(shí)以及仿真期間,AI 引擎應(yīng)用由 PS 進(jìn)行控制。

賽靈思將根據(jù)應(yīng)用的操作系統(tǒng)提供多種 API,如下所述。

Xilinx Run Time (XRT) 和 OpenCL,適用于 Linux 應(yīng)用

裸機(jī)驅(qū)動(dòng)程序

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 智能引擎
    +關(guān)注

    關(guān)注

    0

    文章

    9

    瀏覽量

    7248
  • 處理器系統(tǒng)
    +關(guān)注

    關(guān)注

    0

    文章

    10

    瀏覽量

    7922
  • Versal
    +關(guān)注

    關(guān)注

    1

    文章

    176

    瀏覽量

    8535

原文標(biāo)題:【工程師必看】 Versal ACAP AI 引擎入門(mén)

文章出處:【微信號(hào):FPGA-EETrend,微信公眾號(hào):FPGA開(kāi)發(fā)圈】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    ×中國(guó)郵政 | 以北斗授時(shí),護(hù)航國(guó)脈AI新基座

    當(dāng)下AI多模態(tài)應(yīng)用、國(guó)產(chǎn)化成為行業(yè)主流熱點(diǎn)。作為其“十四五"數(shù)智化發(fā)展重點(diǎn)工程,中國(guó)郵政構(gòu)建起覆蓋多場(chǎng)景的AI中臺(tái)全棧體系,加速推進(jìn)數(shù)智化轉(zhuǎn)型。北斗授時(shí)服務(wù)器以國(guó)產(chǎn)高精度授時(shí)能力,
    的頭像 發(fā)表于 04-14 14:09 ?260次閱讀
    <b class='flag-5'>賽</b><b class='flag-5'>思</b>×中國(guó)郵政 | 以北斗授時(shí),護(hù)航國(guó)脈<b class='flag-5'>AI</b>新基座

    重磅發(fā)布|全品類晶振,賦能AI算力精準(zhǔn)前行!

    在新質(zhì)生產(chǎn)力加速構(gòu)建的浪潮中,人工智能已成為引領(lǐng)未來(lái)的核心引擎。而AI算力躍升、大模型穩(wěn)定運(yùn)行,離不開(kāi)一項(xiàng)關(guān)鍵底層支撐——高精度時(shí)頻技術(shù)。深耕時(shí)頻十余載,全產(chǎn)業(yè)鏈布局實(shí)現(xiàn)晶振核心技
    的頭像 發(fā)表于 04-09 14:40 ?888次閱讀
    重磅發(fā)布|<b class='flag-5'>賽</b><b class='flag-5'>思</b>全品類晶振,賦能<b class='flag-5'>AI</b>算力精準(zhǔn)前行!

    FPGA電源解決方案全解析

    FPGA電源解決方案全解析 在當(dāng)今的電子設(shè)計(jì)領(lǐng)域,現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)憑借其出色的設(shè)計(jì)靈活性和較低的工程成本,在眾多應(yīng)用和終端市場(chǎng)中占據(jù)了重要地位。然而,F(xiàn)PGA的電源設(shè)計(jì)和管理卻是一
    的頭像 發(fā)表于 04-02 15:45 ?192次閱讀

    時(shí)頻同步產(chǎn)品手冊(cè)

    時(shí)頻同步產(chǎn)品手冊(cè)
    發(fā)表于 03-24 16:02 ?0次下載

    元器件選型手冊(cè)-中文版

    元器件選型手冊(cè)
    發(fā)表于 03-24 16:01 ?0次下載

    高性能計(jì)算與高速通信的中堅(jiān)力量 ——XCKU5P-2FFVB676I 深度解析

    解析
    的頭像 發(fā)表于 03-02 15:43 ?1800次閱讀

    工程師必入!288 元解鎖開(kāi)發(fā)板

    做項(xiàng)目、練技術(shù)、備賽事卻找不到高性價(jià)比開(kāi)發(fā)板?合眾恒躍重磅福利——ZYNQ系列開(kāi)發(fā)板限時(shí)特惠,HZ-XC-7Z010-SP_EVM寵粉價(jià)僅需288元!
    的頭像 發(fā)表于 12-17 17:48 ?992次閱讀
    工程師必入!288 元解鎖<b class='flag-5'>賽</b><b class='flag-5'>靈</b><b class='flag-5'>思</b>開(kāi)發(fā)板

    晶振:高端裝備的“數(shù)字心臟”,為何AI時(shí)代更離不開(kāi)它?

    ”。從數(shù)據(jù)中心的萬(wàn)億參數(shù)訓(xùn)練到工業(yè)機(jī)器人的精密協(xié)同,晶振系列產(chǎn)品以其精準(zhǔn)控制,為智能世界注入穩(wěn)定心跳。01晶振:數(shù)字世界的“指揮家”,AI系統(tǒng)的同步基石在AI
    的頭像 發(fā)表于 10-17 10:21 ?753次閱讀
    <b class='flag-5'>賽</b><b class='flag-5'>思</b>晶振:高端裝備的“數(shù)字心臟”,為何<b class='flag-5'>AI</b>時(shí)代更離不開(kāi)它?

    浙江電子科技有限公司產(chǎn)品手冊(cè)-元器件

    元器件產(chǎn)品選型手冊(cè)
    發(fā)表于 09-23 16:47 ?0次下載

    【作品合集】匯博SEEK100開(kāi)發(fā)板測(cè)評(píng)

    SEEK100開(kāi)發(fā)板開(kāi)箱&amp;簡(jiǎn)介 【匯博SEEK100開(kāi)發(fā)板試用體驗(yàn)】02 環(huán)境搭建及新建測(cè)試工程 【匯博SEEK100開(kāi)發(fā)板試用體驗(yàn)】03 簡(jiǎn)約風(fēng)天氣APP開(kāi)發(fā)--首頁(yè)UI布局
    發(fā)表于 09-15 10:24

    特威第二屆機(jī)器視覺(jué)方案大會(huì)圓滿收官

    近日,由易特威聯(lián)合舉辦的第二屆機(jī)器視覺(jué)方案大會(huì)在深圳福田會(huì)展中心成功舉行。本次大會(huì)以技術(shù)驅(qū)動(dòng)與應(yīng)用落地為核心,匯聚了行業(yè)專家、合作伙伴與資深工程師,共同探討了機(jī)器視覺(jué)領(lǐng)域的前沿技術(shù)與未來(lái)趨勢(shì)。
    的頭像 發(fā)表于 09-02 12:51 ?1039次閱讀

    特威第二屆機(jī)器視覺(jué)大會(huì)即將舉辦

    去年盛夏,首屆易特威機(jī)器視覺(jué)技術(shù)大會(huì)點(diǎn)燃了行業(yè)創(chuàng)新的火花。易驚艷亮相的 TJ375 FPGA與
    的頭像 發(fā)表于 08-13 09:53 ?1538次閱讀

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    DeepSeek-R1:強(qiáng)大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司開(kāi)發(fā)的新一代AI大模型。其核心優(yōu)勢(shì)在于強(qiáng)大的推理引擎能力,融合了自然語(yǔ)言處理(
    發(fā)表于 07-16 15:29

    快訊 | 嘉興市委書(shū)記陳偉一行蒞臨調(diào)研

    深化“教科人”一體、產(chǎn)學(xué)研融合!#嘉興市委書(shū)記#陳偉一行蒞臨調(diào)研,副總經(jīng)理田永和等陪同調(diào)研。5月16日下午,市委書(shū)記陳偉在南湖區(qū)走訪創(chuàng)新平臺(tái)、科技型企業(yè),專題調(diào)研人才工作。他強(qiáng)
    的頭像 發(fā)表于 05-23 10:22 ?1010次閱讀
    <b class='flag-5'>賽</b><b class='flag-5'>思</b>快訊 | 嘉興市委書(shū)記陳偉一行蒞臨<b class='flag-5'>賽</b><b class='flag-5'>思</b>調(diào)研

    Deepseek海SD3403邊緣計(jì)算AI產(chǎn)品系統(tǒng)

    SD3403邊緣計(jì)算AI框架,提供了一套開(kāi)放式AI訓(xùn)練產(chǎn)品工具包,解決客戶低成本AI系統(tǒng),針對(duì)差異化AI 應(yīng)用場(chǎng)景,自己采集樣本數(shù)據(jù),進(jìn)
    發(fā)表于 04-28 11:05
    长沙县| 九龙县| 吴桥县| 五原县| 张北县| 治多县| 连州市| 彭泽县| 东丰县| 台东县| 南丹县| 繁昌县| 平谷区| 施秉县| 浙江省| 津南区| 若尔盖县| 特克斯县| 毕节市| 灵璧县| 玛曲县| 崇仁县| 北辰区| 孝感市| 霍州市| 贵港市| 高尔夫| 沾化县| 甘肃省| 瑞安市| 潞西市| 龙江县| 镇雄县| 德惠市| 上林县| 巴里| 磐安县| 深水埗区| 南平市| 工布江达县| 平远县|