哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

做芯片要軟硬結合

hl5C_deeptechch ? 來源:DeepTech深科技 ? 作者:DeepTech深科技 ? 2020-10-30 10:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2016 年,第一顆基于可重構計算的人工智能芯片誕生于清華。該成果曾發(fā)表在《IEEE 固態(tài)電路期刊》,《麻省理工科技評論》也報道過該芯片。

這是清華可重構計算實驗室 “十年磨一劍” 的成果。2006 年起,清華開始研究可重構計算并成立實驗室。

2018 年,該實驗室開始走向產(chǎn)品化,并成立清微智能公司。兩年來,公司已在語音識別、視覺識別等領域研發(fā)出規(guī)?;瘧卯a(chǎn)品,并和阿里巴巴等互聯(lián)網(wǎng)巨頭建立合作。如今,清微智能將最新技術運用于 AI 編譯工具鏈中,并服務于其量產(chǎn)芯片 TX5 系列中,通過編譯優(yōu)化,全球首款多模態(tài)智能計算芯片TX510 用于人臉識別時,其處理速度能夠提升一倍。

DeepTech 近日聯(lián)系到清微智能首席科學家、清華大學微電子與納電子學系教授尹首一,就該公司的主要產(chǎn)品、和他本人近日以通訊作者發(fā)表的新論文進行了深度交流。

自 2018 年以來,清微智能針對終端產(chǎn)品的語音和視覺兩大應用場景,量產(chǎn)出貨兩款芯片產(chǎn)品:超低功耗的智能語音 SoC 芯片 TX210,已應用至多款 TWS 耳機、電子產(chǎn)品及多種智能家居產(chǎn)品中;TX510 芯片于 2020 年 7 月實現(xiàn)量產(chǎn),在金融支付、智能安防、工業(yè)機器人、航空等領域也已分批交付客戶,出貨量已超十萬片,并承擔多個國家重大項目的建設。

圖|TX 510 應用領域

以清微智能的 TX510 智能視覺芯片系列為例,該芯片的休眠功耗為 10uW、支持中斷喚醒,冷啟動下的人臉檢測識別時間小于 100ms,典型工作功耗為 350mW,算力達 1.2T (Int8)/9.6T (Binary),AI 有效能效比達 5.6TOPS/W。

TX510 還擁有可重構 AI 引擎,其支持 AlexNet、GoogleNet、ResNet、VGG、Faster-RCNN、YOLO、SSD、FCN 和 SegNet 等主流神經(jīng)網(wǎng)絡,可實現(xiàn)人臉識別、物體識別和手勢識別等功能,適用于 AIoT、智能安防、智能家居、智能穿戴、智能制造等領域。

TX510 內(nèi)置 3D 引擎,支持 3D 結構光、TOF(Time of flight,飛行時間)和立體視覺,誤識率千萬分之一的情況下識別率大于 90%。

接口方面,TX510 支持市面上主流的視頻接口、存儲接口和通用接口,可保證產(chǎn)品兼容性。

盡管從硬件層面芯片性能已經(jīng)取得了較大進步,但尹首一告訴 DeepTech,業(yè)界向來有一個共識,光有芯片架構還不夠,編譯工具和開發(fā)工具等軟硬件體系也必須做好。否則,很難完全把硬件功能的優(yōu)勢發(fā)揮出來。

在軟件上面,其團隊已經(jīng)有新進展。

做芯片要軟硬結合

在近日的第 16 屆 ACM/IEEE 國際嵌入式系統(tǒng)會議 上,清華微電子所魏少軍、尹首一教授團隊的論文《面向神經(jīng)網(wǎng)絡處理器的非規(guī)則網(wǎng)絡結構高效調(diào)度技術》(“Efficient Scheduling of Irregular Network Structures on CNN Accelerators”) 獲得最佳論文獎。

尹首一表示,這是中國完成單位首次在 AI 編譯優(yōu)化領域獲得國際學術會議最佳論文獎。該研究成果填補了大規(guī)模、非規(guī)則神經(jīng)網(wǎng)絡編譯映射這一技術空白,可大幅提升神經(jīng)網(wǎng)絡處理器的計算性能。

該成果解決的痛點在于,隨著 AI 算法的不斷普及,以 AIoT 為代表的嵌入式系統(tǒng)應用,給 AI 芯片的性能、功耗、成本、可靠性和可編程性等提出了嚴格且迫切的需求。為此,基于可重構架構、專用指令集架構、存內(nèi)計算架構等技術的神經(jīng)網(wǎng)絡處理器應運而生。

相比 CPU/GPU 等傳統(tǒng)架構,神經(jīng)網(wǎng)絡處理器可將 AI 算法的計算能效提高 1~2 個數(shù)量級,目前其已在移動設備、可穿戴設備、智能傳感器等應用場景中獲得廣泛的應用。

但是,神經(jīng)網(wǎng)絡處理器的應用離不開編譯器的支撐,編譯器一方面實現(xiàn)了 AI 應用到芯片的自動化部署,另一方面通過優(yōu)化算法到芯片架構的適配,能為 AI 應用的執(zhí)行效率帶來大幅提升。

當架構設計經(jīng)過工藝制造并固化為硬件電路后,硬件電路的運算行為則由編譯器所生成的機器碼來指揮,執(zhí)行速度和能量開銷也將因此而確定。因此,編譯器的優(yōu)化程度是研發(fā) AI 芯片的關鍵所在。

然而,當前最先進的神經(jīng)網(wǎng)絡模型,仍舊具備不可預測的非規(guī)則網(wǎng)絡拓撲結構,在編譯層面表現(xiàn)為錯綜復雜的數(shù)據(jù)流圖、和呈指數(shù)增長的解空間,而這給編譯器中的表達式優(yōu)化、算子調(diào)度、資源分配、循環(huán)優(yōu)化、自動代碼生成等關鍵技術環(huán)節(jié)帶來嚴峻挑戰(zhàn)。

現(xiàn)有的深度學習編譯框架,如 TVM、TensorRT 等僅針對網(wǎng)絡中的某些特定模式進行優(yōu)化,它們沒有處理任意結構的能力,因此未能有效解決上述難題。

針對上述問題,魏少軍、尹首一團隊在本次研究中,研發(fā)出支持任意網(wǎng)絡拓撲結構的端到端深度學習編譯框架(下稱編譯框架),相比同類編譯映射方法實現(xiàn)了 1.41-2.61 倍的計算加速。

圖|支持任意網(wǎng)絡拓撲結構的端到端深度學習編譯框架

具體來說,本次編譯框架有三大創(chuàng)新性技術貢獻點。

第一, 針對結構復雜的數(shù)據(jù)流圖,提出了基于計算節(jié)點深度聚類的編譯方法,該方法可對圖結構進行復雜度降維和搜索路徑生成,進而可求解到具備全局最優(yōu)特性的圖調(diào)度方案,在硬件處理器上表現(xiàn)為多級存儲系統(tǒng)間的數(shù)據(jù)傳輸開銷、與額外計算開銷之間的最佳平衡,即推理計算性能達到最優(yōu);

第二,針對非規(guī)則網(wǎng)絡結構導致的解空間指數(shù)增長,提出了一種基于回溯搜索和參數(shù)匹配的啟發(fā)式資源分配方法,并對神經(jīng)網(wǎng)絡基本算子在時空域上的分布進行聯(lián)合優(yōu)化,從而實現(xiàn)硬件層面上處理器緩存資源利用率最大化;

第三,針對新型網(wǎng)絡結構的循環(huán)優(yōu)化問題,該團隊推導得出最小循環(huán)變換粒度,并在編譯框架中建立了最優(yōu)陣列映射機制,使得嵌套循環(huán)的運算與計算資源達到最優(yōu)匹配。

由于該編譯框架的優(yōu)化方法具備通用性,因此它也能用于專用神經(jīng)網(wǎng)絡處理器以外的其他架構。

對于研究該問題的初衷,尹首一表示,這來自該團隊親身經(jīng)歷的痛點。過去,在開發(fā)神經(jīng)網(wǎng)絡處理器時,人們往往只考慮到處理單元陣列的搭建和底層的數(shù)據(jù)復用等問題。而對于神經(jīng)網(wǎng)絡算法編譯,由于當時的模型結構簡單、調(diào)度空間有限,僅僅采用常規(guī)編譯優(yōu)化就已足夠。

然而,在面對近年來基于神經(jīng)架構搜索(NAS)等方法所生成的復雜網(wǎng)絡結構時,之前的設計范式不再能提供具備接近最優(yōu)性能的解決方案,從而大大制約了算力的發(fā)揮。因而該團隊認識到,必須要有針對性的軟件編譯工具,才能對新型 AI 應用進行充分的優(yōu)化和加速。

尹首一告訴 DeepTech,在編譯方面他們并非 “新人”。他和團隊十多年來一直研究通用可重構處理器編譯問題,已具備較為深厚的研究基礎,因而在面對神經(jīng)網(wǎng)絡編譯這一新問題時,能迅速把握問題本質(zhì),從而得以快速完成研究。

據(jù)他介紹,目前由其擔任首席科學家的清微智能,已經(jīng)將該論文的技術發(fā)明運用在 AI 編譯工具鏈中,并已服務于量產(chǎn)芯片 TX5 系列中。對終端客戶而言,這意味著可用同樣的費用買到更多的算力。例如,通過編譯優(yōu)化,TX510 芯片用于人臉識別時,其處理速度能夠提升一倍。

目前,清微智能的 AI 編譯工具鏈還在不斷升級優(yōu)化中,旨在使實際運行中的神經(jīng)網(wǎng)絡處理器逼近其理論算力上限。

AI 芯片公司應 “軟硬” 結合

尹首一認為,和所有初創(chuàng)公司一樣,AI 芯片企業(yè)要想構建成功的商業(yè)模式,在市場競爭中站穩(wěn)腳跟,就得扎實細致地研究客戶實際需求。

當前,AI 芯片的客戶多數(shù)是整機和應用開發(fā)相關企業(yè),這類客戶主要面向算法和應用來開發(fā)神經(jīng)網(wǎng)絡模型,他們急需的是將生成的模型、便捷高效地在硬件設備上進行部署,因此他們不太關心硬件的底層架構和編譯細節(jié)。

但是,芯片公司光有先進的硬件和架構是不夠的,因為這無法讓客戶快速用起來,也無法將硬件算力轉化為可觀的計算性能。這時,AI 芯片公司就得提供軟硬件全棧式解決方案。參照英偉達在圖形加速領域的成功經(jīng)驗,有兩點值得其他公司學習:其一是先進的 GPU 硬件架構,其二則是 GPU 開發(fā)工具鏈的成熟和完善。

目前,尹首一把主要精力集中在前沿研究上,這些研究成果不斷支撐著產(chǎn)品的競爭優(yōu)勢。以清微智能 AI 編譯工具鏈為例,它集成了模型自動量化、定點訓練、通用算法計算和網(wǎng)絡調(diào)度映射等多方面的先進技術,可高效處理神經(jīng)網(wǎng)絡和及其他 AI 算法,并且兼容主流的深度學習框架,因而實現(xiàn)了從應用算法、到可重構計算硬件的端到端部署。

通過這套 AI 工具鏈,開發(fā)者可在不改變編程習慣的情況下,快速高效地部署 AI 算法。以已經(jīng)量產(chǎn)出貨的視覺智能芯片 TX510 為例,開發(fā)者可以僅僅通過調(diào)用功能級 API,就實現(xiàn)包含剪枝參數(shù)和權值位寬參數(shù)在內(nèi)的最優(yōu)模型壓縮策略,以及包括數(shù)據(jù)流圖優(yōu)化、算子時空域映射在內(nèi)的最優(yōu)調(diào)度結果。

尹首一最后總結到,和操作系統(tǒng)一樣,編譯器也是核心基礎軟件,它是一切可編程芯片的靈魂,應當受到國內(nèi)公司的更多重視。做 AI 芯片的公司,應當從開發(fā)伊始就對軟硬件兩方面的技術路線進行充分布局,這樣才能走得更遠。

-End-

原文標題:AI芯片公司,架構、編譯兩手都要硬!搭載清華最新深度學習編譯研究成果的芯片已商用

文章出處:【微信公眾號:DeepTech深科技】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    463

    文章

    54423

    瀏覽量

    469312
  • AI
    AI
    +關注

    關注

    91

    文章

    41107

    瀏覽量

    302593
  • 人工智能
    +關注

    關注

    1820

    文章

    50324

    瀏覽量

    266940

原文標題:AI芯片公司,架構、編譯兩手都要硬!搭載清華最新深度學習編譯研究成果的芯片已商用

文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    芯片燒錄總是出錯?常見 6 個問題及解決辦法

    電子生產(chǎn)和 SMT 貼片的朋友,經(jīng)常會遇到芯片燒錄不穩(wěn)定、報錯、漏燒、錯燒等問題。今天結合我們燒錄機多年的經(jīng)驗,總結一下最常見的原因和解決思路,歡迎同行交流。 常見 6 個問題及解
    的頭像 發(fā)表于 04-10 15:30 ?229次閱讀
    <b class='flag-5'>芯片</b>燒錄總是出錯?常見 6 個問題及解決辦法

    理想汽車發(fā)布端側大模型軟硬協(xié)同設計定律

    近日,理想汽車聯(lián)合國創(chuàng)決策智能技術研究所正式發(fā)布端側大模型“軟硬協(xié)同設計定律”,提出面向車載與邊緣場景的大模型軟硬一體化設計方法,為下一代智能駕駛芯片的架構定義提供了系統(tǒng)性理論基礎。此次成果不僅是
    的頭像 發(fā)表于 03-04 16:00 ?904次閱讀
    理想汽車發(fā)布端側大模型<b class='flag-5'>軟硬</b>協(xié)同設計定律

    ADP3631 MOSFET驅動芯片:高速與可靠的完美結合

    ADP3629/ADP3630/ADP3631 MOSFET 驅動芯片:高速與可靠的完美結合 在電子工程師的日常工作中,為功率MOSFET或IGBT選擇合適的驅動芯片至關重要。今天,我們來深入探討
    的頭像 發(fā)表于 02-03 16:10 ?542次閱讀

    思必馳高始興受邀參加蘇州市委經(jīng)濟工作會議

    一直以來,思必馳圍繞“端云一體化”進行布局,為智慧出行、智慧物聯(lián)、會議辦公等領域提供軟硬結合的人工智能技術與產(chǎn)品服務,現(xiàn)已服務梅賽德斯-奔馳、比亞迪、奧迪、美的、海爾、追覓、老板、聯(lián)想、小米等行業(yè)頭部企業(yè),并依托與多家本土品牌的深度合作,推動中國人工智能技術走向了更廣闊的國際市場。
    的頭像 發(fā)表于 01-06 16:37 ?1197次閱讀

    FOC控制中如何利用芯片內(nèi)部的運放設計電流采樣電路?

    最近開發(fā)電機控制的項目,我開始使用最新的CW32L012做主控,CW32L012作為混合信號MCU,相比于傳統(tǒng)MCU控制,集成度較高,性能當然也更好,加之又是48Pin的芯片,因此我開始的關于CW32L012主控的電機驅動項目,都是
    的頭像 發(fā)表于 01-05 16:50 ?2958次閱讀
    FOC控制中如何利用<b class='flag-5'>芯片</b>內(nèi)部的運放設計電流采樣電路?

    英特爾創(chuàng)新引領AI NAS:軟硬結合引領本地數(shù)據(jù)智慧管理與多場景創(chuàng)新應用

    2025年12月3日,西安 —— 2025英特爾AI NAS 解決方案峰會今日成功舉行。圍繞“芯生萬象 智存未來”的主題,英特爾攜手生態(tài)伙伴及三十余家渠道客戶,共同展望 AI NAS未來發(fā)展方向,并展示面向中小企業(yè)、消費者和專業(yè)用戶,賦能新場景、加速產(chǎn)品落地的最新技術方案。會上,綠聯(lián)、極空間、鐵威馬、暢網(wǎng)、飛牛等AI NAS 廠商,發(fā)布和展示了一系列基于英特爾? 酷睿? Ultra處理器和英特爾銳炫? B60 顯卡的多場景AI NAS解決方案,旨在打造智能本地數(shù)據(jù)存儲創(chuàng)
    的頭像 發(fā)表于 12-12 15:45 ?722次閱讀
    英特爾創(chuàng)新引領AI NAS:<b class='flag-5'>軟硬結合</b>引領本地數(shù)據(jù)智慧管理與多場景創(chuàng)新應用

    伺服控制 “集成 + 靈活”?TMC4671:硬件實現(xiàn) FOC,還支持前饋補償!

    TMC4671:硬件實現(xiàn)FOC伺服控制“集成+靈活”?伺服項目時,大家總希望芯片既能裝下核心功能,又能應對不同電機需求——而TMC4671這款完全集成的伺服控制芯片,剛好踩中了“集
    的頭像 發(fā)表于 12-10 17:48 ?674次閱讀
    伺服控制<b class='flag-5'>要</b> “集成 + 靈活”?TMC4671:硬件實現(xiàn) FOC,還支持前饋補償!

    承接PCB設計及生產(chǎn)外包

    專業(yè)的事交給專業(yè)的人,HDI FPC 軟硬結合
    的頭像 發(fā)表于 12-05 10:55 ?502次閱讀

    為什么進行芯片測試以及分別在什么階段進行

    為什么進行芯片測試? 芯片測試是一個比較大的問題,直接貫穿整個芯片設計與量產(chǎn)的過程中。首先芯片fail可以是下面幾個方面: ? ? ? ?
    的頭像 發(fā)表于 11-14 11:18 ?525次閱讀
    為什么<b class='flag-5'>要</b>進行<b class='flag-5'>芯片</b>測試以及分別在什么階段進行

    利用 NucleiStudio IDE 和 vivado 進行軟硬件聯(lián)合仿真

    本文利用NucleiStudio IDE 和 vivado 對 NICE demo協(xié)處理器進行軟硬件聯(lián)合仿真。 1. 下載demo_nice例程:https://github.com
    發(fā)表于 11-05 13:56

    一種經(jīng)典的軟硬結合+5V一鍵開關機電路 #MOS管 #電路原理 #半導體 #電子

    軟硬
    微碧半導體VBsemi
    發(fā)布于 :2025年09月05日 16:38:40

    嵌入式從入門到進階,怎么學?

    嵌入式從入門到進階,怎么學? 嵌入式學習的核心是 “軟硬結合的技術壁壘”,科學分層才能高效突破。以下是從入門到高階的精簡路線,幫你避開彎路: 1、基礎奠基層:構建技術底座 C 語言聚焦 指針、結構體
    發(fā)表于 09-02 09:44

    硬核加速,軟硬協(xié)同!混合仿真賦能RISC-V芯片敏捷開發(fā)

    RISC-V開放指令集架構(ISA)正為芯片產(chǎn)業(yè)帶來革命性機遇,其開源性與模塊化特性助力企業(yè)實現(xiàn)定制化、差異化創(chuàng)新,顯著加速產(chǎn)品迭代。隨著RISC-V向高性能多核架構演進,軟硬件協(xié)同驗證復雜度急劇
    的頭像 發(fā)表于 08-29 10:49 ?1221次閱讀
    硬核加速,<b class='flag-5'>軟硬</b>協(xié)同!混合仿真賦能RISC-V<b class='flag-5'>芯片</b>敏捷開發(fā)

    HDC 2025:鴻蒙星閃,軟硬結合,絕佳“CP”

    ? 開源鴻蒙,誕生于2023年,基于鴻蒙,正在成為萬物智聯(lián)的數(shù)字底座。 星閃,發(fā)布于2022年,正在點亮萬物互聯(lián)。 那么“開源鴻蒙+星閃”將帶來什么? 開源鴻蒙從設計之初就面向萬物智聯(lián)時代,尤其是其分布式軟總線的技術特性,成為萬物智聯(lián)時代的數(shù)字底座,可以作為智家中樞,統(tǒng)一調(diào)度和管理智能設備。開源鴻蒙具有獨立、開放、中立的特點,基于開源鴻蒙系統(tǒng)來構建智慧家庭的管理底座,符合消費者、家電廠商、產(chǎn)業(yè)伙伴的共同需求。 星閃作為
    的頭像 發(fā)表于 06-22 17:31 ?7254次閱讀
    HDC 2025:鴻蒙星閃,<b class='flag-5'>軟硬結合</b>,絕佳“CP”

    STM32H743VIT6用QSPI的接口,想換個CS的管腳,但芯片內(nèi)置是綁死的,這個怎么處理?

    關于STM32H743VIT6 在用QSPI的接口,想換個CS的管腳,但芯片內(nèi)置是綁死的,這個怎么處理,用個其他的IO口片選
    發(fā)表于 06-11 08:02
    昌乐县| 永吉县| 广州市| 镇原县| 云龙县| 黑水县| 汶上县| 肃宁县| 墨脱县| 河南省| 卓资县| 岑巩县| 永丰县| 西盟| 西昌市| 金门县| 抚宁县| 习水县| 梅河口市| 佛教| 崇州市| 宁城县| 华蓥市| 乌兰察布市| 郎溪县| 黔西县| 延寿县| 柳州市| 平顺县| 邵武市| 独山县| 元氏县| 体育| 额敏县| 临泉县| 兴仁县| 寻甸| 万安县| 荔浦县| 商南县| 多伦县|