哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

清華「計圖」現(xiàn)在支持國產(chǎn)芯片了!

旺材芯片 ? 來源:凹非寺量子位 ? 作者:明敏 ? 2021-05-20 09:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

清華自研的深度學(xué)習(xí)框架計圖(Jittor)在動態(tài)圖推理速度上又一次完勝PyTorch。

最近,計圖團隊完成了在寒武紀芯片MLU270上的移植。

這一次跟寒武紀的合作,使Jittor在backbone網(wǎng)絡(luò)模型中的動態(tài)圖推理速度較PyTorch平均提升了276.69倍。

從團隊公布的實驗結(jié)果可以看到,在寒武紀芯片上分別用計圖(Jittor)和PyTorch進行推理。

計圖(Jittor)在16種backbone網(wǎng)絡(luò)模型中的推理速度都較PyTorch大幅提升,其中包括alexnet、vgg系列、resnet系列。

其中最快的是alexnet,提升速度達到了464.43倍,最慢的resnet50也達到了153倍。

平均提升速度達276.69倍。

660375ea-b47b-11eb-bf61-12bb97331649.jpg

6611aa8e-b47b-11eb-bf61-12bb97331649.jpg

△表1:模型具體數(shù)值

與此同時,計圖的精度損失也較PyTorch大幅減少。

66332ff6-b47b-11eb-bf61-12bb97331649.jpg

△表2:resnet18的mse誤差對比

團隊以resnet18網(wǎng)絡(luò)為例進行對比,baseline是CPU;結(jié)果顯示:計圖的精度損失比PyTorch降低了42.53%。

還是「元算子」的功勞

性能得到如此大的提升,是怎么實現(xiàn)的呢?

要知道,在TensorFlow,PyTorch框架底層,有上千個算子;想要移植新的硬件,就必須將大量的算子復(fù)寫,這樣一來不僅工作量劇增、而且難度也會加大。

Jittor這次還是依靠他們的核心武器——元算子。

根據(jù)Jittor官方文檔定義,元算子是指神經(jīng)網(wǎng)絡(luò)所需的基本算子。

早在設(shè)計Jittor的時候,研發(fā)團隊就定下了一個目標,即用戶只需要數(shù)行代碼,就可定義新的算子和模型。在保證易用的同時,不喪失任何可定制性。

所以在Jittor中,多個元算子之間,可以相互融合成更加復(fù)雜的算子,這些復(fù)雜算子構(gòu)成了神經(jīng)網(wǎng)絡(luò)計算的多個模塊,如卷積層,歸一化層等等。

664c0422-b47b-11eb-bf61-12bb97331649.jpg

△使用元算子實現(xiàn)卷積層

這一次將Jittor移植到寒武紀上,也是同樣的原理。

研究團隊把神經(jīng)網(wǎng)絡(luò)所需的基本算子,定義為三類共18個元算子。

讓元算子相互融合形成常用算子,這樣就能通過優(yōu)化非常少的元算子,實現(xiàn)對常用算子性能的提升。

66677d4c-b47b-11eb-bf61-12bb97331649.jpg

并且,元算子還是反向傳播閉包,所有元算子反向傳播后依舊是元算子。

所以在完成三類元算子的移植后,Jittor天然就能支持大部分常用算子的推理和簡單訓(xùn)練。

從Jittor元算子到BANG

為了能讓用戶更為簡單地操作,Jittor內(nèi)置了元算子編譯器,可以將用戶的Python代碼動態(tài)編譯成寒武紀BANG語言。

BANG語言是專門針對寒武紀產(chǎn)品架構(gòu)的一種代碼語言,它能極大優(yōu)化寒武紀芯片的通用編程能力,提升用戶編程的自由度。

并且它還有全套編譯工具鏈來提高性能。包括CNCC(Cambricon Neuware Compiler Collection )、CNAS(Cambricon Neuware Assembler)、CNLINKER(Cambricon Neuware Linker)。

Jittor內(nèi)置的元算子編譯器可以把元算子自動轉(zhuǎn)化為BANG算子。

采用動態(tài)編譯的方式,能在運行時獲取更多的信息,比如計算圖上下文、形狀信息等,這些信息都可以進一步提升算子的性能。

并且,Jittor還內(nèi)置了可以根據(jù)硬件設(shè)備自動對BANG語言進行優(yōu)化的優(yōu)化編譯遍(complier pass),從而生成對硬件設(shè)備更為適合的底層算子。

用這種方法,僅僅一行Python代碼,就能表示BatchNorm算子的核心思想。

元算子編譯器再把這行代碼自動優(yōu)化成BANG語言代碼。

由于BANG語言的設(shè)計更加成熟,提供了類似于CUDA語言的線程調(diào)度模式,使得上手和調(diào)試都更加簡單;也能更好地釋放寒武紀芯片的算力。

6678e168-b47b-11eb-bf61-12bb97331649.jpg

清華自研,首個中國高校深度學(xué)習(xí)開源框架

計圖(Jittor)的開發(fā)團隊,均來自清華大學(xué)計算機系圖形學(xué)實驗室,負責(zé)人是清華大學(xué)計算機系的胡事民教授。

而主要負責(zé)開發(fā)的,則是來自實驗室的博士生們:梁盾、楊國燁、楊國煒、周文洋……

計圖(Jittor)與主流的深度學(xué)習(xí)框架TensorFlow、Pytorch等最大的不同在于,它是一個完全基于動態(tài)編譯(Just-in-time)、使用元算子和統(tǒng)一計算圖的深度學(xué)習(xí)框架。

它可以不像Pytorch那樣依賴tracing機制,讓用戶的操作更加簡單,同時還可以得到更好的學(xué)習(xí)訓(xùn)練效果。

對于這一次取得的成果,開發(fā)者之一梁盾透露未來有可能發(fā)表在頂會上,并且會開源給大家。

此前,計圖開源的點云模型庫,在多種主流模型上訓(xùn)練性能較Pytorch提升一倍以上;并發(fā)布了第一個支持金屬度、粗糙度的可微渲染庫。

最近,他們還開源了一個智能P圖神器DeepFaceEditing,可以通過草圖自由編輯人臉。

感興趣的同學(xué)可以去試試哦~

GitHub開源:

https://github.com/IGLICT/DeepFaceEditing-Jittor

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11329

    瀏覽量

    225903
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4842

    瀏覽量

    108180
  • 寒武紀
    +關(guān)注

    關(guān)注

    13

    文章

    219

    瀏覽量

    75069
  • pytorch
    +關(guān)注

    關(guān)注

    2

    文章

    813

    瀏覽量

    14923

原文標題:關(guān)注 | 清華「計圖」現(xiàn)在支持國產(chǎn)芯片了!動態(tài)圖推理比PyTorch快了270倍

文章出處:【微信號:wc_ysj,微信公眾號:旺材芯片】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    《一個國產(chǎn) MCU 原廠支持 200+ 型號的工程實踐記錄》

    我們參與一個國產(chǎn) MCU 原廠的 Studio 工具建設(shè), 最終支持 200+ MCU 型號。 這里不談功能,只談工程實踐。 一條非常重要的經(jīng)驗 不要試圖給每個
    發(fā)表于 02-06 09:20

    PT153S是方寸微電子自主研發(fā)的一款全國產(chǎn)化USB千兆網(wǎng)卡芯片

    國產(chǎn)32位高性能RISC-VCPU,并集成國產(chǎn)USB3.0及以太網(wǎng)PHY,從設(shè) 、生產(chǎn)到封裝全流程均在國內(nèi)完成。同時該芯片提供完整的應(yīng)用解決方案,可幫助客戶縮 短產(chǎn)品開發(fā)周期、降低整
    發(fā)表于 02-02 14:31

    國產(chǎn)芯片真的 “穩(wěn)” ?這家企業(yè)的 14nm 制程,已經(jīng)悄悄滲透到這些行業(yè)…

    最近扒國產(chǎn)芯片的進展,發(fā)現(xiàn)中芯國際(官網(wǎng)鏈接:https://www.smics.com)的 14nm FinFET 制程已經(jīng)不是 “實驗室技術(shù)” —— 從消費電子的中端處理器
    發(fā)表于 11-25 21:03

    致遠儀器 PA310功率:成為國產(chǎn)首款支持SPECpower? 服務(wù)器能效測試的功率分析儀器

    本文導(dǎo)讀致遠儀器PA310功率新增SPECpower基準支持,成為國產(chǎn)首款支持SPECpower服務(wù)器能效測試的功率分析儀器,為服務(wù)器產(chǎn)業(yè)鏈的研發(fā)、選型與認證等環(huán)節(jié),提供精準可靠的
    的頭像 發(fā)表于 11-19 11:42 ?1794次閱讀
    致遠儀器 PA310功率<b class='flag-5'>計</b>:成為<b class='flag-5'>國產(chǎn)</b>首款<b class='flag-5'>支持</b>SPECpower? 服務(wù)器能效測試的功率分析儀器

    愛芯元智出席第四屆清華大學(xué)汽車芯片設(shè)計及產(chǎn)業(yè)應(yīng)用研討會

    近日,第四屆清華大學(xué)汽車芯片設(shè)計及產(chǎn)業(yè)應(yīng)用研討會暨校友論壇在蘇州市吳江區(qū)舉行。作為清華大學(xué)自動化系校友,愛芯元智創(chuàng)始人兼董事長仇肖莘博士應(yīng)邀發(fā)表主旨演講,深入剖析高智價比AI
    的頭像 發(fā)表于 11-02 09:18 ?563次閱讀

    國產(chǎn)MCU開始卷開發(fā)工具?McuStudio是對STM32Cube的拙劣模仿還是真香逆襲?

    看到壇子里老生常談國產(chǎn)MCU模仿STM32,現(xiàn)在戰(zhàn)火已經(jīng)燒到工具鏈。STM32Cube確實香,但現(xiàn)在國產(chǎn)陣營里像McuStudio這類圖形
    發(fā)表于 10-31 10:18

    振弦式位移是否支持多點測量?

    振弦式位移是否支持多點測量?最近又用戶向南京峟思咨詢這樣的問題,那么今天就此問題來給大家做出具體的介紹。振弦式位移是否支持多點測量需根據(jù)設(shè)備類型進行區(qū)分。我司提供的單點位移
    的頭像 發(fā)表于 08-25 11:12 ?731次閱讀
    振弦式位移<b class='flag-5'>計</b>是否<b class='flag-5'>支持</b>多點測量?

    #電路知識 #芯片 #國產(chǎn)芯片

    國產(chǎn)芯片行業(yè)資訊
    芯佰微電子
    發(fā)布于 :2025年04月29日 10:19:29

    國產(chǎn)SL4013芯片如何實現(xiàn)USB 5V升壓至24V以上?

    可靠且易用的解決方案。隨著國產(chǎn)芯片技術(shù)的持續(xù)突破,SL4013將在工業(yè)自動化、智能硬件等領(lǐng)域展現(xiàn)更大價值。 提供樣品 技術(shù)支持 原理
    發(fā)表于 04-28 17:39
    林甸县| 班戈县| 崇文区| 镶黄旗| 宿州市| 乌拉特前旗| 宝兴县| 西林县| 焦作市| 宜阳县| 霍州市| 甘德县| 双桥区| 修水县| 康保县| 错那县| 宜黄县| 西城区| 东安县| 唐海县| 陆川县| 云和县| 华坪县| 潜山县| 日喀则市| 吉首市| 洪洞县| 嵩明县| 丽水市| 镇巴县| 望奎县| 沙坪坝区| 伊春市| 花垣县| 太保市| 涟水县| 平昌县| 历史| 兴国县| 易门县| 静海县|