哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI、游戲與通用計算,國產(chǎn)GPU的定位

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚 ? 2022-11-11 09:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/周凱揚)從去年國產(chǎn)GPU開始陸續(xù)冒尖后,今年各大廠商的動作明顯更大了一些,新品頻繁面世。但從這些新品的規(guī)格和技術(shù)來看,其實每家公司對于自己GPU產(chǎn)品的定位都是不同的,我們就選幾家國產(chǎn)GPU廠商來分析一下他們的產(chǎn)品定位以及未來技術(shù)趨勢。

摩爾線程

作為近期剛發(fā)布了新品的國產(chǎn)GPU廠商,摩爾線程確實收獲了不少關(guān)注,他們最新的顯卡MTT S80也一度成了熱點話題。MTT S80作為一張游戲顯卡,搭載了MT-春曉芯片核心,功耗最高250W,單精度浮點算力高達14.4TFLOPS。

不僅如此,MTT S80也是業(yè)內(nèi)首個PCIe 5.0的顯卡,支持雙向128GB/s的傳輸帶寬。更重要的是,哪怕標(biāo)榜的是游戲顯卡,MTT S80依然支持3D圖形渲染、智能多媒體、物理仿真及科學(xué)計算和AI計算加速的全功能應(yīng)用。
CleanShot 2022-11-10 at 17.25.49@2x
MTT S3000 / 摩爾線程

除了MTT S80以外,春曉這一芯片也為摩爾線程帶來了面向服務(wù)器GPU市場的新產(chǎn)品,MTT S3000。單從芯片規(guī)格上來看,MTT S3000與MTT S80都用的是完整的MT-春曉芯片,都內(nèi)置了4096個MUSA流處理單元,但前者將主頻提高到了1.9GHz,F(xiàn)P32也因此提升到了15.2TFLOPS。

為了讓MTT S3000更適用于服務(wù)器市場,摩爾線程也將其顯存提升至了32GB,并增加了對虛擬化的支持,可對GPU彈性切分,MTT S3000也從MTT S80的主動散熱改為了被動散熱。

到了AI上,摩爾線程的MUSA架構(gòu)和軟件棧為MTT S3000提供了訓(xùn)推一體的支持。除了訓(xùn)練支持TensorFlow、PyTorch、飛槳等常見框架外,摩爾線程還在推理上打造了自研AI推理引擎TensorX,甚至推出了兼容CUDA源碼的方案。

可以看出,摩爾線程不僅已經(jīng)在游戲GPU市場有了彌足珍貴的進展,同樣想在服務(wù)器市場實現(xiàn)突破,甚至是通過兼容CUDA來吸引更多的客戶,這其實也是英偉達這樣的GPU巨頭主攻的兩大方向。但兼容或?qū)?biāo)CUDA一法,AMD、英特爾這樣的國際大廠也都在推進,卻也都是各自為戰(zhàn),考慮到其中涉及的開發(fā)投入和難度之大,或許在軟件生態(tài)上走合作之路會更適合。

芯動科技

在使用GPU這類產(chǎn)品的過程中,支持不同的圖形與計算API對于開發(fā)者來說尤為重要。而芯動科技的風(fēng)華GPU在這API上的支持尤為亮眼,目前已經(jīng)完美支持到OpenGL 4.3、OpenGL ES 3.2、Vulkan 1.2和OpenCL 3.0,這也為風(fēng)華GPU的開發(fā)生態(tài)奠定了基礎(chǔ)。
IMG_256
芯動高性能接口IP / 芯動科技

雖然其產(chǎn)品性能本身已經(jīng)足夠亮眼,但風(fēng)華GPU真正最大的優(yōu)勢在于芯動自研高性能接口IP上,包括高帶寬內(nèi)存(GDDR6x、HBM3)、高速SerDes(PCIe 5.0、CXL 2.0)和高清多媒體(HDMI 2.1、eDP 1.4)等等,同時這些IP也實現(xiàn)了對先進工藝的覆蓋。而且芯動科技已經(jīng)在最近推出了跨工藝、跨封裝的Chiplet互聯(lián)解決方案Innolink Chiplet,同時兼容UCIe Chiplet。

對于高性能GPU來說,如果說核心IP決定了性能上限的話,那么這些接口IP就決定了GPU能發(fā)揮出多少實力,以及是否能在未來的服務(wù)器市場大放異彩。目前看來,風(fēng)華2號的定位是一款低功耗的GPU產(chǎn)品,更適合用于智能座艙之類的應(yīng)用中,而風(fēng)華1號則是面向服務(wù)器市場,尤其是像云游戲、云手機之類的場景。

可從規(guī)格來看,這兩款一年以內(nèi)發(fā)布的產(chǎn)品其實都還沒有用到PCIe 5.0之類的新接口技術(shù)。芯動科技已經(jīng)在8月公開表示,風(fēng)華3號也已經(jīng)基本完成研發(fā),還支持光線追蹤技術(shù),據(jù)了解該產(chǎn)品和風(fēng)華1號一樣也是面向服務(wù)器/數(shù)據(jù)中心市場的,但或許還是會側(cè)重在云游戲等商用場景上,相信我們會在未來的發(fā)布上看到風(fēng)華3號更強大的性能表現(xiàn)。

壁仞科技

雖然壁仞科技最近遇上了一些麻煩,但不可否認的是,其BR100系列通用GPU芯片確實在性能上達到了極高的水準(zhǔn)。與上面提到的兩個GPU不同,BR100雖然是通用計算GPU,但明顯更適合于AI和科學(xué)計算這樣的高性能計算場景,所以BR100并沒有去做DirectX和Vulkan這樣的圖形API支持。

這點從BR100的芯片設(shè)計上也能看出,單個BR100由16個流處理簇構(gòu)成,每個都采用了16個執(zhí)行單元的設(shè)計,而每個執(zhí)行單元包含16個流處理核心(V-core)和一個向量引擎(T-Core)。V-Core作為SIMT處理器,支持到FP32、FP16、INT32、INT16,用于通用計算。

而T-core在SPC級別的2.5D GEMM架構(gòu)下,可以極大加速常見的AI運算,諸如MMA矩陣乘加和卷積等。T-Core不僅支持FP32、TF32這些主流數(shù)據(jù)精度外,還原創(chuàng)定義了TF32+數(shù)據(jù)精度,相較TF32在實現(xiàn)更高精度的同時,也提高了吞吐性能。

從軟件平臺上看,壁仞科技的BIRENSUPA不僅支持PyTorch之類的主流框架,也有壁仞自研的推理加速引擎。從BIRENSUPA平臺框圖中的應(yīng)用定位來看,壁仞科技的主要發(fā)力方向看來還是多媒體、自動駕駛和推薦系統(tǒng)等重AI的場景。
IMG_256
壁仞100P OAM模組 / 壁仞科技

壁仞科技也是在一眾國產(chǎn)PCIe產(chǎn)品中,唯一推出了OAM模組的廠商,壁仞科技也和浪潮合作推出了“海玄”這種OAM服務(wù)器,實現(xiàn)了8PFLLOPS的峰值算力。不過也正是因為實現(xiàn)了如此高的性能,似乎招致了一些惡意阻礙,但這也恰恰說明了他們走的方向是對的,如果他們能走出這一困境的話,無疑能在服務(wù)器市場大有作為。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5259

    瀏覽量

    136039
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40941

    瀏覽量

    302521
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    國產(chǎn)來襲!2nm AI GPU

    電子發(fā)燒友網(wǎng)報道(文/黃山明)在當(dāng)前,GPU已經(jīng)從最初的游戲圖形渲染工具,逐漸演變?yōu)橹悄軙r代的核心。簡單來說,如果沒有GPU,今天我們所熟知的ChatGPT、自動駕駛、AI繪畫等技術(shù)根
    的頭像 發(fā)表于 04-15 07:02 ?7598次閱讀

    成功案例:象帝先計算技術(shù)與Imagination合作——面向現(xiàn)代圖形與計算工作負載的專業(yè)GPU

    解決方案的企業(yè)需要一種既能提供強大性能,又能支持復(fù)雜系統(tǒng)環(huán)境的GPU架構(gòu)。象帝先計算技術(shù):面向?qū)I(yè)市場的多功能GPU解決方案象帝先計算技術(shù)是一家專注于開發(fā)
    的頭像 發(fā)表于 03-09 09:17 ?423次閱讀
    成功案例:象帝先<b class='flag-5'>計算</b>技術(shù)與Imagination合作——面向現(xiàn)代圖形與<b class='flag-5'>計算</b>工作負載的專業(yè)<b class='flag-5'>GPU</b>

    OrangePi RV2 深度技術(shù)評測:RISC-V AI融合架構(gòu)的先行者

    x265 視頻編碼 :僅1.2 fps,遠低于主流 ARM 平臺 整體結(jié)論 :通用計算性能相當(dāng)于5 年前入門級 ARM 處理器 (如Cortex-A53),無法勝任重度計算任務(wù)。 2.2 AI 算力
    發(fā)表于 03-03 20:19

    又一國產(chǎn)GPU企業(yè)上市

    GPU企業(yè)、國內(nèi)首家實現(xiàn)“訓(xùn)練+推理”通用GPU雙量產(chǎn)的企業(yè),天數(shù)智芯的上市標(biāo)志著國產(chǎn)高端芯片產(chǎn)業(yè)邁入資本驅(qū)動與技術(shù)突破并行的關(guān)鍵階段。 ? 從技術(shù)深耕到資本進階 ? 天數(shù)智芯成立于2
    的頭像 發(fā)表于 01-08 18:09 ?7036次閱讀

    Banana Pi 基于龍芯2K3000的國產(chǎn)信創(chuàng)工業(yè)計算網(wǎng)關(guān)設(shè)計,采用無風(fēng)扇設(shè)計

    2K3000的國產(chǎn)信創(chuàng)工業(yè)計算網(wǎng)關(guān)[]() 設(shè)計原則 設(shè)計基于2K3000處理器的全功能COM-E(Type6)核心板,覆蓋處理器所有資源,避免因需求變化,而必須對核心板進行裁剪及重新設(shè)計的工作量,增強通用
    發(fā)表于 12-17 11:06

    為啥 AI 計算速度這么驚人?—— 聊聊 GPU、內(nèi)存與并行計算

    提到AI,大家常說它“算得快”,其實是指AI能在眨眼間處理海量數(shù)據(jù)。可它為啥有這本事?答案就藏在“GPU+高速內(nèi)存+并行計算”這trio(組合)里。咱們可以把
    的頭像 發(fā)表于 12-05 14:35 ?1079次閱讀
    為啥 <b class='flag-5'>AI</b> <b class='flag-5'>計算</b>速度這么驚人?—— 聊聊 <b class='flag-5'>GPU</b>、內(nèi)存與并行<b class='flag-5'>計算</b>

    Imagination中國區(qū)董事長兼亞太區(qū)總裁白農(nóng):通用計算GPU驅(qū)動端側(cè)AI發(fā)展

    通用計算GPU正成為驅(qū)動端側(cè)AI發(fā)展的重要引擎。當(dāng)前,端側(cè)AI算力迎來爆發(fā)式增長,端側(cè)芯片需承載感知數(shù)據(jù)處理、圖像渲染、AI大模型
    的頭像 發(fā)表于 11-26 13:56 ?683次閱讀
    Imagination中國區(qū)董事長兼亞太區(qū)總裁白農(nóng):<b class='flag-5'>通用計算</b><b class='flag-5'>GPU</b>驅(qū)動端側(cè)<b class='flag-5'>AI</b>發(fā)展

    游戲引擎到AI動力核心

    顯卡技術(shù)演進:從游戲引擎到AI動力核心 曾經(jīng)專為圖形渲染而生的顯卡,如今正成為推動人工智能、邊緣計算和科學(xué)模擬的關(guān)鍵驅(qū)動力。 近年來,顯卡技術(shù)已從單純的圖形處理單元演變?yōu)?b class='flag-5'>通用計算加速器
    的頭像 發(fā)表于 10-30 11:08 ?403次閱讀

    首款全國產(chǎn)通用GPU芯片發(fā)布 沐曦集成推出曦云C600

    沐曦集成電路(南京)有限公司近日正式發(fā)布了首款全國產(chǎn)通用GPU——曦云C600,這標(biāo)志著國產(chǎn)高性能GPU實現(xiàn)歷史性突破。 據(jù)新華日報報道顯示
    的頭像 發(fā)表于 10-19 20:04 ?4.7w次閱讀

    摩爾線程副總裁王華:AI工廠全棧技術(shù)重構(gòu)算力基建,開啟國產(chǎn) GPU 黃金時代

    協(xié)同,重新定義了?AI?基礎(chǔ)設(shè)施的生產(chǎn)力公式 ——AI?工廠生產(chǎn)效率?=?加速計算通用性 × 單芯片有效算力 × 單節(jié)點效率 × 集群效率 × 集群穩(wěn)定性。作為國內(nèi)率先實現(xiàn)單芯片集成?
    的頭像 發(fā)表于 08-02 14:21 ?5762次閱讀
    摩爾線程副總裁王華:<b class='flag-5'>AI</b>工廠全棧技術(shù)重構(gòu)算力基建,開啟<b class='flag-5'>國產(chǎn)</b> <b class='flag-5'>GPU</b> 黃金時代

    國產(chǎn)化FMC接口通用計算平臺設(shè)計原理圖:2367-基于FMQL45T900 FMC接口通用計算平臺

    , 數(shù)字信號處理卡, FMC接口通用計算平臺, FMQL45T900I, 前端信號處理
    的頭像 發(fā)表于 07-03 11:23 ?739次閱讀
    <b class='flag-5'>國產(chǎn)</b>化FMC接口<b class='flag-5'>通用計算</b>平臺設(shè)計原理圖:2367-基于FMQL45T900 FMC接口<b class='flag-5'>通用計算</b>平臺

    GPU架構(gòu)深度解析

    GPU架構(gòu)深度解析從圖形處理到通用計算的進化之路圖形處理單元(GPU),作為現(xiàn)代計算機中不可或缺的一部分,已經(jīng)從最初的圖形渲染專用處理器,發(fā)展成為強大的并行
    的頭像 發(fā)表于 05-30 10:36 ?2008次閱讀
    <b class='flag-5'>GPU</b>架構(gòu)深度解析

    Imagination與澎峰科技攜手推動GPU+AI解決方案,共拓計算生態(tài)

    的深度融合展開合作。雙方將結(jié)合 Imagination 領(lǐng)先的 GPU IP 技術(shù)與澎峰科技在 AI 模型壓縮與性能優(yōu)化方面的軟硬協(xié)同能力,共同開拓面向 AI 行業(yè)應(yīng)用的計算解決方案
    發(fā)表于 05-21 09:40 ?1289次閱讀

    Imagination與澎峰科技攜手推動GPU+AI解決方案,共拓計算生態(tài)

    近日,ImaginationTechnologies與國內(nèi)領(lǐng)先的異構(gòu)計算軟件與智算混合云服務(wù)提供商澎峰科技(PerfXLab)正式簽署合作備忘錄(MoU),圍繞GPUAI的深度融合展開合作。雙方將
    的頭像 發(fā)表于 05-20 08:33 ?1015次閱讀
    Imagination與澎峰科技攜手推動<b class='flag-5'>GPU+AI</b>解決方案,共拓<b class='flag-5'>計算</b>生態(tài)

    黑芝麻A2000#高階智能駕駛與通用AI計算芯片詳細解析

    、產(chǎn)品定位與核心目標(biāo) A2000家族是黑芝麻智能華山系列的最新產(chǎn)品, 定位于高階智能駕駛與通用AI計算 ,目標(biāo)是通過高算力、高能效的芯片設(shè)計
    的頭像 發(fā)表于 04-30 10:33 ?7405次閱讀
    黑芝麻A2000#高階智能駕駛與<b class='flag-5'>通用</b><b class='flag-5'>AI</b><b class='flag-5'>計算</b>芯片詳細解析
    凌海市| 襄汾县| 冕宁县| 江油市| 招远市| 朝阳县| 新源县| 阿图什市| 防城港市| 铅山县| 中西区| 綦江县| 延吉市| 观塘区| 光泽县| 金昌市| 休宁县| 息烽县| 朝阳市| 蕉岭县| 马公市| 丰县| 万州区| 通辽市| 光山县| 高陵县| 秦皇岛市| 合山市| 塔城市| 土默特左旗| 砚山县| 积石山| 浑源县| 金华市| 龙南县| 简阳市| 蓝田县| 特克斯县| 土默特右旗| 保康县| 阳春市|