哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

IPU 與 GPU 間無縫銜接,未來聚焦數(shù)據(jù)中心的AI訓(xùn)練和推理部署

工程師鄧生 ? 來源:DeepTech深科技 ? 作者:DeepTech深科技 ? 2021-01-02 10:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

“不管是在今天 GPU 能夠做的事情上,還是 GPU 不能做的事情上,IPU 都有它的價(jià)值點(diǎn)和價(jià)值定位?!?日前,在英國 AI 芯片初創(chuàng)公司 Graphcore 中國區(qū)的媒體溝通會(huì)上,Graphcore 高級(jí)副總經(jīng)理兼中國區(qū)總經(jīng)理盧濤和 Graphcore 中國工程總負(fù)責(zé)人、AI 算法科學(xué)家金琛,就 Graphcore 的新產(chǎn)品性能以及該公司在中國的落地策略向 DeepTech 等媒體進(jìn)行了同步。

溝通會(huì)上,Graphcore 解讀了其于本月公布的大規(guī)模系統(tǒng)級(jí)產(chǎn)品 IPU-M2000 的應(yīng)用測試數(shù)據(jù)。公布數(shù)據(jù)顯示,在典型 CV 模型 ResNet、基于分組卷積的 ResNeXt、EfficientNet、語音模型、BERT-Large 等自然語言處理模型以及 MCMC 等傳統(tǒng)機(jī)器學(xué)習(xí)模型中,IPU-M2000 在吞吐量、訓(xùn)練時(shí)間和學(xué)習(xí)結(jié)果生成時(shí)間方面都有較好表現(xiàn)。比如,在 IPU-M2000 上 EfficientNet 的吞吐量達(dá)到 A100 的 18 倍。

圖 | IPU-M2000 與 GPU 的吞吐量、訓(xùn)練及結(jié)果生成時(shí)間對(duì)比(來源:Graphcore)

66e3cb43bec8442f90d9105440bb1a58.jpeg

此前,IPU-M2000 與 Graphcore 第二代 IPU 處理器 GC200 已于今年 7 月 15 日發(fā)布。據(jù)介紹,GC200 芯片基于臺(tái)積電的 7nm 工藝制造,集成 250 TFlops AI-Float 算力和 900MB 處理器內(nèi)存,相較第一代產(chǎn)品性能提升 8 倍。而對(duì)于第三代 IPU,盧濤在此次溝通會(huì)上并未透露發(fā)布的具體時(shí)間表,不過他表示下一代產(chǎn)品正在研發(fā)中,將依舊重點(diǎn)解決存儲(chǔ)問題。

支持 PyTorch、TensorFlow,在 IPU 與 GPU 間無縫銜接

另外,Graphcore 還發(fā)布了 Poplar SDK 1.4 版本和 PyTorch 的 IPU 版本。

Graphcore 對(duì) Poplar SDK 1.4 版本在易用性和速度上進(jìn)行了優(yōu)化,能夠支持模型和數(shù)據(jù)并行,同時(shí)能夠?qū)崿F(xiàn)模型的橫向擴(kuò)展 —— 從 1 個(gè) IPU 橫向擴(kuò)展到 64 個(gè) IPU。金琛表示,下一版本的 Poplar SDK 有望實(shí)現(xiàn)橫向擴(kuò)展到 128 個(gè) IPU。

值得關(guān)注的是,除支持 Graphcore 的自研框架 PopART 外,Poplar SDK 1.4 還支持 Facebook 的 PyTorch 框架、以及 Google 的 TensorFlow 框架。

據(jù)金琛介紹,Graphcore 在 PyTorch 代碼中引入了 PopTorch 輕量級(jí)接口,通過這一接口,用戶可基于當(dāng)前的 PyTorch 模型進(jìn)行封裝,以實(shí)現(xiàn) IPU 和 CPU 之間的無障礙銜接。

對(duì)于實(shí)現(xiàn)這一功能的核心技術(shù),金琛做進(jìn)一步解釋說,Graphcore 采用 PyTorch 里的 jit.trace 機(jī)制對(duì)計(jì)算圖進(jìn)行編譯,轉(zhuǎn)化為 IPU 和 PyTorch 兼容的表達(dá)格式,最后用 Graphcore 自研框架 PopART 后端的 audiff 功能自動(dòng)生成反向圖,便可以實(shí)現(xiàn)同一個(gè)模型在不同平臺(tái)的無差別運(yùn)行。

目前,PyTorch 因其直觀易懂、靈活易用等優(yōu)勢受到開發(fā)者的廣泛喜愛和應(yīng)用。Poplar SDK 1.4 增加了對(duì) PyTorch 的支持,策略上是希望用戶在 IPU 上也能體驗(yàn) PyTorch,讓用戶多一個(gè)轉(zhuǎn)戰(zhàn) IPU 的理由。不過目前英偉達(dá)的 GPU 已經(jīng)在 AI 計(jì)算領(lǐng)域占據(jù)大部分市場,此時(shí) IPU 能夠提供的價(jià)值、轉(zhuǎn)場到 IPU 的成本等,都是用戶所要考慮的問題。

在遷移成本上,盧濤表示,經(jīng)過幾年來對(duì) Poplar SDK 的打磨,現(xiàn)在從 GPU 到 IPU 的軟硬件遷移難度已經(jīng)比大家認(rèn)為的小得多。

金琛補(bǔ)充道,在訓(xùn)練上,針對(duì)一個(gè)不太復(fù)雜的模型,一般一周可以遷移完成,對(duì)于復(fù)雜的模型大概需要兩周;在推理上,基本上是 1-2 天的工作量。

談及性能,盧濤表示:“IPU 在訓(xùn)練推理、語音、圖像模型處理上基本全面超越 GPU?!?不過他也坦言:“不能說 100% 超越了 GPU,因?yàn)樗惴P痛_實(shí)非常多,比如說語音有不同的語音模型、圖像也是有不同的圖像模型?!?/p>

未來:持續(xù)優(yōu)化性能,進(jìn)一步壓縮遷移成本

IPU 在機(jī)器學(xué)習(xí)性能上的明顯優(yōu)勢是不可否認(rèn)的,但前有身強(qiáng)體壯且努力奔跑的巨頭英偉達(dá),Graphcore 更是一刻也不容懈怠。盧濤在溝通會(huì)上也多次提到,“目前 Graphcore 面對(duì)的壓力最主要還是來自英偉達(dá)”。

“重壓” 之下,Graphcore 短期內(nèi)的計(jì)劃是聚焦在數(shù)據(jù)中心高性能訓(xùn)練和推理市場上,持續(xù)打磨 IPU 和軟件平臺(tái),持續(xù)優(yōu)化性能和提高可用性。盧濤說,“只有在我們聚焦的領(lǐng)域跑得更快,Graphcore 和英偉達(dá)之間的距離才會(huì)越來越短,甚至在某些領(lǐng)域超過英偉達(dá)”。

他還表示,Graphcore 希望未來數(shù)年內(nèi),能在數(shù)據(jù)中心的 AI 訓(xùn)練、推理批量部署、以及發(fā)貨和體量上做到除英偉達(dá)以外的另一個(gè)頭部地位。

為實(shí)現(xiàn)該目標(biāo),Graphcore 也將從增加 AI 框架支持、以及模型覆蓋兩個(gè)維度著手,以期進(jìn)一步減少用戶的遷移成本。此外,除目前 AI 應(yīng)用最廣泛的互聯(lián)網(wǎng)和云計(jì)算兩個(gè)場景外,盧濤表示公司明年還將在金融、汽車、智慧醫(yī)療、智慧教育、智慧城市和政府服務(wù)等領(lǐng)域,至少突破一到兩個(gè)比較主流的領(lǐng)域。

責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5271

    瀏覽量

    136069
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    18

    文章

    5767

    瀏覽量

    75206
  • IPU
    IPU
    +關(guān)注

    關(guān)注

    0

    文章

    35

    瀏覽量

    16003
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    數(shù)據(jù)中心缺電,英偉達(dá)又有新動(dòng)作!

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近日,英偉達(dá)宣布將舉辦一場私人峰會(huì),邀請聚焦數(shù)據(jù)中心電力問題的初創(chuàng)公司參會(huì),共同應(yīng)對(duì)可能阻礙人工智能發(fā)展的電力難題。當(dāng)下,大模型訓(xùn)練推理對(duì)算力的需求呈指
    的頭像 發(fā)表于 12-14 00:06 ?1.3w次閱讀
    <b class='flag-5'>數(shù)據(jù)中心</b>缺電,英偉達(dá)又有新動(dòng)作!

    高通挑戰(zhàn)英偉達(dá),發(fā)布768GB內(nèi)存AI推理芯片,“出征”AI數(shù)據(jù)中心

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)隨著生成式AI應(yīng)用的爆發(fā)式增長,數(shù)據(jù)中心對(duì)高效、低成本、低功耗AI推理能力的需求急劇上升。高通憑借其在移動(dòng)計(jì)算和通信領(lǐng)域的技術(shù)積累,正試圖通過差異化戰(zhàn)略,
    的頭像 發(fā)表于 10-29 10:36 ?3929次閱讀
    高通挑戰(zhàn)英偉達(dá),發(fā)布768GB內(nèi)存<b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片,“出征”<b class='flag-5'>AI</b><b class='flag-5'>數(shù)據(jù)中心</b>

    高通挑戰(zhàn)英偉達(dá)!發(fā)布768GB內(nèi)存AI推理芯片,“出征”AI數(shù)據(jù)中心

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)隨著生成式AI應(yīng)用的爆發(fā)式增長,數(shù)據(jù)中心對(duì)高效、低成本、低功耗AI推理能力的需求急劇上升。高通憑借其在移動(dòng)計(jì)算和通信領(lǐng)域的技術(shù)積累,正試圖通過差異化戰(zhàn)略,
    的頭像 發(fā)表于 10-29 09:14 ?6719次閱讀
    高通挑戰(zhàn)英偉達(dá)!發(fā)布768GB內(nèi)存<b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片,“出征”<b class='flag-5'>AI</b><b class='flag-5'>數(shù)據(jù)中心</b>

    曦智科技探討AI數(shù)據(jù)中心三大擴(kuò)展策略

    在OFC 2026期,曦智科技接受了Semiconductor Engineering的專訪,探討了AI數(shù)據(jù)中心三大擴(kuò)展策略——縱向擴(kuò)展(Scale-up)、橫向擴(kuò)展(Scale-out)和跨
    的頭像 發(fā)表于 04-21 16:34 ?260次閱讀
    曦智科技探討<b class='flag-5'>AI</b><b class='flag-5'>數(shù)據(jù)中心</b>三大擴(kuò)展策略

    Arm CPU推動(dòng)數(shù)據(jù)中心業(yè)務(wù)正加速發(fā)展

    在過去十年中的大部分時(shí)間里,數(shù)據(jù)中心領(lǐng)域的話題都圍繞著加速器展開。隨著人工智能 (AI) 訓(xùn)練工作負(fù)載的爆炸式增長,GPU、TPU 等占據(jù)了新聞?lì)^條、投資者報(bào)告和基礎(chǔ)設(shè)施路線圖的核心位
    的頭像 發(fā)表于 03-24 10:15 ?471次閱讀

    128周才能交貨!AI狂潮下,全球數(shù)據(jù)中心排隊(duì)等變壓器?

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)AI加速落地,算力需求呈指數(shù)級(jí)增長。以大模型訓(xùn)練、推理服務(wù)為代表的AI應(yīng)用,推動(dòng)全球數(shù)據(jù)中心規(guī)模持續(xù)擴(kuò)張。據(jù)I
    的頭像 發(fā)表于 01-30 09:06 ?6269次閱讀

    安森美創(chuàng)新方案助力AI數(shù)據(jù)中心提升能效

    人工智能 (AI) 正在迅速發(fā)展,并滲透到我們?nèi)粘I畹姆椒矫婷?,從?nèi)容生成到客服聊天機(jī)器人皆是如此。與此同時(shí),數(shù)據(jù)處理量大幅激增,而數(shù)據(jù)處理很大程度上依賴于強(qiáng)大的計(jì)算基礎(chǔ)設(shè)施。此外,AI
    的頭像 發(fā)表于 12-26 10:23 ?776次閱讀
    安森美創(chuàng)新方案助力<b class='flag-5'>AI</b><b class='flag-5'>數(shù)據(jù)中心</b>提升能效

    數(shù)據(jù)中心應(yīng)急供電:超級(jí)電容無縫切換,守護(hù)數(shù)據(jù)不丟失

    數(shù)據(jù)中心應(yīng)急供電中,超級(jí)電容通過毫秒級(jí)無縫切換技術(shù),有效防止數(shù)據(jù)丟失,成為保障數(shù)據(jù)中心穩(wěn)定運(yùn)行的核心組件 。其核心價(jià)值體現(xiàn)在瞬時(shí)響應(yīng)、高功率支撐、長壽命及安全可靠等方面,具體分析如下:
    的頭像 發(fā)表于 12-02 14:40 ?1337次閱讀

    Credo攜1.6T Bluebird DSP破解AI數(shù)據(jù)中心算力瓶頸

    高速連接17年的企業(yè)再擲重磅——發(fā)布 新一代1.6T Bluebird DSP ,為AI數(shù)據(jù)中心的“算力軍備競賽”注入關(guān)鍵動(dòng)力。 當(dāng)下,AI大模型訓(xùn)練集群的
    的頭像 發(fā)表于 10-17 14:49 ?960次閱讀
    Credo攜1.6T Bluebird DSP破解<b class='flag-5'>AI</b><b class='flag-5'>數(shù)據(jù)中心</b>算力瓶頸

    睿海光電以高效交付與廣泛兼容助力AI數(shù)據(jù)中心800G光模塊升級(jí)

    NVIDIA Quantum-2交換機(jī)等主流設(shè)備。 平滑擴(kuò)展:與現(xiàn)有400G/100G設(shè)備無縫互通,降低數(shù)據(jù)中心升級(jí)成本。 多場景覆蓋:從AI訓(xùn)練集群的“大象流”到
    發(fā)表于 08-13 19:01

    加速AI未來,睿海光電800G OSFP光模塊重構(gòu)數(shù)據(jù)中心互聯(lián)標(biāo)準(zhǔn)

    客戶的共同選擇 超算中心應(yīng)用 :為某國家實(shí)驗(yàn)室提供800G OSFP SR8模塊,構(gòu)建E級(jí)超算互聯(lián)網(wǎng)絡(luò) AI訓(xùn)練集群 :某自動(dòng)駕駛企業(yè)采用我們的解決方案,GPU
    發(fā)表于 08-13 16:38

    ai_cube訓(xùn)練模型最后部署失敗是什么原因?

    ai_cube訓(xùn)練模型最后部署失敗是什么原因?文件保存路徑里也沒有中文 查看AICube/AI_Cube.log,看看報(bào)什么錯(cuò)?
    發(fā)表于 07-30 08:15

    PCIe協(xié)議分析儀在數(shù)據(jù)中心中有何作用?

    數(shù)據(jù)中心的整體可靠性。以下是其核心作用及具體應(yīng)用場景的詳細(xì)分析:一、性能優(yōu)化:突破帶寬瓶頸,提升計(jì)算效率 鏈路帶寬利用率分析 場景:在AI訓(xùn)練集群中,GPU通過PCIe與CPU交換
    發(fā)表于 07-29 15:02

    PCIe協(xié)議分析儀能測試哪些設(shè)備?

    :提升數(shù)據(jù)中心的整體效率,降低CPU負(fù)載。 四、異構(gòu)計(jì)算與擴(kuò)展設(shè)備 多GPU系統(tǒng) 測試場景:利用PCIe協(xié)議分析儀模擬高負(fù)載的GPU通信,測試PCIe交換機(jī)的性能和穩(wěn)定性。 應(yīng)用價(jià)
    發(fā)表于 07-25 14:09

    中型數(shù)據(jù)中心中的差分晶體振蕩器應(yīng)用與匹配方案

    中型數(shù)據(jù)中心的定義與特點(diǎn) 中型數(shù)據(jù)中心通常服務(wù)于中大型企業(yè)、科研機(jī)構(gòu)或地方行業(yè)節(jié)點(diǎn),具備50至200個(gè)機(jī)柜,部署多臺(tái)服務(wù)器、交換設(shè)備、存儲(chǔ)系統(tǒng)與光通信鏈路等,強(qiáng)調(diào)高帶寬、低延遲與高可用性。關(guān)鍵設(shè)備
    發(fā)表于 07-01 16:33
    会昌县| 奇台县| 望都县| 赞皇县| 师宗县| 随州市| 杭锦后旗| 彩票| 邻水| 大丰市| 舟曲县| 新宁县| 巴彦淖尔市| 北流市| 河津市| 怀集县| 中阳县| 腾冲县| 丰镇市| 云阳县| 高清| 泰安市| 宾川县| 喀喇沁旗| 大荔县| 四子王旗| 宣威市| 新乐市| 泰宁县| 合江县| 宜兰市| 溧水县| 长垣县| 巫山县| 林周县| 新平| 赣榆县| 邵阳市| 宜宾市| 华亭县| 阿克陶县|