哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

打通AI芯片到大模型訓(xùn)練的算力橋梁,開放加速設(shè)計指南強力助推

全球TMT ? 來源: 全球TMT ? 作者: 全球TMT ? 2023-10-17 16:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

北京2023年10月17日/美通社/ -- 日前,2023全球AI芯片峰會(GACS 2023)在深圳市舉行,AI芯片產(chǎn)業(yè)鏈頂尖企業(yè)、專家學(xué)者齊聚,圍繞生成式AI與大模型算力需求、AI芯片高效落地等產(chǎn)業(yè)議題進行研討分享。

面向大模型時代的計算需求,算力創(chuàng)新已不僅是單個處理器微架構(gòu)和芯片工藝的突破,而需要產(chǎn)業(yè)攜手進行軟硬件全棧系統(tǒng)架構(gòu)全面創(chuàng)新。當(dāng)前各類AI芯片創(chuàng)新仍面臨存儲墻、功耗墻等架構(gòu)痼疾,隨著開放的通用指令架構(gòu)、互聯(lián)總線、AI加速器、開源的操作系統(tǒng)、模型框架、工具鏈和軟件紛紛涌現(xiàn),開放開源的算力系統(tǒng)創(chuàng)新,已經(jīng)成為實現(xiàn)AI芯片轉(zhuǎn)化為高效算力的二級引擎。

會上,浪潮信息分享了在開放加速計算系統(tǒng)領(lǐng)域的最新成果《開放加速規(guī)范AI服務(wù)器設(shè)計指南》,通過系統(tǒng)平臺層面的技術(shù)創(chuàng)新,攜手產(chǎn)業(yè)上下游加速生成式AI算力產(chǎn)業(yè)發(fā)展。

wKgZomUuSyuAedvQAAB8OWRGPj8210.jpg


大模型推動算力產(chǎn)業(yè)步入系統(tǒng)級創(chuàng)新時代

隨著制程工藝逼近天花板,AI芯片正迎來架構(gòu)創(chuàng)新的黃金時代,諸多創(chuàng)新者正通過越來越廣泛的創(chuàng)新思路來繞過摩爾定律瀕臨極限的瓶頸,圍繞架構(gòu)創(chuàng)新,AI芯片產(chǎn)業(yè)正從早期的百花齊放,向更深更多維層面發(fā)展。

與此同時,參數(shù)量高達數(shù)千億的大模型創(chuàng)新往往需要在成百上千的AI服務(wù)器組成的平臺上進行訓(xùn)練。面向AIGC的算力能力考量的不僅僅是單一芯片、或者是單一服務(wù)器,而是包含計算、存儲、網(wǎng)絡(luò)設(shè)備,軟件、框架、模型組件,機柜、制冷、供電基礎(chǔ)設(shè)施等在內(nèi)的一體化高度集成的智算集群。

因此,要將AI芯片真正轉(zhuǎn)化為大模型算力,需要產(chǎn)業(yè)鏈上下游攜手從規(guī)?;懔Σ渴鸬慕嵌冗M行系統(tǒng)級創(chuàng)新,統(tǒng)籌考慮大模型訓(xùn)練需求特點,設(shè)計構(gòu)建算力系統(tǒng),以實現(xiàn)全局最優(yōu)的性能、能效或TCO指標(biāo)。

開放加速設(shè)計指南,打通從芯片到大模型的算力橋梁

2019年,開放計算組織OCP面向大模型訓(xùn)練發(fā)布了開放加速計算(OAI)技術(shù)標(biāo)準(zhǔn),旨在促進上下游協(xié)同,降低產(chǎn)業(yè)創(chuàng)新成本和周期。開放加速計算(OAI)系統(tǒng)架構(gòu)具備更高的散熱和互聯(lián)能力,可以承載具有更高算力的芯片,同時具備非常強的跨節(jié)點擴展能力。因為天然適用于大規(guī)模深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),已經(jīng)在全球范圍內(nèi)得到芯片、系統(tǒng)及應(yīng)用廠商的廣泛參與支持。

大模型訓(xùn)練對開放加速計算系統(tǒng)的總功耗、總線速率、電流密度的需求不斷提升,給系統(tǒng)設(shè)計帶來了巨大的挑戰(zhàn)。因此,浪潮信息基于系統(tǒng)研發(fā)和大模型工程實踐經(jīng)驗,將從AI芯片到大模型算力系統(tǒng)所需完成的體系結(jié)構(gòu)、信號完整性、散熱、可靠性、架構(gòu)設(shè)計等大量系統(tǒng)性設(shè)計標(biāo)準(zhǔn)進行細(xì)化總結(jié),發(fā)布了面向生成式AI場景的《開放加速規(guī)范AI服務(wù)器指南》(以下簡稱《指南》),提出四大設(shè)計原則、全棧設(shè)計方法,包括硬件設(shè)計參考、管理接口規(guī)范和性能測試標(biāo)準(zhǔn)。

wKgaomUuSyuADkWWAACq9tyIEYc269.jpg


《開放加速規(guī)范AI服務(wù)器指南》全棧設(shè)計方法

《開放加速規(guī)范AI服務(wù)器指南》統(tǒng)籌考慮大模型分布式訓(xùn)練對于計算、網(wǎng)絡(luò)和存儲的需求特點,提供了從節(jié)點層到集群層的AI芯片應(yīng)用部署全棧設(shè)計參考。包括各項硬件規(guī)范、電氣規(guī)范、時序規(guī)范,并提供管理、故障診斷和網(wǎng)絡(luò)拓?fù)湓O(shè)計等軟硬協(xié)同參考,旨在通過節(jié)點層/集群層多維協(xié)同設(shè)計確保AI服務(wù)器節(jié)點和服務(wù)器集群以超大規(guī)模集群互連的大模型訓(xùn)練能力。

wKgZomUuSyyAVh8cAACHyJ1iTGg863.jpg


基于板端QSFP-DD的跨節(jié)點互連拓?fù)?/p>

由于架構(gòu)復(fù)雜度高、芯片種類多、高速信號多、系統(tǒng)功耗大等特點,異構(gòu)加速計算節(jié)點常面臨故障率高的問題。因此,《指南》提供了詳細(xì)的系統(tǒng)測試指導(dǎo),對結(jié)構(gòu)、散熱、壓力、穩(wěn)定性、軟件兼容性等方面的測試要點進行了全面梳理,幫助用戶最大程度降低系統(tǒng)生產(chǎn)、部署、運行過程中的故障風(fēng)險,提高系統(tǒng)穩(wěn)定性,減少斷點對訓(xùn)練持續(xù)性的影響。

wKgaomUuSyyAC7xZAAB-mfj5Y7o590.jpg


OAM互連信號損耗要求

不同于通用計算系統(tǒng),面向生成式AI的加速計算系統(tǒng)具有軟硬件強耦合特性。為了提高開放加速計算系統(tǒng)的算力可用性,《指南》給出了八類AI主流業(yè)務(wù)和三類AIGC大模型基準(zhǔn)測評和調(diào)優(yōu)方法,以確保開放加速計算系統(tǒng)能夠有效支撐當(dāng)前主流大模型的創(chuàng)新應(yīng)用。

AI芯片廠商可以基于《指南》快速將符合開放加速規(guī)范的AI芯片落地成高可用高可靠高性能的大模型算力系統(tǒng),提高系統(tǒng)適配和集群部署效率,減少芯片合作伙伴在系統(tǒng)層面的研發(fā)成本投入,加速生成式AI算力產(chǎn)業(yè)的創(chuàng)新步伐。

全棧協(xié)同,高效釋放大模型創(chuàng)新生產(chǎn)力

目前,浪潮信息已經(jīng)基于開放加速規(guī)范發(fā)布了三代AI服務(wù)器產(chǎn)品,和10余家芯片伙伴實現(xiàn)了多元AI計算產(chǎn)品的創(chuàng)新研發(fā)。多元算力產(chǎn)品方案得到了眾多用戶的認(rèn)可,已經(jīng)在多個智算中心應(yīng)用落地,成功支持GPT-2、源1.0及實驗室自研蛋白質(zhì)結(jié)構(gòu)預(yù)測等多個超大規(guī)模巨量模型的高效訓(xùn)練。

同時,為進一步解決大模型算力的系統(tǒng)全棧問題、兼容適配問題、性能優(yōu)化問題等,浪潮信息基于大模型自身實踐與服務(wù)客戶的專業(yè)經(jīng)驗,推出OGAI大模型智算軟件棧,能夠為大模型業(yè)務(wù)提供AI算力系統(tǒng)環(huán)境部署、算力調(diào)度及開發(fā)管理的完整軟件棧和工具鏈,幫助更多企業(yè)順利跨越大模型研發(fā)應(yīng)用門檻,充分釋放大模型算力價值。

作為全球領(lǐng)先的AI算力基礎(chǔ)設(shè)施供應(yīng)商,浪潮信息將通過智算系統(tǒng)軟硬件高度協(xié)同進行持續(xù)創(chuàng)新,攜手產(chǎn)業(yè)伙伴加速AI算力繁榮發(fā)展并充分釋放算力生產(chǎn)力,推動實現(xiàn)"助百模,智千行",加速生成式AI產(chǎn)業(yè)創(chuàng)新。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    54422

    瀏覽量

    469270
  • 半導(dǎo)體
    +關(guān)注

    關(guān)注

    339

    文章

    31236

    瀏覽量

    266523
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41103

    瀏覽量

    302585
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1673

    瀏覽量

    16833
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3771

    瀏覽量

    5270
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    監(jiān)控的下半場:從基礎(chǔ)設(shè)施報警精算師

    摘要: 在十萬卡集群與萬億參數(shù)模型時代,基礎(chǔ)設(shè)施的穩(wěn)定性直接決定了模型訓(xùn)練的邊際成本。當(dāng)單次訓(xùn)練成本高達千萬美元時,監(jiān)控系統(tǒng)不再是簡單的報警,而是衡量
    的頭像 發(fā)表于 03-18 11:13 ?393次閱讀

    邊緣AI臨界點:深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價值

    310P芯片的底層架構(gòu),深度剖析這款產(chǎn)品的技術(shù)細(xì)節(jié)、門檻及其在實際產(chǎn)業(yè)落地中的真實價值。 一、176TOPS的產(chǎn)業(yè)門檻:為何這是邊緣
    發(fā)表于 03-10 14:19

    訓(xùn)練到推理:大模型需求的新拐點已至

    在大模型產(chǎn)業(yè)發(fā)展的早期階段,行業(yè)焦點主要集中在大模型訓(xùn)練所需的投入。一個萬億參數(shù)大模型
    的頭像 發(fā)表于 02-05 16:07 ?1027次閱讀
    從<b class='flag-5'>訓(xùn)練</b>到推理:大<b class='flag-5'>模型</b><b class='flag-5'>算</b><b class='flag-5'>力</b>需求的新拐點已至

    工信部力推:國產(chǎn)訓(xùn)練芯片與異構(gòu)引領(lǐng)AI新征程

    部將以落實《實施意見》為抓手,推動人工智能產(chǎn)業(yè)高質(zhì)量發(fā)展,技術(shù)創(chuàng)新是重點,突破訓(xùn)練芯片、異構(gòu)等關(guān)鍵技術(shù)是關(guān)鍵。 ? 訓(xùn)練
    的頭像 發(fā)表于 01-21 14:11 ?1.1w次閱讀

    2025年曙光存儲以先進存構(gòu)建開放底座并加速AI進化

    數(shù)據(jù)存儲作為AI基礎(chǔ)設(shè)施的重要組成,戰(zhàn)略價值日益凸顯。2025年,曙光存儲以先進存構(gòu)建開放底座、
    的頭像 發(fā)表于 01-07 09:39 ?639次閱讀

    邁向云端巔峰:昆侖芯K200 AI加速卡全面解讀

    昆侖芯K200作為云端AI加速卡,在K100架構(gòu)基礎(chǔ)上全面升級。其INT8達256 TOPS,配備16GB HBM內(nèi)存與512GB/s帶寬,專為千億參數(shù)大
    的頭像 發(fā)表于 12-14 11:17 ?2285次閱讀
    邁向云端<b class='flag-5'>算</b><b class='flag-5'>力</b>巔峰:昆侖芯K200 <b class='flag-5'>AI</b><b class='flag-5'>加速</b>卡全面解讀

    捷智重大更新|API接口全面開放,調(diào)用更高效

    人工調(diào)度太耗時?業(yè)務(wù)系統(tǒng)對接總卡殼?捷智重磅升級——租賃平臺API接口正式開放,讓
    的頭像 發(fā)表于 11-21 18:41 ?1087次閱讀
    捷智<b class='flag-5'>算</b>重大更新|API接口全面<b class='flag-5'>開放</b>,<b class='flag-5'>算</b><b class='flag-5'>力</b>調(diào)用更高效

    國產(chǎn)AI芯片真能扛住“內(nèi)卷”?海思昇騰的這波操作藏了多少細(xì)節(jié)?

    最近行業(yè)都在說“AI的命門”,但國產(chǎn)芯片真的能接住這波需求嗎? 前陣子接觸到海思昇騰910B,實測下來有點超出預(yù)期——7nm工藝下
    發(fā)表于 10-27 13:12

    與電力的終極博弈,填上了AIDC的“電力黑洞”

    ),專注于提供人工智能訓(xùn)練與推理所需的服務(wù)、數(shù)據(jù)服務(wù)和算法服務(wù)。AIDC采用異構(gòu)計算架構(gòu),結(jié)合GPU、FPGA、ASIC等多種AI加速
    的頭像 發(fā)表于 09-22 02:43 ?9008次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片AGI芯片

    能力 2)內(nèi)存帶寬 3)邊緣設(shè)備的AI 2、架構(gòu)與形態(tài) 1)AGI芯片的基本架構(gòu) 設(shè)計AGI芯片需考慮哪些因素: ①具身智能的大部分功能
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的未來:提升還是智力

    持續(xù)發(fā)展體現(xiàn)在: 1、收益遞減 大模型的基礎(chǔ)的需要極大的,這首先源于昂貴的高性能AI芯片,然后是寶貴的電力、水等與環(huán)境相關(guān)的資源。 收益
    發(fā)表于 09-14 14:04

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu)

    射頻模擬處理器的原型與概念驗證 3、光電組合AI芯片 目前最好的應(yīng)對Transformer模型需要的極高的方法之一就是使用光子計算
    發(fā)表于 09-12 17:30

    科技上線赤兔推理引擎服務(wù),創(chuàng)新解鎖FP8大模型

    模型輕量化部署方案。用戶通過遠(yuǎn)程平臺預(yù)置的模型鏡像與AI工具,僅需50%的GPU
    的頭像 發(fā)表于 07-30 21:44 ?1039次閱讀

    網(wǎng)絡(luò)的“神經(jīng)突觸”:AI互聯(lián)技術(shù)如何重構(gòu)分布式訓(xùn)練范式

    過程中,由于單個AI芯片提升速度無法跟上模型參數(shù)的增長速率,再加上龐大的模型參數(shù)和
    的頭像 發(fā)表于 06-08 08:11 ?7715次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>網(wǎng)絡(luò)的“神經(jīng)突觸”:<b class='flag-5'>AI</b>互聯(lián)技術(shù)如何重構(gòu)分布式<b class='flag-5'>訓(xùn)練</b>范式

    即國力,比克電池如何為AI時代“蓄能

    從車路協(xié)同破解出行困局,AI醫(yī)生實現(xiàn)千萬級問診,再到智能工廠的全球零時差協(xié)同——人類正加速邁入以定義生產(chǎn)
    的頭像 發(fā)表于 06-04 14:22 ?1261次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>即國力,比克電池如何為<b class='flag-5'>AI</b>時代“蓄能
    榆社县| 杭锦后旗| 瓮安县| 张掖市| 玛纳斯县| 吐鲁番市| 旺苍县| 平顶山市| 明溪县| 阜平县| 岐山县| 晴隆县| 万盛区| 固镇县| 达尔| 恩施市| 朝阳县| 洛隆县| 长岛县| 邯郸县| 新郑市| 麟游县| 宁国市| 镇雄县| 阿巴嘎旗| 三台县| 前郭尔| 潜山县| 九寨沟县| 望奎县| 台山市| 临夏市| 萝北县| 栾川县| 泸定县| 江城| 通化市| 余干县| 合川市| 革吉县| 鲜城|