哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

奇異摩爾攜手產業(yè)伙伴共建IO-NET芯粒工作組

奇異摩爾 ? 來源:奇異摩爾 ? 2026-04-02 15:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

3月31日,ODCC春季全會網絡工作組會議在浙江舟山圓滿落幕。為應對下一代AI網絡技術的演進需求,騰訊牽頭正式成立IO-NET項目工作組。該工作組將圍繞面向Agent的新型互聯體系,實現訓練、推理、業(yè)務執(zhí)行一體化展開深入探討,攜手產業(yè)鏈共建統(tǒng)一生態(tài)規(guī)范,推動AI網絡持續(xù)演進。

作為IO-NET項目的重要成員,奇異摩爾依托工作組平臺,牽頭組織基于IO-NET的IOD芯粒工作組,聯合產業(yè)鏈伙伴共同探索通用IOD的實現路徑,為構建高效、標準化的下一代AI互聯生態(tài)提供核心技術支撐。

奇異摩爾首席架構師朱琛發(fā)表主題演講《基于通用IOD的XPU Scale-up網絡互聯實現路徑》。演講重點分析了Agent時代背景下,內存瓶頸正驅動集群架構向資源解耦方向演進。在這一演進過程中,通用IOD的應用場景從XPU-to-XPU拓展至XPU-to-CPU及XPU-to-Memory Pool。

朱琛指出,傳統(tǒng)RDMA在XPU-to-CPU及XPU-to-Memory Pool場景下顯得過于繁重,亟需一種更輕量化的DMA引擎。圍繞這一需求,他從分層視角出發(fā),系統(tǒng)探討了從D2D,功能層以及Scale-up接口層通用IOD的實現路徑。他進一步闡述了奇異摩爾作為騰訊牽頭IO-NET項目組子項目的定位與未來規(guī)劃,研究目標的及相關技術規(guī)范的落地展望。

Agent時代所帶來的內存瓶頸

在大模型推理中,內存消耗大戶遠不止模型參數,更棘手的是KV Cache、長上下文、會話狀態(tài)、多輪Agent記憶以及Prompt Cache等動態(tài)數據。KV Cache存儲注意力機制中的鍵值向量,避免每生成一個token都重新計算,其大小隨序列長度和批量大小線性增長,在大規(guī)模場景下甚至會超過模型權重本身。

為何需要統(tǒng)一內存池

在大模型訓練與推理中,Batch Size是決定性能與效果的關鍵超參數。它不僅影響吞吐速度,更直接關系到模型的收斂行為與泛化能力。

隨著Agent時代的到來,長序列已成為推理場景的主流趨勢,顯存需求呈指數級攀升。在這一背景下,Batch Size的選擇正面臨兩難困境:

過大:過量占用GPU顯存,極易觸發(fā)顯存溢出(OOM),同時推升Token生成延遲,影響服務穩(wěn)定性;

過?。簾o法充分利用GPU計算資源,導致計算單元因“喂不飽”而持續(xù)空轉,算力利用率大幅下降。

此時,統(tǒng)一內存池的重要性便凸顯出來。通過構建全局統(tǒng)一、彈性伸縮的內存池,能夠打破靜態(tài)顯存分配的僵化邊界,在Batch Size動態(tài)變化時實現顯存資源的靈活復用與高效調度——既能支撐更大Batch Size以提升吞吐,又能在高并發(fā)長序列場景下避免顯存瓶頸,真正實現算力與內存的協(xié)同最優(yōu)。

從CPU-GPU到全域統(tǒng)一編址

9a857ccc-2d80-11f1-90a1-92fbcf53809c.png

(圖:奇異摩爾@ODCC春季大會)

如今,CPU與GPU不再是各自持有獨立內存的異構設備,而是能夠平等訪問統(tǒng)一內存空間的計算單元,徹底消除了傳統(tǒng)架構中數據在CPU內存與GPU顯存之間反復拷貝的瓶頸。以英偉達為例,其通過NVLink-C2C互聯構建了GPU與CPU對共享內存的無差別、低延遲訪問,CPU和GPU可共享同一進程頁表,硬件維護緩存一致性,GPU可直接訪問CPU端LPDDR5X內存(總帶寬900 GB/s),CPU也能以緩存行粒度訪問GPU端內存。

華為的UB-Mesh在架構上也采用了類似思路,通過統(tǒng)一總線協(xié)議連接GPU、內存池、SSD、網卡等異構資源,構建可擴展至百萬級芯片的大規(guī)模AI系統(tǒng)。

面向下一代AI推理,統(tǒng)一編址的理念正從“CPU-GPU對”向更廣闊的異構計算生態(tài)延伸——XPU與內存池之間的協(xié)同、異構算力的統(tǒng)一調度、異構芯片間的互聯能力,已成為下一代AI推理系統(tǒng)亟待突破的核心課題。

從XPU間互聯到內存池互聯

以IOD 芯粒讓計算和互聯解耦的技術路徑已經逐步形成產業(yè)共識。正如Meta的最新的MTIA系列都基于上一代優(yōu)化,采用模塊化小芯片(芯粒,將大芯片拆分為多個獨立小模塊拼接,降低研發(fā)難度、提升復用性)設計,融入最新的 AI 工作負載洞察與硬件技術,并以更短的周期完成部署。這種更緊湊的迭代閉環(huán),讓硬件能更好地適配不斷演變的模型架構,靈活支持未來大模型所需硬件技術的落地應用。

9ae25a78-2d80-11f1-90a1-92fbcf53809c.png

(圖:奇異摩爾@ODCC春季大會)

Kiwi IOD作為一款相對通用、支持內存語義、具備RDMA引擎且靈活可擴展的IO芯粒,除了實現XPU間互聯外,同樣可為XPU-Memory Pool互聯提供了理想技術載體。

原生支持內存語義

Kiwi IOD從底層支持內存語義(Memory Semantics),使得XPU訪問遠端內存池時,無需借助復雜的驅動或中間層,即可通過Load/Store指令直接讀寫池化內存。這種設計讓遠端內存訪問的編程體驗與訪問本地內存無異,大幅降低軟件開發(fā)復雜度。

輕量化協(xié)議封裝

針對內存池互聯場景,Kiwi IOD復用Scale-up協(xié)議,可優(yōu)化報文封裝開銷,通過減輕IOD DMA操作(Read/Write/Atomic)的軟件參與度,實現數據通路的硬件直通。

通用IOD的XPU

Scale-up網絡互聯實現路徑

9b3a1b5a-2d80-11f1-90a1-92fbcf53809c.png

(圖:奇異摩爾@ODCC春季大會)

從NoC接口來看,計算芯粒的NoC與IOD必須在協(xié)議層實現接口對齊。在協(xié)議層適配方面,UCIe協(xié)議層原生支持PCIe Flit模式與CXL Flit模式,計算芯粒與IOD的協(xié)議適配層需采用一致的映射方式以實現互通。在統(tǒng)一的IOD協(xié)議層接口下,IOD能夠為NoC提供差異化支持:在XPU-to-XPU場景中,支持XPU個性化的原子操作;在XPU-to-Memory Pool場景中,支持XPU個性化的近存計算操作。

從功能層來看,以XPU-to-Memory Pool場景為例,內存池對XPU的內存分配策略(如靜態(tài)分配、動態(tài)按需分配)以及池化內存到XPU地址空間的映射方式與地址翻譯機制,可選擇通過IOD實現。

從Scale-up接口來看,IOD本身支持多元化的Scale-up接口,其靈活性使其能夠持續(xù)適應Scale-up生態(tài)的演進需求。

9b94b3f8-2d80-11f1-90a1-92fbcf53809c.png

(圖:IO-NET內存池項目計劃)

展望未來,奇異摩爾將持續(xù)依托騰訊IO-NET工作組的整體規(guī)劃,牽頭打造面向IO-NET的芯粒工作組,攜手產業(yè)鏈上下游,共同構建適用于XPU-to-XPU、XPU-to-CPU及Memory Pool等場景的通用IOD技術規(guī)范,并推動專用IOD硬件的定制化落地。以此為AI Agent時代背景下的推理瓶頸提供互聯領域的關鍵支撐,加速下一代異構計算互聯生態(tài)的標準化與規(guī)?;M程。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 內存
    +關注

    關注

    9

    文章

    3224

    瀏覽量

    76478
  • Agent
    +關注

    關注

    0

    文章

    216

    瀏覽量

    29121
  • 奇異摩爾
    +關注

    關注

    0

    文章

    85

    瀏覽量

    4070

原文標題:生態(tài)共建 | 奇異摩爾攜手產業(yè)共建IO-NET芯粒工作組,引領下一代AI網絡演進

文章出處:【微信號:奇異摩爾,微信公眾號:奇異摩爾】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    奇異摩爾與圖靈量子達成深度戰(zhàn)略合作

    融合的計算新范式,為全球算力產業(yè)升級注入全新動能?;顒赢斕?,奇異摩爾聯合創(chuàng)始人兼產品解決方案副總裁祝俊東、圖靈量子副總經理戰(zhàn)永興等重要嘉賓出席簽約儀式。
    的頭像 發(fā)表于 04-15 17:52 ?745次閱讀

    得瑞領新入選全國集成電路標委會芯片應用工作組,以標準之力賦能國產存儲高質量發(fā)展

    近日,全國集成電路標委會芯片應用工作組正式成立,得瑞領新作為工作組成員單位受邀參會,與產業(yè)伙伴共同探討國產芯片規(guī)?;瘧门c標準化建設相關話題,助力我國集成電路
    的頭像 發(fā)表于 04-15 14:25 ?102次閱讀
    得瑞領新入選全國集成電路標委會芯片應用<b class='flag-5'>工作組</b>,以標準之力賦能國產存儲高質量發(fā)展

    奇異摩爾聯合成立智算互聯實驗室

    2026年4月2日,ODCC春季全體會議在浙江舟山成功召開。中國信通院云大所總工程師郭亮,ODCC網絡工作組組長、騰訊基礎網絡中心總監(jiān)何澤坤、奇異摩爾聯合創(chuàng)始人&產品解決方案副總裁祝俊東、博
    的頭像 發(fā)表于 04-07 14:03 ?214次閱讀
    <b class='flag-5'>奇異</b><b class='flag-5'>摩爾</b>聯合成立智算互聯<b class='flag-5'>芯</b><b class='flag-5'>粒</b>實驗室

    比亞迪正式加入國際汽車工作組

    日前,比亞迪股份有限公司正式加入國際汽車工作組(IATF)。作為全球新能源汽車領軍企業(yè),比亞迪將與大眾、通用等國際汽車巨頭共同參與國際核心標準的制定。此舉標志著中國汽車企業(yè)在國際標準領域邁出重要一步。
    的頭像 發(fā)表于 03-12 11:53 ?512次閱讀

    奇異摩爾參編人工智能加速器互聯技術要求團體標準發(fā)布

    近日,中國電子工業(yè)標準化技術協(xié)會批準并發(fā)布了《人工智能超節(jié)點服務器技術要求》等28項團體標準。其中由中國移動研究院牽頭、奇異摩爾產品市場&研發(fā)部門主要參編的《人工智能加速器互聯技術
    的頭像 發(fā)表于 01-09 11:20 ?740次閱讀
    <b class='flag-5'>奇異</b><b class='flag-5'>摩爾</b>參編人工智能加速器互聯<b class='flag-5'>芯</b><b class='flag-5'>粒</b>技術要求團體標準發(fā)布

    半導體攜手生態(tài)伙伴助力AI硬件產業(yè)規(guī)?;涞?/a>

    當前,AI大模型加速滲透硬件產業(yè),AI硬件正從 “單點智能” 邁向 “系統(tǒng)級智能”,大模型已成為硬件產品的基礎能力之一。順應這一行業(yè)發(fā)展趨勢,珠海泰半導體有限公司(以下簡稱 “泰半導體”)積極
    的頭像 發(fā)表于 01-05 17:18 ?1328次閱讀

    華為受邀出席5GDNA聯盟新通話工作組產業(yè)發(fā)展專題會議

    12月23日,5GDNA聯盟在北京召開2025年工作會議暨新通話工作組產業(yè)發(fā)展專題會議。來自中國信通院、中國電信研究院、中國移動終端公司、中國移動設計院、中國聯通在線信息科技公司、華為、三星電子中國研究院、OPPO、vivo、紫
    的頭像 發(fā)表于 12-31 11:47 ?899次閱讀

    公司出席IEEE P1901.3雙模通信國際標準工作組第九次會議

    10月14日至15日,IEEE P1901.3雙模通信國際標準工作組第9次會議在烏茲別克斯坦塔什干召開,標準工作組主席,國家電網公司營銷部,中國電科院,智公司所屬智半導體、深國電以
    的頭像 發(fā)表于 10-24 15:28 ?983次閱讀

    奇異摩爾助力中國移動GSE 2.5版本協(xié)議標準發(fā)布

    近日,在2025移動合作伙伴大會“算力網絡聯合創(chuàng)新”分論壇上,中國移動攜手包括奇異摩爾、中興及新華三等在內的產業(yè)合作
    的頭像 發(fā)表于 10-17 16:44 ?1340次閱讀

    奇異摩爾Networking for AI生態(tài)沙龍成功舉辦

    近日,中國信息通信研究院華東分院與行業(yè)領先的AI網絡全棧式互聯產品及解決方案提供商——奇異摩爾聯合舉辦的“聚力向 算涌無界 Networking for AI”生態(tài)沙龍活動在上海浦東成功舉辦。
    的頭像 發(fā)表于 10-09 12:45 ?914次閱讀

    借助Arm技術構建計算未來

    在我們近期與業(yè)界伙伴的多次交流中,明顯發(fā)現時代的大幕已徐徐拉開,行業(yè)已經不再抱存對的質疑態(tài)度,而是正在合作解決如何借助
    的頭像 發(fā)表于 09-25 17:18 ?1321次閱讀

    奇異摩爾助力OISA全向智感互聯IO技術白皮書發(fā)布

    提供商,奇異摩爾憑借其在領域的深厚技術積累與產業(yè)實踐,多方位貢獻于該白皮書的撰寫與關鍵技術路徑的梳理
    的頭像 發(fā)表于 09-23 15:55 ?2203次閱讀
    <b class='flag-5'>奇異</b><b class='flag-5'>摩爾</b>助力OISA全向智感互聯<b class='flag-5'>IO</b><b class='flag-5'>芯</b><b class='flag-5'>粒</b>技術白皮書發(fā)布

    奇異摩爾攜手中國移動發(fā)布OISA 2.0協(xié)議

    山西大同,在 2025中國算力大會主論壇上,中國移動攜手包括奇異摩爾、燧原科技、壁韌科技、摩爾線程、昆侖、盛科通信、浪潮集團等多家AI基礎
    的頭像 發(fā)表于 08-27 15:08 ?3612次閱讀
    <b class='flag-5'>奇異</b><b class='flag-5'>摩爾</b><b class='flag-5'>攜手</b>中國移動發(fā)布OISA 2.0協(xié)議

    軟通動力加入openEuler社區(qū)AI聯合工作組

    近日,2025開放原子開源生態(tài)大會開幕,openEuler社區(qū)攜手軟通動力與社區(qū)成員單位共同發(fā)起成立“openEuler社區(qū)AI聯合工作組”,工作組將整合芯片、算法、應用等全產業(yè)鏈力量
    的頭像 發(fā)表于 07-25 14:42 ?1235次閱讀

    奇異摩爾出席第三屆開發(fā)者大會AI芯片與系統(tǒng)分論壇

    多名行業(yè)同仁齊聚一堂。由奇異摩爾承辦的“第三屆開發(fā)者大會 - AI芯片與系統(tǒng)分論壇”在無錫成功舉行。
    的頭像 發(fā)表于 07-22 11:34 ?1434次閱讀
    保定市| 炉霍县| 长沙市| 黄石市| 滁州市| 富蕴县| 百色市| 绵竹市| 万荣县| 康乐县| 安徽省| 英超| 英德市| 龙岩市| 古浪县| 星子县| 白银市| 九江市| 霍城县| 砀山县| 江口县| 平遥县| 新乡市| 奎屯市| 盐城市| 阳朔县| 伊宁市| 包头市| 湘乡市| 乃东县| 朔州市| 镇赉县| 泰和县| 茂名市| 兰州市| 葵青区| 巴彦县| 遂川县| 高青县| 日照市| 当阳市|