哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI智能網(wǎng)卡在AI網(wǎng)絡(luò)中的作用

奇異摩爾 ? 來源:奇異摩爾 ? 2024-12-18 16:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

寫在開頭,本文主要介紹智能網(wǎng)卡在AI網(wǎng)絡(luò)的作用并在一定場景下說明DPU和智能網(wǎng)卡在功能上的一些區(qū)別以理解兩者的相似點和不同點。

智算中心又稱人工智能計算中心,通常配置有大量的圖形處理單元(GPU)和張量處理單元(TPU),以及針對人工智能工作負載優(yōu)化的高帶寬內(nèi)存和存儲系統(tǒng)。它們?yōu)?a target="_blank">機器學(xué)習(xí)深度學(xué)習(xí)提供專門支持,包括數(shù)據(jù)預(yù)處理、模型訓(xùn)練以及推理服務(wù)。

人工智能計算中心的設(shè)計非常重視并行處理能力,并且能夠處理大量的數(shù)據(jù)集。它們通常包括深度學(xué)習(xí)框架和庫的支持,為開發(fā)者提供方便的開發(fā)環(huán)境。此外,它們可能會提供針對人工智能應(yīng)用的優(yōu)化工具與API,從而最大化硬件性能。

以GPU為核心的分布式計算

GPU擁有高度并行的處理架構(gòu),能夠同時處理大量的計算任務(wù),特別適合于人工智能領(lǐng)域中大規(guī)模的矩陣運算和向量計算。在智算中心,GPU是主要的計算節(jié)點,而CPU則更多承擔(dān)任務(wù)調(diào)度、系統(tǒng)管理和其他非并行計算任務(wù)。智算中心是以GPU為中心的架構(gòu)設(shè)計,是為了滿足人工智能領(lǐng)域?qū)Ω咝阅苡嬎阗Y源的需求,且要求網(wǎng)絡(luò)高可靠、超低延時及超高的帶寬。

AI智能網(wǎng)卡在AI網(wǎng)絡(luò)中的作用

我們所說的Scale-out架構(gòu)的流量特性究竟是什么呢?它要求具備高吞吐量,通常約為100 Gbps,同時包長較短,典型的往返時間僅為10微秒。Scale-out架構(gòu)的關(guān)鍵在于必須有效利用所有可用帶寬,并確保流量的均勻分布。GPU流量通常較大,與典型的服務(wù)器間流量存在差異,因此應(yīng)高效采用負載均衡方案,如路徑感知(Path-aware)、自適應(yīng)(Adaptive)或無損(Lossless)負載均衡方式。此外,還需具備快速的丟包恢復(fù)和重傳機制,以避免產(chǎn)生高延遲,并結(jié)合適用于該架構(gòu)需求的擁塞控制算法以實現(xiàn)最佳性能。

AI智能網(wǎng)卡Smart NIC主要解決的問題就是通過與交換機、GPU等硬件互聯(lián)實現(xiàn)盡可能的無損通信。由于AI集群的規(guī)模從萬卡到十萬卡演進,北向網(wǎng)絡(luò)的擴展即Scale-out網(wǎng)絡(luò)互聯(lián)(又可以理解為后端網(wǎng)絡(luò))通常需要配備高性能、高帶寬的智能網(wǎng)卡,配合其他硬件設(shè)備共同解決大規(guī)模網(wǎng)絡(luò)擁塞、死鎖、丟包及亂序等一系列網(wǎng)絡(luò)傳輸?shù)膯栴}。智能網(wǎng)卡的功能是重在網(wǎng)絡(luò)加速傳輸,而DPU則更適合需要降低CPU工作負載以及需要加密存儲的多類功能的場景。

以下以AMD不久前發(fā)布的AI網(wǎng)絡(luò)互聯(lián)結(jié)構(gòu)為例可以幫助我們理解原生智能網(wǎng)卡和DPU的應(yīng)用區(qū)別:

傳統(tǒng)以太網(wǎng)Frontend:連接非AI服務(wù)器的其他數(shù)據(jù)中心基礎(chǔ)設(shè)施和外部網(wǎng)絡(luò),需確保安全和存儲加速能力并降低CPU開銷,AMD通過最新的Saline 400 DPU與ZEN 5 EPYC CPU連接并降低其工作負載。

后端網(wǎng)絡(luò)Backend:Scale-out網(wǎng)絡(luò)直接連接GPU,以便共享查詢和激活結(jié)果,支持大規(guī)模訓(xùn)練和推理。當(dāng)前面臨的挑戰(zhàn)主要包括高效擴展、故障恢復(fù)、網(wǎng)絡(luò)擁塞和數(shù)據(jù)丟失等一系列網(wǎng)絡(luò)傳輸問題。AMD使用8張Pollara 400 SmartNIC 與GPU /交換機互通,所以這里的網(wǎng)卡與DPU存在適用場景的區(qū)別。

下一代的智能網(wǎng)卡應(yīng)該具備更高的速率帶寬(400G-800G演進),除了自適應(yīng)路由、選擇性重傳功能以及支持智能堆棧的可擴展性與靈活性,能夠支持更高的QP隊列動態(tài)管理也是重要的優(yōu)選性能之一。隨著UEC超以太聯(lián)盟的壯大以及基于以太網(wǎng) RDMA優(yōu)化的智算網(wǎng)絡(luò)Scale out改進路線的明確,下一代支持UEC的智能網(wǎng)卡將是邁向十萬卡集群的重要互聯(lián)硬件。這些創(chuàng)新技術(shù)為AI網(wǎng)絡(luò)的未來奠定了堅實的基礎(chǔ),使得網(wǎng)絡(luò)更加高效與可靠。

智能網(wǎng)卡和DPU的主要結(jié)構(gòu)區(qū)別

我們以英偉達BlueField-3 DPUs為例來解釋DPU和網(wǎng)卡的主要結(jié)構(gòu)區(qū)別,BlueField 架構(gòu)本質(zhì)上是將網(wǎng)卡子系統(tǒng)(基于 ConnectX)與可編程數(shù)據(jù)路徑、用于加密、壓縮和正則表達式的硬件加速器以及用于控制平面的 Arm控制器融為一體。在 BlueField-3 中,可編程包處理器包含 16 個核可處理 256 個線程,實現(xiàn)了 Arm 核上的零負載數(shù)據(jù)路徑處理。在許多應(yīng)用中,由數(shù)據(jù)路徑自主處理已知的網(wǎng)絡(luò)流量,由 Arm 核處理新流量等例外情況及控制平面功能。

從其內(nèi)部架構(gòu)我們發(fā)現(xiàn)BlueField-3 DPU 自帶一部分CX7的智能網(wǎng)卡網(wǎng)絡(luò)傳輸功能,針對云計算和云原生環(huán)境對多租戶安全及加密的高要求,DPU內(nèi)置了強大的壓縮和加密功能。同時,為了適應(yīng)云計算場景下多樣化的軟件應(yīng)用需求,DPU集成了眾多加速器引擎,并配備了高性能的Arm CPU內(nèi)核,有效減輕了CPU在相關(guān)領(lǐng)域的工作負擔(dān)。

相對而言,智能網(wǎng)卡主要專注于網(wǎng)絡(luò)加速和傳輸性能的提升,其內(nèi)嵌的CPU內(nèi)核更為精簡,對于加密、壓縮功能以及軟件應(yīng)用加速引擎的需求并不高。因此,相較于DPU,智能網(wǎng)卡在功能上顯得更為“輕量級”,這一說法也因此而來。

以上綜述可以得出一個結(jié)論:新一代的SmartNIC的主要面向的是AI網(wǎng)絡(luò),尤其是在分布式訓(xùn)練、大規(guī)模推理的應(yīng)用場景進行網(wǎng)絡(luò)傳輸加速與管理;它使用比DPU更少的計算能力及成本來實現(xiàn)這一目標。反過來說,DPU除了標準的網(wǎng)絡(luò)接口功能,它通常還包含多個處理核心、專用加速模塊(如加密解密、深度包檢查、虛擬化支持)等,普遍成本高于SmartNIC。

GenAI IaaS背景下SmartNIC的需求

根據(jù)國際數(shù)據(jù)公司 (IDC)發(fā)布的《中國智算服務(wù)市場(2023下半年)跟蹤》報告顯示,2023下半年中國智算服務(wù)市場整體規(guī)模達到114.1億元人民幣,同比增長85.8%。其中,2023下半年,智算集成服務(wù)市場規(guī)模為36.0億元人民幣,同比增速129.4%;GenAI IaaS市場在2023年從0到1爆發(fā)式增長,在下半年市場規(guī)模達到32.2億元人民幣;Non-GenAI IaaS市場規(guī)模達到45.9億元人民幣,以較低增速保持增長。

智算集成服務(wù)以及GenAI IaaS貢獻了市場重要增量:回顧整個2023年,中國Gen AI進入發(fā)展元年,智能算力需求爆發(fā)式增長。相比于2022年,2023年智算服務(wù)市場增長81.6億元人民幣。其中GenAI IaaS市場貢獻59%,智算集成服務(wù)市場貢獻38%。

頭部云廠商過往在AI+云計算領(lǐng)域有雙向積累的公司正在獲得先發(fā)優(yōu)勢,如字節(jié)、阿里、百度、騰訊受益于過往在AI領(lǐng)域的沉淀、GPU資源以及在基礎(chǔ)設(shè)施上的領(lǐng)先技術(shù)儲備,在市場上獲得先發(fā)優(yōu)勢并將其資源投入不斷向GenAI IaaS市場靠攏。

隨著AI網(wǎng)絡(luò)技術(shù)的不斷迭代,以Scale-out 互聯(lián)作為集群服務(wù)器間大規(guī)模擴展的需求已經(jīng)成為業(yè)內(nèi)共識。如今,智能網(wǎng)卡作為Scale-out 的關(guān)鍵組件,其產(chǎn)品定位與發(fā)展路線顯然與DPU不同。

根據(jù)Dell’Oro集團發(fā)布的《Ethernet Adapter and Smart NIC 5-Year July 2024 Forecast Report》,預(yù)計到2028年,以太網(wǎng)智能網(wǎng)卡的市場價值將超過160億美元。這一增長主要得益于AI服務(wù)器集群Scale-out對后端網(wǎng)絡(luò)以太網(wǎng)連接的強烈需求。隨著人工智能通用應(yīng)用的出現(xiàn),服務(wù)器與后端以太網(wǎng)網(wǎng)絡(luò)的連接需求日益增長,這對于大型語言模型的訓(xùn)練至關(guān)重要。

以上數(shù)據(jù)并不意味著國內(nèi)DPU的市場已經(jīng)萎縮,由于AI大模型的爆發(fā),云廠商們正在通過加強發(fā)展生態(tài)合作伙伴來尋求異構(gòu)算力的調(diào)度以及基礎(chǔ)設(shè)施的集成,推動云計算與AI網(wǎng)絡(luò)的按需融合。

DPU和智能網(wǎng)卡作為現(xiàn)代網(wǎng)絡(luò)基礎(chǔ)設(shè)施中不可或缺的硬件組件,它們在各自的目標應(yīng)用領(lǐng)域內(nèi)展現(xiàn)出了潛力和廣闊的發(fā)展前景。在我國云計算、邊緣計算以及智算中心的迅猛發(fā)展背景下,我們有理由相信,未來將會有更多創(chuàng)新技術(shù)在這兩類產(chǎn)品中得到推陳出新,為國內(nèi)新質(zhì)生產(chǎn)力的崛起提供支撐。

關(guān)于我們

AI網(wǎng)絡(luò)全棧式互聯(lián)架構(gòu)產(chǎn)品及解決方案提供商

奇異摩爾,成立于2021年初,是一家行業(yè)領(lǐng)先的AI網(wǎng)絡(luò)全棧式互聯(lián)產(chǎn)品及解決方案提供商。公司依托于先進的高性能RDMA 和Chiplet技術(shù),創(chuàng)新性地構(gòu)建了統(tǒng)一互聯(lián)架構(gòu)——Kiwi Fabric,專為超大規(guī)模AI計算平臺量身打造,以滿足其對高性能互聯(lián)的嚴苛需求。我們的產(chǎn)品線豐富而全面,涵蓋了面向不同層次互聯(lián)需求的關(guān)鍵產(chǎn)品,如面向北向Scale out網(wǎng)絡(luò)的AI原生智能網(wǎng)卡、面向南向Scale up網(wǎng)絡(luò)的GPU片間互聯(lián)芯粒、以及面向芯片內(nèi)算力擴展的2.5D/3D IO Die和UCIe Die2Die IP等。這些產(chǎn)品共同構(gòu)成了全鏈路互聯(lián)解決方案,為AI計算提供了堅實的支撐。

奇異摩爾的核心團隊匯聚了來自全球半導(dǎo)體行業(yè)巨頭如NXPIntel、Broadcom等公司的精英,他們憑借豐富的AI互聯(lián)產(chǎn)品研發(fā)和管理經(jīng)驗,致力于推動技術(shù)創(chuàng)新和業(yè)務(wù)發(fā)展。團隊擁有超過50個高性能網(wǎng)絡(luò)及Chiplet量產(chǎn)項目的經(jīng)驗,為公司的產(chǎn)品和服務(wù)提供了強有力的技術(shù)保障。我們的使命是支持一個更具創(chuàng)造力的芯世界,愿景是讓計算變得簡單。奇異摩爾以創(chuàng)新為驅(qū)動力,技術(shù)探索新場景,生態(tài)構(gòu)建新的半導(dǎo)體格局,為高性能AI計算奠定穩(wěn)固的基石。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    14

    文章

    8336

    瀏覽量

    95569
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41156

    瀏覽量

    302622
  • 智能網(wǎng)卡
    +關(guān)注

    關(guān)注

    1

    文章

    53

    瀏覽量

    12773

原文標題:Kiwi Talks | AI網(wǎng)絡(luò)為何需要智能網(wǎng)卡?一文看懂智能網(wǎng)卡與DPU的差異

文章出處:【微信號:奇異摩爾,微信公眾號:奇異摩爾】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    邊緣AI算力臨界點:深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價值

    ) 根據(jù)昇騰社區(qū)開發(fā)者分享的實戰(zhàn)經(jīng)驗,OrangePi AI Station已被用于部署具身智能領(lǐng)域的 ACT (Action Chunking with Transformers) 模型 。在這一案例
    發(fā)表于 03-10 14:19

    使用NORDIC AI的好處

    ,時延更低,系統(tǒng)在網(wǎng)絡(luò)不穩(wěn)定甚至離線時也能繼續(xù)工作。[Edge AI 概述] 提升隱私與可靠性 原始傳感器數(shù)據(jù)(如運動、生理信號等)可以留在本地,只上傳推理結(jié)果,有利于隱私與數(shù)據(jù)安全。 本地決策
    發(fā)表于 01-31 23:16

    瑞芯微SOC智能視覺AI處理器

    需要連接多種外設(shè)的產(chǎn)品。顯示: 支持雙屏異顯,最高4K@60fps輸出。 RK1126B: 一款集成自研NPU的智能視覺AI處理器,專注于視頻輸入端的AI分析與處理。CPU: 雙核A53,主要負責(zé)
    發(fā)表于 12-19 13:44

    AI賦能6G與衛(wèi)星通信:開啟智能天網(wǎng)新時代

    的\"天網(wǎng)\"更加智能、可靠和高效。 AI驅(qū)動的網(wǎng)絡(luò)優(yōu)化:讓6G網(wǎng)絡(luò)\"聰明\"起來 想象一下,當(dāng)城市突然出現(xiàn)大型活動,如體育賽事或音樂節(jié)
    發(fā)表于 10-11 16:01

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    、現(xiàn)階段更智能、更接近AGI的6算法與模型 1、MoE模型 MoE模型作為Transfomer模型的后繼者,代表著AI技術(shù)的一項重大創(chuàng)新和發(fā)展。 優(yōu)勢: 在于能處理龐大的參數(shù)規(guī)模,顯著減少內(nèi)存占用
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+具身智能芯片

    智能的第一層,也是最基礎(chǔ)的一層。 主要負責(zé)從外部環(huán)境獲取數(shù)據(jù),并將這些數(shù)據(jù)轉(zhuǎn)化為計算機可以理解的形式。感知層包括各種傳感器和輸入設(shè)備,如攝像頭、麥克風(fēng)、鍵盤和激光雷達等。 作用:是將外部數(shù)據(jù)轉(zhuǎn)化
    發(fā)表于 09-18 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學(xué)應(yīng)用

    AI被賦予了人的智能,科學(xué)家們希望在沒有人類的引導(dǎo)下,AI自主的提出科學(xué)假設(shè),諾貝爾獎級別的假設(shè)哦。 AI驅(qū)動科學(xué)被認為是科學(xué)發(fā)現(xiàn)的第五個范式了,與實驗科學(xué)、理論科學(xué)、計算科學(xué)、數(shù)據(jù)驅(qū)
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    ②Transformer引擎③NVLink Switch系統(tǒng)④機密計算⑤HBM FPGA: 架構(gòu)的主要特點:可重構(gòu)邏輯和路由,可以快速實現(xiàn)各種不同形式的神經(jīng)網(wǎng)絡(luò)加速。 ASIC: 介紹了幾種ASIC AI芯片
    發(fā)表于 09-12 16:07

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:從AI硬件到AI濕件

    的不同。隨著AI熱潮的興起,大腦的抽象模型已被提煉成各種的AI算法,并使用半導(dǎo)體芯片技術(shù)加以實現(xiàn)。 而大腦是一個由無數(shù)神經(jīng)元通過突觸連接而成的復(fù)雜網(wǎng)絡(luò),是極其復(fù)雜和精密的。大腦在本質(zhì)上就是一臺濕潤的軟組織
    發(fā)表于 09-06 19:12

    AI 邊緣計算網(wǎng)關(guān):開啟智能新時代的鑰匙?—龍興物聯(lián)

    ,這一過程常受網(wǎng)絡(luò)延遲和不穩(wěn)定的困擾。如今,借助 AI 邊緣計算網(wǎng)關(guān),數(shù)據(jù)處理任務(wù)下沉至網(wǎng)絡(luò)邊緣,在本地即可快速完成。以智能安防監(jiān)控為例,在大型商場
    發(fā)表于 08-09 16:40

    【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    的應(yīng)用,最后聚焦類腦芯片、具身智能芯片和AGI芯片等系統(tǒng)級創(chuàng)新,構(gòu)建了完整的AI芯片知識框架。 ▲精彩書摘 另一大特點注重實踐與產(chǎn)業(yè)結(jié)合,書中包含大量產(chǎn)業(yè)實踐案例,介紹各類AI芯片在實際場景
    發(fā)表于 07-28 13:54

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡(luò)智能診斷邁向 “自愈”時代

    模態(tài)的技術(shù)特性,DeepSeek正加速推動AI在金融、政務(wù)、科研及網(wǎng)絡(luò)智能化等關(guān)鍵領(lǐng)域的深度應(yīng)用。 信而泰:AI推理引擎賦能網(wǎng)絡(luò)
    發(fā)表于 07-16 15:29

    最新人工智能硬件培訓(xùn)AI基礎(chǔ)入門學(xué)習(xí)課程參考2025版(離線AI語音視覺識別篇)

    端側(cè)離線 AI 智能硬件作為 AI 技術(shù)的重要載體之一,憑借其無需依賴網(wǎng)絡(luò)即可實現(xiàn)智能功能的特性,在一些
    發(fā)表于 07-04 11:14

    Nordic收購 Neuton.AI 關(guān)于產(chǎn)品技術(shù)的分析

    Nordic Semiconductor 于 2025 年收購了 Neuton.AI,這是一家專注于超小型機器學(xué)習(xí)(TinyML)解決方案的公司。 Neuton 開發(fā)了一種獨特的神經(jīng)網(wǎng)絡(luò)框架,能夠
    發(fā)表于 06-28 14:18

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗】+ 入門篇學(xué)習(xí)

    很高興又有機會學(xué)習(xí)ai技術(shù),這次試讀的是「零基礎(chǔ)開發(fā)AI Agent」,作者葉濤、管鍇、張心雨。 大模型的普及是近三年來的一件大事,萬物皆可大模型已成為趨勢。作為大模型開發(fā)應(yīng)用重要組成部分,提示詞
    發(fā)表于 05-02 09:26
    翼城县| 辽宁省| 平舆县| 喜德县| 嘉峪关市| 伊通| 合作市| 梁河县| 慈利县| 宁津县| 乌拉特后旗| 巴东县| 沅陵县| 宿松县| 岢岚县| 拉萨市| 扶绥县| 连江县| 盐山县| 洛南县| 卫辉市| 肃宁县| 阳山县| 嫩江县| 弥勒县| 长丰县| 革吉县| 金门县| 玛纳斯县| 茶陵县| 芮城县| 九寨沟县| 拜泉县| 精河县| 新沂市| 江川县| 黄骅市| 随州市| 尼木县| 清原| 汶上县|