
圖1:移動云磐石智算交換機
圖2:超節(jié)點AI算力集群
在大會現(xiàn)場,記者也先后看到華為、中興、中科海光、超聚變等廠商展示超節(jié)點AI集群服務器,在奔向AI+時代當中,AI算力的需求發(fā)生了哪些變化?頭部通信運營商、互聯(lián)網(wǎng)巨頭是怎樣看待這些變化?國產(chǎn)算力芯片又有了哪些最新的進展?記者結(jié)合最新的實地采訪和前沿產(chǎn)品和大家分析。
中移動+三大互聯(lián)網(wǎng)巨頭布局AI智算,大型自主算力供給亟需國產(chǎn)芯片突破
鵬城實驗室高效能云計算所所長余躍表示,2025年以來,國內(nèi)外算力發(fā)展模式呈現(xiàn)不同路徑,國外十萬卡集群在如火如荼的建設當中,特別像“星際之門”這樣規(guī)模的集群快速建設,全球算力資源正在加速向少數(shù)國家、少數(shù)科技巨頭集中,呈現(xiàn)出高度不均衡的發(fā)展態(tài)勢。中國算力總量居世界第二位,但單體算力與國外大型算力相比尚存在差距,亟需通過有組織方式推進分散算力的互聯(lián)協(xié)同。

“從通信層、計算層、網(wǎng)絡層和應用層形成全棧式的關鍵挑戰(zhàn),算力網(wǎng)的四大技術大山分別是:一、大型自主算力供給與應用,比如從千卡走向萬卡,從萬卡走向十萬卡,十萬卡集群以華為384超節(jié)點Atlas 900 A3 SuperProD為代表,在上面能否訓練大模型方向的智能化服務;二、芯光纖通信與網(wǎng)絡傳輸,即算力從局域網(wǎng)到廣域,芯片互聯(lián)集群走向IDC之間的互聯(lián),大型的傳輸如何解決;三、協(xié)同調(diào)度和算力協(xié)同標準,不同的算力中心使用不同的芯片,彼此之間有不同的異構,中間的計算層的互聯(lián)適配非常難;四、安全可信的計算環(huán)境?!?余躍分析說。
考慮到美國禁止高端算力芯片向中國供應,大型自主算力供給已經(jīng)成為目前的卡點。美國人工智能芯片龍頭企業(yè)英偉達CEO黃仁勛預測,預測今年中國AI市場約有500億美元的機會,并且每年還會增長50%。
電子發(fā)燒友通過多位供應鏈人士了解到,按保守計算,2024年中國市場英偉達H20系列芯片出貨量約為60萬-80萬枚,某國產(chǎn)主流AI芯片出貨量約為30萬-40萬枚。中國2024年對AI芯片的需求大約100萬枚。而2025年,中國移動、字節(jié)跳動、騰訊、阿里都在加大算力設施的投入力度,意味著需要更多AI芯片采購。
據(jù)悉,2025年中國移動在智算領域投入373億元,AI直接投資超百億元,智算總規(guī)模達61.3 EFLOPS,并啟動50億元級AI推理設備集采,全面構建“云-邊-端”一體化智算體系。此外,公開消息顯示,字節(jié)跳動2025年AI資本投入1600億元人民幣,其中AI芯片采購采用了海外和國產(chǎn)芯片雙渠道模式。
8月13日,騰訊總裁劉熾平在Q2業(yè)績會表示,元寶、AI搜索等多個應用場景的用戶數(shù)提升帶來推理負載占比提升,公司考慮推理芯片供應渠道側(cè)具備多種選擇。鑒于海外高端芯片貿(mào)易政策仍存在較大不確定性,騰訊有望依托華為、寒武紀、海光等國產(chǎn)廠商的推理芯片滿足相關算力需求。
8月21日,DeepSeek更新模型版本至DeepSeek-V3.1,新版本模型相比前代模型能在更短時間內(nèi)給出答案,具備更強的Agent能力,新版本模型使用了UE8M0 FP8 Scale參數(shù)精度,DeepSeek表示新精度格式針對即將發(fā)布的下一代預計將國產(chǎn)芯片設計。
9月24日,在2025年阿里云棲大會上,阿里巴巴集團CEO兼阿里云智能集團董事長吳泳銘宣布了公司迄今為止最激進的AI投資計劃,未來三年(2025–2027年)將投入超過3800億元人民幣,用于云計算與AI硬件基礎設施建設。資金用于建設AI算力中心和AI芯片、服務器集群采購,以及通義千問大模型等AI基礎模型研發(fā)。
支持UE8MO FP8精度,國產(chǎn)算力芯片新品迭出
2025年,在出口管制與國產(chǎn)替代雙重刺激下,國產(chǎn)AI算力芯片進入“新品爆發(fā)期”。AI芯片呈現(xiàn)三大發(fā)展趨勢:高效能(提升單位功耗算力輸出)、高精度(增強數(shù)據(jù)處理準確性)、軟硬協(xié)同(優(yōu)化芯片與軟件棧適配性),其中,高精度計算能力的突破尤為關鍵。
10月10日,在2025中國移動伙伴大會2層華為展區(qū)前,昇騰384超節(jié)點Atlas 900 A3 SuperProD最受矚目。該產(chǎn)品通過總線技術實現(xiàn)384個NPU之間的大帶寬低延時互聯(lián),算力規(guī)模300 PFlops,單卡的推理量,從每秒600Token躍升到現(xiàn)在每秒2300Token,提升4倍,成功打破跨機通信帶寬性能瓶頸,實現(xiàn)從服務器級到矩陣級的資源供給模式轉(zhuǎn)變。

圖:華為超節(jié)點產(chǎn)品Atlas 900SuperPoD 電子發(fā)燒友拍攝
早在9月18日華為全連接大會2025上,華為副董事長、輪值董事長徐直軍宣布:“華為發(fā)布了最新超節(jié)點產(chǎn)品Atlas 950SuperPoD和Atlas 960SuperPoD超節(jié)點,分別支持8192及15488張昇騰卡,在卡規(guī)模、總算力、內(nèi)存容量、互聯(lián)帶寬等關鍵指標上全面領先,在未來多年都將是全球最強算力的超節(jié)點。Atlas 950SuperPoD預計2025年四季度上市,Atlas 960SuperPoD預計2027年四季度上市。”
徐直軍介紹,未來三年華為規(guī)劃多款昇騰算力芯片,包括昇騰 950PR、950DT、以及昇騰960和970,其中昇騰950PR 將在2026年第一季度對外推出,該芯片采用了華為自研HBM。
據(jù)悉,昇騰950PR芯片架構新增支持低精度數(shù)據(jù)格式,其中FP8/MXFP8/HIF8: 1 PFLOPS,MXFP4: 2 PFLOPS,重點提升向量算力,提升互聯(lián)寬帶2.5倍,支持華為自研HBM高帶寬內(nèi)存,分為HiBL 1.0和HiZQ 2.0兩個版本。規(guī)格方面,HiBL 1.0容量128GB,帶寬1.6TB/s;HiZQ 2.0容量144GB,帶寬4TB/s。
此外,昇騰950DT采用HiZQ 2.0內(nèi)存,可提升推理Decode(解碼)性能,提升訓練性能,提升內(nèi)存容量和帶寬。
寒武紀則在7月份的上海人工智能大會展示了最新的云端智能訓練芯片思元590,采用 MLUarch05 全新架構,實測訓練性能較在售旗艦產(chǎn)品大幅提升,提供了更大的內(nèi)存容量和更高的內(nèi)存帶寬,其 IO 和片間互聯(lián)接口也實現(xiàn)大幅升級,讓 AI 運算速度更快,處理復雜任務更得心應手 。
海光信息在AI大算力芯片(DCU)領域已形成“深算一號、二號、三號、四號”的梯次迭代,并率先實現(xiàn)商業(yè)落地,成為國產(chǎn)GPU陣營里唯一能穩(wěn)定盈利、批量供貨的玩家。記者在中移動合作伙伴大會現(xiàn)場看到,中興海光服務器廣泛部署中國移動關鍵業(yè)務場景,HYGON DCU深算二號K100-AI是訓推一體機,覆蓋邊緣一體機到大型數(shù)據(jù)中心的集群部署。

圖:中興海光合作推出訓推一體機 電子發(fā)燒友拍攝
海光信息的新一代AI 算力芯片同樣表現(xiàn)出色,采用 7 納米制程技術,配備 16 核處理器,運算速度相比前一代提升了 50%,功耗卻大幅降低。海光信息官方微信也顯示,9月29日,DeepSeek-V3.2-Exp發(fā)布并且開源,引入稀疏Attention架構,海光DCU第一時間實現(xiàn)無縫適配+深度調(diào)優(yōu),高效支持Tilelang算子,確保大模型算力“零等待”部署。
百度今年推出最新一代昆侖芯P800系列產(chǎn)品,采用昆侖芯100%自研的XPU-P架構,憑借卓越的計算性能、完善的軟件生態(tài)和領先的大規(guī)模部署能力,該芯片已在國產(chǎn)AI芯片行業(yè)內(nèi)率先實現(xiàn)3萬卡集群的成功部署。
本文由電子發(fā)燒友原創(chuàng),轉(zhuǎn)載請注明以上來源。微信號zy1052625525。需入群交流,請?zhí)砑游⑿舉lecfans999,投稿爆料采訪需求,請發(fā)郵箱zhangying@huaqiu.com。
-
華為
+關注
關注
218文章
36153瀏覽量
262572 -
寒武紀
+關注
關注
13文章
218瀏覽量
75047
發(fā)布評論請先 登錄
端側(cè)AI爆發(fā)!斯貝達全棧自研技術,助力國產(chǎn)AI算力崛起
國內(nèi)首個國產(chǎn)AI推理千卡集群落地,采用云天勵飛全自研AI推理芯片
中科曙光3套scaleX萬卡超集群落地國家超算互聯(lián)網(wǎng)鄭州核心節(jié)點
中科曙光scaleX萬卡超集群重塑超大規(guī)模算力基礎設施
中科曙光scaleX萬卡超集群背后的持續(xù)創(chuàng)新
墨芯人工智能千卡集群正式簽約入駐新疆算力中心
國產(chǎn)AI芯片真能扛住“算力內(nèi)卷”?海思昇騰的這波操作藏了多少細節(jié)?
華為發(fā)布全球最強算力超節(jié)點和集群
壁仞科技聯(lián)合三方打造國產(chǎn)算力集群落地
從萬卡集群到十萬卡集群,燧原科技始終踐行算力普惠
華為領銜,三劍客入局!十萬卡智算集群落地,國產(chǎn)算力芯片強勢崛起
評論