哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

國產AI算力:從DeepSeek V4與華為昇騰協(xié)同看全棧自主之路

Carol Li ? 來源:電子發(fā)燒友網 ? 作者:李彎彎 ? 2026-04-25 07:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網報道(文/李彎彎)2026年4月24日,DeepSeek V4 - Pro和DeepSeek V4 - Flash正式發(fā)布并開源。模型上下文處理長度從128K大幅提升至1M,新增KV Cache滑窗和壓縮算法,顯著降低計算與訪存開銷,在Agent能力、世界知識和推理性能上處于國內及開源領域領先地位。

與此同時,華為宣布昇騰超節(jié)點全系列產品全面支持DeepSeek V4系列,這場芯模協(xié)同不僅彰顯技術實力,更標志著國產AI算力在擺脫海外依賴、構建全棧自主生態(tài)上邁出關鍵一步。

生態(tài)遷移:從CUDA到CANN的跨越

DeepSeek V4與華為昇騰的合作,核心在于從英偉達CUDA生態(tài)向華為自研的CANN異構計算架構遷移,這一過程遠非簡單的代碼移植。

過去,中國大模型開發(fā)高度依賴英偉達GPU和CUDA生態(tài),從訓練到推理都面臨卡脖子風險。此次遷移需重寫數十萬行底層代碼,重構通信協(xié)議、顯存管理等核心模塊,攻克算子對齊、通信優(yōu)化、內存管理三大技術壁壘。

據傳,DeepSeek團隊耗時14個月攻堅,華為工程師駐場支持,反復調試精度、優(yōu)化算子。最終,經深度優(yōu)化,DeepSeek V4在昇騰950PR上的推理速度較初期版本提升35倍,能耗降低40%。第三方評測顯示,昇騰950PR單卡推理性能達到英偉達特供版H20芯片的2.87倍。這一成果表明國產AI芯片正加速從“可用”邁向“好用”,在特定場景下已具備超越國際主流產品的競爭力。

華為計算官微顯示,華為昇騰950超節(jié)點通過融合kernel和多流并行技術,結合多種量化算法,實現(xiàn)了DeepSeek V4模型的高吞吐、低時延推理部署。具體而言,昇騰950超節(jié)點實現(xiàn)了DeepSeek V4 - Pro 20ms和DeepSeek V4 - Flash 10ms的極低時延推理。在8K輸入場景下,單卡Decode吞吐分別可達4700TPS(V4 - Pro)和1600TPS(V4 - Flash)。這一成就得益于昇騰950底層架構的三大升級:原生精度加速支持FP8、MXFP8等數據格式,內存占用降低50%以上;稀疏訪存優(yōu)化解決MoE模型帶寬瓶頸;Vector與Cube共享Memory設計消除數據搬運開銷。

此外,Atlas 900 A3 SuperPoD液冷超節(jié)點及Atlas 800 A3風冷超節(jié)點采用平等架構、全局內存統(tǒng)一編址、點對點互聯(lián)帶寬達784GB/s。提供32到384多種規(guī)格滿足不同業(yè)務需求,昇騰超節(jié)點是國內唯一成熟規(guī)模商用的超節(jié)點產品,滿足互聯(lián)網、運營商、金融等行業(yè)對大模型推理超高吞吐、超大并發(fā)的極致性能需求。

基于昇騰A3 64卡超節(jié)點結合大EP模式部署,DeepSeek V4-Flash模型,8K/1K輸入輸出場景,基于vLLM推理引擎可實現(xiàn)2000+TPS的單卡Decode吞吐,單卡吞吐持續(xù)提升。針對DeepSeek V4-Pro模型,昇騰A3同步支持推理部署,性能持續(xù)優(yōu)化中。

此次合作意義重大,徹底打破了國產AI對海外技術的依賴。DeepSeek V4成為首個在華為昇騰平臺上完成從訓練到推理完整閉環(huán)的萬億級模型,中國首次擁有了從頂級大模型到自主算力基礎設施的完整、可控的AI技術棧。這不僅是技術上的勝利,更是產業(yè)生態(tài)的轉折點,向市場證明國產算力有能力承載全球頂尖AI模型,且能實現(xiàn)性能與成本的雙重優(yōu)勢。

國產大模型與算力的協(xié)同共進

在DeepSeek V4發(fā)布當天,寒武紀宣布基于自研NeuWare軟件生態(tài)與vLLM框架,完成對DeepSeek V4的“Day 0”適配,并將適配代碼開源至GitHub社區(qū)。這是寒武紀連續(xù)第二次在DeepSeek新模型發(fā)布首日推出國產芯片適配方案,通過自研高性能融合算子庫Torch - MLU - Ops和BangC編程語言,充分釋放硬件底層潛力。

天數智芯也完成了與DeepSeek - V4的Day 0級適配,以天垓系列訓練芯片與智鎧系列推理芯片為核心,承接DeepSeek - V4的全場景應用。此外,DeepSeek V4 - Flash還已經在海光信息、沐曦、摩爾線程(FP8)、昆侖芯、平頭哥真武等國產AI芯片平臺上實現(xiàn)適配。

近年來,隨著先進大模型的發(fā)布和開源,國產AI芯片廠商紛紛發(fā)布Day 0適配消息。如MiniMax M2.7全球開源時,華為昇騰、摩爾線程、沐曦股份、昆侖芯等廠商就宣布推理平臺已完成Day0適配,即在開源首日完成模型接入與推理適配工作。

MiniMax M2.7開源當日,華為昇騰AI基礎軟硬件實現(xiàn)首日適配,基于vllm - Ascend推理引擎在Atlas800A3、Atlas800IA2系列產品上為模型推理部署提供全流程支持;摩爾線程技術團隊基于MUSA架構,針對M2.7的模型特點完成深度調優(yōu),成功在MTTS5000上實現(xiàn)模型高性能推理;沐曦曦云C系列GPU憑借全棧自研的MXMACA軟件棧,首日完成深度適配,實現(xiàn)“模型發(fā)布即算力就緒”的Day0體驗;昆侖芯依托自研架構,通過底層算子優(yōu)化與軟硬件協(xié)同加速,保障M2.7在平臺上的穩(wěn)定、高效運行。

此外,近日騰訊混元Hy3preview語言模型發(fā)布并開源,依托全棧自研技術優(yōu)勢,壁仞科技基于vLLM主流開源框架實現(xiàn)Hy3preview模型的Day0適配及推理驗證。月內該公司旗艦GPU產品適配國內多家大模型,包括月之暗面Kimi K2.6模型、阿里(BABA)Qwen3.6-35B-A3B大模型等。

在AI大模型和芯片領域,適配是關鍵技術術語,指讓軟件在特定硬件或軟件平臺上順利、高效運行的一整套技術工作。國產AI芯片在支持大模型推理上已呈現(xiàn)全面發(fā)展態(tài)勢,此次華為昇騰對DeepSeek V4的全面支持,讓DeepSeek V4擺脫CUDA生態(tài)依賴,使用CANN,國產AI算力實力更上一層樓。

國產AI算力的未來展望

DeepSeek V4與華為昇騰的深度融合,不僅是技術上的成功適配,更是深刻的戰(zhàn)略轉型,標志著中國AI產業(yè)從依賴海外技術邁向全鏈路自主可控。

性能上的反超和成本上的巨大優(yōu)勢,為國產AI的商業(yè)化落地鋪平道路。隨著下半年昇騰950超節(jié)點的批量上市,DeepSeek V4 - Pro的服務價格有望大幅下調,這將加速AI技術在金融、政務、法律等關鍵領域的普及應用。

從數據上來看,全球智能計算芯片市場預計2029年達到5857億美元,2024-2029年年符合增長率37.5%;中國市場增長更快,復合增長率達46.3%,國產AI芯片廠商市場份額有望持續(xù)提升。

展望未來,一個由國產芯片、國產框架、國產大模型構成的完整AI生態(tài)閉環(huán)正在加速形成。這不僅體現(xiàn)了國家科技自立自強的戰(zhàn)略要求,也為全球AI產業(yè)發(fā)展提供了新的思路和模式。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI算力
    +關注

    關注

    1

    文章

    169

    瀏覽量

    10033
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    DeepSeek V3.1發(fā)布!擁抱國產芯片

    架構到Agent能力突破,API價格調整到國產芯片生態(tài)共建,DeepSeek V3.1的發(fā)布標志著中國AI產業(yè)進入技術突破與產業(yè)落地
    的頭像 發(fā)表于 08-23 07:55 ?1.8w次閱讀
    <b class='flag-5'>DeepSeek</b> <b class='flag-5'>V</b>3.1發(fā)布!擁抱<b class='flag-5'>國產</b><b class='flag-5'>算</b><b class='flag-5'>力</b>芯片

    長江計算G940K V2超節(jié)點服務器完成對DeepSeek V4模型極速適配

      4月24日,備受行業(yè)關注的大模型產品DeepSeek V4正式發(fā)布。烽火通信旗下長江計算憑借深厚的技術積累與前瞻布局,以G940K V2超節(jié)點服務器為核心載體,同步完成對
    的頭像 發(fā)表于 04-24 17:40 ?497次閱讀

    端側AI爆發(fā)!斯貝達自研技術,助力國產AI崛起

    江接受采訪,分享了國產AI布局和產品市場拓展等話題。 ?
    的頭像 發(fā)表于 04-14 16:51 ?5116次閱讀

    【硬核發(fā)布】310B盒上新賦能2026集創(chuàng)賽華強x賽道玩轉新創(chuàng)意!

    -TECHNOLOGICALPROGRESS-310BAIBOX上新全場景AI高能效
    的頭像 發(fā)表于 03-27 17:12 ?1174次閱讀
    【硬核發(fā)布】<b class='flag-5'>昇</b><b class='flag-5'>騰</b>310B<b class='flag-5'>算</b><b class='flag-5'>力</b>盒上新賦能2026集創(chuàng)賽華強x<b class='flag-5'>昇</b><b class='flag-5'>騰</b>賽道玩轉新創(chuàng)意!

    國產出海元年開啟

    ? 國產開啟“大航?!睍r代。 黃仁勛前段時間訪華時曾表示:“華為AI芯片取代英偉達只是時間問題?!北藭r,這話多被解讀為對老對手的客套。但
    的頭像 發(fā)表于 03-24 15:15 ?509次閱讀
    <b class='flag-5'>國產</b><b class='flag-5'>算</b><b class='flag-5'>力</b>出海元年開啟

    華為發(fā)布全新950PR,Atlas 350單卡接近3倍于H20

    950PR在低精度數據格式、向量、互聯(lián)帶寬及自研HBM等方面實現(xiàn)大幅提升。 ? 芯片是華為AI
    的頭像 發(fā)表于 03-24 09:08 ?5971次閱讀

    【賽題解析】2026集創(chuàng)賽華強x企業(yè)命題!用國產AI重塑未來數字幻境!

    國產AI打造下一代沉浸式體驗!2026集創(chuàng)賽“華強x”企業(yè)命題火熱報名中!本賽題由華強
    的頭像 發(fā)表于 03-11 08:04 ?767次閱讀
    【賽題解析】2026集創(chuàng)賽華強x<b class='flag-5'>昇</b><b class='flag-5'>騰</b>企業(yè)命題!用<b class='flag-5'>國產</b><b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>重塑未來數字幻境!

    邊緣AI臨界點:深度解析176TOPS香橙派AI Station的產業(yè)價值

    、內存革命:48GB/96GB LPDDR4X 背后的帶寬博弈 很多開發(fā)者容易陷入唯論的誤區(qū),但在實際部署大模型時,內存容量和帶寬往往是真正的性能瓶頸。OrangePi AI St
    發(fā)表于 03-10 14:19

    香橙派系列開發(fā)板如何部署OpenClaw

    OrangePi AIPro8T/20T、AI Station、AI Studio Pro、AI Studio都可以按同樣的步驟操作。 隨著香橙派
    發(fā)表于 02-25 10:13

    國產AI芯片真能扛住“內卷”?海思的這波操作藏了多少細節(jié)?

    最近行業(yè)都在說“AI的命門”,但國產芯片真的能接住這波需求嗎? 前陣子接觸到海思910
    發(fā)表于 10-27 13:12

    華為發(fā)布全球最強超節(jié)點和集群

    華為聯(lián)接大會2025(HUAWEI CONNECT 2025)上,華為發(fā)布最強超節(jié)點和集群,并表示將發(fā)展生態(tài)作為公司核心戰(zhàn)略,提升到
    的頭像 發(fā)表于 10-10 17:29 ?2450次閱讀

    高達2070TFLOPS視科技基于NVIDIA Jetson Thor系列模組,重磅推出AI邊緣智大腦解決方案

    視科技基于NVIDIA Jetson Thor系列模組推出的AI邊緣智大腦解決方案,以其卓越的性能和廣泛的適用性,為物理
    的頭像 發(fā)表于 07-28 18:09 ?1416次閱讀
    高達2070TFLOPS<b class='flag-5'>算</b><b class='flag-5'>力</b>|<b class='flag-5'>騰</b>視科技基于NVIDIA Jetson Thor系列模組,重磅推出<b class='flag-5'>全</b><b class='flag-5'>棧</b><b class='flag-5'>AI</b>邊緣智<b class='flag-5'>算</b>大腦解決方案

    高達2070TFLOPS視科技基于NVIDIA Jetson Thor系列模組,重磅推出AI邊緣智大腦解決方案

    視科技基于NVIDIA Jetson Thor系列模組推出的AI邊緣智大腦解決方案,以其卓越的性能和廣泛的適用性,為物理
    的頭像 發(fā)表于 07-28 16:48 ?1768次閱讀
    高達2070TFLOPS<b class='flag-5'>算</b><b class='flag-5'>力</b>|<b class='flag-5'>騰</b>視科技基于NVIDIA Jetson Thor系列模組,重磅推出<b class='flag-5'>全</b><b class='flag-5'>棧</b><b class='flag-5'>AI</b>邊緣智<b class='flag-5'>算</b>大腦解決方案

    高達2070TFLOPS視科技基于NVIDIA Jetson Thor系列模組,重磅推出AI邊緣智大腦解決方案

    視科技基于NVIDIA Jetson Thor系列模組推出的AI邊緣智大腦解決方案,以其卓越的性能和廣泛的適用性,為物理
    的頭像 發(fā)表于 07-28 16:45 ?1048次閱讀
    高達2070TFLOPS<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>騰</b>視科技基于NVIDIA Jetson Thor系列模組,重磅推出<b class='flag-5'>全</b><b class='flag-5'>棧</b><b class='flag-5'>AI</b>邊緣智<b class='flag-5'>算</b>大腦解決方案

    有關 AI ,華為刷新行業(yè)記錄

    電子發(fā)燒友網報道(文 / 吳子鵬)近日,GitCode 網站上更新了一份題為《 AI 集群基礎設施高可用技術系列報告》的文件。報告顯
    的頭像 發(fā)表于 06-16 01:08 ?6453次閱讀
    有關 <b class='flag-5'>AI</b> <b class='flag-5'>算</b><b class='flag-5'>力</b>,<b class='flag-5'>華為</b><b class='flag-5'>昇</b><b class='flag-5'>騰</b>刷新行業(yè)記錄
    玉树县| 富源县| 濉溪县| 莱阳市| 松潘县| 兖州市| 新野县| 泰顺县| 陈巴尔虎旗| 宝鸡市| 防城港市| 德安县| 梅河口市| 津南区| 奉节县| 余江县| 于田县| 安仁县| 正镶白旗| 彭阳县| 荥阳市| 通道| 博罗县| 繁峙县| 泸水县| 海伦市| 陆良县| 扎赉特旗| 嘉黎县| 沁水县| 五华县| 栾城县| 开封市| 富源县| 海伦市| 荆门市| 玛曲县| 涿鹿县| 东至县| 新蔡县| 习水县|