哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

國產(chǎn)AI換芯提速!DeepSeek V4和小米MiMo-V2.5上線,主流國產(chǎn)芯片適配

章鷹觀察 ? 來源:章鷹觀察 ? 作者:章鷹 ? 2026-04-28 15:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

4月24日,中國 AI 新創(chuàng)公司 DeepSeek 宣布兩條重大消息:一是公司首次啟動融資,目標估值從100億美元迅速抬升至200億美元到300億美元,騰訊、阿里正在洽談入局;二是DeepSeek正式發(fā)布全新系列 AI 大模型 DeepSeek-V4 的預覽版本并同步開源,憑借百萬字超長上下文及領先的 Agent 能力引發(fā)業(yè)界高度關注。

4月25日,梁文鋒出手了,DeepSeek-V4-Pro開啟限時2.5折優(yōu)惠,輸入價格(緩存命中)降至0.25元/百萬tokens。4月26日晚間,DeepSeek就再次降價。全系API輸入緩存命中價格直接降至首發(fā)價的1/10。

4月28日,小米技術(shù)官方宣布最強模型小米 MiMo-V2.5 系列,該系列采用MIT協(xié)議,支持商用推理部署與二次訓練,無需額外授權(quán)。小米MiMo-V2.5開源 & Orbit 百萬億 Token 計劃啟動。

這兩款新AI大模型各有何優(yōu)勢?在芯片適配方面,已經(jīng)進展到哪里?本文進行解析。

DeepSeek V4具備強悍性能,適配國產(chǎn)主流AI芯片

4月24日,DeepSeek-V4預覽版本上線并同步開源,包含DeepSeek-V4-Pro和DeepSeek-V4-Flash兩個模型。DeepSeek-V4-Pro總參數(shù)1.6萬億,每次推理激活490億參數(shù),定位對標頂級閉源模型,適用于復雜推理、智能體(Agent)及長文本處理。DeepSeek-V4-Flash總參數(shù)2840億,激活130億參數(shù),主打高性價比,適合高并發(fā)、輕量化場景。

DeepSeek V4 Pro新模型將總參數(shù)推至1.6萬億,首次將百萬token上下文打成標配,并實現(xiàn)了百萬上下文下每token的算力消耗僅為V3.2的27%,KV緩存占用只有10%。

DeepSeek V4 在編程(如 SWE-Bench、HumanEval)和數(shù)學推理(如奧數(shù)題)方面的表現(xiàn)非常出色,甚至在部分開源榜單上超越了 GPT-5.4 和 Claude Opus 4.6 的非思考模式。它非常適合程序員用來寫代碼、做復雜邏輯分析。

模型輸出質(zhì)量上,V4同時支持三檔推理強度,并針對Agentic Coding做了專項優(yōu)化。

在性能層面,DeepSeek-V4-Pro 實現(xiàn)了顯著突破。技術(shù)報告顯示,該模型在 Agent 能力上達到開源模型最佳水平,Agentic Coding 使用體驗優(yōu)于閉源的 Claude Sonnet 4.5。

目前,模型已經(jīng)為華為昇騰950芯片完成適配,預計下半年昇騰950超節(jié)點批量上市后,V4 Pro價格進一步下調(diào)。華為昇騰超節(jié)點全系列產(chǎn)品已支持DeepSeek V4系列模型,實現(xiàn)DeepSeek V4-Pro20ms和DeepSeek V4-Flash 10ms低時延推理。

DeepSeek在推理引擎層面兼容CUDA與昇騰CANN并支持FP4/FP8等低精度策略,顯著縮短“模型發(fā)布—芯片適配—產(chǎn)業(yè)部署”的時間差,驗證國產(chǎn)卡在超長序列與大規(guī)模推理場景的可用性與性價比,推動“國模國芯”從跑通到高效協(xié)同的躍遷。

此外,寒武紀、海光信息、摩爾線程、天數(shù)智芯、沐曦等國產(chǎn)芯片廠商也宣布支持DeepSeek-V4新模型。寒武紀基于vLLM推理框架完成Day 0適配,適配代碼已開源至GitHub社區(qū),支持DeepSeek-V4-Pro和DeepSeek-V4-Flash。

海光DCU(深算系列)完成對DeepSeek-V4的Day 0適配,并對模型進行深度調(diào)優(yōu),形成“模型發(fā)布—芯片適配—產(chǎn)業(yè)落地”的閉環(huán),提供即取即用的部署方案。

摩爾線程完成 DeepSeek V4 適配的芯片是其旗艦級 AI 訓推一體全功能 GPU——MTT S5000。此次適配由摩爾線程聯(lián)合智源 FlagOS 社區(qū)共同完成,實現(xiàn)了對 DeepSeek-V4-Flash 模型的“Day-0”(發(fā)布即適配)極速支持,并完成了全量核心算子的深度優(yōu)化。

4月24日,DeepSeek V4發(fā)布當日,上海AI實驗室DeepLink團隊依托KernelSwift智能算子遷移系統(tǒng),完成DeepSeek-V4核心算子在多元芯片的Day 0適配,天數(shù)智芯作為核心合作方,實現(xiàn)天垓訓練芯片、智鎧推理芯片對該模型的核心算子適配。

DeepSeekV4是國內(nèi)首個在華為昇騰 910B/C 等國產(chǎn)芯片上實現(xiàn)“開箱即用”的萬億參數(shù)模型。這意味著在不依賴英偉達高端AI芯片的情況下,國內(nèi)企業(yè)也能低成本運行頂級大模型,戰(zhàn)略意義重大。

根據(jù)OpenRouter的數(shù)據(jù), 2026年3月30日-4月5日,中國AI模型的周調(diào)用量突破12.96萬億Token,是同期美國的4.3倍,國產(chǎn)化無疑有著巨大的市場前景。

小米MiMo-V2.5定位多模態(tài)模型,多個性能超過DeepSeek V4,首日適配國產(chǎn)五大芯片

4月28日,小米宣布旗下最強模型 MiMo-V2.5 系列,包括帶來V2.5-Pro和V2.5兩款版本,MiMo-V2.5-Pro 為混合專家架構(gòu)(MoE)模型,總參數(shù)量達 1.02 兆(1.02T),其中 420 億(42B)個啟動參數(shù),支持最長 100 萬 Token 的超長上下文處理,Token 效率相較前代大幅提升。

MiMo-V2.5系列包含兩款模型,均支持100萬上下文窗口。其中,MiMo-V2.5-Pro主打復雜任務場景,可以支持1T的超大參數(shù)量,以及1M超長上下文的模型推理。該模型深度適配Agent與Coding應用,在GDPVal-AA和ClawEval榜單上位列全球開源模型第一。

模型采局部滑動窗口注意力(SWA)與全局注意力(GA)以 6:1 比例交錯設計,可在長上下文場景下將 KV 高速緩存占用縮減近 7 倍,同時維持效能表現(xiàn)。此外,內(nèi)建輕量級多標記預測(MTP)模塊,可將輸出吞吐量提升約三倍,并加速強化學習部署。

預訓練規(guī)模方面,MiMo-V2.5-Pro 使用 27 兆(27T)個 Token、FP8 混合精度進行訓練,原生序列長度 32K,再透過上下文擴展至 100 萬 Token。

小米公布的最新評測結(jié)果顯示,MiMo-V2.5-Pro 在 GDPVal-AA(Elo)、Claw-Eval(Pass^3)等多項基準檢驗中,超越了 DeepSeek 最新開源的 DeepSeek-V4-Pro,也優(yōu)于甫發(fā)布不久的 Kimi K2.6 等主流閉源模型,總體排名第一。

MiMo-V2.5-Pro已于開源首日完成多個芯片廠商的接入適配,其中包括阿里平頭哥、亞馬遜云科技(基于 Trainium2 芯片)、AMD、百度昆侖芯、燧原科技、沐曦、天數(shù)智芯七家芯片廠商接入適配,同步完成 SGLang 與 vLLM 兩大主流推理框架的 Day 0 適配。

小米同步推出「MiMo Orbit 計劃」,涵蓋兩大方向:百兆 Token 創(chuàng)造者激勵計劃:面向全球 AI 用戶,于 2026 年 4 月 28 日至 5 月 28 日期間免費發(fā)放共計 100 兆 Token 權(quán)益,通過審核者最高可獲得價值人民幣 659 元的 Max 檔位 Token Plan,額度發(fā)完為止。

代理生態(tài)共建計劃:面向全球代理框架團隊,提供 Token 免費支持,并共同舉辦 AI Hackathon 等活動,目前已與 OpenCode、Hermes Agent、KiloCode 等框架廠商展開深度合作。

而在4月28日, DeepSeek官網(wǎng)API文檔相關頁面顯示,當前deepseek-v4-pro模型的2.5折優(yōu)惠活動將延長至今年5月31日23:59。目前,deepseek-v4-pro的輸入價格(緩存命中)為0.025元(每百萬tokens),輸入價格(緩存未命中)為3元,輸出價格為6元。使用成本遠低于美國競爭對手,僅為 OpenAI 同類產(chǎn)品價格的 3%,分析人士認為此舉旨在吸引更多企業(yè)用戶與開發(fā)者

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    463

    文章

    54448

    瀏覽量

    469457
  • 小米
    +關注

    關注

    70

    文章

    14551

    瀏覽量

    152604
  • AI大模型
    +關注

    關注

    0

    文章

    409

    瀏覽量

    1042
  • DeepSeek
    +關注

    關注

    2

    文章

    847

    瀏覽量

    3406
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    DeepSeek V3.1發(fā)布!擁抱國產(chǎn)算力芯片

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)2025年8月21日,DeepSeek正式官宣發(fā)布DeepSeek-V3.1大模型。新版本不僅在技術(shù)架構(gòu)上實現(xiàn)重大升級,更通過參數(shù)精度優(yōu)化與國產(chǎn)芯片深度
    的頭像 發(fā)表于 08-23 07:55 ?1.8w次閱讀
    <b class='flag-5'>DeepSeek</b> <b class='flag-5'>V</b>3.1發(fā)布!擁抱<b class='flag-5'>國產(chǎn)</b>算力<b class='flag-5'>芯片</b>

    華為云首發(fā)適配DeepSeek-V4模型

    4月24日,DeepSeek-V4模型正式發(fā)布并開源,華為云首發(fā)適配。DeepSeek-V4擁有百萬Token超長上下文,在Agent能力、世界知識和推理性能上均實現(xiàn)國內(nèi)與開源領域的領
    的頭像 發(fā)表于 04-28 17:01 ?64次閱讀

    軟通華方超節(jié)點服務器產(chǎn)品全面適配DeepSeek V4模型

    超節(jié)點服務器,率先完成了對DeepSeek V4的全棧適配與驗證工作。這一舉措不僅展現(xiàn)了公司在國產(chǎn)算力領域的深厚技術(shù)積淀,更為廣大企業(yè)用戶提供了穩(wěn)定、高效的算力底座,加速
    的頭像 發(fā)表于 04-28 16:34 ?44次閱讀

    沐曦股份曦云C系列GPU產(chǎn)品Day 0適配小米MiMo-V2.5-Pro模型

    4月23日,小米開啟 MiMo-V2.5系列模型的公測,并于4月28日正式發(fā)布及開源。沐曦股份已同步完成對 MiMo-V2.5-Pro 的
    的頭像 發(fā)表于 04-28 15:59 ?50次閱讀
    沐曦股份曦云C系列GPU產(chǎn)品Day 0<b class='flag-5'>適配</b><b class='flag-5'>小米</b><b class='flag-5'>MiMo-V2.5</b>-Pro模型

    沐曦股份Day 0適配DeepSeek-V4-Flash模型

    4月24日,沐曦股份攜手FlagOS,已完對DeepSeek最新開源的DeepSeek-V4-Flash模型的Day 0適配。同日,沐曦股份還聯(lián)合上海人工智能實驗室KernelSwif
    的頭像 發(fā)表于 04-28 15:53 ?42次閱讀

    燧原科技L600極速適配小米MiMo-V2.5-Pro系列模型

    2026年4月28日,小米正式發(fā)布 MiMo-V2.5-Pro 系列模型,并于同日正式開源。燧原科技已同步完成對 MiMo-V2.5-Pro的 Day-0 極速
    的頭像 發(fā)表于 04-28 15:21 ?76次閱讀
    燧原科技L600極速<b class='flag-5'>適配</b><b class='flag-5'>小米</b><b class='flag-5'>MiMo-V2.5</b>-Pro系列模型

    燧原科技L600 FP8原生適配DeepSeek-V4-Pro/Flash模型

    2026年4月24日,深度求索(DeepSeek)正式發(fā)布并開源新一代旗艦大模型DeepSeek?V4,同步推出1.6T DeepSeek?
    的頭像 發(fā)表于 04-28 15:19 ?141次閱讀

    國產(chǎn)AI算力:從DeepSeek V4與華為昇騰協(xié)同看全棧自主之路

    Cache滑窗和壓縮算法,顯著降低計算與訪存開銷,在Agent能力、世界知識和推理性能上處于國內(nèi)及開源領域領先地位。 ? 與此同時,華為宣布昇騰超節(jié)點全系列產(chǎn)品全面支持DeepSeek V4系列,這場
    的頭像 發(fā)表于 04-25 07:02 ?6941次閱讀

    長江計算G940K V2超節(jié)點服務器完成對DeepSeek V4模型極速適配

      4月24日,備受行業(yè)關注的大模型產(chǎn)品DeepSeek V4正式發(fā)布。烽火通信旗下長江計算憑借深厚的技術(shù)積累與前瞻布局,以G940K V2超節(jié)點服務器為核心載體,同步完成對
    的頭像 發(fā)表于 04-24 17:40 ?1674次閱讀

    海光信息DCU平臺完成對DeepSeek V4模型極速適配

      4月24日,深度求索正式發(fā)布并開源DeepSeek V4。海光DCU同步完成對DeepSeek V4的Day0
    的頭像 發(fā)表于 04-24 17:32 ?1552次閱讀

    摩爾線程S5000 + 智源FlagOS:基于原生FP8引擎,Day-0適配DeepSeek-V4

    推理力度模式(Flash-Max)下推理能力逼近Pro版本。值得關注的是,V4模型首次采用“FP4+FP8”混合精度策略,而當前國內(nèi)主流 AI 芯片
    發(fā)表于 04-24 16:30 ?1005次閱讀
    摩爾線程S5000 + 智源FlagOS:基于原生FP8引擎,Day-0<b class='flag-5'>適配</b><b class='flag-5'>DeepSeek-V4</b>

    昆侖萬維天工AI大模型SkyReels V4登上Artificial Analysis榜單全球第一

    3月19日,天工AI大模型SkyReels V4登上Artificial Analysis榜單Text to Video (With Audio) 賽道全球第一,顯著超越Kling 3.0
    的頭像 發(fā)表于 03-26 10:10 ?963次閱讀

    太初元碁:40+AI大模型全覆蓋,新版本即發(fā)即適配、上線即可用,實現(xiàn)國產(chǎn)”速度

    日前,國產(chǎn)AI芯片企業(yè)太初(無錫)電子科技有限公司(又稱“太初元碁”)完成智譜GLM-5.0、阿里千問Qwen3.5-397B-A17B等大模型的深度適配,截至目前,其已完成包括
    的頭像 發(fā)表于 02-25 09:21 ?2053次閱讀

    中科曙光AI超集群系統(tǒng)和scaleX640超節(jié)點等產(chǎn)品全面適配DeepSeek V3.2

    12月1日,DeepSeek正式發(fā)布DeepSeek-V3.2和DeepSeek-V3.2-Speciale,大幅強化Agent能力,融入思考推理?;谥袊讉€AI計算開放架構(gòu),硬件層
    的頭像 發(fā)表于 12-05 14:32 ?963次閱讀

    國產(chǎn)SL4013芯片如何實現(xiàn)USB 5V升壓至24V以上?

    穩(wěn)定。 國產(chǎn)SL4013芯片通過技術(shù)創(chuàng)新與工程優(yōu)化,成功解決了USB 5V升壓至24V+場景下的效率、穩(wěn)定性與成本難題。其?高集成度設計?(僅需4
    發(fā)表于 04-28 17:39
    昆山市| 新昌县| 阜新市| 望江县| 滨海县| 廊坊市| 云龙县| 双峰县| 阿城市| 淳安县| 玛纳斯县| 尖扎县| 老河口市| 阜新市| 剑河县| 海盐县| 伊宁县| 汝南县| 兴隆县| 犍为县| 陈巴尔虎旗| 阿鲁科尔沁旗| 嘉义市| 安福县| 昭苏县| 崇仁县| 察隅县| 溧水县| 金堂县| 清河县| 鹤峰县| 和政县| 杨浦区| 紫阳县| 松原市| 确山县| 囊谦县| 固阳县| 柘城县| 古蔺县| 鄯善县|