久久久夜夜夜视频,日本视频12345区

4月24日，中國 AI 新創(chuàng)公司 DeepSeek 宣布兩條重大消息：一是公司首次啟動融資，目標估值從100億美元迅速抬升至200億美元到300億美元，騰訊、阿里正在洽談入局；二是DeepSeek正式發(fā)布全新系列 AI 大模型 DeepSeek-V4 的預覽版本并同步開源，憑借百萬字超長上下文及領先的 Agent 能力引發(fā)業(yè)界高度關注。

4月25日，梁文鋒出手了，DeepSeek-V4-Pro開啟限時2.5折優(yōu)惠，輸入價格（緩存命中）降至0.25元/百萬tokens。4月26日晚間，DeepSeek就再次降價。全系API輸入緩存命中價格直接降至首發(fā)價的1/10。

4月28日，小米技術(shù)官方宣布最強模型小米 MiMo-V2.5 系列，該系列采用MIT協(xié)議，支持商用推理部署與二次訓練，無需額外授權(quán)。小米MiMo-V2.5開源＆ Orbit 百萬億 Token 計劃啟動。

這兩款新AI大模型各有何優(yōu)勢？在芯片適配方面，已經(jīng)進展到哪里？本文進行解析。

DeepSeek V4具備強悍性能，適配國產(chǎn)主流AI芯片

4月24日，DeepSeek-V4預覽版本上線并同步開源，包含DeepSeek-V4-Pro和DeepSeek-V4-Flash兩個模型。DeepSeek-V4-Pro總參數(shù)1.6萬億，每次推理激活490億參數(shù)，定位對標頂級閉源模型，適用于復雜推理、智能體（Agent）及長文本處理。DeepSeek-V4-Flash總參數(shù)2840億，激活130億參數(shù)，主打高性價比，適合高并發(fā)、輕量化場景。

DeepSeek V4 Pro新模型將總參數(shù)推至1.6萬億，首次將百萬token上下文打成標配，并實現(xiàn)了百萬上下文下每token的算力消耗僅為V3.2的27%，KV緩存占用只有10%。

DeepSeek V4 在編程（如 SWE-Bench、HumanEval）和數(shù)學推理（如奧數(shù)題）方面的表現(xiàn)非常出色，甚至在部分開源榜單上超越了 GPT-5.4 和 Claude Opus 4.6 的非思考模式。它非常適合程序員用來寫代碼、做復雜邏輯分析。

模型輸出質(zhì)量上，V4同時支持三檔推理強度，并針對Agentic Coding做了專項優(yōu)化。

在性能層面，DeepSeek-V4-Pro 實現(xiàn)了顯著突破。技術(shù)報告顯示，該模型在 Agent 能力上達到開源模型最佳水平，Agentic Coding 使用體驗優(yōu)于閉源的 Claude Sonnet 4.5。

目前，模型已經(jīng)為華為昇騰950芯片完成適配，預計下半年昇騰950超節(jié)點批量上市后，V4 Pro價格進一步下調(diào)。華為昇騰超節(jié)點全系列產(chǎn)品已支持DeepSeek V4系列模型，實現(xiàn)DeepSeek V4-Pro20ms和DeepSeek V4-Flash 10ms低時延推理。

DeepSeek在推理引擎層面兼容CUDA與昇騰CANN并支持FP4/FP8等低精度策略，顯著縮短“模型發(fā)布—芯片適配—產(chǎn)業(yè)部署”的時間差，驗證國產(chǎn)卡在超長序列與大規(guī)模推理場景的可用性與性價比，推動“國模國芯”從跑通到高效協(xié)同的躍遷。

此外，寒武紀、海光信息、摩爾線程、天數(shù)智芯、沐曦等國產(chǎn)芯片廠商也宣布支持DeepSeek-V4新模型。寒武紀基于vLLM推理框架完成Day 0適配，適配代碼已開源至GitHub社區(qū)，支持DeepSeek-V4-Pro和DeepSeek-V4-Flash。

海光DCU（深算系列）完成對DeepSeek-V4的Day 0適配，并對模型進行深度調(diào)優(yōu)，形成“模型發(fā)布—芯片適配—產(chǎn)業(yè)落地”的閉環(huán)，提供即取即用的部署方案。

摩爾線程完成 DeepSeek V4 適配的芯片是其旗艦級 AI 訓推一體全功能 GPU——MTT S5000。此次適配由摩爾線程聯(lián)合智源 FlagOS 社區(qū)共同完成，實現(xiàn)了對 DeepSeek-V4-Flash 模型的“Day-0”（發(fā)布即適配）極速支持，并完成了全量核心算子的深度優(yōu)化。

4月24日，DeepSeek V4發(fā)布當日，上海AI實驗室DeepLink團隊依托KernelSwift智能算子遷移系統(tǒng)，完成DeepSeek-V4核心算子在多元芯片的Day 0適配，天數(shù)智芯作為核心合作方，實現(xiàn)天垓訓練芯片、智鎧推理芯片對該模型的核心算子適配。

DeepSeekV4是國內(nèi)首個在華為昇騰 910B/C 等國產(chǎn)芯片上實現(xiàn)“開箱即用”的萬億參數(shù)模型。這意味著在不依賴英偉達高端AI芯片的情況下，國內(nèi)企業(yè)也能低成本運行頂級大模型，戰(zhàn)略意義重大。

根據(jù)OpenRouter的數(shù)據(jù)， 2026年3月30日-4月5日，中國AI模型的周調(diào)用量突破12.96萬億Token，是同期美國的4.3倍，國產(chǎn)化無疑有著巨大的市場前景。

小米MiMo-V2.5定位多模態(tài)模型，多個性能超過DeepSeek V4，首日適配國產(chǎn)五大芯片

4月28日，小米宣布旗下最強模型 MiMo-V2.5 系列，包括帶來V2.5-Pro和V2.5兩款版本，MiMo-V2.5-Pro 為混合專家架構(gòu)（MoE）模型，總參數(shù)量達 1.02 兆（1.02T），其中 420 億（42B）個啟動參數(shù)，支持最長 100 萬 Token 的超長上下文處理，Token 效率相較前代大幅提升。

MiMo-V2.5系列包含兩款模型，均支持100萬上下文窗口。其中，MiMo-V2.5-Pro主打復雜任務場景，可以支持1T的超大參數(shù)量，以及1M超長上下文的模型推理。該模型深度適配Agent與Coding應用，在GDPVal-AA和ClawEval榜單上位列全球開源模型第一。

模型采局部滑動窗口注意力（SWA）與全局注意力（GA）以 6:1 比例交錯設計，可在長上下文場景下將 KV 高速緩存占用縮減近 7 倍，同時維持效能表現(xiàn)。此外，內(nèi)建輕量級多標記預測（MTP）模塊，可將輸出吞吐量提升約三倍，并加速強化學習部署。

預訓練規(guī)模方面，MiMo-V2.5-Pro 使用 27 兆（27T）個 Token、FP8 混合精度進行訓練，原生序列長度 32K，再透過上下文擴展至 100 萬 Token。

小米公布的最新評測結(jié)果顯示，MiMo-V2.5-Pro 在 GDPVal-AA（Elo）、Claw-Eval（Pass^3）等多項基準檢驗中，超越了 DeepSeek 最新開源的 DeepSeek-V4-Pro，也優(yōu)于甫發(fā)布不久的 Kimi K2.6 等主流閉源模型，總體排名第一。

MiMo-V2.5-Pro已于開源首日完成多個芯片廠商的接入適配，其中包括阿里平頭哥、亞馬遜云科技（基于 Trainium2 芯片）、AMD、百度昆侖芯、燧原科技、沐曦、天數(shù)智芯七家芯片廠商接入適配，同步完成 SGLang 與 vLLM 兩大主流推理框架的 Day 0 適配。

小米同步推出「MiMo Orbit 計劃」，涵蓋兩大方向：百兆 Token 創(chuàng)造者激勵計劃：面向全球 AI 用戶，于 2026 年 4 月 28 日至 5 月 28 日期間免費發(fā)放共計 100 兆 Token 權(quán)益，通過審核者最高可獲得價值人民幣 659 元的 Max 檔位 Token Plan，額度發(fā)完為止。

代理生態(tài)共建計劃：面向全球代理框架團隊，提供 Token 免費支持，并共同舉辦 AI Hackathon 等活動，目前已與 OpenCode、Hermes Agent、KiloCode 等框架廠商展開深度合作。

而在4月28日， DeepSeek官網(wǎng)API文檔相關頁面顯示，當前deepseek-v4-pro模型的2.5折優(yōu)惠活動將延長至今年5月31日23:59。目前，deepseek-v4-pro的輸入價格（緩存命中）為0.025元（每百萬tokens），輸入價格（緩存未命中）為3元，輸出價格為6元。使用成本遠低于美國競爭對手，僅為 OpenAI 同類產(chǎn)品價格的 3%，分析人士認為此舉旨在吸引更多企業(yè)用戶與開發(fā)者。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴