4月24日,深度求索團(tuán)隊(duì)宣布全新系列模型 DeepSeek-V4 的預(yù)覽版本正式上線并同步開源。依托成熟的BIRENSUPA軟件棧與自研GPU全棧智能體“AIModelMaster”,壁仞科技快速完成DeepSeek-V4在旗艦通用GPU壁礪166系列產(chǎn)品的適配驗(yàn)證與優(yōu)化,充分釋放產(chǎn)品算力密度與帶寬優(yōu)勢(shì),全面賦能GenAI推理加速。

實(shí)證:DeepSeek-V4基于BR166芯片完成推理任務(wù)
DeepSeek-V4
邁入百萬(wàn)上下文普惠時(shí)代
根據(jù)官方介紹,DeepSeek-V4擁有百萬(wàn)字超長(zhǎng)上下文,在Agent能力、世界知識(shí)和推理性能上均實(shí)現(xiàn)國(guó)內(nèi)與開源領(lǐng)域的領(lǐng)先。
其中,DeepSeek-V4-Pro性能比肩頂級(jí)閉源模型。在Agentic Coding評(píng)測(cè)中達(dá)到開源最佳水平;在數(shù)學(xué)、STEM 及競(jìng)賽代碼測(cè)評(píng)中,超越所有公開評(píng)測(cè)的開源模型,展現(xiàn)出世界頂級(jí)的推理性能。DeepSeek-V4-Flash則更快捷高效;在簡(jiǎn)單任務(wù)的推理能力和 Agent 表現(xiàn)上與 Pro 版旗鼓相當(dāng),能提供更快捷、經(jīng)濟(jì)的 API 服務(wù)。隨著1M(一百萬(wàn))上下文成為DeepSeek所有官方服務(wù)的標(biāo)配后,大模型將邁入百萬(wàn)長(zhǎng)文本普惠新時(shí)代。

DeepSeek-V4系列模型
自研AIModelMaster
支撐模型“越跑越快越優(yōu)”
壁仞科技本次適配聚焦DeepSeek-V4核心技術(shù)特性,圍繞MoE架構(gòu)、稀疏注意力、FP8混合精度等關(guān)鍵模塊展開深度優(yōu)化,依托BIRENSUPA軟件棧與AIModelMaster,完成模型驗(yàn)證跑通、定制化算子開發(fā)及端到端性能調(diào)優(yōu),實(shí)現(xiàn)“當(dāng)天適配、次日優(yōu)化”的極速交付。
AIModelMaster是壁仞科技推出的面向自研GPU全棧、貫通“部署-適配-深度優(yōu)化”全鏈路的智能體系統(tǒng),基于AI Agent接收AI模型(支持HuggingFace、ModelScope或本地checkpoint),通過(guò)br_pytorch+BIRENSUPA棧完成向壁礪系列硬件的適配。


壁仞科技自研GPU全棧智能體
AIModelMaster三大核心能力
一,Day0極速適配,可實(shí)現(xiàn)主流大模型發(fā)布當(dāng)日即可在壁仞科技算力平臺(tái)快速跑通,將原本數(shù)周的適配周期壓縮至小時(shí)級(jí),并已通過(guò)多輪真實(shí)大模型落地驗(yàn)證;
二,全自動(dòng)深度優(yōu)化,不止保障模型和算子順利運(yùn)行,更通過(guò)自動(dòng)化硬門控機(jī)制精準(zhǔn)攻克性能瓶頸,集成AIOpMaster自動(dòng)生成和優(yōu)化算子的能力,全方位優(yōu)化性能,實(shí)現(xiàn)端到端數(shù)倍性能加速;
三,自演進(jìn)能力,系統(tǒng)會(huì)沉淀每一輪優(yōu)化經(jīng)驗(yàn)至專屬知識(shí)庫(kù),讓同類型模型后續(xù)適配優(yōu)化實(shí)現(xiàn)高位起步,真正做到長(zhǎng)期迭代進(jìn)化,有效降本提效,達(dá)成部署越久、人力更省、周期更短、硬件利用率更高的落地價(jià)值。
全棧自研技術(shù)能力
助力國(guó)產(chǎn)SOTA大模型規(guī)?;涞?/p>
壁仞科技堅(jiān)定走全棧自主研發(fā)路線,從微架構(gòu)、指令集到軟件棧全面實(shí)現(xiàn)核心技術(shù)自主可控;BIRENSUPA軟件棧深度兼容PyTorch、vLLM、SGLang、Diffusers等主流AI框架生態(tài),支持500+ AI模型開箱即用;憑借卓越的技術(shù)成熟度,壁礪166系列可顯著降低開發(fā)者的模型部署與應(yīng)用門檻,以全?;芰χ?guó)產(chǎn)SOTA大模型規(guī)模化落地。
近期,壁仞科技已完成Deepseek V/R系列、騰訊混元系列、月之暗面Kimi系列、阿里巴巴千問(wèn)Qwen系列、MiniMax M2系列、智譜GLM系列、階躍星辰Step系列、OpenMOSS MOVA系列等領(lǐng)先大模型的全面適配,覆蓋語(yǔ)言、多模態(tài)、AIGC全品類矩陣。
-
gpu
+關(guān)注
關(guān)注
28文章
5278瀏覽量
136077 -
壁仞科技
+關(guān)注
關(guān)注
1文章
91瀏覽量
4203 -
DeepSeek
+關(guān)注
關(guān)注
2文章
847瀏覽量
3406
原文標(biāo)題:壁仞科技壁礪?166系列完成DeepSeek-V4適配驗(yàn)證與優(yōu)化
文章出處:【微信號(hào):Birentech,微信公眾號(hào):壁仞科技Birentech】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
華為云首發(fā)適配DeepSeek-V4模型
壁仞科技壁礪166系列GPU產(chǎn)品率先支持騰訊混元Hy3 preview語(yǔ)言模型
OpenClaw 全面接入DeepSeek-V4系列模型
榮耀YOYO首搭DeepSeek-V4大模型 重塑安卓端側(cè)AI新標(biāo)桿
壁仞科技壁礪166系列GPU產(chǎn)品率先支持Kimi K2.6模型
壁仞科技光速支持阿里Qwen3.6-35B-A3B大模型
壁仞科技壁礪166系列產(chǎn)品Day 0適配智譜GLM-5.1旗艦模型
壁仞科技壁礪166系列產(chǎn)品深度適配MiniMax M2.5和智譜GLM-5模型
壁仞科技壁礪166M產(chǎn)品適配模思智能MOSS-TTS Family模型
壁仞科技壁礪166系列產(chǎn)品適配階躍星辰基座模型Step 3.5 Flash
壁仞科技在香港聯(lián)合交易所掛牌上市
壁仞科技壁礪166M產(chǎn)品適配騰訊混元開源翻譯模型1.5版本
壁仞科技壁礪166系列GPU產(chǎn)品率先支持DeepSeek-V4模型
評(píng)論