哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

沐曦股份Day 0適配DeepSeek-V4-Flash模型

沐曦MetaX ? 來源:沐曦metaX ? 2026-04-28 15:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

4月24日,沐曦股份攜手FlagOS,已完對DeepSeek最新開源的DeepSeek-V4-Flash模型的Day 0適配。同日,沐曦股份還聯(lián)合上海人工智能實驗室KernelSwift智能算子遷移系統(tǒng),率先完成DeepSeek-V4核心算子的Day0適配。

截至目前,沐曦股份已完成針對國內(nèi)19款主流開源模型的極速適配,全面覆蓋DeepSeek、MiniMax、智譜、阿里巴巴、騰訊、階躍星辰、百度等頭部廠商最新旗艦模型,種類涵蓋語言、多模態(tài)、OCR、3D生成等全領(lǐng)域,效率領(lǐng)跑行業(yè)。

能夠取得這一成果,既得益于沐曦股份在GPU硬件設(shè)計與自研軟件棧MXMACA上的長期技術(shù)積累,也與上海人工智能實驗室、FlagOS合作伙伴的深度協(xié)同密不可分。

FlagOS三大核心技術(shù)支持,沐曦芯片完成全量適配

在沐曦股份與FlagOS的合作中,背后有三大關(guān)鍵技術(shù)提供支持:

高性能通用大模型算子庫FlagGems。據(jù)FlagOS介紹,F(xiàn)lagGems 提供支持8種以上芯片的全算子替代。此次DeepSeek V4在注意力機制和量化策略上引入了5個新算子,F(xiàn)lagGems針對全部5個算子進行了重新實現(xiàn),以支持國產(chǎn)多芯片適配。

FlagOS采用獨立并行策略,解除張量并行最多單機8卡限制,將可運行芯片范圍從“僅限單機80GB以上顯存的個別高端卡”擴展到“多機64GB/32GB的更多主流國產(chǎn)芯片”。

FlagOS支持從“FP4+FP8混合精度” 到 BF16的精度轉(zhuǎn)換。此次 DeepSeek-V4-Flash模型發(fā)布時首次采用 FP4+FP8混合精度,F(xiàn)lagOS 完成了從 FP4 到 BF16 的完整精度轉(zhuǎn)換,使得模型可部署在 FP8 及 BF16 生態(tài)的主流國產(chǎn)芯片上。

目前,F(xiàn)lagOS已經(jīng)完成針對DeepSeek-V4開源模型的多芯全量適配與推理部署,開發(fā)者可直接獲取對應芯片的開箱即用方案。

沐曦適配版本鏈接

魔搭:

https://modelscope.cn/models/FlagRelease/DeepSeek-V4-Flash-metax-FlagOS

HuggingFace:

https://huggingface.co/FlagRelease/DeepSeek-V4-Flash-metax-FlagOS

KernelSwift加速,沐曦芯片實現(xiàn)核心算子高效遷移

算子遷移效率與性能優(yōu)化是解鎖國產(chǎn)算力的關(guān)鍵。

沐曦股份在與上海人工智能實驗室的合作中,借助實驗室研發(fā)的智能算子遷移系統(tǒng)KernelSwift,沐曦芯片率先完成了DeepSeek-V4核心算子的Day0適配, 算子平均通過率約80%。

在DeepSeek-V4模型發(fā)布后,KernelSwift啟動全自動流程生成核心算子并適配多元國產(chǎn)芯片,全程無人工干預。DeepSeek-V4模型共計21個核心算子中,KernelSwift采用融合策略,核心算子相比?TileLang?達到1.2倍以上性能加速,國產(chǎn)芯片平均實現(xiàn)75%+正確性,平均加速比達3.4倍。自動生成的算子經(jīng)人工修改后,國產(chǎn)芯片平均實現(xiàn)100%正確性,大大提高了算子開發(fā)和遷移效率。

依托“自研GPU硬件+MXMACA軟件?!避浻惨惑w計算平臺的核心優(yōu)勢,沐曦股份快速響應大模型迭代節(jié)奏,高效完成了多款主流模型的適配工作,以全棧技術(shù)實力為大模型快速落地筑牢算力支撐。

未來,沐曦股份將繼續(xù)與上海人工智能實驗室、FlagOS深度合作,以Day 0適配為標準,實現(xiàn)大模型“發(fā)布即落地”,共同打造從底層算力到上層應用的無縫銜接生態(tài),加速AI技術(shù)在千行百業(yè)的規(guī)?;渴穑步ㄗ灾骺煽氐闹悄苡嬎阈碌鬃?。

關(guān)于沐曦股份

沐曦股份致力于自主研發(fā)全棧高性能GPU芯片及計算平臺,為智算、通用計算、云渲染等前沿領(lǐng)域提供高能效、高通用性的算力支撐,助力數(shù)字經(jīng)濟發(fā)展。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1820

    文章

    50344

    瀏覽量

    266986
  • 沐曦
    +關(guān)注

    關(guān)注

    1

    文章

    103

    瀏覽量

    1880
  • DeepSeek
    +關(guān)注

    關(guān)注

    2

    文章

    847

    瀏覽量

    3406

原文標題:沐曦股份攜手FlagOS、上海人工智能實驗室,完成DeepSeek-V4 Day 0適配

文章出處:【微信號:沐曦MetaX,微信公眾號:沐曦MetaX】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    華為云首發(fā)適配DeepSeek-V4模型

    ,DeepSeek-V4-Flash模型參數(shù)下降至284B,推理成本進一步降低,模型參數(shù)和激活更小,V4-Flash能夠提供更加快捷、經(jīng)濟的API服務,實現(xiàn)百萬上下文普惠。當前,華為云
    的頭像 發(fā)表于 04-28 17:01 ?141次閱讀

    股份云C系列GPU產(chǎn)品Day 0適配小米MiMo-V2.5-Pro模型

    4月23日,小米開啟 MiMo-V2.5系列模型的公測,并于4月28日正式發(fā)布及開源。
    的頭像 發(fā)表于 04-28 15:59 ?55次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>曦</b>云C系列GPU產(chǎn)品<b class='flag-5'>Day</b> <b class='flag-5'>0</b><b class='flag-5'>適配</b>小米MiMo-<b class='flag-5'>V</b>2.5-Pro<b class='flag-5'>模型</b>

    股份云C系列GPU產(chǎn)品Day 0適配騰訊混元Hy3 preview語言模型

    4月23日,騰訊混元團隊正式發(fā)布并開源Hy3 preview語言模型。股份旗下云 C 系列
    的頭像 發(fā)表于 04-28 15:51 ?101次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>曦</b>云C系列GPU產(chǎn)品<b class='flag-5'>Day</b> <b class='flag-5'>0</b><b class='flag-5'>適配</b>騰訊混元Hy3 preview語言<b class='flag-5'>模型</b>

    摩爾線程S5000 + 智源FlagOS:基于原生FP8引擎,Day-0適配DeepSeek-V4

    4月24日,摩爾線程攜手智源眾智FlagOS社區(qū),在旗艦級AI訓推一體全功能GPU MTT S5000上,率先實現(xiàn)對新一代大模型DeepSeek-V4-FlashDay-0極速
    發(fā)表于 04-24 16:30 ?1008次閱讀
    摩爾線程S5000 + 智源FlagOS:基于原生FP8引擎,<b class='flag-5'>Day-0</b><b class='flag-5'>適配</b><b class='flag-5'>DeepSeek-V4</b>

    股份Day 0適配阿里千問Qwen3.6-35B-A3B大模型

    阿里巴巴千問模型團隊最新宣布,開源旗下多模態(tài)“智能體小鋼炮” Qwen3.6-35B-A3B模型。股份與FlagOS合作,完成了該
    的頭像 發(fā)表于 04-22 11:13 ?582次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>Day</b> <b class='flag-5'>0</b><b class='flag-5'>適配</b>阿里千問Qwen3.6-35B-A3B大<b class='flag-5'>模型</b>

    股份云C系列GPU產(chǎn)品Day 0適配百度文心ERNIE-Image文生圖模型

    4月15日,百度文心大模型團隊重磅推出ERNIE?Image文生圖模型股份
    的頭像 發(fā)表于 04-15 17:39 ?472次閱讀

    MiniMax M2.7全球開源,摩爾線程、等完成Day0適配

    電子發(fā)燒友網(wǎng)綜合報道 4月12日,MiniMax M2.7在全球正式開源。華為昇騰、摩爾線程、股份、昆侖芯、NVIDIA,以及TogetherAI、Fireworks、Ollama
    的頭像 發(fā)表于 04-14 11:05 ?1753次閱讀

    股份云C系列GPU產(chǎn)品Day 0適配MiniMax M2.7模型

    4月12日,MiniMax新一代Agent旗艦大模型M2.7開源。股份云C系列GPU已完成
    的頭像 發(fā)表于 04-13 17:08 ?825次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>曦</b>云C系列GPU產(chǎn)品<b class='flag-5'>Day</b> <b class='flag-5'>0</b><b class='flag-5'>適配</b>MiniMax M2.7<b class='flag-5'>模型</b>

    股份云C系列GPU產(chǎn)品Day 0適配智譜GLM-5.1旗艦模型

    4月8日,智譜新一代旗艦模型GLM-5.1實現(xiàn)開源。目前,股份云 C 系列 GPU已完成該
    的頭像 發(fā)表于 04-09 11:25 ?395次閱讀

    股份云C系列GPU全面適配通義千問Qwen3.5三款新模型

    今日,通義千問團隊正式開源發(fā)布Qwen3.5系列中等規(guī)模模型,推出包括Qwen3.5-35B-A3B、Qwen3.5-122B-A10B、Qwen3.5-27B三個版本。股份旗下
    的頭像 發(fā)表于 02-28 10:05 ?732次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>曦</b>云C系列GPU全面<b class='flag-5'>適配</b>通義千問Qwen3.5三款新<b class='flag-5'>模型</b>

    股份云C系列GPU深度適配通義千問Qwen3.5模型

    今天,通義千問今天正式發(fā)布 Qwen3.5,并推出Qwen3.5系列的第一款模型 Qwen3.5-397B-A17B 的開放權(quán)重版本。股份
    的頭像 發(fā)表于 02-26 14:26 ?802次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>曦</b>云C系列GPU深度<b class='flag-5'>適配</b>通義千問Qwen3.5<b class='flag-5'>模型</b>

    云C系列GPU Day 0 適配智譜全新一代大模型GLM-5

    智譜AI正式上線并開源全新一代大模型 GLM-5,股份實現(xiàn)?Day 0 深度
    的頭像 發(fā)表于 02-12 10:53 ?1104次閱讀
    <b class='flag-5'>曦</b>云C系列GPU <b class='flag-5'>Day</b> <b class='flag-5'>0</b> <b class='flag-5'>適配</b>智譜全新一代大<b class='flag-5'>模型</b>GLM-5

    云C600 GPU產(chǎn)品適配階躍星辰基座模型Step 3.5 Flash

    今天,階躍星辰技術(shù)團隊發(fā)布并開源最新旗艦基座模型 Step 3.5 Flash。股份已實現(xiàn)
    的頭像 發(fā)表于 02-02 14:44 ?549次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b>云C600 GPU產(chǎn)品<b class='flag-5'>適配</b>階躍星辰基座<b class='flag-5'>模型</b>Step 3.5 <b class='flag-5'>Flash</b>

    云C500/C550 GPU產(chǎn)品適配PaddleOCR-VL-1.5模型

    PaddleOCR-VL 系列的全新迭代版本PaddleOCR-VL-1.5今天正式上線,云C500/C550 Day 0
    的頭像 發(fā)表于 01-30 10:19 ?1344次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b>云C500/C550 GPU產(chǎn)品<b class='flag-5'>適配</b>PaddleOCR-VL-1.5<b class='flag-5'>模型</b>

    股份云C系列GPU Day 0適配智譜GLM-4.6V多模態(tài)大模型

    12月8日智譜AI發(fā)布并開源 GLM-4.6V 系列多模態(tài)大模型,股份云C系列GPU完成
    的頭像 發(fā)表于 12-17 14:28 ?840次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>曦</b>云C系列GPU <b class='flag-5'>Day</b> <b class='flag-5'>0</b><b class='flag-5'>適配</b>智譜GLM-4.6<b class='flag-5'>V</b>多模態(tài)大<b class='flag-5'>模型</b>
    都匀市| 花莲县| 元朗区| 泽州县| 阿鲁科尔沁旗| 隆回县| 饶平县| 郸城县| 禹州市| 梧州市| 咸宁市| 金溪县| 如东县| 宽城| 凤庆县| 余庆县| 台州市| 高阳县| 曲靖市| 南昌县| 商都县| 元阳县| 玉林市| 太仆寺旗| 太谷县| 汉中市| 新乡县| 彩票| 焦作市| 乌拉特前旗| 道真| 阳信县| 鲜城| 沂南县| 东乡| 庐江县| 太白县| 肥西县| 榆中县| 建湖县| 凤凰县|