哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

萬(wàn)億參數(shù)!元腦企智一體機(jī)率先支持Kimi K2大模型

全球TMT ? 來(lái)源:全球TMT ? 作者:全球TMT ? 2025-07-22 09:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

北京2025年7月21日 /美通社/ --浪潮信息宣布元腦企智一體機(jī)已率先完成對(duì)Kimi K2 萬(wàn)億參數(shù)大模型的適配支持,并實(shí)現(xiàn)單用戶70 tokens/s的流暢輸出速度,為企業(yè)客戶高效部署應(yīng)用大模型提供高處理性能和完善的軟件工具平臺(tái)支持。


Kimi K2是月之暗面推出的開(kāi)源萬(wàn)億參數(shù)大模型,創(chuàng)新使用了MuonClip優(yōu)化器進(jìn)行訓(xùn)練,大幅提升了模型的學(xué)習(xí)效率。K2在代碼生成、數(shù)學(xué)推理、Agent多步驟任務(wù)上展現(xiàn)出領(lǐng)先能力,評(píng)測(cè)指標(biāo)達(dá)到業(yè)界領(lǐng)先水平。自發(fā)布以來(lái),K2在開(kāi)發(fā)者和研究社區(qū)引起廣泛關(guān)注,迅速獲得在編碼輔助和Agent驅(qū)動(dòng)自動(dòng)化任務(wù)中的部署應(yīng)用。

Kimi K2的模型總參數(shù)量達(dá)1萬(wàn)億,激活參數(shù)為320億。K2使用混合專(zhuān)家(MoE)模型結(jié)構(gòu),較DeepSeek V3采用了更大的參數(shù)量和更多的專(zhuān)家數(shù)。K2模型1萬(wàn)億的參數(shù)量對(duì)AI計(jì)算系統(tǒng)提出至少1TB的顯存容量需求,384個(gè)路由專(zhuān)家所帶來(lái)的專(zhuān)家負(fù)載不均衡性對(duì)推理速度有很大影響。目前業(yè)界可公開(kāi)訪問(wèn)的K2 API的輸出速度一般低于20 tokens/s,這樣較低的性能對(duì)于編程或Agent類(lèi)場(chǎng)景很不友好,會(huì)嚴(yán)重影響用戶體驗(yàn)。Kimi K2憑借其為智能體任務(wù)設(shè)計(jì)的架構(gòu)和優(yōu)秀的智能體驗(yàn),展現(xiàn)出巨大的應(yīng)用潛力,但提升推理速度和輸出穩(wěn)定性是其成為可信賴(lài)的生產(chǎn)力工具需要解決的核心挑戰(zhàn)。

元腦企智一體機(jī)采用元腦服務(wù)器NF5688G7作為算力底座,其搭載FP8計(jì)算引擎,配備1128GB HBM3e高速顯存,單臺(tái)服務(wù)器即可支持K2 萬(wàn)億參數(shù)全量模型部署。NF5688G7服務(wù)器具備900GB/s的GPU P2P帶寬,為Kimi K2提供了專(zhuān)家間高速并行通信,最大化并行效率。該服務(wù)器可支持3200Gbps的RDMA擴(kuò)展網(wǎng)絡(luò),為預(yù)填充-解碼分離部署和大規(guī)模專(zhuān)家并行預(yù)留了充足的擴(kuò)展空間。

浪潮信息已完成元腦企智一體機(jī)對(duì)K2的適配,支持64K上下文長(zhǎng)度和多路用戶實(shí)時(shí)并發(fā)訪問(wèn)。基于SGLang推理框架,通過(guò)減少M(fèi)oE對(duì)齊塊大小內(nèi)核的小批量模式開(kāi)銷(xiāo)和fused_moe的內(nèi)存消耗,并復(fù)用deepGEMM等高效算子,實(shí)現(xiàn)單用戶并發(fā)下輸出速度超過(guò)70 tokens/s,25用戶并發(fā)時(shí)每用戶輸出速度超過(guò)25 tokens/s。優(yōu)化后的計(jì)算性能可保證用戶在進(jìn)行復(fù)雜的代碼生成、長(zhǎng)文本書(shū)寫(xiě)或Agent調(diào)用時(shí),能夠獲得流暢、低延遲的交互體驗(yàn)。

wKgZO2h-PNGAL-wnAAF67yjafGk421.jpg


SGLang啟動(dòng)K2推理服務(wù),用戶交互時(shí)的解碼速度

元腦企智一體機(jī)提供了元腦企智(EPAI)平臺(tái)與K2大模型的無(wú)縫集成,為企業(yè)用戶提供了一套軟硬件協(xié)同優(yōu)化、開(kāi)箱即用的端到端大模型私有化部署解決方案。通過(guò)元腦企智平臺(tái),企業(yè)可利用低代碼、可視化界面,便捷地進(jìn)行數(shù)據(jù)準(zhǔn)備、模型微調(diào)、知識(shí)檢索(RAG)和智能體(Agent)構(gòu)建。

元腦企智一體機(jī)已成功部署于金融、制造、能源、醫(yī)療等多個(gè)關(guān)鍵行業(yè),幫助企業(yè)快速、安全、經(jīng)濟(jì)地構(gòu)建專(zhuān)屬大模型應(yīng)用,加速產(chǎn)業(yè)智能化轉(zhuǎn)型步伐。

浪潮信息是全球領(lǐng)先的IT基礎(chǔ)設(shè)施產(chǎn)品、方案和服務(wù)提供商,通過(guò)發(fā)展新一代以系統(tǒng)為核心的計(jì)算架構(gòu),打造開(kāi)放、多元、綠色的元腦智算產(chǎn)品和方案。浪潮信息致力于AI計(jì)算平臺(tái)、資源平臺(tái)和算法平臺(tái)的研發(fā)創(chuàng)新,并通過(guò)元腦生態(tài)攜手領(lǐng)先伙伴,加速人工智能的創(chuàng)新和應(yīng)用落地。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3740

    瀏覽量

    5263
  • Kimi
    +關(guān)注

    關(guān)注

    0

    文章

    14

    瀏覽量

    335
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Nullmax智能前視一體機(jī)方案獲量產(chǎn)定點(diǎn)

    Nullmax 攜手全球流汽車(chē)零部件供應(yīng)商,將為國(guó)內(nèi)某頭部車(chē)提供基于愛(ài)芯智 M57 芯片打造的 MaxDrive Basic 智能前視一體機(jī)方案,兼具高性能、快部署及高性?xún)r(jià)比優(yōu)勢(shì)
    的頭像 發(fā)表于 04-09 16:30 ?318次閱讀

    觸拓(CHUTO)戶外廣告一體機(jī),無(wú)懼酷暑全天候在線# 觸拓 #戶外觸摸一體機(jī)

    一體機(jī)
    深圳市觸拓科技有限公司
    發(fā)布于 :2026年04月08日 12:20:40

    OBOO鷗柏交互式查詢(xún)一體機(jī):展館里的智能信息導(dǎo)航站

    一體機(jī)
    鷗柏科技
    發(fā)布于 :2025年12月30日 19:04:58

    潤(rùn)和軟件入選大模型一體機(jī)產(chǎn)業(yè)圖譜

    近日,由中國(guó)人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟與中國(guó)信息通信研究院聯(lián)合編制的《大模型一體機(jī)產(chǎn)業(yè)圖譜》正式發(fā)布。該圖譜系統(tǒng)梳理并收錄了國(guó)內(nèi)大模型一體機(jī)產(chǎn)業(yè)鏈上下游70余家代表性企業(yè),全面呈現(xiàn)我國(guó)大
    的頭像 發(fā)表于 12-10 17:56 ?1652次閱讀
    潤(rùn)和軟件入選大<b class='flag-5'>模型</b><b class='flag-5'>一體機(jī)</b>產(chǎn)業(yè)圖譜

    澎峰科技最新推出Deep Fusion DF35智算一體機(jī)

    在人工智能加速落地的今天,企業(yè)部署大模型面臨成本、性能與數(shù)據(jù)安全的三重挑戰(zhàn)。澎峰科技最新推出的Deep Fusion DF35智算一體機(jī),以29000起的突破性定價(jià),將Qwen3-Next 80B FP16精度
    的頭像 發(fā)表于 10-13 16:51 ?1914次閱讀
    澎峰科技最新推出Deep Fusion DF35智算<b class='flag-5'>一體機(jī)</b>

    遠(yuǎn)景達(dá)掃碼模組適用于觸摸一體機(jī)終端的型號(hào)

    隨著數(shù)字化交互場(chǎng)景的拓展,遠(yuǎn)景達(dá)掃碼模組憑借其高效識(shí)別速度、多設(shè)備適配能力及穩(wěn)定運(yùn)行表現(xiàn),成為觸摸一體機(jī)終端的關(guān)鍵配置組件。本文結(jié)合技術(shù)參數(shù)與實(shí)際應(yīng)用案例,整理其適用于觸摸一體機(jī)的主流型號(hào)及技術(shù)特點(diǎn)
    的頭像 發(fā)表于 08-11 16:12 ?924次閱讀
    遠(yuǎn)景達(dá)掃碼模組適用于觸摸<b class='flag-5'>一體機(jī)</b>終端的型號(hào)

    浪潮信息發(fā)布&quot;SD200&quot;超節(jié)點(diǎn),面向萬(wàn)億參數(shù)模型創(chuàng)新設(shè)計(jì)

    擴(kuò)展支持64路本土GPU芯片。SD200可實(shí)現(xiàn)單機(jī)內(nèi)運(yùn)行超萬(wàn)億參數(shù)模型,并
    的頭像 發(fā)表于 08-08 22:17 ?763次閱讀
    浪潮信息發(fā)布&quot;<b class='flag-5'>元</b><b class='flag-5'>腦</b>SD200&quot;超節(jié)點(diǎn),面向<b class='flag-5'>萬(wàn)億</b><b class='flag-5'>參數(shù)</b>大<b class='flag-5'>模型</b>創(chuàng)新設(shè)計(jì)

    ?Groq LPU 如何讓萬(wàn)億參數(shù)模型「飛」起來(lái)?揭秘 Kimi K2 40 倍提速背后的黑科技

    Groq LPU 如何讓萬(wàn)億參數(shù)模型「飛」起來(lái)?揭秘 Kimi K2 40 倍提速背后的黑科技? 最近,Moonshot AI 的千億參數(shù)
    的頭像 發(fā)表于 08-07 10:01 ?1291次閱讀

    硅基流動(dòng)攜手沐曦首發(fā)基于曦云的Kimi K2推理服務(wù)

    今天,硅基流動(dòng)聯(lián)合沐曦集成電路(上海)股份有限公司(簡(jiǎn)稱(chēng)“沐曦”),全球首發(fā)基于沐曦曦云 C550 集群的月之暗面 Kimi-K2模型商業(yè)化服務(wù)部署。該服務(wù)運(yùn)行于匯天網(wǎng)絡(luò)科技有限公司(簡(jiǎn)稱(chēng)“匯
    的頭像 發(fā)表于 07-23 17:33 ?2110次閱讀

    一體機(jī)主板步入大存儲(chǔ)時(shí)代,存儲(chǔ)突圍到性能質(zhì)變

    ,我們發(fā)現(xiàn)了客戶新的需求。一體機(jī)電腦場(chǎng)景在企業(yè)辦公多任務(wù)處理中,多開(kāi)辦公軟件、數(shù)據(jù)報(bào)表處理卡頓,需要更多內(nèi)存支持多應(yīng)用同時(shí)流暢運(yùn)行。場(chǎng)景二專(zhuān)業(yè)設(shè)計(jì)與渲染、4K視頻剪
    的頭像 發(fā)表于 06-19 10:47 ?652次閱讀
    <b class='flag-5'>一體機(jī)</b>主板步入大存儲(chǔ)時(shí)代,存儲(chǔ)突圍到性能質(zhì)變

    開(kāi)普云「開(kāi)悟智核」:極致性?xún)r(jià)比的智能一體機(jī),破局大模型應(yīng)用難題

    當(dāng)下,AI一體機(jī)憑借開(kāi)箱即用、數(shù)據(jù)可控等優(yōu)勢(shì),成為行業(yè)大模型落地的重要載體之。然而實(shí)際應(yīng)用時(shí),用戶卻面臨諸多問(wèn)題:算力成本與性能難以平衡;非滿血版模型存在“幻覺(jué)”、精度低等問(wèn)題;由于
    的頭像 發(fā)表于 06-09 10:34 ?1289次閱讀
    開(kāi)普云「開(kāi)悟智核」:極致性?xún)r(jià)比的智能<b class='flag-5'>體</b><b class='flag-5'>一體機(jī)</b>,破局大<b class='flag-5'>模型</b>應(yīng)用難題

    松下4K手持式攝錄一體機(jī)AJ-UPX380介紹

    2025年第季度,松下正式推出4K手持式攝錄一體機(jī)AJ-UPX380,旨在為廣播及流媒體專(zhuān)業(yè)人士提供更高品質(zhì)的視頻制作解決方案。作為UPX系列專(zhuān)業(yè)攝錄一體機(jī)的新成員,AJ-UPX38
    的頭像 發(fā)表于 05-30 15:54 ?1867次閱讀
    梅河口市| 鱼台县| 东源县| 阿图什市| 清徐县| 神木县| 邵阳县| 文成县| 静海县| 马尔康县| 安溪县| 西盟| 恩平市| 灯塔市| 嘉黎县| 鄱阳县| 景宁| 临澧县| 太谷县| 常德市| 河西区| 宁陵县| 巩留县| 金寨县| 彭州市| 黔南| 龙岩市| 石屏县| 垣曲县| 江西省| 巴青县| 克拉玛依市| 河间市| 阳谷县| 邛崃市| 长宁县| 贵南县| 南开区| 新巴尔虎左旗| 镇远县| 柞水县|