哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

下載量超300w的ChatGLM-6B再升級:8-32k上下文,推理提速42%

OSC開源社區(qū) ? 來源:OSC開源社區(qū) ? 2023-06-29 16:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

GLM 技術(shù)團(tuán)隊(duì)宣布再次升級 ChatGLM-6B,發(fā)布 ChatGLM2-6B。ChatGLM-6B 于 3 月 14 日發(fā)布,截至 6 月 24 日在 Huggingface 上的下載量已經(jīng)超過 300w。 截至 6 月 25 日,ChatGLM2 模型在主要評估 LLM 模型中文能力的 C-Eval 榜單中以 71.1 的分?jǐn)?shù)位居 Rank 0;ChatGLM2-6B 模型則以 51.7 的分?jǐn)?shù)位居 Rank 6,是榜單上排名最高的開源模型。

e88cc704-15a0-11ee-962d-dac502259ad0.png

ChatGLM2-6B 是開源中英雙語對話模型 ChatGLM-6B 的第二代版本,在保留了初代模型對話流暢、部署門檻較低等眾多優(yōu)秀特性的基礎(chǔ)之上,ChatGLM2-6B 引入了如下新特性:

更強(qiáng)大的性能:基于 ChatGLM 初代模型的開發(fā)經(jīng)驗(yàn),全面升級了 ChatGLM2-6B 的基座模型。ChatGLM2-6B 使用了 GLM 的混合目標(biāo)函數(shù),經(jīng)過了 1.4T 中英標(biāo)識符的預(yù)訓(xùn)練與人類偏好對齊訓(xùn)練,評測結(jié)果顯示,相比于初代模型,ChatGLM2-6B 在 MMLU(+23%)、CEval(+33%)、GSM8K(+571%) 、BBH(+60%)等數(shù)據(jù)集上的性能取得了大幅度的提升,在同尺寸開源模型中具有較強(qiáng)的競爭力。

更長的上下文:基于 FlashAttention 技術(shù),項(xiàng)目團(tuán)隊(duì)將基座模型的上下文長度(Context Length)由 ChatGLM-6B 的 2K 擴(kuò)展到了 32K,并在對話階段使用 8K 的上下文長度訓(xùn)練,允許更多輪次的對話。但當(dāng)前版本的 ChatGLM2-6B 對單輪超長文檔的理解能力有限,我們會(huì)在后續(xù)迭代升級中著重進(jìn)行優(yōu)化。

更高效的推理:基于 Multi-Query Attention 技術(shù),ChatGLM2-6B 有更高效的推理速度和更低的顯存占用:在官方的模型實(shí)現(xiàn)下,推理速度相比初代提升了 42%,INT4 量化下,6G 顯存支持的對話長度由 1K 提升到了 8K。

更開放的協(xié)議:ChatGLM2-6B 權(quán)重對學(xué)術(shù)研究完全開放,在獲得官方的書面許可后,亦允許商業(yè)使用。

評測結(jié)果

以下為 ChatGLM2-6B 模型在 MMLU (英文)、C-Eval(中文)、GSM8K(數(shù)學(xué))、BBH(英文) 上的測評結(jié)果。

e8c601e0-15a0-11ee-962d-dac502259ad0.png

推理性能

ChatGLM2-6B 使用了 Multi-Query Attention,提高了生成速度。生成 2000 個(gè)字符的平均速度對比如下

e908b06c-15a0-11ee-962d-dac502259ad0.png

Multi-Query Attention 同時(shí)也降低了生成過程中 KV Cache 的顯存占用,此外,ChatGLM2-6B 采用 Causal Mask 進(jìn)行對話訓(xùn)練,連續(xù)對話時(shí)可復(fù)用前面輪次的 KV Cache,進(jìn)一步優(yōu)化了顯存占用。因此,使用 6GB 顯存的顯卡進(jìn)行 INT4 量化的推理時(shí),初代的 ChatGLM-6B 模型最多能夠生成 1119 個(gè)字符就會(huì)提示顯存耗盡,而 ChatGLM2-6B 能夠生成至少 8192 個(gè)字符。

e93eb04a-15a0-11ee-962d-dac502259ad0.png

項(xiàng)目團(tuán)隊(duì)也測試了量化對模型性能的影響。結(jié)果表明,量化對模型性能的影響在可接受范圍內(nèi)。

e9538a2e-15a0-11ee-962d-dac502259ad0.png

示例對比

相比于初代模型,ChatGLM2-6B 多個(gè)維度的能力都取得了提升,以下是一些對比示例。 數(shù)理邏輯

e975b338-15a0-11ee-962d-dac502259ad0.png

e99b519c-15a0-11ee-962d-dac502259ad0.png

知識推理

e9dd13ac-15a0-11ee-962d-dac502259ad0.png

ea0bf118-15a0-11ee-962d-dac502259ad0.png

長文檔理解

ea33526c-15a0-11ee-962d-dac502259ad0.png

ea6b3e98-15a0-11ee-962d-dac502259ad0.png

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    4346

    瀏覽量

    46442
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3818

    瀏覽量

    52268
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1240

    瀏覽量

    26261

原文標(biāo)題:下載量超300w的ChatGLM-6B再升級:8-32k上下文,推理提速42%

文章出處:【微信號:OSC開源社區(qū),微信公眾號:OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    300W高可靠綠色醫(yī)療電源RPS - 300系列解析

    300W高可靠綠色醫(yī)療電源RPS - 300系列解析 作為電子工程師,在醫(yī)療設(shè)備電源設(shè)計(jì)領(lǐng)域不斷探索更可靠、更高效的解決方案是我們的重要任務(wù)。今天,就來詳細(xì)解析一款備受關(guān)注的300W醫(yī)療電源
    的頭像 發(fā)表于 04-05 16:15 ?657次閱讀

    300W單輸出醫(yī)療型MSP - 300系列電源模塊深度解析

    300W單輸出醫(yī)療型MSP - 300系列電源模塊深度解析 在醫(yī)療電子設(shè)備的設(shè)計(jì)中,電源模塊的性能直接關(guān)系到整個(gè)設(shè)備的穩(wěn)定性和可靠性。今天,我們來深入了解一下300W單輸出醫(yī)療型MSP - 3
    的頭像 發(fā)表于 04-05 10:15 ?280次閱讀

    300W單輸出帶PFC功能的HRP - 300系列電源模塊解析

    300W單輸出帶PFC功能的HRP - 300系列電源模塊解析 引言 在電子設(shè)備的設(shè)計(jì)中,電源模塊的性能至關(guān)重要。HRP - 300系列電源模塊是一款具有300W單輸出且?guī)в蠵FC(功
    的頭像 發(fā)表于 04-05 09:25 ?240次閱讀

    300W工業(yè)1U ATX電源:IPC-300A與IPC-300B的技術(shù)解析

    A和IPC-300B這兩款電源的特性、規(guī)格及應(yīng)用場景,為電子工程師們在設(shè)計(jì)中提供有價(jià)值的參考。 文件下載: IPC-300A.pdf 產(chǎn)品概述 IPC-300A和IPC-
    的頭像 發(fā)表于 04-05 09:15 ?266次閱讀

    MEAN WELL HSP - 300系列300W單輸出開關(guān)電源深度解析

    的HSP - 300系列300W單輸出開關(guān)電源,看看它在實(shí)際應(yīng)用中能為我們帶來哪些優(yōu)勢和特點(diǎn)。 文件下載: HSP-300-2.8.pdf 一、產(chǎn)品概述 MEAN WELL的HSP -
    的頭像 發(fā)表于 04-05 09:15 ?299次閱讀

    300W單輸出帶PFC功能的HRP - 300N系列電源解析

    它有哪些特點(diǎn)和優(yōu)勢。 文件下載: HRP-300N-12.pdf 產(chǎn)品概述 HRP - 300N系列是一款300W單輸出型AC/DC電源,適用于85 - 264VAC的輸入電壓范圍。它
    的頭像 發(fā)表于 04-04 16:40 ?1030次閱讀

    EPP - 300系列300W單輸出電源模塊:特性與應(yīng)用詳解

    電源模塊,看看它有哪些獨(dú)特的特性和優(yōu)勢。 文件下載: EPP-300-27.pdf 一、產(chǎn)品概述 EPP - 300系列是一款具備功率因數(shù)校正(PFC)功能的300W單輸出電源模塊。它
    的頭像 發(fā)表于 04-04 15:55 ?690次閱讀

    ADP1047 300W 評估套件:助力高效電源設(shè)計(jì)

    300W 評估套件(ADP1047 - 300 - EVALZ)。 文件下載: ADP1047-300-EVALZ.pdf 一、套件特性 1. 拓?fù)渑c性能優(yōu)勢 該評估板采用了升壓功率
    的頭像 發(fā)表于 03-30 16:25 ?111次閱讀

    300W工業(yè)電源:性能卓越,設(shè)計(jì)精良

    300W工業(yè)電源:性能卓越,設(shè)計(jì)精良 在工業(yè)電子設(shè)備的設(shè)計(jì)中,電源的性能和穩(wěn)定性至關(guān)重要。今天,我們就來詳細(xì)了解一款300W工業(yè)電源,看看它有哪些值得關(guān)注的特點(diǎn)和技術(shù)參數(shù)。 文件下載
    的頭像 發(fā)表于 03-30 14:00 ?130次閱讀

    IRAC1150 - 300W 演示板:電源因數(shù)校正的實(shí)用方案

    實(shí)現(xiàn) PFC 的優(yōu)秀方案。 文件下載: IRAC1150-300W.pdf 一、引言 IRAC1150 - 300W 演示板旨在展示 IR1150S 控制 IC 在 300W 連續(xù)導(dǎo)通
    的頭像 發(fā)表于 03-29 09:10 ?190次閱讀

    NVIDIA BlueField-4為推理上下文記憶存儲(chǔ)平臺提供強(qiáng)大支持

    隨著代理式 AI 工作流將上下文窗口擴(kuò)展到數(shù)百萬個(gè) token,并將模型規(guī)模擴(kuò)展到數(shù)百萬億個(gè)參數(shù),AI 原生企業(yè)正面臨著越來越多的擴(kuò)展挑戰(zhàn)。這些系統(tǒng)目前依賴于智能體長期記憶來存儲(chǔ)跨多輪、工具和會(huì)話持續(xù)保存的上下文,以便智能體能夠基于先前的
    的頭像 發(fā)表于 02-02 10:29 ?1292次閱讀
    NVIDIA BlueField-4為<b class='flag-5'>推理上下文</b>記憶存儲(chǔ)平臺提供強(qiáng)大支持

    大語言模型如何處理上下文窗口中的輸入

    本博客介紹了五個(gè)基本概念,闡述了大語言模型如何處理上下文窗口中的輸入。通過明確的例子和實(shí)踐中獲得的見解,本文介紹了多個(gè)與上下文窗口有關(guān)的基本概念,如詞元化、序列長度和注意力等。
    的頭像 發(fā)表于 12-03 13:48 ?760次閱讀
    大語言模型如何處理<b class='flag-5'>上下文</b>窗口中的輸入

    【CIE全國RISC-V創(chuàng)新應(yīng)用大賽】基于 K1 AI CPU 的大模型部署落地

    量化” 策略。我們必須使用 Q2_K (2-bit) 量化格式,將模型體積壓縮到 5.5GB 左右,從而在 8GB 內(nèi)存上給 KV Cache(上下文)留出空間。 以下是按照官方工具鏈針對 14
    發(fā)表于 11-27 14:43

    請問riscv中斷還需要軟件保存上下文和恢復(fù)嗎?

    以下是我拷貝的文檔里的說明,這個(gè)中斷處理還需要軟件來寫上下文保存和恢復(fù),在使用ARM核的單片機(jī)都不需要考慮這些的,使用過的小伙伴能解答嗎? 3.8. 進(jìn)出中斷的上下文保存和恢復(fù) RISC-V架構(gòu)
    發(fā)表于 10-20 09:56

    鴻蒙NEXT-API19獲取上下文,在class中和ability中獲取上下文,API遷移示例-解決無法在EntryAbility中無法使用最新版

    摘要:隨著鴻蒙系統(tǒng)API升級至16版本(modelVersion5.1.1),多項(xiàng)API已廢棄。獲取上下文需使用UIContext,具體方法包括:在組件中使用getUIContext(),在類中使
    的頭像 發(fā)表于 07-01 10:57 ?898次閱讀
    鴻蒙NEXT-API19獲取<b class='flag-5'>上下文</b>,在class中和ability中獲取<b class='flag-5'>上下文</b>,API遷移示例-解決無法在EntryAbility中無法使用最新版
    集贤县| 金秀| 边坝县| 宕昌县| 纳雍县| 四会市| 沂源县| 卓资县| 陆良县| 安义县| 拜城县| 永兴县| 杭锦后旗| 民丰县| 永州市| 嘉善县| 甘肃省| 渑池县| 玛纳斯县| 堆龙德庆县| 石泉县| 福清市| 武山县| 建瓯市| 双柏县| 晋城| 广东省| 裕民县| 扬州市| 湄潭县| 大同市| 西华县| 桑日县| 乌拉特中旗| 扶绥县| 沙田区| 呼和浩特市| 常宁市| 开远市| 彭水| 双鸭山市|