哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于Arm架構(gòu)的NVIDIA DGX Spark平臺(tái)構(gòu)建離線(xiàn)語(yǔ)音助手系統(tǒng)

Arm社區(qū) ? 來(lái)源:Arm社區(qū) ? 2026-04-09 15:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Arm 首席解決方案架構(gòu)師 沈綸銘

基于云的人工智能 (AI) 占據(jù)了大多數(shù)關(guān)注焦點(diǎn),但真正實(shí)現(xiàn)響應(yīng)和隱私保護(hù)的交互則發(fā)生在邊緣側(cè)。本文將展示如何基于 Arm 架構(gòu)的 NVIDIA DGX Spark 平臺(tái),構(gòu)建一個(gè)完全離線(xiàn)、實(shí)時(shí)運(yùn)行的語(yǔ)音助手系統(tǒng)。該系統(tǒng)集成了諸如 faster-whisper 和 vLLM 等開(kāi)源組件,在無(wú)需將數(shù)據(jù)發(fā)送到本地環(huán)境之外的情況下,實(shí)現(xiàn)低延遲、接近人類(lèi)對(duì)話(huà)體驗(yàn)的交互。

技術(shù)挑戰(zhàn)

對(duì)云的依賴(lài)?yán)Ь?/strong>

在許多企業(yè)環(huán)境中,技術(shù)人員需要快速訪(fǎng)問(wèn)內(nèi)部文檔或獲得實(shí)時(shí)支持。然而,依賴(lài)云端 API 會(huì)帶來(lái)三個(gè)關(guān)鍵瓶頸:

延遲:與云端 API 的往返通信會(huì)打斷語(yǔ)音對(duì)話(huà)的自然節(jié)奏。

隱私:將敏感數(shù)據(jù)發(fā)送到外部服務(wù)器會(huì)帶來(lái)合規(guī)風(fēng)險(xiǎn),尤其是在涉及專(zhuān)有內(nèi)容時(shí)。

成本與可控性:基于 API 的計(jì)費(fèi)模式和使用限制,會(huì)限制系統(tǒng)的擴(kuò)展能力以及針對(duì)特定行業(yè)需求的定制化能力。

解決方案

異構(gòu)的開(kāi)源流水線(xiàn)

為了應(yīng)對(duì)上述問(wèn)題,我們?cè)?DGX Spark 上設(shè)計(jì)了一套流水線(xiàn),DGX Spark 基于 NVIDIA GB10 Grace Blackwell 構(gòu)建。在該方案中,CPU 被定位一個(gè)主動(dòng)的、以低延遲為優(yōu)化目標(biāo)的計(jì)算引擎。

軟件棧

為了實(shí)現(xiàn)最大的靈活性與性能,整個(gè)系統(tǒng)運(yùn)行在以下開(kāi)源工具上:

09805778-3268-11f1-90a1-92fbcf53809c.png

關(guān)鍵組件與系統(tǒng)設(shè)計(jì)

實(shí)時(shí)音頻與語(yǔ)音活動(dòng)檢測(cè)

系統(tǒng)以 16kHz 單聲道音頻進(jìn)行采集,并使用 WebRTC 的語(yǔ)音活動(dòng)檢測(cè) (VAD) 在 30 毫秒的幀級(jí)別上檢測(cè)語(yǔ)音信號(hào)。該方法能夠確保系統(tǒng)只處理有效的語(yǔ)音輸入,同時(shí)忽略背景噪聲和靜音間隔。

基于 Arm 架構(gòu) CPU 的高速語(yǔ)音轉(zhuǎn)寫(xiě)

對(duì)于短時(shí)、對(duì)延遲敏感的任務(wù),系統(tǒng)并未將其分流到 GPU 上,而是使用高性能的 Arm CPU 集群(Arm Cortex-X 和 Cortex-A 系列核心)來(lái)處理。

為什么選擇 Arm:Arm 架構(gòu)針對(duì)實(shí)時(shí)搜索、小批量推理任務(wù)等延遲關(guān)鍵型工作負(fù)載進(jìn)行了優(yōu)化,

性能表現(xiàn):在 Arm CPU 上運(yùn)行 faster-whisper 可以滿(mǎn)足低延遲需求,在交互式系統(tǒng)中,語(yǔ)音轉(zhuǎn)寫(xiě)時(shí)間約為 70 至 90 毫秒。

基于 GPU 加速的推理 (vLLM)

在完成語(yǔ)音轉(zhuǎn)寫(xiě)后,文本會(huì)被傳遞至 vLLM 進(jìn)行處理。DGX Spark 采用統(tǒng)一內(nèi)存 (Unified Memory),使 CPU 與 GPU 共享同一內(nèi)存空間。該設(shè)計(jì)允許 GPU 直接訪(fǎng)問(wèn) CPU 的輸出數(shù)據(jù),從而無(wú)需顯式的數(shù)據(jù)傳輸或消除通過(guò) PCIe 進(jìn)行拷貝所帶來(lái)的額外開(kāi)銷(xiāo)。

系統(tǒng)架構(gòu)流程圖

以下流程圖展示了在 DGX Spark 上構(gòu)建的一個(gè)高性能異構(gòu)流水線(xiàn)。系統(tǒng)將任務(wù)分配給最合適的計(jì)算單元,以降低整體延遲。

09ef7a22-3268-11f1-90a1-92fbcf53809c.png

圖:DGX Spark 異構(gòu)流水線(xiàn)。Arm CPU 負(fù)責(zé) STT 轉(zhuǎn)錄,

GPU 負(fù)責(zé)生成響應(yīng),從而顯著降低交互延遲。

在該流水線(xiàn)中,Cortex-X 和 Cortex-A CPU 核心用于處理對(duì)延遲敏感的任務(wù),例如音頻采集和語(yǔ)音轉(zhuǎn)寫(xiě)。這種方式可以實(shí)現(xiàn)低于 100 毫秒的響應(yīng)時(shí)間。系統(tǒng)采用統(tǒng)一內(nèi)存,使 GPU 能夠直接訪(fǎng)問(wèn)共享 DRAM 中的轉(zhuǎn)寫(xiě)數(shù)據(jù),從而消除了傳統(tǒng) PCIe 數(shù)據(jù)傳輸帶來(lái)的開(kāi)銷(xiāo)。整個(gè)流程的最后,由 NVIDIA GPU 運(yùn)行 vLLM 引擎生成智能響應(yīng),從而實(shí)現(xiàn)高吞吐量且具備隱私保護(hù)的對(duì)話(huà)體驗(yàn)。

演示:

本地語(yǔ)音交互與性能指標(biāo)

我們通過(guò)一個(gè)多輪“訂閱取消”場(chǎng)景對(duì)系統(tǒng)進(jìn)行了驗(yàn)證。系統(tǒng)能夠生成經(jīng)過(guò)驗(yàn)證、基于事實(shí)的回答,并且未出現(xiàn)幻覺(jué) (hallucination) 問(wèn)題。

性能指標(biāo):延遲拆解

以下數(shù)據(jù)記錄了從用戶(hù)語(yǔ)音結(jié)束到大語(yǔ)音模型開(kāi)始生成響應(yīng)之間的精確時(shí)間(即響應(yīng)延遲)。

0a518e60-3268-11f1-90a1-92fbcf53809c.png

觀(guān)察結(jié)果:所有對(duì)話(huà)輪次的平均響應(yīng)延遲約為四秒。該性能表現(xiàn)可與基于云的解決方案相媲美,同時(shí)在無(wú)需網(wǎng)絡(luò)連接的情況下提供了更強(qiáng)的隱私保護(hù)。

構(gòu)建你自己的系統(tǒng)?

理解 Arm 架構(gòu) AI 能力的最佳方式是親自實(shí)踐。為此,我們準(zhǔn)備了一套完整的、循序漸進(jìn)的 Learning Path,幫助你部署這一流水線(xiàn)??靵?lái)動(dòng)手實(shí)踐吧!

該 Learning Path 將指導(dǎo)以下內(nèi)容:

如何為邊緣設(shè)備配置專(zhuān)業(yè)級(jí)麥克風(fēng)采集系統(tǒng);

如何針對(duì) Arm Cortex-X 優(yōu)化 faster-whisper;

如何使用量化模型部署 vLLM,以最大化本地吞吐性能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    135

    文章

    9581

    瀏覽量

    393361
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5678

    瀏覽量

    110073
  • 語(yǔ)音助手
    +關(guān)注

    關(guān)注

    7

    文章

    243

    瀏覽量

    27639

原文標(biāo)題:在邊緣側(cè)重新思考語(yǔ)音 AI:基于 Arm 架構(gòu)的 DGX Spark 的實(shí)用離線(xiàn)流水線(xiàn)

文章出處:【微信號(hào):Arm社區(qū),微信公眾號(hào):Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA DGX Spark平臺(tái)上對(duì)NVIDIA ConnectX-7 200G網(wǎng)卡配置教程

    NVIDIA DGX Spark 平臺(tái)上對(duì) NVIDIA ConnectX-7 200G 網(wǎng)卡進(jìn)行配置時(shí),會(huì)遇到“4 個(gè)邏輯端口”現(xiàn)象。
    的頭像 發(fā)表于 11-21 09:19 ?5937次閱讀
    在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b><b class='flag-5'>平臺(tái)</b>上對(duì)<b class='flag-5'>NVIDIA</b> ConnectX-7 200G網(wǎng)卡配置教程

    NVIDIA DGX Spark系統(tǒng)恢復(fù)過(guò)程與步驟

    在使用 NVIDIA DGX Spark 的過(guò)程中,可能會(huì)出現(xiàn)配置故障,而導(dǎo)致開(kāi)發(fā)中斷的問(wèn)題,本篇教程將帶大家了解如何一步步完成系統(tǒng)恢復(fù)。
    的頭像 發(fā)表于 11-28 09:46 ?5809次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b><b class='flag-5'>系統(tǒng)</b>恢復(fù)過(guò)程與步驟

    NVIDIA DGX Spark快速入門(mén)指南

    NVIDIA DGX Spark 已正式向 AI 開(kāi)發(fā)者交付,對(duì)于剛?cè)胧值娜?DGX Spark,該如何進(jìn)行初始化設(shè)置?本篇文章將引導(dǎo)您完
    的頭像 發(fā)表于 11-17 14:11 ?6890次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b>快速入門(mén)指南

    Microchip發(fā)布專(zhuān)為NVIDIA DGX Spark而設(shè)計(jì)的MEC1723嵌入式控制器定制固件

    DGX Spark個(gè)人AI超級(jí)計(jì)算機(jī)定制設(shè)計(jì)的 MEC1723嵌入式控制器(EC)固件 ,進(jìn)一步優(yōu)化MEC1723 EC在NVIDIA DGX平臺(tái)
    的頭像 發(fā)表于 01-15 18:51 ?6.6w次閱讀
    Microchip發(fā)布專(zhuān)為<b class='flag-5'>NVIDIA</b> <b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b>而設(shè)計(jì)的MEC1723嵌入式控制器定制固件

    NVIDIA 宣布推出 DGX Spark 個(gè)人 AI 計(jì)算機(jī)

    臺(tái)式超級(jí)計(jì)算機(jī)由 NVIDIA Grace Blackwell 驅(qū)動(dòng),為開(kāi)發(fā)者、研究人員和數(shù)據(jù)科學(xué)家提供加速 AI 功能;系統(tǒng)由頭部計(jì)算機(jī)制造商(包括華碩、Dell Technologies、HP
    發(fā)表于 03-19 09:59 ?864次閱讀
       <b class='flag-5'>NVIDIA</b> 宣布推出 <b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b> 個(gè)人 AI 計(jì)算機(jī)

    NVIDIA GTC2025 亮點(diǎn) NVIDIA推出 DGX Spark個(gè)人AI計(jì)算機(jī)

    和聯(lián)想)提供。 NVIDIA 發(fā)布了由 NVIDIA Grace Blackwell 平臺(tái)驅(qū)動(dòng)的 DGX 個(gè)人 AI 超級(jí)計(jì)算機(jī)。 DGX
    的頭像 發(fā)表于 03-20 18:59 ?1750次閱讀
    <b class='flag-5'>NVIDIA</b> GTC2025 亮點(diǎn)  <b class='flag-5'>NVIDIA</b>推出 <b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b>個(gè)人AI計(jì)算機(jī)

    NVIDIA發(fā)布AI優(yōu)先DGX個(gè)人計(jì)算系統(tǒng)

    NVIDIA 宣布,多家行業(yè)領(lǐng)先系統(tǒng)制造商將打造 NVIDIA DGX Spark。
    的頭像 發(fā)表于 05-22 09:39 ?1231次閱讀

    NVIDIA DGX Spark桌面AI計(jì)算機(jī)開(kāi)啟預(yù)訂

    DGX Spark 現(xiàn)已開(kāi)啟預(yù)訂!麗臺(tái)科技作為 NVIDIA 授權(quán)分銷(xiāo)商,提供從產(chǎn)品到服務(wù)的一站式解決方案,助力輕松部署桌面 AI 計(jì)算機(jī)。
    的頭像 發(fā)表于 09-23 17:20 ?1492次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b>桌面AI計(jì)算機(jī)開(kāi)啟預(yù)訂

    NVIDIA DGX Spark新一代AI超級(jí)計(jì)算機(jī)正式交付

    NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛在 SpaceX 向埃隆·馬斯克交付 DGX Spark。
    的頭像 發(fā)表于 10-21 10:41 ?1399次閱讀

    NVIDIA DGX Spark助力構(gòu)建自己的AI模型

    2025 年 1 月 6 日,NVIDIA 正式宣布其 Project DIGITS 項(xiàng)目,并于 3 月 18 日更名為 NVIDIA DGX Spark,進(jìn)一步公布了產(chǎn)品細(xì)節(jié)。
    的頭像 發(fā)表于 11-21 09:25 ?1466次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b>助力<b class='flag-5'>構(gòu)建</b>自己的AI模型

    如何在DGX Spark上運(yùn)行NVIDIA Omniverse

    首先感謝 Vigor 同學(xué)第一時(shí)間的分享,以下是具體如何在 DGX Spark 上運(yùn)行 Omniverse 的方法。
    的頭像 發(fā)表于 12-17 10:13 ?872次閱讀
    如何在<b class='flag-5'>DGX</b> <b class='flag-5'>Spark</b>上運(yùn)行<b class='flag-5'>NVIDIA</b> Omniverse

    NVIDIA DGX Spark桌面級(jí)AI超級(jí)計(jì)算機(jī)助力開(kāi)發(fā)者構(gòu)建AI模型

    開(kāi)源 AI 正在加速各行各業(yè)的創(chuàng)新,NVIDIA DGX Spark 將幫助開(kāi)發(fā)者將創(chuàng)新轉(zhuǎn)化為影響力。
    的頭像 發(fā)表于 01-09 09:49 ?651次閱讀

    全新軟件與模型優(yōu)化為NVIDIA DGX Spark注入強(qiáng)大動(dòng)力

    自發(fā)布以來(lái),NVIDIA 通過(guò)持續(xù)的軟件優(yōu)化以及與軟件合作伙伴和開(kāi)源社區(qū)的緊密協(xié)作,不斷提升基于 Grace Blackwell 架構(gòu)DGX Spark 的性能。這些舉措在推理、訓(xùn)
    的頭像 發(fā)表于 01-09 10:17 ?782次閱讀

    NVIDIA DGX Spark助力高等教育領(lǐng)域重大項(xiàng)目

    在全球各地的頂尖高校,NVIDIA DGX Spark 桌面超級(jí)計(jì)算機(jī)正將數(shù)據(jù)中心級(jí)的 AI 能力帶到實(shí)驗(yàn)室臺(tái)前、教師辦公室里和學(xué)生的終端設(shè)備上。在地球最南端的南極,也有一臺(tái) DGX
    的頭像 發(fā)表于 03-09 16:33 ?631次閱讀

    首屆中國(guó)NVIDIA DGX Spark黑客松大賽開(kāi)啟報(bào)名

    NVIDIA 前沿技術(shù)生態(tài),聚焦 DGX Spark 平臺(tái)的全棧開(kāi)發(fā)能力,以代碼為刃,以算力為鋒,共同探索 DGX
    的頭像 發(fā)表于 03-14 16:39 ?2670次閱讀
    陇西县| 石嘴山市| 花莲市| 鄂伦春自治旗| 兴文县| 丹棱县| 云和县| 沙河市| 渝中区| 绍兴市| 秦安县| 永春县| 巴楚县| 罗源县| 德格县| 东阳市| 吉隆县| 舒兰市| 黑水县| 军事| 霞浦县| 武山县| 长岭县| 邵东县| 韩城市| 大石桥市| 通城县| 南部县| 乐亭县| 仪征市| 汶上县| 襄樊市| 永仁县| 新宾| 建德市| 鄱阳县| 咸丰县| 高要市| 得荣县| 遂宁市| 修文县|