哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA助力微軟將AI Transformer模型投入生產用途

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 作者:NVIDIA英偉達企業(yè)解 ? 2022-03-28 09:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Microsoft 的目標是,通過結合使用 Azure 與 NVIDIA GPU 和 Triton 推理軟件,率先將一系列強大的 AI Transformer 模型投入生產用途。

如果您的軟件能喚起人們喜悅的淚水,您就是在傳播歡樂。

Translator 是一項 Microsoft Azure 認知服務,通過應用一些規(guī)模龐大的 AI 模型來幫助更多人進行交流。

“有太多精彩的故事可以講了!” Translator 開發(fā)經理 Vishal Chowdhary 表示。

比如,在 2010 年海地遭受 7.0 級地震后,在短短 5 天的沖刺期里為相關應用緊急添加海地克里奧爾語支持,進而為救援人員提供幫助。再比如,祖父母在使用這款軟件,與講著他們不懂的語言的遠方孫輩進行第一次實時交流時,感動到哽咽。

雄心勃勃的目標

“我們的愿景是,讓成千上萬的開發(fā)者都已經在使用的這個 API,能打破不同語言、不同模式之間的阻礙?!?Chowdhary 說。

考量全球現行的語言大約有 7000 種,這真的是個雄心勃勃的目標。

因此,團隊采用了一種強大而復雜的工具,即是混合專家系統(MoE)AI 方法。

在推動自然語言處理快速發(fā)展進步的 Transformer 模型中,這是非常先進的一種。它具有 50 億個參數,其規(guī)模比團隊在生產過程中用于自然語言處理的最大模型大了 80 倍。

MoE 模型涉及到龐大的計算量,很難找到能將其投入生產環(huán)境中使用的用戶。在初始測試中,基于 CPU 的服務器無法滿足團隊要在一秒鐘內完成翻譯一個文檔的要求。

27 倍的提速

隨后,該團隊使用 NVIDIA Triton 推理服務器(本周 GTC 大會上宣布的 NVIDIA AI Enterprise 2.0 平臺的其中一部分)在加速系統上進行了測試。

Chowdhary 說:“借助 NVIDIA GPU 和 Triton,我們得以實現這一目標,且非常高效?!?/p>

事實上,相較于未經優(yōu)化的 GPU 運行時,該團隊實現了高達 27 倍的提速。

“這讓我們可以構建一個模型來執(zhí)行不同的語言理解任務,例如匯總、生成文本和翻譯等,而不必為每個任務開發(fā)單獨的模型?!?負責監(jiān)督測試的 Microsoft 首席研究員 Hanny Hassan Awadalla 表示。

Triton 如何提供幫助

Microsoft 的模型能將大型任務(如翻譯多個文檔)拆分為許多個小任務,在每個小任務中翻譯幾百個句子。Triton 的動態(tài)批處理功能將諸多此類請求整合起來,從而充分利用 GPU 的強大功能。

對于 Triton 使用 CPU、GPU 或其他加速器在各種模式下運行各種模型的能力,讓該團隊贊不絕口。

Chowdhary 的團隊十多年來一直在開發(fā)大規(guī)模分布式系統。Chowdhary 表示:“這種解決方案周到地考慮了我的工作場景,提供了我想要的各種功能,就像是我給自己親手定制的解決方案一樣。

在幕后,有兩個軟件組件是 Triton 取得成功的關鍵。一個是 NVIDIA 擴展型 FasterTransformer,這是一個處理推理計算的軟件層,可支持 MoE 模型。另一個是 CUTLASS,這是一個 NVIDIA 數學庫,有助于高效實現模型。

在四周內提供已驗證的原型

盡管測試十分復雜,但該團隊通過與 NVIDIA 工程師合作并運用 Triton 的強大力量,在不到一個月的時間內就獲得了可投入正常運轉的端到端原型。

“在如此之短的時間內制作出一款達到可發(fā)布程度的產品,這樣的效率實在令人印象深刻,對此我真的非常感激。” Awadalla 這樣說道。

雖然這是該團隊第一次使用 Triton,但 “我們使用它來發(fā)布 MoE 模型,不用花費太多力氣就重新構建了運行時環(huán)境,現在我衷心希望在我們的長期托管系統中納入這款解決方案?!?Chowdhary 補充表示。

采取后續(xù)措施

加速后的服務將采用審慎的步驟實施,初期會用于少數幾種主要語言的文檔翻譯。

Chowdhary 表示:“我們的最終目標是,讓客戶能在所有場景中通過透明的方式獲享這些新模型的優(yōu)點。”

這項工作是 Microsoft 的一項涉獵更廣泛的計劃的一部分。其目的是推動 Office 和 Teams 等眾多產品的進步,幫助各類開發(fā)者與客戶(從專注于打造一款應用的小型公司到財富 500 強企業(yè))取得發(fā)展。

為了給這一計劃鋪平道路,Awadalla 的團隊于去年 9 月發(fā)表了一項研究成果,介紹如何在 NVIDIA A100 Tensor Core GPU 上訓練具有多達 2 千億個參數的 MoE 模型。自那之后,該團隊還在具有超過 3 千億個參數的模型上使用 80G 版本的 A100 GPU,將性能提升了 8 倍。

Adawalla 表示:“為了更好地表示更多的語言,尤其是我們手頭沒有太多數據的語言,模型必定會越來越大。”

原文標題:GTC22 | 促進人際交流:微軟使用 NVIDIA Triton 改善 Translator 翻譯工具的 AI 質量和效率

文章出處:【微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 微軟
    +關注

    關注

    4

    文章

    6750

    瀏覽量

    108061
  • NVIDIA
    +關注

    關注

    14

    文章

    5682

    瀏覽量

    110085
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5258

    瀏覽量

    136031
  • AI
    AI
    +關注

    關注

    91

    文章

    40905

    瀏覽量

    302477

原文標題:GTC22 | 促進人際交流:微軟使用 NVIDIA Triton 改善 Translator 翻譯工具的 AI 質量和效率

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    NVIDIA攜手微軟加速機器人和物理AI的發(fā)展

    在 GTC 大會上,微軟宣布了其代理式和物理 AI 系統統一平臺的更新,加速從實驗到生產落地的進程。 Microsoft Foundry 與 NV
    的頭像 發(fā)表于 03-23 15:21 ?899次閱讀

    NVIDIA 成立由全球領先 AI 實驗室組成的 Nemotron Coalition,推動開放前沿模型發(fā)展

    在內的領先創(chuàng)新者皆是創(chuàng)始成員,助力塑造新一代 AI 系統。 ● 聯盟成員協作開發(fā)一款基于 NVIDIA DGX? Cloud 訓練的開放模型
    的頭像 發(fā)表于 03-17 11:14 ?270次閱讀
    <b class='flag-5'>NVIDIA</b> 成立由全球領先 <b class='flag-5'>AI</b> 實驗室組成的 Nemotron Coalition,推動開放前沿<b class='flag-5'>模型</b>發(fā)展

    NVIDIA Jetson模型賦能AI在邊緣端落地

    開源生成式 AI 模型不再局限于數據中心,而是開始深入到現實世界的各種機器中。從 Orin 到 Thor,NVIDIA Jetson 系列正在成為運行 NVIDIA Nemotron、
    的頭像 發(fā)表于 03-16 16:27 ?569次閱讀
    <b class='flag-5'>NVIDIA</b> Jetson<b class='flag-5'>模型</b>賦能<b class='flag-5'>AI</b>在邊緣端落地

    Transformer 入門:從零理解 AI模型的核心原理

    ) × (4, 5) = 錯誤!? (3 ≠ 4) 在 Transformer 中的應用 scss 體驗AI代碼助手 代碼解讀 復制代碼 Token 嵌入計算
    發(fā)表于 02-10 16:33

    NVIDIA攜手Mistral AI發(fā)布全新開源大語言模型系列

    全新 Mistral 3 系列涵蓋從前沿級到緊湊型模型,針對 NVIDIA 平臺進行了優(yōu)化,助力 Mistral AI 實現云到邊緣分布式智能愿景。
    的頭像 發(fā)表于 12-13 09:58 ?1412次閱讀

    NVIDIA推動面向數字與物理AI的開源模型發(fā)展

    NVIDIA 發(fā)布一系列涵蓋語音、安全與輔助駕駛領域的全新 AI 工具,其中包括面向移動出行領域的行業(yè)級開源視覺-語言-動作推理模型(Reasoning VLA) NVIDIA DRI
    的頭像 發(fā)表于 12-13 09:50 ?1506次閱讀

    NVIDIA擴大與微軟合作推動AI超級工廠建設

    在 Microsoft Ignite 大會上,NVIDIA 擴大與微軟的合作,包括在由 NVIDIA Blackwell 平臺驅動的全新 Microsoft Fairwater AI
    的頭像 發(fā)表于 12-01 09:52 ?943次閱讀

    使用NVIDIA Nemotron RAG和Microsoft SQL Server 2025構建高性能AI應用

    搜索和調用外部 AI 模型的 SQL 原生 API。NVIDIA微軟共同 SQL Server 2025 與
    的頭像 發(fā)表于 12-01 09:31 ?989次閱讀
    使用<b class='flag-5'>NVIDIA</b> Nemotron RAG和Microsoft SQL Server 2025構建高性能<b class='flag-5'>AI</b>應用

    利用NVIDIA Cosmos開放世界基礎模型加速物理AI開發(fā)

    NVIDIA 最近發(fā)布了 NVIDIA Cosmos 開放世界基礎模型(WFM)的更新,旨在加速物理 AI 模型的測試與驗證數據生成。借助
    的頭像 發(fā)表于 12-01 09:25 ?1368次閱讀

    NVIDIA DGX Spark助力構建自己的AI模型

    作為個人 AI 超級計算機,為世界各地的 AI 研究人員、數據科學家和學生提供 NVIDIA Grace Blackwell 平臺的強大功能。
    的頭像 發(fā)表于 11-21 09:25 ?1477次閱讀
    <b class='flag-5'>NVIDIA</b> DGX Spark<b class='flag-5'>助力</b>構建自己的<b class='flag-5'>AI</b><b class='flag-5'>模型</b>

    MediaTek攜手NVIDIA開啟個人AI算力新紀元

    Spark 助力開發(fā)者能在本地端對大型 AI 模型進行原型設計(Prototype)、微調(Fine-tune)和推理(Inference)。NVIDIA DGX Spark 將于
    的頭像 發(fā)表于 10-16 11:26 ?915次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現深度學習AI芯片的創(chuàng)新方法與架構

    射頻模擬處理器的原型與概念驗證 3、光電組合AI芯片 目前最好的應對Transformer模型需要的極高算力的方法之一就是使用光子計算芯片來代替基于CMOS的芯片。 光電組合AI芯片的
    發(fā)表于 09-12 17:30

    NVIDIA Nemotron Nano 2推理模型發(fā)布

    NVIDIA 正式推出準確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的頭像 發(fā)表于 08-27 12:45 ?1988次閱讀
    <b class='flag-5'>NVIDIA</b> Nemotron Nano 2推理<b class='flag-5'>模型</b>發(fā)布

    NVIDIA攜手微軟加速代理式AI發(fā)展

    代理式 AI 正在重新定義科學探索,推動各行各業(yè)的研究突破和創(chuàng)新發(fā)展。NVIDIA微軟正通過深化合作提供先進的技術,從云到 PC 加速代理式 AI 應用的發(fā)展。
    的頭像 發(fā)表于 05-27 14:03 ?1198次閱讀

    機器人領域領先企業(yè)利用NVIDIA技術實現工業(yè)AI

    包括 KUKA、西門子、Standard Bots、優(yōu)傲機器人和 Vention 在內的行業(yè)領先企業(yè),展示了由 NVIDIA 加速且可投入生產的工業(yè)自動化解決方案。
    的頭像 發(fā)表于 05-20 16:10 ?1160次閱讀
    海原县| 安国市| 阿巴嘎旗| 珠海市| 揭西县| 瑞昌市| 抚顺市| 昌吉市| 张家界市| 牡丹江市| 广宗县| 安岳县| 南和县| 华坪县| 海门市| 张掖市| 嘉祥县| 灵寿县| 英德市| 元江| 株洲县| 大城县| 永福县| 巴马| 渑池县| 手游| 吉水县| 志丹县| 锡林浩特市| 句容市| 荣昌县| 永昌县| 隆化县| 吉林省| 樟树市| 昌乐县| 蕉岭县| 尼玛县| 恭城| 平乡县| 出国|