哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于NVIDIA GPU加速端點使用千問3.5 VLM開發(fā)原生多模態(tài)智能體

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2026-03-04 16:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

阿里巴巴推出了全新開源千問3.5系列,專為構建原生多模態(tài)智能體而設計。該系列的首個模型是一款總參數(shù)為397B、具備推理能力的原生視覺語言模型(VLM),基于由混合專家模型(MoE)和門控Delta網絡(Gated Delta Networks)組成的混合架構構建。千問3.5能夠理解和導航用戶界面,相較上一代VLM有了顯著提升。

千問3.5適用于各種用例,包括:

編碼任務,包括Web開發(fā)

視覺推理任務,包括移動端和Web界面

聊天應用

復雜搜索

千問3.5
模態(tài) 視覺、語言
總參數(shù) 397B
激活參數(shù) 17B
激活率 4.28%
輸入上下文長度 256K token,可擴展至1M token
支持的語言 200+
其他配置信息
專家 512
共享專家 1
每個token使用的專家數(shù)量 11(10個路由專家+ 1個共享專家)
層數(shù) 60
詞表大小 248,320

表1. 千問3.5模型的規(guī)格和配置詳情

使用NVIDIA端點進行構建

您可以在NVIDIA官網上免費使用由NVIDIA GPU驅動的GPU加速端點使用千問3.5進行構建。作為NVIDIA開發(fā)者計劃的一部分,您可以在瀏覽器中快速體驗、試驗不同的提示詞,并使用自己的數(shù)據(jù)測試模型,以評估其在實際場景中的性能。

視頻1.了解如何在NVIDIA GPU加速端點上測試千問3.5

您還可以通過API來調用NVIDIA托管的模型,注冊NVIDIA開發(fā)者計劃即可免費使用。

import requests 
   
invoke_url = "https://integrate.api.nvidia.com/v1/chat/completions" 
   
headers = { 
    "Authorization": "Bearer $NVIDIA_API_KEY", 
    "Accept": "application/json", 
} 
   
payload = { 
  "messages": [ 
    { 
    "role": "user", 
    "content": "" 
    } 
  ], 
  "model": "qwen/qwen3.5-397b-a17b", 
  "chat_template_kwargs": { 
    "thinking": True 
  }, 
  "frequency_penalty": 0, 
  "max_tokens": 16384, 
  "presence_penalty": 0, 
  "stream": True, 
  "temperature": 1, 
  "top_p": 1 
} 
   
# re-use connections 
session = requests.Session() 
   
response = session.post(invoke_url, headers=headers, json=payload) 
   
response.raise_for_status() 
response_body = response.json() 
print(response_body)

要使用工具調用功能,只需定義一個由OpenAI兼容工具組成的數(shù)組,并將其添加到聊天補全接口的tools參數(shù)中。

NVIDIA NIM可以輕松將千問3.5從開發(fā)階段遷移到生產環(huán)境。NIM提供經過優(yōu)化的容器化推理微服務,將模型與性能調優(yōu)、標準化API和企業(yè)所需的部署靈活性打包集成。您可以在各類環(huán)境中下載并運行,無論是本地、云上或混合環(huán)境。

使用NVIDIANeMo自定義模型

千問3.5已具備出色的“開箱即用”多模態(tài)功能,NVIDIA NeMo框架仍提供了關鍵的工具集,使其進一步適配特定領域的需求。開發(fā)者可以使用NeMo Automodel庫微調千問3.5 397B參數(shù)架構,實現(xiàn)高吞吐效率。

NeMoAutomodel是一個原生PyTorch訓練庫,提供Day 0 Hugging Face支持,無需繁瑣的模型轉換,即可在現(xiàn)有檢查點上直接進行訓練。無論是執(zhí)行全量監(jiān)督微調(Supervised Fine-Tuning, SFT),還是使用LoRA等內存高效方法,都有助于快速開展實驗。

作為參考實現(xiàn)指南,開發(fā)者可以利用醫(yī)學視覺問答技術教程,該教程詳細說明了如何在放射學數(shù)據(jù)集上微調千問3.5。在大規(guī)模場景下,NeMo支持多節(jié)點Slurm和Kubernetes部署,從而確保即使是最大的MoE模型,也能在特定領域的推理和復雜智能體工作流中實現(xiàn)低延遲的優(yōu)化,并將延遲降至最低。

開始使用千問3.5

從數(shù)據(jù)中心部署到可隨時隨地進行容器化部署的NVIDIA NIM,NVIDIA提供了千問3.5的集成解決方案。訪問Hugging Face上的千問3.5模型頁面,并前往NVIDIA官網體驗千問3.5的功能。

關于作者

Anu Srivastava 是高級技術營銷經理,專注于開放 AI 模型。她與主要合作伙伴和基金會合作,為開源開發(fā)者生態(tài)系統(tǒng)提供 NVIDIA 加速平臺支持。加入 NVIDIA 之前,她曾在 Google 擔任各種工程職務超過 10 年,并擁有德克薩斯大學奧斯汀分校計算機科學學位。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5678

    瀏覽量

    110073
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5253

    瀏覽量

    136017
  • 阿里巴巴
    +關注

    關注

    7

    文章

    1648

    瀏覽量

    49312

原文標題:基于 NVIDIA GPU 加速端點,使用千問3.5 VLM 開發(fā)原生多模態(tài)智能體

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    《CST Studio Suite 2024 GPU加速計算指南》

    監(jiān)控/利用率、選擇可用GPU卡子集等內容。 6. 故障排除:針對NVIDIA驅動安裝、GPU設置、GPU模式、硬件識別、CUDA錯誤、TC
    發(fā)表于 12-16 14:25

    NVIDIA火熱招聘GPU高性能計算架構師

    這邊是NVIDIA HR Allen, 我們目前在上海招聘GPU高性能計算架構師(功能驗證)的崗位,有意向的朋友歡迎發(fā)送簡歷到 allelin@nvidia
    發(fā)表于 09-01 17:22

    AI開發(fā)者福音!阿里云推出國內首個基于英偉達NGC的GPU優(yōu)化容器

    云計算服務異構加速平臺,為人工智能產業(yè)提供場景化的全球加速能力。2017年11月,阿里云發(fā)布了國內首個支持 NVIDIA ?Tesla ?
    發(fā)表于 04-04 14:39

    Nvidia GPU風扇和電源顯示ERR怎么解決

    問題最近在Ubuntu上使用Nvidia GPU訓練模型的時候,如果機器鎖屏一段時間再打開的時候鼠標非??D,或者說顯示界面非??D,使用nvidia-smi查看發(fā)現(xiàn),訓練模型的GPU
    發(fā)表于 12-30 06:44

    在Ubuntu上使用Nvidia GPU訓練模型

    問題最近在Ubuntu上使用Nvidia GPU訓練模型的時候,沒有問題,過一會再訓練出現(xiàn)非??D,使用nvidia-smi查看發(fā)現(xiàn),顯示GPU的風扇和電源報錯:解決方案自動風扇控制在
    發(fā)表于 01-03 08:24

    慕尼黑電子展回顧:啟明智顯模態(tài)硬件智能引領科技潮流

    在剛剛落幕的慕尼黑電子展上,啟明云端攜啟明智顯與觸覺智能兩家子公司,共同為全球觀眾呈現(xiàn)了一場科技盛宴。本次展會,啟明智顯憑借其創(chuàng)新的模態(tài)硬件智能
    的頭像 發(fā)表于 07-10 16:17 ?1139次閱讀
    慕尼黑電子展回顧:啟明智顯<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>硬件<b class='flag-5'>智能</b><b class='flag-5'>體</b>引領科技潮流

    商湯絕影在行業(yè)率先實現(xiàn)原生模態(tài)大模型的車端部署

    “基于原生模態(tài)大模型,商湯絕影正在打造一系列全新的車載智能化產品,推動智能汽車向超級智能
    的頭像 發(fā)表于 07-23 10:52 ?1290次閱讀
    商湯絕影在行業(yè)率先實現(xiàn)<b class='flag-5'>原生</b><b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大模型的車端部署

    ?VLM(視覺語言模型)?詳細解析

    視覺語言模型(Visual Language Model, VLM)是一種結合視覺(圖像/視頻)和語言(文本)處理能力的模態(tài)人工智能模型,能夠理解并生成與視覺內容相關的自然語言。以下
    的頭像 發(fā)表于 03-17 15:32 ?9541次閱讀
    ?<b class='flag-5'>VLM</b>(視覺語言模型)?詳細解析

    移遠通信智能模組全面接入模態(tài)AI大模型,重塑智能交互新體驗

    隨著行百業(yè)數(shù)智化進程的不斷加速模態(tài)AI大模型的應用需求不斷攀升,圖像、語音、視頻等多樣化的交互方式正逐漸成為推動行業(yè)變革的新動力。3月20日,全球物聯(lián)網整體解決方案供應商移遠通信
    的頭像 發(fā)表于 03-20 19:03 ?938次閱讀
    移遠通信<b class='flag-5'>智能</b>模組全面接入<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>AI大模型,重塑<b class='flag-5'>智能</b>交互新體驗

    移遠通信智能模組全面接入模態(tài)AI大模型,重塑智能交互新體驗

    隨著行百業(yè)數(shù)智化進程的不斷加速模態(tài)AI大模型的應用需求不斷攀升,圖像、語音、視頻等多樣化的交互方式正逐漸成為推動行業(yè)變革的新動力。 ? 3月20日,全球物聯(lián)網整體解決方案供應商移
    發(fā)表于 03-21 14:12 ?570次閱讀
    移遠通信<b class='flag-5'>智能</b>模組全面接入<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>AI大模型,重塑<b class='flag-5'>智能</b>交互新體驗

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)

    NVIDIA GTC 推出新一代專業(yè)級 GPU 和 AI 賦能的開發(fā)者工具—同時,ChatRTX 更新現(xiàn)已支持 NVIDIA NIM,RTX Remix 正式結束測試階段,本月的
    的頭像 發(fā)表于 03-28 09:59 ?1423次閱讀

    沐曦股份曦云C系列GPU深度適配通義Qwen3.5模型

    今天,通義今天正式發(fā)布 Qwen3.5,并推出Qwen3.5系列的第一款模型 Qwen3.5-397B-A17B 的開放權重版本。沐曦股
    的頭像 發(fā)表于 02-26 14:26 ?734次閱讀
    沐曦股份曦云C系列<b class='flag-5'>GPU</b>深度適配通義<b class='flag-5'>千</b><b class='flag-5'>問</b>Qwen<b class='flag-5'>3.5</b>模型

    沐曦股份曦云C系列GPU全面適配通義Qwen3.5三款新模型

    今日,通義團隊正式開源發(fā)布Qwen3.5系列中等規(guī)模模型,推出包括Qwen3.5-35B-A3B、Qwen3.5-122B-A10B、Q
    的頭像 發(fā)表于 02-28 10:05 ?652次閱讀
    沐曦股份曦云C系列<b class='flag-5'>GPU</b>全面適配通義<b class='flag-5'>千</b><b class='flag-5'>問</b>Qwen<b class='flag-5'>3.5</b>三款新模型

    NVIDIA攜手全球工業(yè)軟件巨頭構建AI智能加速設計與工程開發(fā)流程

    ? 以及 GPU 加速的工業(yè)軟件與工具引入 FANUC、HD 現(xiàn)代集團、本田、捷豹路虎、凱傲集團、梅賽德斯奔馳、聯(lián)發(fā)科技、百事公司、三星、SK 海力士和 TSMC 等企業(yè),以加速工業(yè)設計、工程
    的頭像 發(fā)表于 03-19 15:39 ?367次閱讀

    天數(shù)智芯完成阿里云通義Qwen3.5系列模態(tài)模型全量適配

    近日,天數(shù)智芯攜手眾智FlagOS 社區(qū)完成阿里云通義 Qwen3.5 系列模態(tài)模型全量適配,實現(xiàn)模型精度精準對齊與端到端無縫部署,再
    的頭像 發(fā)表于 03-26 09:25 ?1216次閱讀
    二手房| 和平县| 禹州市| 福安市| 秦皇岛市| 黄大仙区| 新蔡县| 高阳县| 通山县| 东乌珠穆沁旗| 保康县| 河曲县| 万盛区| 鄂伦春自治旗| 迭部县| 普陀区| 泸定县| 司法| 扶沟县| 高台县| 密山市| 绥宁县| 横山县| 藁城市| 讷河市| 渑池县| 沙坪坝区| 沧源| 彰武县| 滨州市| 隆昌县| 拉萨市| 甘德县| 三都| 酉阳| 深州市| 阿鲁科尔沁旗| 宜阳县| 当阳市| 濮阳县| 烟台市|