哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何為Orca-2-13B創(chuàng)建一個(gè)與OpenAI兼容的API服務(wù)呢?

jf_wN0SrCdH ? 來源:Second State ? 2023-11-27 10:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Orca-2-13B[1] 是微軟最新發(fā)布的 Orca 2 系列中的一款模型,Orca 2 另外還提供 7B 版本。Orca 2系列模型是由 LLAMA 2 基礎(chǔ)模型中微調(diào)而來。Orca 2系列模型擅長(zhǎng)推理、文本總結(jié)、數(shù)學(xué)問題解決和理解任務(wù),是在原始 13B Orca 模型的基礎(chǔ)上進(jìn)一步發(fā)展而來,模仿更強(qiáng)大的 AI 系統(tǒng)推理過程從而提高小型模型在復(fù)雜任務(wù)中的能力。

本文將以 Orca-2-13B 為例,將介紹:

如何在你自己的設(shè)備上運(yùn)行 Orca-2-13B

如何為 Orca-2-13B 創(chuàng)建一個(gè)與 OpenAI 兼容的 API 服務(wù)

你也可以使用同樣的方式運(yùn)行 Orca-2-7B 模型,只需要替換 Orca-2-7B模型的 GGUF 格式的下載鏈接。

我們將用 Rust + Wasm 技術(shù)棧來開發(fā)和部署這個(gè)模型的應(yīng)用程序。無需安裝復(fù)雜的 Python 包或 C++ 工具鏈!了解我們?yōu)槭裁催x擇 Rust+Wasm 技術(shù)棧[2]。

在自己的設(shè)備上運(yùn)行 Orca-2-13B

步驟 1:通過以下命令行安裝 WasmEdge[3]。

curl-sSfhttps://raw.githubusercontent.com/WasmEdge/WasmEdge/master/utils/install.sh|bash-s----pluginwasi_nn-ggml

步驟 2:下載模型 GGUF 文件[4]。由于模型文件有幾 GB,所以可能需要很長(zhǎng)時(shí)間。

curl-LOhttps://huggingface.co/second-state/Orca-2-13B-GGUF/resolve/main/Orca-2-13b-ggml-model-q4_0.gguf

步驟 3:下載一個(gè)跨平臺(tái)的可移植 Wasm 文件,用于聊天應(yīng)用。該應(yīng)用能讓你用命令行與模型進(jìn)行交流。戳這里[5]查看該應(yīng)用的 Rust 源代碼。

curl-LOhttps://github.com/second-state/llama-utils/raw/main/chat/llama-chat.wasm

就這樣。接下來,可以通過輸入以下命令在終端與模型進(jìn)行聊天。

wasmedge--dir.:.--nn-preloaddefaultAUTO:Orca-2-13b-ggml-model-q4_0.ggufllama-chat.wasm-pchatml-s'YouareOrca,anAIlanguagemodelcreatedbyMicrosoft.Youareacautiousassistant.Youcarefullyfollowinstructions.Youarehelpfulandharmlessandyoufollowethicalguidelinesandpromotepositivebehavior.'--stream-stdout

這個(gè)可移植的 Wasm 應(yīng)用會(huì)自動(dòng)利用你設(shè)備上的硬件加速器(如 GPU)。

在我的 Mac M1 32G 內(nèi)存設(shè)備上,它的速度約為每秒 9.15 個(gè)token。

[USER]:What isanOrca?

[ASSISTANT]:
Anorca,orkillerwhale,isalargetoothedpredatorbelongingtotheoceanicdolphinfamily.Theyarehighlyintelligentandsocialanimals,knownfortheircuriosityandplayfulness.

[USER]:

為 Orca-2-13B 創(chuàng)建一個(gè)與 OpenAI 兼容的 API 服務(wù)

一個(gè)與 OpenAI 兼容的網(wǎng)絡(luò) API 能讓 Orca-2-13B 與大量的 LLM 工具和代理框架(如 flows.network、LangChain 和 LlamaIndex)一起工作。

首先,先下載一個(gè) API 服務(wù)器應(yīng)用。它也是一個(gè)可以在許多 CPU 和 GPU 設(shè)備上運(yùn)行的跨平臺(tái)可移植 Wasm 應(yīng)用。

curl-LOhttps://github.com/second-state/llama-utils/raw/main/api-server/llama-api-server.wasm

然后,使用以下命令行啟動(dòng)模型的 API 服務(wù)器。

wasmedge--dir.:.--nn-preloaddefaultAUTO:Orca-2-13B.Q5_K_M.ggufllama-api-server.wasm-pchatml

從另一個(gè)終端,你可以使用 curl 與 API 服務(wù)器進(jìn)行交互。

curl-XPOSThttp://0.0.0.0:8080/v1/chat/completions-H'accept:application/json'-H'Content-Type:application/json'-d'{"messages":[{"role":"system","content":"YouareahelpfulAIassistant"},{"role":"user","content":"WhatisthecapitalofFrance?"}],"model":"Orca-2-13B"}'

就這樣。WasmEdge 是運(yùn)行 Orca-2-13B 大模型應(yīng)用程序最簡(jiǎn)單、最快、最安全的方式[6]。試試看吧!





審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • C++語言
    +關(guān)注

    關(guān)注

    0

    文章

    147

    瀏覽量

    7775
  • python
    +關(guān)注

    關(guān)注

    58

    文章

    4885

    瀏覽量

    90308
  • 硬件加速器
    +關(guān)注

    關(guān)注

    0

    文章

    43

    瀏覽量

    13548
  • Rust
    +關(guān)注

    關(guān)注

    1

    文章

    241

    瀏覽量

    7649
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1249

    瀏覽量

    10281

原文標(biāo)題:跨設(shè)備運(yùn)行微軟最新大語言模型 Orca-2-13B,只需4個(gè)命令行

文章出處:【微信號(hào):Rust語言中文社區(qū),微信公眾號(hào):Rust語言中文社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【飛凌嵌入式RV1126B開發(fā)板試用體驗(yàn)】+ 4. “小龍蝦”openClaw部署(2)--openClaw部署和測(cè)試

    本帖最后由 slmxiaodai_163 于 2026-3-23 15:45 編輯 接著 第篇:【飛凌嵌入式RV1126B開發(fā)板試用體驗(yàn)】+ 1. 開發(fā)環(huán)境搭建https
    發(fā)表于 03-23 10:56

    1688按圖搜索API技術(shù)實(shí)現(xiàn)詳解

    ? 在電商系統(tǒng)開發(fā)或貨源查找工具中,按圖搜索商品是項(xiàng)非常實(shí)用的功能。1688平臺(tái)作為國內(nèi)領(lǐng)先的B2B電商平臺(tái),提供了官方的按圖搜索商品API接口。本文將詳細(xì)講解如何調(diào)用該接口。 、
    的頭像 發(fā)表于 03-13 17:01 ?852次閱讀
    1688按圖搜索<b class='flag-5'>API</b>技術(shù)實(shí)現(xiàn)詳解

    調(diào)用樂天平臺(tái)API獲取商品詳情數(shù)據(jù)

    。 1. 準(zhǔn)備工作 在開始調(diào)用API之前,你需要完成以下準(zhǔn)備工作: 注冊(cè)開發(fā)者賬號(hào) :訪問樂天開發(fā)者門戶,注冊(cè)并創(chuàng)建開發(fā)者賬號(hào)。 創(chuàng)建應(yīng)用 :在開發(fā)者門戶中創(chuàng)建
    的頭像 發(fā)表于 02-02 16:25 ?336次閱讀
    調(diào)用樂天平臺(tái)<b class='flag-5'>API</b>獲取商品詳情數(shù)據(jù)

    1688交易APIB2B訂單自動(dòng)化,加速成交!

    ? 在B2B電商領(lǐng)域,訂單處理效率直接影響供應(yīng)鏈響應(yīng)速度。1688開放平臺(tái)的交易API為商家提供了自動(dòng)化訂單管理能力,可顯著縮短交易周期。本文將從技術(shù)實(shí)現(xiàn)角度解析核心功能與應(yīng)用場(chǎng)景。 、AP
    的頭像 發(fā)表于 01-04 15:46 ?1038次閱讀
    1688交易<b class='flag-5'>API</b>:<b class='flag-5'>B2B</b>訂單自動(dòng)化,加速成交!

    1688商品詳情API指南

    、摘要 1688平臺(tái)為開發(fā)者提供了完整的商品詳情API接口,支持獲取商品的詳細(xì)信息、規(guī)格參數(shù)、價(jià)格庫存等核心數(shù)據(jù)?;谀傲私獾墓S數(shù)據(jù)API,商品詳情API進(jìn)
    的頭像 發(fā)表于 12-11 11:09 ?917次閱讀

    系統(tǒng)調(diào)用和API有什么區(qū)別?

    個(gè)很棒的功能模塊,恰好我也想使用這個(gè)模塊,但我又懶的去看你的代碼,我只想使用你的代碼,不像去關(guān)心實(shí)現(xiàn)細(xì)節(jié),你想了想把所有的功能封裝在了幾個(gè)函數(shù)上,這幾個(gè)函數(shù)就是這個(gè)功能模塊對(duì)外提供的API。 現(xiàn)在
    發(fā)表于 12-03 06:52

    如何評(píng)價(jià)OpenRouter這樣的大模型API聚合平臺(tái)?

    我個(gè)人認(rèn)為OpenRouter的商業(yè)模式特別優(yōu)雅,大模型時(shí)代的輕資產(chǎn) “賣水人”。 open router自己不訓(xùn)練模型,也不買顯卡推理,他做的就是調(diào)用別家的API,聚合了各家的API成為個(gè)
    的頭像 發(fā)表于 10-28 10:04 ?743次閱讀

    RESTful API設(shè)計(jì)原則: 構(gòu)建易用、可擴(kuò)展的API接口

    (Representational State Transfer)架構(gòu)原則,構(gòu)建易用、可擴(kuò)展的API接口,幫助開發(fā)者創(chuàng)建經(jīng)得起時(shí)間考驗(yàn)的服務(wù)、理解REST架構(gòu)的核心約束 1.1
    的頭像 發(fā)表于 10-20 13:45 ?1483次閱讀

    什么是 API接口?

    API接口的工作原理理解 API接口最簡(jiǎn)單的方式,是從“請(qǐng)求-響應(yīng)”模型入手: 1.客戶端發(fā)起請(qǐng)求:比如在電商網(wǎng)站點(diǎn)擊“使用支付寶付款”,此時(shí)系統(tǒng)會(huì)通過
    的頭像 發(fā)表于 10-08 08:57 ?1215次閱讀

    別再搜了!國內(nèi)用戶搞定OpenAI API Key的兩種最佳實(shí)踐(保姆級(jí)教程)

    需要國際卡? 拿到Key了,卻不知道怎么在代碼里安全地使用? 別慌,你遇到的坑,我都踩過。這篇教程就是你的避坑指南,我將以“技術(shù)學(xué)長(zhǎng)”的身份,帶你走通兩條獲取OpenAI API Key的路徑,從注冊(cè)到代碼調(diào)用,幫你搞定!
    的頭像 發(fā)表于 08-24 19:02 ?1.4w次閱讀

    OpenAI發(fā)布2款開源模型

    OpenAI開源了兩款高性能權(quán)重語言模型gpt-oss-120b和gpt-oss-20b,OpenAI CEO Sam Altman表示:「gpt-oss 發(fā)布了!我們做了
    的頭像 發(fā)表于 08-06 14:25 ?1149次閱讀

    電商API的微服務(wù)架構(gòu)優(yōu)化策略

    ,電商API在高并發(fā)、低延遲和數(shù)據(jù)致性方面面臨嚴(yán)峻挑戰(zhàn)。本文將從基礎(chǔ)概念出發(fā),逐步分析優(yōu)化策略,幫助開發(fā)者構(gòu)建高性能、可靠的電商API系統(tǒng)。 1. 微服務(wù)架構(gòu)在電商中的應(yīng)用 微
    的頭像 發(fā)表于 07-23 14:30 ?731次閱讀
    電商<b class='flag-5'>API</b>的微<b class='flag-5'>服務(wù)</b>架構(gòu)優(yōu)化策略

    具有載波聚合的 RX 分集 FEM(B26、B8、B12/13、B2/25、B4 和 B7) skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()具有載波聚合的 RX 分集 FEM(B26、B8、B12/13、B2/25、B
    發(fā)表于 06-19 18:35
    具有載波聚合的 RX 分集 FEM(<b class='flag-5'>B</b>26、<b class='flag-5'>B</b>8、<b class='flag-5'>B</b>12/<b class='flag-5'>13</b>、<b class='flag-5'>B2</b>/25、<b class='flag-5'>B</b>4 和 <b class='flag-5'>B</b>7) skyworksinc

    安卓原生兼容服務(wù)

    安卓原生兼容服務(wù)器的定義 安卓原生兼容服務(wù)器?指基于Android系統(tǒng)內(nèi)核和服務(wù)框架構(gòu)建的服務(wù)
    的頭像 發(fā)表于 06-19 17:32 ?687次閱讀

    如何獲取 OpenAI API Key?API 獲取與代碼調(diào)用示例 (詳解教程)

    OpenAI API Key 獲取與使用詳解:從入門到精通 OpenAI 正以其 GPT 和 DALL-E 等先進(jìn)模型引領(lǐng)全球人工智能創(chuàng)新。其 API 為開發(fā)者和企業(yè)提供了強(qiáng)大的 AI
    的頭像 發(fā)表于 05-04 11:42 ?1.9w次閱讀
    如何獲取 <b class='flag-5'>OpenAI</b> <b class='flag-5'>API</b> Key?<b class='flag-5'>API</b> 獲取與代碼調(diào)用示例 (詳解教程)
    大新县| 武胜县| 临夏市| 塔城市| 右玉县| 措美县| 扶沟县| 交口县| 莫力| 剑阁县| 宁国市| 玉溪市| 胶南市| 泽州县| 九寨沟县| 佛山市| 灵璧县| 渭南市| 夏津县| 临夏市| 胶州市| 中宁县| 宁海县| 习水县| 古交市| 新蔡县| 乌什县| 额尔古纳市| 启东市| 北海市| 和田县| 和林格尔县| 禄丰县| 井陉县| 淮安市| 株洲县| 子洲县| 图片| 寿宁县| 深圳市| 勐海县|