AV在线电影播放,久久久夜色AV,日产久久视频

今年春節(jié)后，DeepSeek R1 風(fēng)暴般地席卷全國，小到手機(jī) App，大到新能源汽車，似乎一夜間所有產(chǎn)品都接入了 DeepSeek R1。不得不說 DeepSeek R1 確實(shí)好用，對筆者這種編輯來說，從大綱到審閱，效率有著極大的提升。不過，官方滿血版的 DeepSeek R1 雖然好用，但會經(jīng)?！暗艟€”，平均一個小時(shí)只能使用一次。第三方的滿血 DeepSeek R1 很少掉線，但涉及隱私或保密數(shù)據(jù)時(shí)，大家并不放心上傳云端。

于是，很多人萌生自己搭建 DeepSeek R1 的想法。然而滿血版的 DeepSeek R1 模型體積足足有 404GB，遠(yuǎn)超一般消費(fèi)級顯卡的顯存。即使 32B 的蒸餾模型體積也有 20GB。這就對顯卡的性能提出了較高的要求。例如，32GB 顯存的英偉達(dá) RTX 5090 D 公版官方售價(jià)為 16999 元，但實(shí)際上要多花一萬多元才能買到。

一、配置與部署

那么，有沒有什么經(jīng)濟(jì)實(shí)惠且效果不錯的方案呢？聰明的你想到讓多張顯卡協(xié)同工作，不過 AMD 目前的新顯卡已經(jīng)不支持交火了，英偉達(dá)的 SLI 技術(shù)也不支持顯存疊加，而 Intel 的 Arc 顯卡不僅支持交火，并且顯存也可以疊加，價(jià)格也很實(shí)惠，兩張 Arc A770 16GB 價(jià)格 3600 元左右，就可獲得 32GB 的大現(xiàn)存。IT之家這次嘗試使用兩張藍(lán)戟 Intel Arc A770 Photon 16G OC 進(jìn)行交火，來配置 DeepSeek R1 32B 的蒸餾模型。其具體配置如下圖：

Intel Arc A770 有 8G 和 16GB 兩個版本，我們選擇的藍(lán)戟 Intel Arc A770 Photon 16G OC 配備 16GB GDDR6 顯存，顯存帶寬可達(dá) 512GB/s，其擁有 32 個 Xe 核心，最高頻率 2400Mhz。

因?yàn)槭请p卡方案，所以需要留意主板與電源的配置，主板至少需要有兩個 PCIe 顯卡插槽，并且每個插槽必須支持 PCIe 4.0 x8 的傳輸速率。電源方面，單張藍(lán)戟 Intel Arc A770 Photon 16G OC 的 TBP 為 285W，兩張顯卡的功耗就要接近 600W。為了保證系統(tǒng)的穩(wěn)定，我們選擇了海韻的 1300W 電源進(jìn)行測試，這款電源不僅能滿足功率需求，還能滿足兩張顯卡所需的 4 個 PCIe 8Pin 接口。模型我們選擇通過使用 IPEX-LLM 部署在 Linux 上，相比 Window 系統(tǒng)效率會更高一些。

搭建結(jié)束后，我們用另一臺電腦局域網(wǎng)訪問后端，在操作時(shí)盡量不使用測試電腦進(jìn)行截圖錄屏，避免無關(guān)操作對 GPU 的占用。

二、性能與效果

因?yàn)槭?32B 的模型，所以我們直接上強(qiáng)度，讓模型幫我們寫一個 HTML 小游戲。我們首先對模型進(jìn)行提問：

請用 html 寫個貪吃蛇游戲的代碼，需要包含以下功能：

?使用鍵盤上的上下左右箭頭鍵控制蛇的移動方向。

?蛇會自動向前移動，并在吃到紅色的食物時(shí)增長并增加得分。

?當(dāng)蛇碰到墻壁或自己時(shí)，游戲結(jié)束并顯示得分。

?點(diǎn)擊“重新開始”按鈕可以重置游戲并重新開始。

游戲規(guī)則：

?蛇不能碰到墻壁或自己，否則游戲結(jié)束。

?每吃一個食物，得分增加 10 分。

?食物不會出現(xiàn)在蛇的身體上。

DeepSeek R1 開始分析問題并生成代碼，此時(shí)兩張 Arc A770 顯卡的風(fēng)扇全力運(yùn)轉(zhuǎn)，后端顯示 Avg Generation Throughput 可以穩(wěn)定在 26 tokens / s 以上。對比之下，單張 RTX 5090 D 運(yùn)行 32B 模型的性能大約為 46 tokens / s，而官方不到兩成的價(jià)格卻得到了五成以上的性能，這個表現(xiàn)還是很讓人驚喜的。

生成后的 HTML 小游戲可以直接預(yù)覽運(yùn)行，我發(fā)現(xiàn)操作有沖突，按上下方向鍵會滾動網(wǎng)頁。

于是我提出對代碼進(jìn)行修改，要求用 A、S、D、W 來代替方向鍵。DeepSeek R1 很精準(zhǔn)的理解了我的需求，并完成了修改。

隨后，我要求生成更為復(fù)雜的俄羅斯方塊 HTML 代碼，雖說參數(shù)量只有 32B，但 DeepSeek R1 所生成的游戲同樣很完善，幾乎沒有什么 Bug。

說到 AI 大模型的邏輯能力測試，那肯定繞不開弱智吧經(jīng)典問答。我們選擇了兩個問題對雙 A770 搭建的 DeepSeek R1 進(jìn)行測試：

1、神父去世是離職還是升職？

這種讓人一愣的問題 32B 的 DeepSeek R1 也能從現(xiàn)實(shí)與信仰兩種角度出發(fā)給出分析與解釋?？梢钥闯?32B 模型的邏輯能力還是很強(qiáng)的，有著極高的可用性。

2、變形金剛應(yīng)該交車險(xiǎn)還是人險(xiǎn)？

面對二選一的提問，32B 的 DeepSeek R1 并沒有死板的做出選擇，其理解了變形金剛不同形態(tài)的特征給出了兩種保險(xiǎn)都買的絕佳選擇。

總結(jié)：

從測試結(jié)果來看，兩張 Intel Arc A770 16GB 顯卡（總計(jì) 3600 元）組成的雙卡部署 DeepSeek R1 蒸餾模型的方案確實(shí)經(jīng)濟(jì)實(shí)惠。通過 IPEX-LLM 工具在 Linux 系統(tǒng)上部署，測試顯示雙 A770 顯卡能穩(wěn)定運(yùn)行 32B 模型，生成 HTML 小游戲和處理復(fù)雜問題時(shí)表現(xiàn)優(yōu)異，平均吞吐量達(dá) 26 tokens / s，有著不錯的性價(jià)比?？傮w而言，A770 雙卡低成本部署 DeepSeek 32B 兼具成本、性能和數(shù)據(jù)隱私優(yōu)勢，適合中小企業(yè)和個人開發(fā)者。

審核編輯黃宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴