哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI時(shí)代的存儲(chǔ)墻,哪種存算方案才能打破?

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2024-04-21 01:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))回顧計(jì)算行業(yè)幾十年的歷史,芯片算力提升在幾年前,還在遵循摩爾定律??呻S著如今摩爾定律顯著放緩,算力發(fā)展已經(jīng)陷入瓶頸。而且禍不單行,陷入同樣困境的還有存儲(chǔ)。從新標(biāo)準(zhǔn)推進(jìn)的角度來看,存儲(chǔ)市場依然在朝著更高性能的方向發(fā)展。但以這些通用標(biāo)準(zhǔn)推出的產(chǎn)品,終究還是會(huì)被用到馮諾依曼架構(gòu)的計(jì)算體系中去?;蛟S單個(gè)產(chǎn)品的性能有所增加,可面對AI計(jì)算的海量數(shù)據(jù),這點(diǎn)提升還是有些不夠看。

以LLM這個(gè)熱門AI應(yīng)用而言,其數(shù)據(jù)量已經(jīng)在以2年750倍的速度爆發(fā)式增長,相較之下硬件算力正在以2年3倍的速度增長。但與存儲(chǔ)不同,硬件算力是可以靠堆規(guī)模來實(shí)現(xiàn)持續(xù)提升的,可存儲(chǔ)帶寬和互聯(lián)帶寬卻沒法擁有同樣的拓展性,只有存儲(chǔ)容量能夠勉強(qiáng)跟上。所以市場上多數(shù)都在追求某種形式的存算一體方案,但實(shí)現(xiàn)的形式和技術(shù)路線不盡相同。

近存方案,更大的SRAM和HBM

對于我們說的存儲(chǔ)墻而言,其實(shí)在SRAM上并不那么明顯,這種最接近處理單元的存儲(chǔ),常被用作高速緩存,不僅讀寫速度極快,能效比更是遠(yuǎn)超DRAM。但SRAM相對其他存儲(chǔ)而言,存儲(chǔ)密度最低,成本卻不低。所以盡管現(xiàn)如今雖然更大的SRAM設(shè)計(jì)越來越普遍,但容量離DRAM還差得很遠(yuǎn)。

但這并不代表這樣的設(shè)計(jì)沒有人嘗試,對于愿意花大成本的廠商而言,還是很高效的一條技術(shù)路線。以特斯拉為例,其Tesla Dojo超算系統(tǒng)的自研芯片D1就采用了超大SRAM的技術(shù)路線。Dojo在其網(wǎng)格設(shè)計(jì)中采用了超快且平均分布的SRAM。
D1芯片 / 特斯拉

單個(gè)D1核心擁有1.25MB的SRAM,加載速度達(dá)到400GB/s,存儲(chǔ)速度達(dá)到270GB/s。單個(gè)D1芯片的SRAM緩存達(dá)到440MB。簡單來說,Dojo可以用遠(yuǎn)超L2緩存級(jí)別的SRAM容量,實(shí)現(xiàn)L1緩存級(jí)別的帶寬和延遲。

當(dāng)然了,這樣的設(shè)計(jì)注定代表了投入大量的成本。在特斯拉2023財(cái)年Q4的財(cái)報(bào)會(huì)議上,馬斯克強(qiáng)調(diào)他們做了英偉達(dá)和Dojo的兩手準(zhǔn)備。Dojo作為長遠(yuǎn)計(jì)劃,因?yàn)樽罱K的回報(bào)可能會(huì)值回現(xiàn)在的投入,但他也強(qiáng)調(diào)這確實(shí)不是什么高收益的項(xiàng)目。

所以對于已有的計(jì)算架構(gòu)來說,走近存路線,提高DRAM的性能是最為適合的,比如HBM。HBM作為主流的近存高帶寬方案,已經(jīng)被廣泛應(yīng)用在新一代的AI芯片、GPU上。以HBM3e為例,1.2TB/s的超大帶寬足以滿足現(xiàn)如今絕大多數(shù)AI芯片的數(shù)據(jù)傳輸。未來的HBM4更是承諾1.5TB/s到2TB/s的帶寬,

HBM的方案象征了目前DRAM堆疊的集大成技術(shù),但目前還是存在不少問題,比如更高的成本以及對產(chǎn)能的要求。在現(xiàn)如今的AI需求驅(qū)動(dòng)下,新發(fā)布的芯片很難再采用HBM設(shè)計(jì)的同時(shí),保證大批量量產(chǎn),無論是HBM產(chǎn)能還是CoWoS產(chǎn)能都處于滿載的階段,而且與制造廠商強(qiáng)綁定??汕∏〈鎯?chǔ)帶寬決定了AI應(yīng)用的速度,所以在HBM方案量產(chǎn)困難成本高昂的前提下,即便是英特爾AMD這樣的廠商也經(jīng)不起這樣揮霍,不少其他廠商更是選擇了看下存內(nèi)計(jì)算。

存內(nèi)計(jì)算與處理,需要解決算力與存儲(chǔ)雙瓶頸

為了解決AI計(jì)算中數(shù)據(jù)存取的效率問題,把數(shù)據(jù)處理和篩選的工作放在存儲(chǔ)端,就能極大地降低數(shù)據(jù)移動(dòng)的能耗。以三星PIM技術(shù)為例,其將關(guān)鍵的算法內(nèi)核放在內(nèi)存中的PCU模塊中執(zhí)行,相比已有的HBM方案,PIM-HBM可以將能耗降低70%以上。而且不僅是HBM,PIM也可以集成到LPDDR、GDDR等存儲(chǔ)方案中。

不過存內(nèi)處理的方案只解決了功耗和效率的問題,并沒有對計(jì)算性能和存儲(chǔ)性能帶來任何大幅提升。至于將主要計(jì)算工作交給存內(nèi)的計(jì)算單元,就是存內(nèi)計(jì)算的目標(biāo)了,比如不少廠商嘗試的模擬存內(nèi)計(jì)算(AIMC)。但這類方案實(shí)現(xiàn)大規(guī)模并行化運(yùn)算的同時(shí),還是需要昂貴的數(shù)模轉(zhuǎn)換器,以及逃不開的錯(cuò)誤檢測。至于數(shù)字存內(nèi)計(jì)算方案,一定程度上規(guī)避了模擬存內(nèi)計(jì)算的缺陷,但還是犧牲了一些面積效率。對于一些大模型AI應(yīng)用而言,單芯片的存儲(chǔ)容量擴(kuò)展性堪憂。

所以數(shù)模混合成了新的研究方向,比如中科院微電子研究所就在今年的ISSCC大會(huì)上發(fā)表了數(shù)?;旌洗嫠阋惑w芯片的論文,其采用模擬方案來進(jìn)行陣列內(nèi)位乘法計(jì)算,利用數(shù)字方案來進(jìn)行陣列外多位移位累加計(jì)算,從而達(dá)到整體的高能量效率和面積效率,INT8精度下的計(jì)算峰值能效可達(dá)111.17TFLOPS/W.
speedAI240 / Untether AI

除此之外,還有存間計(jì)算的廠商,將計(jì)算單元放在不同的SRAM之間。以存間計(jì)算初創(chuàng)公司Untether AI為例,他們以打造存內(nèi)推理加速器AI為主,通過將計(jì)算單元放在兩個(gè)存儲(chǔ)單元之間,其IC可以提供更高能效比的推理性能。比如他們在打造的第二代IC,speedAI240,集成了1400個(gè)定制RISC-V核心,可以提供至高2PetaFlops的推理性能,能耗比最高可達(dá)30 TFLOPS/W。

除了各種存算一體架構(gòu)的算力瓶頸外,存儲(chǔ)本身也需要做出突破。以三星的PIM為例,其雖然在DRAM上引入了PIM計(jì)算單元,但并未對DRAM本身的帶寬的性能帶來提升,這就造成了在存算一體的架構(gòu)中,依然存在計(jì)算單元與存儲(chǔ)器性能不平衡的問題,各種其他類型的存儲(chǔ)器,包括MRAM、PCM、RRAM,除了量產(chǎn)問題外,寫入速度和功耗的問題也還未實(shí)現(xiàn)突破。

西安紫光國芯為此提出了一種3D異質(zhì)集成DRAM架構(gòu),邏輯晶圓通過3D混合鍵合工藝堆疊至SeDRAM晶圓上,進(jìn)一步提升了訪存帶寬,降低了單位比特能耗,還能實(shí)現(xiàn)超大容量。從去年紫光國芯在VLSI 2023發(fā)布的論文來看,其SeDRAM已經(jīng)發(fā)展至新一代多層陣列架構(gòu)。結(jié)合低溫混合鍵合技術(shù)和mini-TSV堆疊技術(shù),可以實(shí)現(xiàn)135Gbps/Gbit的帶寬和0.66pJ/bit的能效。

寫在最后

其實(shí)無論是哪一種突破存儲(chǔ)墻瓶頸的方式,最終都很難逃脫復(fù)雜工藝帶來的挑戰(zhàn)。行業(yè)遲遲不愿普及相關(guān)的存算技術(shù),還是在制造工藝上沒有達(dá)到適合普及的標(biāo)準(zhǔn),無論是良率、成本還是所需的設(shè)計(jì)、制造流水線變化。已經(jīng)占據(jù)主導(dǎo)地位的計(jì)算芯片廠商,也不會(huì)選擇非得和存儲(chǔ)綁在一條船上,但行業(yè)必然會(huì)朝這個(gè)方向發(fā)展。

此外,不少存內(nèi)計(jì)算的堆疊方案中,還沒有選擇將主計(jì)算資源的CPU或GPU與存儲(chǔ)垂直堆疊,而是把部分計(jì)算負(fù)載交給與存儲(chǔ)結(jié)合的計(jì)算單元。這樣一來既提高了AI計(jì)算的效率,又不會(huì)因?yàn)榻Y(jié)構(gòu)變化而出現(xiàn)不兼容的情況。從行業(yè)發(fā)展的角度來看,近存計(jì)算和存內(nèi)處理最有可能先普及開來。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲(chǔ)
    +關(guān)注

    關(guān)注

    13

    文章

    4885

    瀏覽量

    90255
  • sram
    +關(guān)注

    關(guān)注

    6

    文章

    833

    瀏覽量

    117714
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41025

    瀏覽量

    302545
  • HBM
    HBM
    +關(guān)注

    關(guān)注

    2

    文章

    432

    瀏覽量

    15880
  • 存算一體
    +關(guān)注

    關(guān)注

    1

    文章

    121

    瀏覽量

    5208
  • 存內(nèi)計(jì)算
    +關(guān)注

    關(guān)注

    0

    文章

    35

    瀏覽量

    1674
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    OpenClaw引爆AI力!長江存儲(chǔ)eSSD三箭齊發(fā),有何殺手锏?

    SIA數(shù)據(jù)顯示,從2024年到2029年,eSSD需求的復(fù)合增長率達(dá)到34.9%。長江存儲(chǔ)固態(tài)硬盤事業(yè)部負(fù)責(zé)人譚弘就AI時(shí)代力瓶頸和長江存儲(chǔ)
    的頭像 發(fā)表于 03-31 09:36 ?1.4w次閱讀
    OpenClaw引爆<b class='flag-5'>AI</b><b class='flag-5'>存</b>力!長江<b class='flag-5'>存儲(chǔ)</b>eSSD三箭齊發(fā),有何殺手锏?

    中科曙光scaleX40超節(jié)點(diǎn)革新AI協(xié)同

    在當(dāng)前時(shí)代,以Token(詞元)為代表的力需求已成為行業(yè)核心剛需,而穩(wěn)定、高效的力運(yùn)轉(zhuǎn),離不開底層力的可靠支撐。立足這一行業(yè)發(fā)展邏
    的頭像 發(fā)表于 03-28 15:46 ?1633次閱讀

    ReRAM:AI時(shí)代的潛力存儲(chǔ)技術(shù)

    ,逐漸成為存儲(chǔ)領(lǐng)域和人工智能(AI)領(lǐng)域的焦點(diǎn)。 ? ReRAM是一種非易失性存儲(chǔ)器,由富士通率先研制成功。它基于憶阻器原理,采用金屬 - 介質(zhì)層 - 金屬(MIM)的三層結(jié)構(gòu),通過電阻狀態(tài)的變化來
    的頭像 發(fā)表于 02-25 09:04 ?4733次閱讀

    如何突破AI存儲(chǔ)?深度解析ONFI 6.0高速接口與Chiplet解耦架構(gòu)

    1. 行業(yè)核心痛點(diǎn):AI存儲(chǔ)”危機(jī)在大模型訓(xùn)練與推理場景中,力演進(jìn)速度遠(yuǎn)超存儲(chǔ)帶寬,計(jì)算與存儲(chǔ)
    發(fā)表于 01-29 17:32

    國產(chǎn)高性能ONFI IP解決方案全解析

    PHY IP 方案展現(xiàn)了行業(yè)領(lǐng)先的性能,專為滿足一體及大容量存儲(chǔ)需求而優(yōu)化:? 高速率傳輸:全面支持先進(jìn)規(guī)范,傳輸速率可達(dá) 3600/4800 Mbps。? 卓越信號(hào)完整性:支持
    發(fā)表于 01-13 16:15

    2025年曙光存儲(chǔ)以先進(jìn)力構(gòu)建開放的力底座并加速AI進(jìn)化

    數(shù)據(jù)存儲(chǔ)作為AI基礎(chǔ)設(shè)施的重要組成,戰(zhàn)略價(jià)值日益凸顯。2025年,曙光存儲(chǔ)以先進(jìn)力構(gòu)建開放的力底座、加速
    的頭像 發(fā)表于 01-07 09:39 ?619次閱讀

    AI一體,這家ReRAM新型存儲(chǔ)受關(guān)注

    及相關(guān)芯片產(chǎn)品的研發(fā),涵蓋AI一體(Computing in Memory, CIM)IP及大模型加速方案、高性
    的頭像 發(fā)表于 12-25 09:43 ?2347次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>存</b><b class='flag-5'>算</b>一體,這家ReRAM新型<b class='flag-5'>存儲(chǔ)</b>受關(guān)注

    mSSD存儲(chǔ)介質(zhì)生態(tài)創(chuàng)新,探索AI終端存儲(chǔ)新路徑

    的產(chǎn)業(yè)鏈伙伴,共探AI時(shí)代存儲(chǔ)介質(zhì)生態(tài)創(chuàng)新。AI發(fā)展驅(qū)動(dòng)終端計(jì)算架構(gòu)革新,力持續(xù)突破的同時(shí),存儲(chǔ)
    的頭像 發(fā)表于 12-15 21:32 ?728次閱讀
    mSSD<b class='flag-5'>存儲(chǔ)</b>介質(zhì)生態(tài)創(chuàng)新,探索<b class='flag-5'>AI</b>終端<b class='flag-5'>存儲(chǔ)</b>新路徑

    曙光存儲(chǔ)推出面向金融的可信AI存儲(chǔ)

    近日,曙光存儲(chǔ)推出面向金融的可信AI存儲(chǔ),助力金融行業(yè)高效、安全、穩(wěn)定地使用關(guān)鍵業(yè)務(wù)敏感數(shù)據(jù)。該方案基于全球領(lǐng)先的集中式全閃存儲(chǔ)FlashN
    的頭像 發(fā)表于 10-23 09:24 ?774次閱讀

    江波龍攜AI存儲(chǔ)創(chuàng)新亮相中國移動(dòng)合作伙伴大會(huì),合創(chuàng)AI+時(shí)代

    經(jīng)濟(jì)發(fā)展新機(jī)遇。作為中國移動(dòng)合作伙伴,江波龍?jiān)诒緦么髸?huì)集中展示面向AI、云計(jì)算及數(shù)據(jù)中心的企業(yè)級(jí)存儲(chǔ)方案,與產(chǎn)業(yè)鏈伙伴合創(chuàng)AI+時(shí)代
    的頭像 發(fā)表于 10-10 17:38 ?1396次閱讀
    江波龍攜<b class='flag-5'>AI</b><b class='flag-5'>存儲(chǔ)</b>創(chuàng)新亮相中國移動(dòng)合作伙伴大會(huì),合創(chuàng)<b class='flag-5'>AI</b>+<b class='flag-5'>時(shí)代</b>

    一文看懂“一體”

    今天這篇文章,我們來聊一個(gè)最近幾年很火的概念——一體。為什么會(huì)提出“一體”?一體,英
    的頭像 發(fā)表于 08-18 12:15 ?1651次閱讀
    一文看懂“<b class='flag-5'>存</b><b class='flag-5'>算</b>一體”

    2025端側(cè)AI芯片爆發(fā):一體、非Transformer架構(gòu)誰主浮沉?邊緣計(jì)算如何選型?

    各位技術(shù)大牛好!最近WAIC 2025上端側(cè)AI芯片密集發(fā)布,徹底打破傳統(tǒng)力困局。各位大佬在實(shí)際項(xiàng)目中都是如何選型的呢?
    發(fā)表于 07-28 14:40

    平衡”有多重要?

    。而決定這種配合效率的關(guān)鍵指標(biāo),正是我們今天要聊的“比”。什么是比?比=計(jì)算能力(如
    的頭像 發(fā)表于 07-11 14:06 ?867次閱讀
    “<b class='flag-5'>算</b><b class='flag-5'>存</b>平衡”有多重要?

    力積存儲(chǔ)港股IPO,蓄力研發(fā)AI方案

    電子發(fā)燒友網(wǎng)綜合報(bào)道,5月28日,浙江力積存儲(chǔ)科技股份有限公司(以下簡稱"力積存儲(chǔ)")向港交所提交上市申請書,獨(dú)家保薦人為中信證券(香港)有限公司。 ? 力積存儲(chǔ)是中國領(lǐng)先的內(nèi)存芯片設(shè)計(jì)公司及
    的頭像 發(fā)表于 06-06 00:57 ?8348次閱讀
    力積<b class='flag-5'>存儲(chǔ)</b>港股IPO,蓄力研發(fā)<b class='flag-5'>AI</b><b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>方案</b>

    蘋芯科技 N300 一體 NPU,開啟端側(cè) AI 新征程

    隨著端側(cè)人工智能技術(shù)的爆發(fā)式增長,智能設(shè)備對本地力與能效的需求日益提高。而傳統(tǒng)馮·諾依曼架構(gòu)在數(shù)據(jù)處理效率上存在瓶頸,“內(nèi)存”問題成為制約端側(cè)AI性能突破的關(guān)鍵掣肘。在這一背景下,
    的頭像 發(fā)表于 05-06 17:01 ?1309次閱讀
    蘋芯科技 N300 <b class='flag-5'>存</b><b class='flag-5'>算</b>一體 NPU,開啟端側(cè) <b class='flag-5'>AI</b> 新征程
    尖扎县| 绵竹市| 乌拉特中旗| 吉木乃县| 大埔县| 中方县| 图片| 郑州市| 西和县| 大石桥市| 城市| 北川| 东山县| 凤凰县| 元谋县| 开鲁县| 林口县| 安溪县| 延津县| 新化县| 建湖县| 华安县| 长岭县| 深水埗区| 南和县| 晋中市| 建平县| 浪卡子县| 灵台县| 庄浪县| 湖南省| 双峰县| 喀喇沁旗| 新疆| 蕲春县| 望奎县| 贡山| 喀什市| 荥经县| 兖州市| 全椒县|