哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

不只是GPU,內(nèi)存廠商們的AI野望

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2023-09-01 00:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/周凱揚(yáng))在諸多云服務(wù)廠商或互聯(lián)網(wǎng)廠商一頭扎進(jìn)GPU的瘋搶潮后,不少公司也發(fā)現(xiàn)了限制AI大模型性能或是成本消耗的除了GPU以外,還有內(nèi)存。內(nèi)存墻作為橫亙在AI計(jì)算和HPC更進(jìn)一步的阻礙之一,在計(jì)算量井噴的今天,已經(jīng)變得愈發(fā)難以忽視。所以,在今年的HotChips大會上,內(nèi)存廠商們也競相展示自己的內(nèi)存技術(shù)在AI計(jì)算上的優(yōu)勢。

三星

三星作為最早一批開始跟進(jìn)存內(nèi)計(jì)算的公司,早在兩年前的HotChips33上,就展示了HBM2-PIM的技術(shù)Aquabolt-XL。三星在去年底展示了用PIM內(nèi)存和96個AMD Instinct MI100 GPU組建的大規(guī)模計(jì)算系統(tǒng),并宣稱這一配置將AI訓(xùn)練的速度提高了近2.5倍。

而今年的HotChips上,三星也著重點(diǎn)明了PIM和PNM技術(shù)在生成式AI這類熱門應(yīng)用上的優(yōu)勢。三星認(rèn)為在ChatGPT、GPT-3之類的應(yīng)用中,主要瓶頸出現(xiàn)在生成階段的線性層上,這是因?yàn)镚PU受到了內(nèi)存限制且整個過程是線性順序進(jìn)行的。

在三星對GPT的分析中,其主要由概括和生成兩大負(fù)載組成,其中概括考驗(yàn)的是計(jì)算單元的性能,而生成則考驗(yàn)的是內(nèi)存的性能。而生成占據(jù)了絕大多數(shù)的運(yùn)算次數(shù)和耗時,其中占據(jù)了60%到80%延遲的GEMV(矩陣向量操作)也就成了三星試圖用PIM和PNM攻克的目標(biāo)。

根據(jù)三星的說法,像GPT這類Transformer架構(gòu)的模型,都可以將多頭注意力(MHA)和前饋神經(jīng)網(wǎng)絡(luò)(FFN)完全交給PIM或PNM,完全利用他們的所有帶寬,從而減少在推理上所花費(fèi)的時間和能耗。三星也在單個AMD MI100-PIM的GPU上進(jìn)行了試驗(yàn),得出運(yùn)行GPT模型時,在HBM-PIM的輔助下,能效是GPU搭配傳統(tǒng)HBM的兩倍,性能同樣提升至兩倍以上。

wKgZomTwaRqAN2Y0AAEQ1l7kLeE723.jpg
LPDDR-PIM概念 / 三星

除了HBM-PIM外,這次三星還展示了最新的LPPDR-PIM概念。除了云端生成式AI需要存內(nèi)計(jì)算的輔助外,諸如智能手機(jī)這樣的端側(cè)生成式AI概念也被炒起來,所以LPPDR-PIM這樣的存內(nèi)計(jì)算技術(shù),可以進(jìn)一步保證續(xù)航的同時,也不會出現(xiàn)為了帶寬內(nèi)存使用超量的情況。

SK海力士

另一大韓國內(nèi)存巨頭SK海力士也沒有閑著,在本次HotChips大會上,他們展示了自己的AiM存內(nèi)加速器方案。相較三星而言,他們?yōu)樯墒紸I的推理負(fù)載準(zhǔn)備的是基于GDDR6的存內(nèi)計(jì)算方案。

GDDR6-AiM采用了1y的制造工藝,具備512GB/s內(nèi)部帶寬的同時,也具備32GB/s的外部帶寬。且GDDR6-AiM具備頻率高達(dá)1GHz的處理單元,算力可達(dá)512GFLOPS。GDDR6-AiM的出現(xiàn),為存內(nèi)進(jìn)行GEMV計(jì)算提供了端到端的加速方案,比如乘法累加和激活函數(shù)等操作都可以在內(nèi)存bank內(nèi)同時進(jìn)行,單條指令實(shí)現(xiàn)全bank操作提供更高的計(jì)算效率。

同時,SK海力士也已經(jīng)考慮到了AiM的擴(kuò)展性問題,比如單個AiM卡中集成了8個AiM封裝,也就是8GB的容量和256個處理單元。但這類擴(kuò)展方案最大的問題還是在軟件映射、硬件架構(gòu)和接口上,這也是絕大多數(shù)集成存內(nèi)計(jì)算的新式內(nèi)存面臨的問題。

wKgaomTwaSaAfbrEAAGKrRvOuwQ093.jpg
AiM系統(tǒng)擴(kuò)展性驗(yàn)證Demo / SK海力士


而SK海力士已經(jīng)給出了這方面的解決方案,比如專門針對AiM的Tiling、基于AiM架構(gòu)的控制器、路由和ALU等等。他們還展示了在兩個FPGA上結(jié)合GDDR6-AiM的Demo,以及用于LLM推理的軟件棧。與此同時,他們也還在探索AiM的下一代設(shè)計(jì),比如如何實(shí)現(xiàn)更高的內(nèi)存容量,用于應(yīng)對更加龐大的模型。

寫在最后

無論是三星還是SK海力士都已經(jīng)在存內(nèi)計(jì)算領(lǐng)域耕耘多年,此次AI熱來勢洶洶,也令他們研發(fā)速度進(jìn)一步提快。畢竟如今能夠解決大模型訓(xùn)練與推理的耗時與TCO的硬件持續(xù)大賣,如果存內(nèi)計(jì)算產(chǎn)品商業(yè)化量產(chǎn)落地進(jìn)展順利,且確實(shí)能為AI計(jì)算帶來助力的話,很可能會小幅提振如今略微萎縮的內(nèi)存市場。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5271

    瀏覽量

    136069
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    內(nèi)存要取代GPU?HBM之父警告:以英偉達(dá)GPU為核心的架構(gòu)要被顛覆

    主板和CPU成為了主角。 ? 而最近“HBM之父”金正浩教授也語出驚人,提出未來內(nèi)存將成為主角:“GPU和CPU將會被集成到內(nèi)存(HBM和HBF)里,淪為內(nèi)存中的一個組件”。 ? 倒反
    的頭像 發(fā)表于 04-03 09:54 ?7042次閱讀
    <b class='flag-5'>內(nèi)存</b>要取代<b class='flag-5'>GPU</b>?HBM之父警告:以英偉達(dá)<b class='flag-5'>GPU</b>為核心的架構(gòu)要被顛覆

    西門子攜手Humanoid與NVIDIA推動物理AI落地

    當(dāng)人形機(jī)器人走出實(shí)驗(yàn)室、真正進(jìn)入工廠車間,它需要的不只是“會動”,更要能感知、能判斷、能協(xié)同、能穩(wěn)定執(zhí)行任務(wù)。
    的頭像 發(fā)表于 04-23 09:32 ?345次閱讀

    KOWIN LPDDR5嵌入式存儲芯片在端側(cè)AI的應(yīng)用

    Hi~我是康小盈相信大家已經(jīng)感受到CFMS 2026峰會現(xiàn)場的火爆~,也看到了KOWIN憑實(shí)力出圈的產(chǎn)品,那這篇文章,帶大家深入了解端側(cè)AI,真正卡住的不只是算力,“存儲”同樣也是關(guān)鍵影響因素。
    的頭像 發(fā)表于 03-28 13:56 ?1676次閱讀
    KOWIN LPDDR5嵌入式存儲芯片在端側(cè)<b class='flag-5'>AI</b>的應(yīng)用

    南亞科技3D堆疊AI內(nèi)存UltraWIO技術(shù)

    UltraWIO(Ultra Wide I/O,超寬輸入輸出介面)架構(gòu)內(nèi)存。該架構(gòu)并非JEDEC標(biāo)準(zhǔn)的DRAM產(chǎn)品,而是與客戶的AI運(yùn)算引擎(AI Engine)緊密整合的客制化方案。其概念類似于高帶寬
    的頭像 發(fā)表于 03-06 14:10 ?2310次閱讀

    世強(qiáng)硬創(chuàng)車規(guī)級視覺方案賦能機(jī)器人突破技術(shù)難題

    當(dāng)這樣的基因被注入機(jī)器人視覺,帶來的不只是參數(shù)的提升,更是從可用到可信的跨越。它不只是一顆攝像頭,而是一套完整的視覺引擎。
    的頭像 發(fā)表于 02-04 17:24 ?1337次閱讀

    恩智浦MCX N系列MCU在數(shù)據(jù)中心和AI服務(wù)器領(lǐng)域表現(xiàn)優(yōu)異

    當(dāng)AI技術(shù)逐漸融入我們生活的每個角落,它正以潛移默化的方式重塑整個時代。我們見證著AI帶來的突破,如模型創(chuàng)新、應(yīng)用場景的演進(jìn),但隨著AI發(fā)展進(jìn)入深水區(qū),真正決定其發(fā)展規(guī)模潛力的,早已不只是
    的頭像 發(fā)表于 01-26 09:22 ?2095次閱讀
    恩智浦MCX N系列MCU在數(shù)據(jù)中心和<b class='flag-5'>AI</b>服務(wù)器領(lǐng)域表現(xiàn)優(yōu)異

    為啥 AI 計(jì)算速度這么驚人?—— 聊聊 GPU、內(nèi)存與并行計(jì)算

    提到AI,大家常說它“算得快”,其實(shí)是指AI能在眨眼間處理海量數(shù)據(jù)。可它為啥有這本事?答案就藏在“GPU+高速內(nèi)存+并行計(jì)算”這trio(組合)里。咱們可以把
    的頭像 發(fā)表于 12-05 14:35 ?1119次閱讀
    為啥 <b class='flag-5'>AI</b> 計(jì)算速度這么驚人?—— 聊聊 <b class='flag-5'>GPU</b>、<b class='flag-5'>內(nèi)存</b>與并行計(jì)算

    淺談研華iEMS.AI Agent能源智能體管理平臺

    近日,研華 iEMS.AI Agent能源智能體專題直播圓滿落幕!這場聚焦工業(yè)級智能升級的分享,帶大家解鎖了 AI 驅(qū)動的全新可能 —— 它不只是一套能碳AI管理工具,更是一個具備強(qiáng)大
    的頭像 發(fā)表于 11-24 15:31 ?991次閱讀
    淺談研華iEMS.<b class='flag-5'>AI</b> Agent能源智能體管理平臺

    開創(chuàng)視覺方案新范式!INDEMIND四目空間智能方案讓導(dǎo)航從追求“精準(zhǔn)”邁向“智能協(xié)同”

    導(dǎo)航的終點(diǎn),不只是“精準(zhǔn)移動”,而是空間理解與決策。
    的頭像 發(fā)表于 11-07 17:09 ?2484次閱讀
    開創(chuàng)視覺方案新范式!INDEMIND四目空間智能方案讓導(dǎo)航從追求“精準(zhǔn)”邁向“智能協(xié)同”

    儲能,不只是存電那么簡單

    一、到底啥是儲能? 一句話概括:儲能,就是把能量先存起來,等到需要的時候再拿出來用的技術(shù)。 您可以把它想象成一個超級“能量銀行”或“能量充電寶”。 充電(儲存能量):當(dāng)能量充足、便宜甚至免費(fèi)時(比如陽光明媚、風(fēng)力強(qiáng)勁的白天,或者深夜用電低谷期),把多余的電能或其他形式的能量儲存起來。 放電(釋放能量):當(dāng)能量短缺、昂貴或急需時(比如陰天無風(fēng)、夜晚用電高峰期,或者突然停電),把儲存的能量釋放出來使用。 這個
    的頭像 發(fā)表于 11-06 16:49 ?1623次閱讀
    儲能,<b class='flag-5'>不只是</b>存電那么簡單

    設(shè)備突然停機(jī)虧哭?智能系統(tǒng)實(shí)時監(jiān)測 + AI 預(yù)警,把故障掐在萌芽里

    過去設(shè)備管理是 “人跟著設(shè)備轉(zhuǎn)”,現(xiàn)在靠智能系統(tǒng) “系統(tǒng)跟著數(shù)據(jù)轉(zhuǎn)”—— 實(shí)時監(jiān)測讓異常無處藏,AI 預(yù)警讓故障不突襲。對企業(yè)來說,省下的不只是維修費(fèi),更是寶貴的生產(chǎn)時間。
    的頭像 發(fā)表于 10-09 10:39 ?478次閱讀
    設(shè)備突然停機(jī)虧哭?智能系統(tǒng)實(shí)時監(jiān)測 + <b class='flag-5'>AI</b> 預(yù)警,把故障掐在萌芽里

    科普:什么AI 內(nèi)存技術(shù)

    問題。 為什么 AI 內(nèi)存很重要? 在 AI 模型訓(xùn)練和推理過程中,大量的數(shù)據(jù)需要從內(nèi)存傳輸?shù)教幚砥鳎ㄈ?GPU 或 TPU)進(jìn)行計(jì)算。傳統(tǒng)
    的頭像 發(fā)表于 09-03 15:44 ?1648次閱讀

    一顆 M12,見工業(yè)人心:從選型到價值的思考

    一個小小的 M12,可能只是機(jī)器上的一個零件,但它承擔(dān)著數(shù)據(jù)、信號、動力的流通。 工程師的責(zé)任,不只是把它做對,更是讓它在各種環(huán)境里都能“活得長久”。 這背后,不只是技術(shù),還有對客戶、對產(chǎn)業(yè)、對社會的那份責(zé)任。
    的頭像 發(fā)表于 08-12 15:34 ?845次閱讀
    一顆 M12,見工業(yè)人心:從選型到價值的思考

    AI的未來,屬于那些既能寫代碼,又能焊電路的“雙棲人才”

    工程師”的每一步我們相信,未來的AI系統(tǒng),不只是云端模型的勝利,更是每一個工程細(xì)節(jié)的勝利。每一個能調(diào)硬件、懂系統(tǒng)、會部署的工程師,都是這個AI時代的“產(chǎn)品設(shè)計(jì)師”。AI的未來,屬于那些
    發(fā)表于 07-30 16:15

    既是工具人也是情緒搭子,INDEMIND助力打造陪伴機(jī)器人新范式!

    陪伴機(jī)器人,不只是玩具!
    的頭像 發(fā)表于 06-20 16:39 ?635次閱讀
    博野县| 天柱县| 岳阳县| 田林县| 西平县| 如皋市| 南和县| 曲水县| 禹城市| 安图县| 米脂县| 舞阳县| 杭锦后旗| 繁峙县| 凤冈县| 偃师市| 辽宁省| 承德市| 城口县| 通榆县| 富宁县| 大安市| 拉孜县| 盘山县| 南江县| 容城县| 壤塘县| 翁牛特旗| 南充市| 三河市| 东兰县| 石林| 台前县| 咸阳市| 东台市| 田阳县| 育儿| 松江区| 封丘县| 武功县| 金秀|