哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌發(fā)布第八代TPU,訓(xùn)練推理分離,搭載自研CPU

Carol Li ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2026-04-24 09:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)在2026年4月22日舉行的谷歌云Next大會(huì)上,谷歌正式發(fā)布了第八代張量處理單元(TPU)。此次發(fā)布的產(chǎn)品包含兩款獨(dú)立的芯片:TPU 8t和TPU 8i。這是谷歌首次將訓(xùn)練與推理任務(wù)拆分至獨(dú)立芯片,標(biāo)志著其AI硬件路線的重大轉(zhuǎn)向。

谷歌高級(jí)副總裁兼AI與基礎(chǔ)設(shè)施首席技術(shù)專家Amin Vahdat表示,隨著AI智能體(AI Agents)的興起,訓(xùn)練與服務(wù)場(chǎng)景對(duì)硬件的需求已經(jīng)出現(xiàn)明顯分化。為了最大化效率,需要分別為這兩類場(chǎng)景打造專用芯片。

這一變化反映了當(dāng)前AI基礎(chǔ)設(shè)施建設(shè)的核心趨勢(shì):從單純的模型參數(shù)規(guī)模競(jìng)爭(zhēng),轉(zhuǎn)向了對(duì)算力成本、能效比以及推理延遲的綜合考量。

TPU 8t與8i的技術(shù)亮點(diǎn)

谷歌此次推出的TPU 8t與TPU 8i兩款芯片,在設(shè)計(jì)目標(biāo)、集群規(guī)模、內(nèi)存配置及互聯(lián)架構(gòu)上有明顯差異。TPU 8t聚焦于大規(guī)模模型訓(xùn)練,而TPU 8i則致力于實(shí)現(xiàn)高并發(fā)、低延遲的推理任務(wù)。


TPU 8t的設(shè)計(jì)核心在于構(gòu)建一個(gè)無(wú)阻塞的超大規(guī)模計(jì)算集群,以應(yīng)對(duì)當(dāng)前日益復(fù)雜的萬(wàn)億參數(shù)模型訓(xùn)練挑戰(zhàn)。在集群擴(kuò)展能力方面,單個(gè)超級(jí)計(jì)算單元(Supercomputer Pod)可容納多達(dá)9600枚芯片,而通過(guò)JAX與Pathways框架,分布式訓(xùn)練規(guī)模更可擴(kuò)展至單一集群超過(guò)100萬(wàn)枚TPU芯片。這種前所未有的規(guī)模,使得最復(fù)雜的模型能夠調(diào)用一個(gè)統(tǒng)一的超大規(guī)模內(nèi)存池進(jìn)行計(jì)算,從而大幅減少了跨集群通信的開(kāi)銷,提升了訓(xùn)練效率。

為了解決大規(guī)模集群中的通信瓶頸,TPU 8t采用了全新的Virgo網(wǎng)絡(luò)架構(gòu)。在互聯(lián)架構(gòu)與帶寬方面,芯片間互聯(lián)(ICI)帶寬是上一代的兩倍,而數(shù)據(jù)中心骨干網(wǎng)帶寬則較上一代提升了最高4倍。這種兩層無(wú)阻塞網(wǎng)絡(luò)設(shè)計(jì),確保了即使在數(shù)萬(wàn)枚芯片協(xié)同工作時(shí),數(shù)據(jù)傳輸也不會(huì)成為計(jì)算的限制因素,為超大規(guī)模訓(xùn)練提供了堅(jiān)實(shí)的網(wǎng)絡(luò)支撐。

在計(jì)算性能與可靠性方面,TPU 8t計(jì)算性能較上一代Ironwood提升了近3倍。此外,該芯片還引入了一套完善的可靠性、可用性與可維護(hù)性(RAS)設(shè)計(jì),包括覆蓋數(shù)萬(wàn)枚芯片的實(shí)時(shí)遙測(cè)監(jiān)控,以及在不中斷任務(wù)運(yùn)行的情況下自動(dòng)檢測(cè)并繞過(guò)故障鏈路的機(jī)制。光路電路交換(OCS)技術(shù)的運(yùn)用,更是使得硬件拓?fù)浣Y(jié)構(gòu)能夠在無(wú)需人工干預(yù)的前提下,圍繞故障點(diǎn)自動(dòng)重構(gòu),進(jìn)一步提升了系統(tǒng)的穩(wěn)定性和可靠性。

與TPU 8t追求吞吐量不同,TPU 8i的設(shè)計(jì)核心在于解決推理過(guò)程中的“內(nèi)存墻”問(wèn)題和降低響應(yīng)延遲,特別是針對(duì)混合專家模型(MoE)和復(fù)雜的智能體工作流。為了實(shí)現(xiàn)這一目標(biāo),TPU 8i在片上SRAM方面進(jìn)行了大幅擴(kuò)容。

推理任務(wù)通常涉及頻繁的內(nèi)存讀寫,尤其是在處理長(zhǎng)上下文窗口時(shí)。TPU 8i配備了384MB的片上靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM),容量是上一代的三倍。這意味著模型的活躍工作集(如KV Cache)可以完全保留在芯片內(nèi)部運(yùn)行,從而大幅減少了處理器等待數(shù)據(jù)從外部高帶寬內(nèi)存(HBM)傳輸?shù)臅r(shí)間,顯著降低了推理延遲。

在互聯(lián)架構(gòu)方面,TPU 8i放棄了傳統(tǒng)的3D Torus互聯(lián)結(jié)構(gòu),轉(zhuǎn)而采用分層式的Boardfly網(wǎng)絡(luò)拓?fù)?。這種架構(gòu)由基礎(chǔ)單元(4枚完全互聯(lián)的芯片)組成,進(jìn)一步擴(kuò)展為本地化組,最后通過(guò)OCS互聯(lián)成集群。在這種架構(gòu)下,任意兩枚芯片之間的通信最多只需經(jīng)過(guò)7次跳轉(zhuǎn)(上一代為16跳),全對(duì)全通信延遲改善了最高50%。這對(duì)于MoE模型中頻繁跨芯片路由令牌(Token)的操作至關(guān)重要,有效提升了推理效率。

此外,TPU 8i還新增了片上集合加速引擎(CAE),該引擎可以卸載全局操作,將片上集合操作的延遲降低至多5倍。這對(duì)于自回歸解碼和思維鏈處理等需要多芯片緊密協(xié)作的任務(wù)來(lái)說(shuō),無(wú)疑是一個(gè)巨大的提升,有效增強(qiáng)了集群的并發(fā)效率。

谷歌針對(duì)不同芯片的特性選擇了不同的設(shè)計(jì)合作伙伴。TPU 8t由博通共同設(shè)計(jì),借助博通在高性能ASIC設(shè)計(jì)領(lǐng)域的經(jīng)驗(yàn),實(shí)現(xiàn)了極致的計(jì)算密度和互聯(lián)性能。而TPU 8i則由聯(lián)發(fā)科參與設(shè)計(jì),旨在通過(guò)聯(lián)發(fā)科的工程能力打造高性價(jià)比的推理加速器。兩款芯片均運(yùn)行在谷歌自研的Axion ARM架構(gòu)CPU平臺(tái)上,并由谷歌第四代液冷技術(shù)提供散熱支持,這種全棧自研與定制合作相結(jié)合的模式,有助于谷歌在保證性能的同時(shí),控制數(shù)據(jù)中心的總體擁有成本(TCO)。

全棧生態(tài):從芯片到智能體平臺(tái)

硬件的迭代升級(jí),本質(zhì)是為軟件生態(tài)的蓬勃發(fā)展提供支撐。在此次大會(huì)上,谷歌同步推出多項(xiàng)針對(duì) AI 智能體的軟件與平臺(tái)更新,全力打通從底層算力到頂層應(yīng)用的完整鏈路。

在 Gemini 企業(yè)代理平臺(tái)領(lǐng)域,谷歌推出專為 AI 代理打造的一站式平臺(tái)——Gemini Enterprise。該平臺(tái)集模型選擇、構(gòu)建及代理開(kāi)發(fā)功能于一身,功能強(qiáng)大且全面。其中的 Agent Studio 獨(dú)具特色,企業(yè)可借此構(gòu)建具備長(zhǎng)期記憶、能執(zhí)行多步驟流程的智能體,極大拓展了智能體的應(yīng)用邊界。同時(shí),谷歌推出“知識(shí)目錄”(Knowledge Catalog)和跨云湖倉(cāng)(Cross - Cloud Lakehouse),打破數(shù)據(jù)壁壘。AI 智能體得以無(wú)縫訪問(wèn) AWS、Azure 等外部云服務(wù)商的數(shù)據(jù),有效解決數(shù)據(jù)孤島問(wèn)題,讓 AI 能夠精準(zhǔn)回答涉及復(fù)雜業(yè)務(wù)關(guān)系的深度問(wèn)題。

谷歌 Workspace 套件也迎來(lái)智能化升級(jí)。通過(guò)全新的 Workspace Intelligence 層,Gemini 能夠跨 Gmail、Docs 和 Drive 深度理解上下文。基于此,智能體可自動(dòng)安排會(huì)議、生成契合品牌形象的 PPT,甚至在 Gmail 中提供智能收件箱助手,全方位提升辦公效率。為加速企業(yè)向谷歌 Workspace 的遷移,谷歌還推出“快速企業(yè)遷移”功能,將遷移速度提升至原來(lái)的 5 倍,降低企業(yè)遷移成本。

谷歌第八代 TPU 的發(fā)布對(duì)行業(yè)的影響,可能遠(yuǎn)不止硬件規(guī)格的迭代這么簡(jiǎn)單,它也對(duì) AI 基礎(chǔ)設(shè)施發(fā)展方向提供了參考價(jià)值。

在能效與成本平衡方面,面對(duì)電力供應(yīng)成為數(shù)據(jù)中心主要制約因素的現(xiàn)狀,TPU 8t 和 8i 均將能效作為核心考量指標(biāo)。與上一代 Ironwood 相比,TPU 8t 每瓦性能提升 124%,TPU 8i 提升 117%。能效的顯著提升,使企業(yè)能在相同電力預(yù)算下提供更多算力服務(wù),有效控制成本。

光互聯(lián)市場(chǎng)也迎來(lái)新機(jī)遇。TPU 8 系列對(duì)高帶寬和低延遲的極致追求,有力推動(dòng)光模塊和光路交換機(jī)(OCS)市場(chǎng)增長(zhǎng)。尤其是 TPU 8i 在推理集群中全面采用 OCS 全互聯(lián)技術(shù),預(yù)示光交換技術(shù)將從訓(xùn)練集群向推理集群廣泛滲透,相關(guān)產(chǎn)業(yè)鏈?zhǔn)袌?chǎng)空間有望進(jìn)一步拓展。

寫在最后

目前,亞馬遜、微軟和Meta等科技巨頭也在積極布局自研AI芯片。谷歌通過(guò)“訓(xùn)練+推理”的雙芯策略,結(jié)合自研CPU和液冷技術(shù),構(gòu)建了垂直整合的競(jìng)爭(zhēng)優(yōu)勢(shì)。雖然英偉達(dá)在通用GPU市場(chǎng)仍占據(jù)主導(dǎo)地位,但谷歌通過(guò)定制化的ASIC路線,正在為企業(yè)級(jí)AI應(yīng)用提供一種高性價(jià)比的替代方案。

總體而言,谷歌TPU 8t和8i的推出,旨在以更具成本效益的方式提供大規(guī)模吞吐量和低延遲能力,從而支撐起AI智能體時(shí)代的算力需求。這兩款芯片預(yù)計(jì)將于2026年晚些時(shí)候正式面向市場(chǎng)推出。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • asic
    +關(guān)注

    關(guān)注

    34

    文章

    1278

    瀏覽量

    124940
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6259

    瀏覽量

    111968
  • TPU
    TPU
    +關(guān)注

    關(guān)注

    0

    文章

    173

    瀏覽量

    21716
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    小米3nm旗艦SoC、4G基帶亮相!雷軍回顧11年造芯路

    XRING O1旗艦芯片。除了大芯片之外,還有此前未有曝光的,搭載小米4G基帶的玄戒T1手表芯片,以及小米首款豪華高性能SUV小米YU7。下面我們來(lái)回顧一下發(fā)布會(huì)上的亮點(diǎn),以及小米
    的頭像 發(fā)表于 05-23 09:07 ?7778次閱讀
    小米<b class='flag-5'>自</b><b class='flag-5'>研</b>3nm旗艦SoC、4G基帶亮相!雷軍回顧11年造芯路

    谷歌推出TPU 8t / 8i,分別面向訓(xùn)練推理

    行業(yè)芯事行業(yè)資訊
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2026年04月23日 13:40:46

    谷歌將新一TPU,專用于推理

    行業(yè)芯事行業(yè)資訊
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2026年04月21日 11:19:52

    實(shí)錘!比亞迪首次披露激光雷達(dá)進(jìn)度,已量產(chǎn)上車?。▽⑷衿占埃?/a>

    ,比亞迪發(fā)布2025年度報(bào)告,尤其讓我們關(guān)注的是,在年度【研發(fā)投入】中,比亞迪披露了“第二刀片電池及閃充技術(shù)”等26個(gè)年度重大研發(fā)項(xiàng)目,其中就包括“激光雷達(dá)”項(xiàng)目——這是比亞迪首次曝光
    的頭像 發(fā)表于 04-01 20:07 ?3005次閱讀
    實(shí)錘!比亞迪首次披露<b class='flag-5'>自</b><b class='flag-5'>研</b>激光雷達(dá)進(jìn)度,已量產(chǎn)上車?。▽⑷衿占埃? />    </a>
</div>                              <div   id=

    加快進(jìn)程!Meta計(jì)劃2027年底前推出四AI芯片

    用于支持公司內(nèi)部的AI訓(xùn)練推理任務(wù)。 ? AI 芯片的推進(jìn)進(jìn)程 ? 目前,MTIA 300已進(jìn)入量產(chǎn)階段,主要應(yīng)用于內(nèi)容排序和推薦系統(tǒng)的模型
    的頭像 發(fā)表于 03-16 08:57 ?1.2w次閱讀

    國(guó)內(nèi)首個(gè)國(guó)產(chǎn)AI推理千卡集群落地,采用云天勵(lì)飛全AI推理芯片

    3 月 12 日,云天勵(lì)飛中標(biāo)湛江市AI滲透支撐新質(zhì)生產(chǎn)力基礎(chǔ)設(shè)施建設(shè)項(xiàng)目,中標(biāo)金額4.2億元。項(xiàng)目將基于云天勵(lì)飛的國(guó)產(chǎn)AI推理加速卡,建設(shè)國(guó)產(chǎn)AI推理千卡集群。 該集群將
    發(fā)表于 03-12 11:10 ?1319次閱讀

    曦望發(fā)布新一推理GPU芯片,單位Token推理成本降低90%

    電子發(fā)燒友網(wǎng)報(bào)道 1月27日,國(guó)產(chǎn)GPU廠商曦望(Sunrise)重磅發(fā)布新一推理GPU芯片——啟望S3。這是曦望在近一年累計(jì)完成約30億元戰(zhàn)略融資后的首次集中公開(kāi)亮相。2025年,曦望芯片交付量
    的頭像 發(fā)表于 01-28 17:38 ?9534次閱讀

    微軟發(fā)布AI芯片Maia 200,性能超越谷歌TPU和亞馬遜Trainium

    電子發(fā)燒友網(wǎng)綜合報(bào)道 美東時(shí)間1月26日,微軟重磅發(fā)布第二人工智能芯片Maia 200,這一舉措成為微軟減少對(duì)英偉達(dá)芯片依賴、高效驅(qū)動(dòng)自身服務(wù)的關(guān)鍵一步,也標(biāo)志著其在
    的頭像 發(fā)表于 01-27 16:46 ?7489次閱讀
    微軟<b class='flag-5'>發(fā)布</b>AI芯片Maia 200,性能超越<b class='flag-5'>谷歌</b><b class='flag-5'>TPU</b>和亞馬遜Trainium

    AI硬件全景解析:CPU、GPU、NPU、TPU的差異化之路,一文看懂!?

    CPU作為“通用基石”,支撐所有設(shè)備的基礎(chǔ)運(yùn)行;GPU憑借并行算力,成為AI訓(xùn)練與圖形處理的“主力”;TPU在Google生態(tài)中深耕云端大模型訓(xùn)練;NPU則讓AI從“云端”走向“身邊”
    的頭像 發(fā)表于 12-17 17:13 ?2237次閱讀
    AI硬件全景解析:<b class='flag-5'>CPU</b>、GPU、NPU、<b class='flag-5'>TPU</b>的差異化之路,一文看懂!?

    英偉達(dá)遇最強(qiáng)對(duì)手,谷歌加速推廣TPU

    行業(yè)芯事行業(yè)資訊
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2025年11月26日 13:54:07

    谷歌發(fā)布最強(qiáng)TPU,性能比前代提升4倍

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近日,谷歌云在官方博客上正式宣布,公司成功推出第七TPU(張量處理器)“Ironwood”,該芯片預(yù)計(jì)在未來(lái)幾周內(nèi)正式上市。 ? “Ironwood”由谷歌
    的頭像 發(fā)表于 11-13 07:49 ?8961次閱讀
    <b class='flag-5'>谷歌</b>云<b class='flag-5'>發(fā)布</b>最強(qiáng)<b class='flag-5'>自</b><b class='flag-5'>研</b><b class='flag-5'>TPU</b>,性能比前代提升4倍

    安波福推出第八雷達(dá)系列

    致力于更安全、更綠色、更互聯(lián)未來(lái)的全球科技公司安波福(紐約證券交易所代碼:APTV)今日宣布,正式推出其目前為止最先進(jìn)的第八雷達(dá)系列。該技術(shù)專為滿足未來(lái)高級(jí)駕駛輔助系統(tǒng)(ADAS)的發(fā)展需求而設(shè)
    的頭像 發(fā)表于 10-22 11:49 ?731次閱讀

    德賽西威榮獲第八屆廣東省政府質(zhì)量獎(jiǎng)

    近日,《廣東省人民政府關(guān)于表彰第八屆廣東省政府質(zhì)量獎(jiǎng)獲獎(jiǎng)組織的通報(bào)》發(fā)布,德賽西威榮獲“第八屆廣東省政府質(zhì)量獎(jiǎng)”。
    的頭像 發(fā)表于 09-29 13:56 ?848次閱讀

    東風(fēng)風(fēng)神L8搭載馬赫動(dòng)力電池

    近日,東風(fēng)新旗艦東風(fēng)風(fēng)神L8正式開(kāi)啟預(yù)售,聚焦家庭用車核心需求,該車搭載東風(fēng)“馬赫動(dòng)力電池”打造主流家庭的“質(zhì)價(jià)比之王”。
    的頭像 發(fā)表于 08-15 09:55 ?1754次閱讀

    高端芯片,服務(wù)器芯片傳來(lái)好消息!

    的研發(fā)又有了一些動(dòng)向,例如海光信息、龍芯中科等都在加強(qiáng)這一力度。 ? 海光 C86-5G ? 海光CPU從初基于AMD Zen架構(gòu)開(kāi)發(fā),再到
    的頭像 發(fā)表于 05-18 09:25 ?8529次閱讀
    高端芯片<b class='flag-5'>自</b><b class='flag-5'>研</b>,服務(wù)器芯片傳來(lái)好消息!
    留坝县| 册亨县| 顺平县| 法库县| 温州市| 五大连池市| 恭城| 西青区| 凌海市| 永济市| 长子县| 乌苏市| 乐亭县| 镇康县| 文昌市| 新乡市| 龙游县| 河北省| 湟源县| 罗甸县| 上蔡县| 和顺县| 营山县| 金华市| 合水县| 涪陵区| 定襄县| 合江县| 大连市| 九龙坡区| 临朐县| 娱乐| 汝城县| 灵石县| 龙川县| 赤峰市| 孟津县| 左贡县| 林甸县| 秭归县| 日喀则市|