相信您一定聽說過基于FPGA的計算加速突然成為一個熱門話題。你可能還聽說過英特爾在幾年前收購Altera超過160億美元的消息。FPGA技術已逐漸的一個殺手應用程序。如今,隨著摩爾定律的逐漸減緩。工程師尋找替代方法以更快的速度和更低的功耗處理更多數(shù)據(jù),數(shù)據(jù)中心的控制正在醞釀著巨大的爭奪戰(zhàn)。
FPGA是加速許多類型計算工作負載的出色平臺,特別是那些數(shù)據(jù)通路適用于大規(guī)模并行運算的工作負載。FPGA可以通過在硬件中實現(xiàn)重要的計算密集算法塊來減少傳統(tǒng)處理器,從而大幅減少延遲和(通常更重要的)功耗。
基于FPGA的加速的一大缺點是編程模型。為了從具有FPGA和傳統(tǒng)處理器協(xié)同工作的異構計算系統(tǒng)中獲得最佳性能,您需要一種方法來分解問題,將傳統(tǒng)代碼轉(zhuǎn)換為適當?shù)腇PGA架構,并在精心設計的硬件配置中實現(xiàn)整體功能。除其他外,這需要FPGA設計方面的大量專業(yè)知識,以及將數(shù)據(jù)輸入和輸出這些FPGA加速器的總體策略,以及完成任務的存儲器和存儲架構。做到這一點并不是一件容易的事,并且有很多方法可以在整個過程中出錯并最終從您的FPGA投資中獲得很少的收益。
在本周在達拉斯舉行的超級計算會議上,Bittware(今年早些時候被Molex收購)宣布他們與Nallatech“聯(lián)手”(Molex去年收購了Interconnect Systems,Inc。)。在FPGA加速領域,這是一個大問題。雖然基于FPGA的加速對于我們大多數(shù)人來說可能是一個新的熱門話題,并且看起來像是一個全新的世界正在為工程探索開放,但這些人已經(jīng)有很長一段時間了。
Allan Cantle于1993年創(chuàng)立了Nallatech,專注于基于FPGA的加速。
我們在2004年首次開始了解Nallatech,到那時該公司已經(jīng)有超過十年的經(jīng)驗來處理(當時)被稱為“可重新配置計算”的挑戰(zhàn)。Bittware在加速方面具有類似的傳奇歷史,從1991年開始使用基于DSP的ISA總線開始,到2004年與Altera合作轉(zhuǎn)向FPGA。這兩家公司很可能在基于FPGA的加速方面擁有更多的組合經(jīng)驗。
有趣的是,這項技術的這兩位長期資深玩家將在Molex旗下團結一致。
根據(jù)公告,組合的Bittware / Nallatech團隊將提供基于Intel和Xilinx的FPGA加速解決方案。Bittware稱他們的目標應用包括機器學習推理,實時數(shù)據(jù)分析,高頻交易,實時網(wǎng)絡監(jiān)控和視頻廣播等。Bittware正在利用Bittware,Nallatech和Molex的綜合資源來獲得大型企業(yè)客戶。
Bittware將他們的解決方案分解為“計算”,且專注于“網(wǎng)絡”和“存儲”。雖然使用FPGA加速計算是一種魅力,但計算系統(tǒng)的每個部分都需要針對任務進行設計,否則您最終會將性能留在紙面上。FPGA可以在加速這些任務中發(fā)揮關鍵作用。幾十年前,F(xiàn)PGA在網(wǎng)絡業(yè)務中嶄露頭角,并且最近才在存儲和計算方面證明了自己。
在計算方面,Bittware提供來自Intel和Xilinx的支持HBM2的FPGA器件。HBM集成對于英特爾和Xilinx都是新的,并且是一項改變游戲規(guī)則的創(chuàng)新,它允許加速應用程序,否則這些應用程序?qū)⑹艿絺鹘y(tǒng)分立存儲器實現(xiàn)帶寬的限制。例如,Bittware的520N-MX是一款全高雙寬PCI-Express卡,包含一個Intel Stratix 10 MX FPGA,高達8 GB的集成HBM2 @ 512 Gbps,四個QSFP28網(wǎng)箱,每端口支持高達100G,兩個支持DDR4 SDRAM,QDR-II + SRAM或Intel Optane 3D-XPoint的DIMM,兩個用于直接擴展到NVMe SSD陣列的OCuLink端口,以及用于智能平臺管理的“板卡管理控制器”(BMC)。
XUPVVH是一款3/4長PCIe板,帶有Xilinx Virtex UltraScale + VU35P / VU37P,集成8 GB HBM2 @ 460 GBps,支持Gen1,Gen2或Gen3的PCIe x16接口,4個QSFP適用于4x 40 / 100GbE或16x 10 / 25GbE的籠子,以及高達256 GBytes的DDR4。由于VIrtex的280萬個邏輯元件可以產(chǎn)生大量的熱量,Bittware使用他們稱之為“Viper”的平臺,該平臺使用計算機流動模擬以“熱量優(yōu)先”的方式驅(qū)動物理電路板設計,包括“使用熱量”管道,氣流通道和安排組件,以最大限度地提高服務器中有限的可用氣流。“Viper板默認是被動的,可選擇主動冷卻。
除了硬件的功能和規(guī)格之外,Bittware團隊還擁有豐富的經(jīng)驗,可以從基于FPGA的系統(tǒng)中獲得真實的性能。對復雜數(shù)據(jù)中心安裝中的工作負載進行分區(qū),了解內(nèi)存和網(wǎng)絡帶寬要求以及管理散熱是一項不小的成就,而這個團隊帶來的專業(yè)知識可能是成功與失敗之間的差異,也可能是最佳系統(tǒng)與不平衡折衷之間的差異。
電子發(fā)燒友App














評論