電子發(fā)燒友網(wǎng)報道(文/李彎彎)近些年AI模型的應(yīng)用場景飛速擴(kuò)展,包括自動駕駛、智慧城市、教育、醫(yī)療、金融等等,行業(yè)的多樣性和應(yīng)用場景的分散,使得AI模型爆炸式增長。
在日前某論壇上,商湯科技聯(lián)合創(chuàng)始人兼大裝置首席科學(xué)家林大華談到,商湯科技每年要生產(chǎn)幾萬個AI模型,然而模型豐富,算子的長尾效應(yīng)也很明顯,10% 經(jīng)典算子雖然占據(jù)90% AI芯片算力,而90%長尾算子卻占據(jù)大量計算時間。
多元化的應(yīng)用催生了多樣的算法框架,算法支持應(yīng)用,而算法框架是將算法用于解決實際問題,助力AI芯片算力價值體現(xiàn),充當(dāng)AI芯片與應(yīng)用的橋梁。
比如說算法就是諸如LR、GBDT、DNN、DeepFM這樣的實際解決某個數(shù)學(xué)問題的公式實現(xiàn)。算法框架可以讓算法執(zhí)行更高效,比如最早玩深度學(xué)習(xí)的人都用Theano,基于Theano去開發(fā)算法很困難,后來有了PyTorch和TensorFlow,讓基于深度學(xué)習(xí)的算法開發(fā)更方便。
目前算法框架已經(jīng)非常豐富,包括PyTorch、TensorFlow,還有商湯科技開源的Sense Parrots,華為開源的昇思MindSpore,百度飛槳PaddlePaddle等等。
算法工程師其實是基于算法框架開發(fā)AI算法的,也就是說深度學(xué)習(xí)框架銜接起了硬件芯片算力和上面AI算法應(yīng)用,然而AI訓(xùn)練框架逐漸豐富,但未形成統(tǒng)一的芯片接口,這使得AI訓(xùn)練芯片對框架逐一適配的成本高昂,這也阻礙了AI芯片在市場應(yīng)用上的快速迭代。
為此,商湯科技希望基于已經(jīng)開源開放的算法體系,構(gòu)建統(tǒng)一的接口,把大家協(xié)同在一起,在軟件層面,在算法的結(jié)構(gòu)分解出一些標(biāo)準(zhǔn)算子,表明哪些算子在哪些應(yīng)用場景中最為重要,這樣可以讓大家能夠把有限的適配資源,投放到更有用的地方。
商湯給出的軟件解決方案包括了算法分級體系和標(biāo)準(zhǔn)算子接口體系。據(jù)林大華介紹,算法分級體系首先是從影響力、性能、部署特性三個維度,即算法模型在學(xué)術(shù)界和工業(yè)界的影響力,算法模型的精度和速度,以及算法模型的部署友好性,將AI算法進(jìn)行分級,這樣可以給出方向性的應(yīng)用參考。
接著是卷積輸入配置頻率統(tǒng)計,每個算法模型在實際訓(xùn)練中存在不同的卷積輸入?yún)?shù)配置,不同參數(shù)配置的卷積算子使用頻率存在較大的差異。
再得出高優(yōu)Spec優(yōu)化清單,從算法模型優(yōu)先級評估+模型卷積輸入配置頻率,得到模型重要性和卷積輸入配置頻率加權(quán)評分,再得到高優(yōu)Spec優(yōu)化清單,芯片廠商可參考優(yōu)化的清單進(jìn)行針對性優(yōu)化。
總之,基于算法分級體系的算子優(yōu)化方法可以助力挖掘高優(yōu)Spec,確認(rèn)常用卷積輸入配置優(yōu)化優(yōu)先級,提高芯片廠商適配能效。
長尾算子在實際應(yīng)用中占比非常高,但卻不在標(biāo)準(zhǔn)算法庫里面,因此需要建立標(biāo)準(zhǔn)算子接口來提升芯片和框架的適配。
標(biāo)準(zhǔn)算子接口體系,包括統(tǒng)一算子接口及函數(shù)簽名和一致性測試套件。主要特點是,不依賴具體的框架和芯片,邏輯簡單、易閱讀、易擴(kuò)展,與標(biāo)準(zhǔn)接口定義保持一致,具有可移植性和強(qiáng)適用性,提供一致性的錯誤處理機(jī)制,支持主流開發(fā)框架和應(yīng)用模型。
傳統(tǒng)芯片和框架適配流程,存在這樣的問題:1、廠商合作前溝通成本高;2、適配工作量難度高,風(fēng)險難以控制;3、適配案例和經(jīng)驗難以復(fù)用到其它芯片和框架適配場景中。而接入標(biāo)準(zhǔn)算子接口體系的芯片和框架適配流程,有幾個優(yōu)點:1、廠商合作前沒有額外溝通成本;2、工作量小、難度低,風(fēng)險可控;3、一次接入即可完成對主流芯片、框架適配場景的支持。
整體而言,近些年AI產(chǎn)業(yè)在芯片算力、算法、框架,以及應(yīng)用方面都有很大的進(jìn)步,然而如果AI產(chǎn)業(yè)要長期健康的發(fā)展,還需要上下游機(jī)構(gòu)、廠商一起,攜手合作構(gòu)建出一個繁榮的生態(tài),這中間的算法框架在連接起底層芯片和上層業(yè)務(wù)方面,承擔(dān)著重要責(zé)任。
在日前某論壇上,商湯科技聯(lián)合創(chuàng)始人兼大裝置首席科學(xué)家林大華談到,商湯科技每年要生產(chǎn)幾萬個AI模型,然而模型豐富,算子的長尾效應(yīng)也很明顯,10% 經(jīng)典算子雖然占據(jù)90% AI芯片算力,而90%長尾算子卻占據(jù)大量計算時間。
多元化的應(yīng)用催生了多樣的算法框架,算法支持應(yīng)用,而算法框架是將算法用于解決實際問題,助力AI芯片算力價值體現(xiàn),充當(dāng)AI芯片與應(yīng)用的橋梁。
比如說算法就是諸如LR、GBDT、DNN、DeepFM這樣的實際解決某個數(shù)學(xué)問題的公式實現(xiàn)。算法框架可以讓算法執(zhí)行更高效,比如最早玩深度學(xué)習(xí)的人都用Theano,基于Theano去開發(fā)算法很困難,后來有了PyTorch和TensorFlow,讓基于深度學(xué)習(xí)的算法開發(fā)更方便。
目前算法框架已經(jīng)非常豐富,包括PyTorch、TensorFlow,還有商湯科技開源的Sense Parrots,華為開源的昇思MindSpore,百度飛槳PaddlePaddle等等。

算法工程師其實是基于算法框架開發(fā)AI算法的,也就是說深度學(xué)習(xí)框架銜接起了硬件芯片算力和上面AI算法應(yīng)用,然而AI訓(xùn)練框架逐漸豐富,但未形成統(tǒng)一的芯片接口,這使得AI訓(xùn)練芯片對框架逐一適配的成本高昂,這也阻礙了AI芯片在市場應(yīng)用上的快速迭代。

為此,商湯科技希望基于已經(jīng)開源開放的算法體系,構(gòu)建統(tǒng)一的接口,把大家協(xié)同在一起,在軟件層面,在算法的結(jié)構(gòu)分解出一些標(biāo)準(zhǔn)算子,表明哪些算子在哪些應(yīng)用場景中最為重要,這樣可以讓大家能夠把有限的適配資源,投放到更有用的地方。
商湯給出的軟件解決方案包括了算法分級體系和標(biāo)準(zhǔn)算子接口體系。據(jù)林大華介紹,算法分級體系首先是從影響力、性能、部署特性三個維度,即算法模型在學(xué)術(shù)界和工業(yè)界的影響力,算法模型的精度和速度,以及算法模型的部署友好性,將AI算法進(jìn)行分級,這樣可以給出方向性的應(yīng)用參考。
接著是卷積輸入配置頻率統(tǒng)計,每個算法模型在實際訓(xùn)練中存在不同的卷積輸入?yún)?shù)配置,不同參數(shù)配置的卷積算子使用頻率存在較大的差異。
再得出高優(yōu)Spec優(yōu)化清單,從算法模型優(yōu)先級評估+模型卷積輸入配置頻率,得到模型重要性和卷積輸入配置頻率加權(quán)評分,再得到高優(yōu)Spec優(yōu)化清單,芯片廠商可參考優(yōu)化的清單進(jìn)行針對性優(yōu)化。
總之,基于算法分級體系的算子優(yōu)化方法可以助力挖掘高優(yōu)Spec,確認(rèn)常用卷積輸入配置優(yōu)化優(yōu)先級,提高芯片廠商適配能效。

長尾算子在實際應(yīng)用中占比非常高,但卻不在標(biāo)準(zhǔn)算法庫里面,因此需要建立標(biāo)準(zhǔn)算子接口來提升芯片和框架的適配。
標(biāo)準(zhǔn)算子接口體系,包括統(tǒng)一算子接口及函數(shù)簽名和一致性測試套件。主要特點是,不依賴具體的框架和芯片,邏輯簡單、易閱讀、易擴(kuò)展,與標(biāo)準(zhǔn)接口定義保持一致,具有可移植性和強(qiáng)適用性,提供一致性的錯誤處理機(jī)制,支持主流開發(fā)框架和應(yīng)用模型。

傳統(tǒng)芯片和框架適配流程,存在這樣的問題:1、廠商合作前溝通成本高;2、適配工作量難度高,風(fēng)險難以控制;3、適配案例和經(jīng)驗難以復(fù)用到其它芯片和框架適配場景中。而接入標(biāo)準(zhǔn)算子接口體系的芯片和框架適配流程,有幾個優(yōu)點:1、廠商合作前沒有額外溝通成本;2、工作量小、難度低,風(fēng)險可控;3、一次接入即可完成對主流芯片、框架適配場景的支持。
整體而言,近些年AI產(chǎn)業(yè)在芯片算力、算法、框架,以及應(yīng)用方面都有很大的進(jìn)步,然而如果AI產(chǎn)業(yè)要長期健康的發(fā)展,還需要上下游機(jī)構(gòu)、廠商一起,攜手合作構(gòu)建出一個繁榮的生態(tài),這中間的算法框架在連接起底層芯片和上層業(yè)務(wù)方面,承擔(dān)著重要責(zé)任。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
AI芯片
+關(guān)注
關(guān)注
17文章
2164瀏覽量
36869 -
AI算法
+關(guān)注
關(guān)注
0文章
274瀏覽量
13196
發(fā)布評論請先 登錄
相關(guān)推薦
熱點推薦
半導(dǎo)體芯片封裝中引線框架的概念和工藝
在半導(dǎo)體芯片的制造流程中,封裝是將微小的裸芯片與外部電路系統(tǒng)連接起來的關(guān)鍵環(huán)節(jié)。引線框架(Leadframe)作為封裝內(nèi)部的核心金屬結(jié)構(gòu)件,扮演著不可或缺的角色。它不僅是承載芯片的“骨
恩智浦推出全新eIQ Agentic AI框架
恩智浦半導(dǎo)體宣布推出全新eIQ Agentic AI框架,進(jìn)一步鞏固其在安全實時邊緣AI領(lǐng)域的領(lǐng)導(dǎo)地位。該工具支持在邊緣設(shè)備上直接實現(xiàn)自主智能體功能,助力資深與新手設(shè)備開發(fā)人員簡化并加速智能體
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片
、現(xiàn)階段更智能、更接近AGI的6中算法與模型
1、MoE模型
MoE模型作為Transfomer模型的后繼者,代表著AI技術(shù)的一項重大創(chuàng)新和發(fā)展。
優(yōu)勢:
在于能處理龐大的參數(shù)規(guī)模,顯著減少內(nèi)存占用
發(fā)表于 09-18 15:31
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學(xué)應(yīng)用
主要步驟:
①溯因②假說③實驗
1、科學(xué)推理的類型
①演繹②歸納
2、自動化科學(xué)發(fā)現(xiàn)框架
AI-笛卡兒-----自動化科學(xué)發(fā)現(xiàn)框架,利用數(shù)據(jù)和知識來生成和評估候選的科學(xué)假說。
4項規(guī)則:三、直覺
發(fā)表于 09-17 11:45
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的未來:提升算力還是智力
持續(xù)發(fā)展體現(xiàn)在:
1、收益遞減
大模型的基礎(chǔ)的需要極大的算力,這首先源于昂貴的高性能AI芯片,然后是寶貴的電力、水等與環(huán)境相關(guān)的資源。
收益遞減體現(xiàn)在:
①模型大小
②訓(xùn)練數(shù)據(jù)量
③訓(xùn)練算法的優(yōu)化
2
發(fā)表于 09-14 14:04
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu)
算法
5.2加速矩陣乘法的芯片架構(gòu)
①新的矩陣乘法器架構(gòu)
②基于RISC-V的矩陣乘法擴(kuò)展指令集
③用信息論的思想來減少AI推理計算量
三、用于邊緣側(cè)訓(xùn)練或推理的AI
發(fā)表于 09-12 17:30
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)
的工作嗎?
從書中也了解到了AI芯片都有哪些?像CPU、GPU、FPGA、ASIC都是AI芯片。
其他的還是知道的,F(xiàn)PGA屬于AI
發(fā)表于 09-12 16:07
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:從AI硬件到AI濕件
的不同。隨著AI熱潮的興起,大腦的抽象模型已被提煉成各種的AI算法,并使用半導(dǎo)體芯片技術(shù)加以實現(xiàn)。
而大腦是一個由無數(shù)神經(jīng)元通過突觸連接而成的復(fù)雜網(wǎng)絡(luò),是極其復(fù)雜和精密的。大腦在本質(zhì)上
發(fā)表于 09-06 19:12
如何利用AI算法進(jìn)行裝置數(shù)據(jù)的異常檢測?
- 異常閉環(huán)” 的全流程設(shè)計,實現(xiàn)精準(zhǔn)、高效的異常識別。以下是具體實施框架與關(guān)鍵步驟: 一、第一步:明確裝置數(shù)據(jù)異常類型與檢測目標(biāo) 在選擇 AI 算法前,需先定義 “異?!?的具體場景 —— 工業(yè)裝置的異常并非單一形態(tài),不同異
【「AI芯片:科技探索與AGI愿景」閱讀體驗】+內(nèi)容總覽
,其中第一章是概論,主要介紹大模型浪潮下AI芯片的需求與挑戰(zhàn)。第二章和第三章分別介紹實現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法和架構(gòu)。以及一些新型的算法
發(fā)表于 09-05 15:10
AI 芯片浪潮下,職場晉升新契機(jī)?
芯片設(shè)計為例,從最初的架構(gòu)選型,到算法適配、性能優(yōu)化,每個環(huán)節(jié)都考驗著工程師的專業(yè)素養(yǎng)。在設(shè)計一款面向智能安防領(lǐng)域的 AI 芯片時,需要深入研究安防場景下圖像識別
發(fā)表于 08-19 08:58
【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》
到AGI,一起來探索AI芯片
本書從創(chuàng)新視角出發(fā),系統(tǒng)梳理了AI芯片的前沿技術(shù)與未來方向,串聯(lián)起從算法到系統(tǒng)的實現(xiàn)路徑,全景式展現(xiàn)
發(fā)表于 07-28 13:54
Nordic收購 Neuton.AI 關(guān)于產(chǎn)品技術(shù)的分析
Nordic Semiconductor 于 2025 年收購了 Neuton.AI,這是一家專注于超小型機(jī)器學(xué)習(xí)(TinyML)解決方案的公司。
Neuton 開發(fā)了一種獨特的神經(jīng)網(wǎng)絡(luò)框架,能夠
發(fā)表于 06-28 14:18
AlphaEvolve有望革新AI玩具芯片設(shè)計,算法進(jìn)化驅(qū)動能效與成本雙突破
電子發(fā)燒友網(wǎng)綜合報道,近期,谷歌?DeepMind發(fā)布了一款A(yù)lphaEvolve,是一款通用科學(xué)AI代理,基于大語言模型Gemini系列與進(jìn)化計算框架,專注于算法發(fā)現(xiàn)與優(yōu)化??梢灾С?jǐn)?shù)百行代碼
Deepseek海思SD3403邊緣計算AI產(chǎn)品系統(tǒng)
海思SD3403邊緣計算AI框架,提供了一套開放式AI訓(xùn)練產(chǎn)品工具包,解決客戶低成本AI系統(tǒng),針對差異化AI
應(yīng)用場景,自己采集樣本數(shù)據(jù),進(jìn)
發(fā)表于 04-28 11:05
算法框架是AI芯片與商業(yè)應(yīng)用的橋梁
評論