哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大模型引發(fā)技術(shù)變革, AI芯片公司面臨新挑戰(zhàn)

智能計算芯世界 ? 來源:機器之心 ? 2023-05-04 09:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

ChatGPT 在全球范圍內(nèi)掀起了一場技術(shù)革命與商業(yè)浪潮,AI 市場也迎來了前所未有的機遇與增量。

當前,AI 基礎(chǔ)設(shè)施的算力、算法呈現(xiàn)新 “摩爾定律”:相同算力下能訓(xùn)練生產(chǎn)更優(yōu)質(zhì)的模型,同時最先進的 AI 模型約每幾個月算力需求就會擴大一倍。

14d12908-e8b6-11ed-ab56-dac502259ad0.png

根據(jù)斯坦福大學(xué)和麥肯錫聯(lián)合發(fā)布的《2019 人工智能指數(shù)報告》,2012 年之前最先進 AI 模型計算量每兩年翻一倍;2012 年之后計算量每 3.4 個月翻一番,從 2012 年到 2020 年 3 月已增長 30 萬倍。

伴隨著大模型的快速迭代,其對算力的要求也不斷提高,而算力的核心就是人工智能芯片。因此,如何在新趨勢、新挑戰(zhàn)下快速響應(yīng)客戶需求,推出切實可用的軟硬件解決方案,成為了擺在國內(nèi) AI 芯片企業(yè)面前的首要課題。

擁抱變化,聚焦提升產(chǎn)品力

ChatGPT 及大模型技術(shù)大會上,昆侖芯科技研發(fā)總監(jiān)王志鵬表示:“作為一家芯片公司,需要對市場的需求和變化非常敏感,才能使硬件產(chǎn)品始終精準匹配主流需求?!?/p>

大模型對計算的要求主要體現(xiàn)在三個方面,一是算力,二是互聯(lián),三是成本。就大模型而言,昆侖芯科技在產(chǎn)品定義上已經(jīng)做出布局 —— 相較第一代產(chǎn)品,昆侖芯 2 代 AI 芯片可大幅優(yōu)化算力、互聯(lián)和高性能,而在研的下一代產(chǎn)品則將提供更佳的性能體驗。

昆侖芯科技成立于 2021 年,前身為百度智能芯片及架構(gòu)部。在實際業(yè)務(wù)場景中深耕 AI 加速領(lǐng)域已逾 10 年,專注打造擁有強大通用性、易用性和高性能的通用人工智能芯片。

在持續(xù)推進核心技術(shù)攻關(guān)的同時,昆侖芯科技緊密關(guān)注科技前沿,精準匹配市場需求。目前,公司已實現(xiàn)兩代通用 AI 芯片的量產(chǎn)及落地應(yīng)用,在互聯(lián)網(wǎng)、智慧金融、智慧交通等領(lǐng)域已規(guī)模部署數(shù)萬片。

14eff248-e8b6-11ed-ab56-dac502259ad0.png

昆侖芯在大模型場景的規(guī)模落地實踐

“來自真實場景” 一直是昆侖芯科技最獨特的身份標簽,也是其規(guī)模部署數(shù)萬片、在行業(yè)內(nèi) “領(lǐng)跑落地” 的核心優(yōu)勢所在。

王志鵬認為,只有基于真實業(yè)務(wù)場景中的數(shù)據(jù)進行端到端優(yōu)化,才能順利推進大模型落地。

目前市場上主流的大模型以 Transformer 架構(gòu)為主,包含 Encoder 和 Decoder。Encoder 主要被應(yīng)用于各類 NLP 的判別類任務(wù);而 Decoder 更多被應(yīng)用于翻譯、圖文生成等場景,最近出圈的 ChatGPT 就是典型代表。

針對大模型,昆侖芯持續(xù)打磨部署優(yōu)化方案,領(lǐng)跑產(chǎn)業(yè)落地。昆侖芯已將大模型的 Transformer 相關(guān)優(yōu)化技術(shù)沉淀為重要基建,優(yōu)化后的性能比原有方案提升 5 倍以上,壓縮顯存 30% 以上。

以文生圖大模型為例,昆侖芯已跑通一條端到端優(yōu)化、規(guī)模落地之路。

AI 繪畫模型的推理算力及顯存需求隨圖像分辨率增大而指數(shù)級增加,同時,圖像生成需要循環(huán)采樣數(shù)十次,產(chǎn)業(yè)落地動輒需要高昂成本的部署集群,嚴重阻礙了 AIGC 模型大規(guī)模商業(yè)化落地。

2022 年第四季度,昆侖芯聯(lián)合客戶,基于飛槳 PaddlePaddle 發(fā)起了端到端聯(lián)合優(yōu)化項目。在 2-3 周內(nèi),項目組快速完成端到端優(yōu)化,最終實現(xiàn)輸入文本后 2 秒出圖的優(yōu)化效果,性能提升近 8 倍。

目前,昆侖芯 AI 加速卡 R200 已在該客戶的大模型場景完成規(guī)模部署,性能數(shù)據(jù)全面超越同系列主流推理卡:

基于昆侖芯 AI 加速卡 R200 高效運算與推理能力,綜合優(yōu)化方案,在 dpm-25steps 算法下,利用昆侖芯 AI 加速卡 R200,生成 1024*1024 圖像時的推理速度為 10.89 iters/s,相比同能力的主流推理卡快 20%。

昆侖芯 AI 加速卡 R200 擁有 32G GDDR6 顯存,為大規(guī)模參數(shù)提供更大的存儲容量、更高帶寬的內(nèi)存訪問、更穩(wěn)定的性能,生成更高分辨率的圖片,為用戶提供高性價比服務(wù)。

與此同時,面向當前市場需求迫切的大模型場景,據(jù)悉昆侖芯科技即將推出一款加速器組解決方案。

該加速器組搭載第二代昆侖芯 AI 芯片,是 AI 基礎(chǔ)設(shè)施的重要組成部分,為 AI IAAS 平臺、 AI PAAS 平臺提供堅實算力支撐。該產(chǎn)品可提供更為集約的 AI 算力,具備分布式集群部署能力,支持彈性 RDMA 網(wǎng)絡(luò),對比傳統(tǒng)網(wǎng)絡(luò)通信時延降低 2~3 倍。該產(chǎn)品可明顯提高并行加速比,訓(xùn)推一體化助力提高資源利用率,極大提升模型開發(fā)迭代效率。

攜手上層伙伴共拓 AI 芯生態(tài)

ChatGPT 及大模型技術(shù)大會上,與會者提問:在生態(tài)建設(shè)方面,國內(nèi) AI 芯片產(chǎn)業(yè)面臨的客觀情況是什么?

這也是昆侖芯科技經(jīng)常被客戶提及的現(xiàn)實問題。

昆侖芯科技在努力進一步擴大生態(tài)影響力:首先要深刻理解客戶的使用習(xí)慣,滿足客戶需求,踏踏實實把軟硬件從產(chǎn)品和技術(shù)上做到位。隨著產(chǎn)品的規(guī)模部署,客戶越來越多,生態(tài)也就自然而然建立起來了。與此同時,產(chǎn)品也會因此得到更好的打磨,進入良性循環(huán)。

在昆侖芯科技看來,AI 芯片看似是一個硬件,但其本質(zhì)則是一款軟件產(chǎn)品。這也證明了軟件棧、生態(tài)對于 AI 芯片發(fā)展的關(guān)鍵作用。

目前,昆侖芯已實現(xiàn)對飛槳的原生適配,并完成了 III 級兼容性測試,訓(xùn)練與推理性能可以滿足用戶的應(yīng)用需求。從底層 AI 算力組件、AI 服務(wù)器,到操作系統(tǒng),再到昆侖芯 SDK,昆侖芯和飛槳攜手完成了一套端到端的 AI 計算系統(tǒng)解決方案,并致力于打造一個全棧式軟硬一體的 AI 生態(tài)。

為進一步完善軟件生態(tài),昆侖芯已與多款通用處理器、操作系統(tǒng)、主流框架完成端到端適配,實現(xiàn)了軟硬件解決方案的技術(shù)棧,為客戶提供開箱即用的 AI 芯片產(chǎn)品。

15015312-e8b6-11ed-ab56-dac502259ad0.png

昆侖芯軟件棧

結(jié)語

談及大模型趨勢下 AI 芯片公司面對的變化,王志鵬說道: “必須快速調(diào)整心態(tài),并擁抱大模型帶來的變化?!?/p>

而這也剛好印證了昆侖芯科技 “突破創(chuàng)新” 的公司文化:面對瞬息萬變的外部環(huán)境,突破創(chuàng)新是適應(yīng)行業(yè)的唯一方式。

面對復(fù)雜多變的市場環(huán)境以及新場景新應(yīng)用對研發(fā)和落地的重重挑戰(zhàn),國內(nèi) AI 芯片公司如何出圈?

集十余年 AI 加速領(lǐng)域的技術(shù)積淀,曾任百度智能芯片及架構(gòu)部首席架構(gòu)師、現(xiàn)任昆侖芯科技 CEO 歐陽劍認為,“AI 芯片公司應(yīng)抓住場景和技術(shù)創(chuàng)新‘雙驅(qū)動’模式,驅(qū)動架構(gòu)優(yōu)化升級與軟硬件產(chǎn)品迭代,這是持續(xù)保持競爭力的關(guān)鍵?!?/p>

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41114

    瀏覽量

    302599
  • 智能芯片
    +關(guān)注

    關(guān)注

    0

    文章

    145

    瀏覽量

    26289
  • ChatGPT
    +關(guān)注

    關(guān)注

    31

    文章

    1600

    瀏覽量

    10393

原文標題:大模型引發(fā)技術(shù)變革, AI芯片公司面臨新挑戰(zhàn)

文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    AI模型微調(diào)企業(yè)項目實戰(zhàn)課

    技術(shù) 直接全量微調(diào)大模型依然面臨顯存爆炸的風(fēng)險。實戰(zhàn)課會深入剖析以 LoRA(低秩自適應(yīng))為代表的 PEFT 技術(shù)。它如同給大模型外掛了一
    發(fā)表于 04-16 18:48

    芯片可靠性面臨哪些挑戰(zhàn)

    芯片可靠性是一門研究芯片如何在規(guī)定的時間和環(huán)境條件下保持正常功能的科學(xué)。它關(guān)注的核心不是芯片能否工作,而是能在高溫、高電壓、持續(xù)運行等壓力下穩(wěn)定工作多久。隨著晶體管尺寸進入納米級別,芯片
    的頭像 發(fā)表于 01-20 15:32 ?547次閱讀
    <b class='flag-5'>芯片</b>可靠性<b class='flag-5'>面臨</b>哪些<b class='flag-5'>挑戰(zhàn)</b>

    亞太地區(qū)AI數(shù)據(jù)中心可持續(xù)發(fā)展面臨重重挑戰(zhàn)

    當Chat GPT每秒“吞吐”數(shù)萬次請求、自動駕駛汽車毫秒級解析路況、AI模型訓(xùn)練一口“吞”掉百萬度電時,我們正親歷著一場由“算力浪潮”驅(qū)動的科技革命;與此同時,一個嚴峻的現(xiàn)實問題也浮出水面:強大的AI背后是對電力的極度渴求,
    的頭像 發(fā)表于 12-10 10:24 ?1336次閱讀
    亞太地區(qū)<b class='flag-5'>AI</b>數(shù)據(jù)中心可持續(xù)發(fā)展<b class='flag-5'>面臨</b>重重<b class='flag-5'>挑戰(zhàn)</b>

    如何利用NPU與模型壓縮技術(shù)優(yōu)化邊緣AI

    隨著人工智能模型從設(shè)計階段走向?qū)嶋H部署,工程師面臨著雙重挑戰(zhàn):在計算能力和內(nèi)存受限的嵌入式設(shè)備上實現(xiàn)實時性能。神經(jīng)處理單元(NPU)作為強大的硬件解決方案,擅長處理 AI
    的頭像 發(fā)表于 11-07 15:26 ?1421次閱讀
    如何利用NPU與<b class='flag-5'>模型</b>壓縮<b class='flag-5'>技術(shù)</b>優(yōu)化邊緣<b class='flag-5'>AI</b>

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個AI模型怎么搞,知識盲區(qū)
    發(fā)表于 10-14 07:14

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    、分布式群體智能 1)物聯(lián)網(wǎng)AGI系統(tǒng) 優(yōu)勢: 組成部分: 2)分布式AI訓(xùn)練 7、發(fā)展重點:基于強化學(xué)習(xí)的后訓(xùn)練與推理 8、超越大模型:神經(jīng)符號計算 三、AGI芯片的實現(xiàn) 1、技術(shù)
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學(xué)應(yīng)用

    流體芯片AI計算平臺 ⑥基于AI的自主決策系統(tǒng) ⑦基于AI的自主學(xué)習(xí)系統(tǒng) 2、面臨挑戰(zhàn)
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+半導(dǎo)體芯片產(chǎn)業(yè)的前沿技術(shù)

    閃存。 現(xiàn)在應(yīng)用于邏輯芯片,還在起步階段。 2)3D堆疊技術(shù)面臨挑戰(zhàn) 3D堆疊技術(shù)面臨最大
    發(fā)表于 09-15 14:50

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    : 介紹了7家ASIC的新創(chuàng)公司: Tachyum、Cerebras、SambaNova、Graphcore、Esperanto、Groq、Etched AI 還介紹了中國的AI芯片
    發(fā)表于 09-12 16:07

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+內(nèi)容總覽

    ,其中第一章是概論,主要介紹大模型浪潮下AI芯片的需求與挑戰(zhàn)。第二章和第三章分別介紹實現(xiàn)深度學(xué)習(xí)AI芯片
    發(fā)表于 09-05 15:10

    【免費送書】AI芯片,從過去走向未來:《AI芯片:前沿技術(shù)與創(chuàng)新未來》

    最重大的技術(shù)變革無疑就是大模型的橫空出世,人類的時間仿佛被裝上了加速器,從ChatGPT到DeepSeek,大模型應(yīng)用密集出現(xiàn)、頻繁升級,這讓作者意識到有必要撰寫一本新的
    的頭像 發(fā)表于 07-29 08:06 ?1296次閱讀
    【免費送書】<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>,從過去走向未來:《<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>:前沿<b class='flag-5'>技術(shù)</b>與創(chuàng)新未來》

    【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    計算等類別AI芯片的及時、全面而富有遠見的書。” 那么時至今日,這個世界發(fā)生了什么變化呢? 在這四年間,最重大的技術(shù)變革無疑就是大模型的橫空
    發(fā)表于 07-28 13:54

    FOPLP工藝面臨挑戰(zhàn)

    FOPLP 技術(shù)目前仍面臨諸多挑戰(zhàn),包括:芯片偏移、面板翹曲、RDL工藝能力、配套設(shè)備和材料、市場應(yīng)用等方面。
    的頭像 發(fā)表于 07-21 10:19 ?1785次閱讀
    FOPLP工藝<b class='flag-5'>面臨</b>的<b class='flag-5'>挑戰(zhàn)</b>

    AI?時代來襲,手機芯片面臨哪些新挑戰(zhàn)

    邊緣AI、生成式AI(GenAI)以及下一代通信技術(shù)正為本已面臨高性能與低功耗壓力的手機帶來更多計算負載。領(lǐng)先的智能手機廠商正努力應(yīng)對本地化生成式A
    的頭像 發(fā)表于 06-10 08:34 ?1378次閱讀
    <b class='flag-5'>AI</b>?時代來襲,手機<b class='flag-5'>芯片面臨</b>哪些新<b class='flag-5'>挑戰(zhàn)</b>?

    成本狂降90%!國產(chǎn)芯片+開源模型如何改寫AI玩具規(guī)則

    電子發(fā)燒友網(wǎng)綜合報道,在AI技術(shù)持續(xù)突破的當下,AI玩具正在經(jīng)歷一場靜默的變革,而變革的核心,在于輕量級大
    的頭像 發(fā)表于 05-29 00:52 ?4093次閱讀
    屯门区| 祥云县| 乌兰察布市| 家居| 太仆寺旗| 汤原县| 延寿县| 文水县| 轮台县| 兴文县| 辰溪县| 上杭县| 昌黎县| 贞丰县| 铅山县| 河间市| 昭苏县| 县级市| 井冈山市| 乾安县| 琼结县| 宜都市| 双鸭山市| 靖州| 邵阳县| 平谷区| 电白县| 杭锦旗| 邵东县| 隆林| 临沂市| 普兰县| 鸡东县| 上思县| 张家口市| 茶陵县| 和政县| 河津市| 炎陵县| 青河县| 鄂伦春自治旗|