哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

“一億”是“一千萬”的十倍嗎?顯然不是

CAE學(xué)習(xí)之家 ? 來源:恩宇科技 ? 作者:CAE學(xué)習(xí)之家 ? 2021-10-28 11:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

-----1億是1千萬的10倍?-----

早期筆者使用矩量法求解線性方程組,在不使用快速多級(jí)方法,自由度達(dá)到3萬時(shí),臺(tái)式機(jī)上已經(jīng)無法求解出,8G的機(jī)器內(nèi)存不夠用。對(duì)于滿秩矩陣的線性方程組,常規(guī)求解方法時(shí)間復(fù)雜度為n^3(n的3次方)。

對(duì)于自由度1千萬以下稀疏矩陣的求解,好的臺(tái)式機(jī)基本能應(yīng)付,而當(dāng)自由度達(dá)到1億的時(shí)候,簡單的將硬件乘以10倍完全不能滿足要求。因?yàn)橛?jì)算的空間復(fù)雜度,時(shí)間復(fù)雜度并不是線性,通常是NlogN,N^2或者更高。當(dāng)自由度達(dá)到1億時(shí),不僅需要對(duì)硬件核心部件CPU,內(nèi)存擴(kuò)容,而且在磁盤陣列,I/O,并發(fā)計(jì)算,GPU,網(wǎng)絡(luò),帶寬等方面都提出了更苛刻的要求。

算法方面看,減少網(wǎng)格密度,在物理量梯度大的地方加密,無變化的地方將網(wǎng)格變稀疏,可以有效減少計(jì)算量;另外優(yōu)化求解算法本身,使其更加易于并行化計(jì)算。

從目前來看,計(jì)算機(jī)硬件計(jì)算能力的更新速度,跟不上指數(shù)級(jí)求解規(guī)模的增加速度。這也是量子力學(xué)發(fā)展的最大推動(dòng)力!

-----------------

針對(duì)該問題,本文稍微展開一下。

這里的1億,主要指仿真中最終求解線性方程組的自由度個(gè)數(shù),就是剛度矩陣的規(guī)模,即在方程Kx=b中,K的規(guī)模為1億*1億的方陣。

從硬件角度看,性能瓶頸首先在內(nèi)存。目前臺(tái)式機(jī)的內(nèi)存普遍在64G以下。對(duì)于1千萬的稀疏矩陣,存儲(chǔ)勉強(qiáng)夠用,加上計(jì)算,一般都不夠用,在windows系統(tǒng)上如果內(nèi)存不夠用,會(huì)啟用虛擬內(nèi)存,也就是用頁面交換把硬盤當(dāng)內(nèi)存使用,頻繁讀寫磁盤,這時(shí)候性能會(huì)大大降低。而對(duì)于1億自由度的矩陣,可能剛度矩陣組裝都不夠用。對(duì)于一億自由度的矩陣,首先要保證內(nèi)存能夠存儲(chǔ),一般的方法是使用具有超大內(nèi)存的工作站服務(wù)器。

內(nèi)存問題解決后,再就是CPU性能。前面講過,通常矩陣計(jì)算的空間復(fù)雜度,時(shí)間復(fù)雜度并不是線性,而是NlogN,N^2或者更高。使用單核單線程,耗費(fèi)的時(shí)間是條曲線上升趨勢(shì)。雖然稀疏矩陣采用了CSR等方法壓縮數(shù)據(jù),但自由度的平方數(shù)據(jù)仍然還是海量數(shù)據(jù)。現(xiàn)在的CPU普遍多核多個(gè)邏輯線程。這也要求在進(jìn)行迭代法求解方程組時(shí),合理的進(jìn)行矩陣分解,參考一篇文章入門仿真軟件性能優(yōu)化,采用分治的方法適應(yīng)硬件的需求。

這里需要注意的是單核CPU的性能以及CPU的數(shù)量。根據(jù)實(shí)際情況進(jìn)行分治!

在滿足了單機(jī)CPU運(yùn)行之后,再就是集群分布式計(jì)算。采用多臺(tái)計(jì)算設(shè)備,比如刀片等專業(yè)服務(wù)器,超算等等,這里需要考量的是負(fù)載均衡和網(wǎng)絡(luò)帶寬,即保證單臺(tái)設(shè)備的利用率和整體進(jìn)度保持一致。對(duì)于超大量的計(jì)算,最好能軟件實(shí)現(xiàn)動(dòng)態(tài)規(guī)劃,對(duì)于頻繁交換數(shù)據(jù)的計(jì)算,要注意網(wǎng)絡(luò)帶寬的瓶頸。

再從軟件方面來看,根據(jù)筆者的研發(fā)經(jīng)驗(yàn),相當(dāng)一部分仿真的性能問題可以通過軟件以及改進(jìn)算法解決。在前處理中,盡量避免軟件中高頻操作,大數(shù)據(jù)拷貝,大量細(xì)小數(shù)據(jù)操作等。如果必須有,對(duì)操作進(jìn)行采樣性能評(píng)估,保證在可接受范圍內(nèi)。在求解線性方程組前,提取矩陣特征,盡可能在最細(xì)度上根據(jù)矩陣特征,同時(shí)結(jié)合模型和業(yè)務(wù)的特點(diǎn),選取最合適的求解方法。

其實(shí)目前對(duì)于數(shù)值計(jì)算方法而言,其算法都是公開透明的,商業(yè)軟件之間真正較量的是業(yè)務(wù)模型的準(zhǔn)確性,算法的穩(wěn)定性以及效率。而這也恰恰是每個(gè)軟件可以改進(jìn)和提升的地方

2004年,ANSYS解出了1億自由度的模型,2008年,ANSYS解出了10億自由度的模型。即使現(xiàn)在來看,我們認(rèn)為自由度超過1千萬的模型是個(gè)大模型,所以1億自由度的模型仍然可以認(rèn)為是超大模型,且只能在超大的服務(wù)器上運(yùn)行,可以想象,隨著硬件的提升和算法的改進(jìn),實(shí)際應(yīng)用中會(huì)有越來越多的超1億自由度的模型求解。

回到開始的問題,“一億”是“一千萬”的十倍嗎?顯然不是。

最后還是以業(yè)內(nèi)的一句話作為結(jié)束語:

“如果你的仿真還沒有受到硬件的限制,那說明你的仿真還沒有入門”。

編輯:fqj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • CAE技術(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    9

    瀏覽量

    7109
  • 數(shù)值計(jì)算
    +關(guān)注

    關(guān)注

    3

    文章

    5

    瀏覽量

    6969
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    百億營收、單季利潤暴增十倍!存儲(chǔ)行業(yè)驚現(xiàn)“印鈔機(jī)”?

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)2025年,全球半導(dǎo)體產(chǎn)業(yè)迎來強(qiáng)勁增長,其中存儲(chǔ)賽道表現(xiàn)尤為亮眼。受益于人工智能(AI)算力需求爆發(fā)、服務(wù)器內(nèi)存升級(jí)、端側(cè)智能設(shè)備普及以及存儲(chǔ)價(jià)格觸底回升等多重因素,國產(chǎn)存儲(chǔ)產(chǎn)業(yè)鏈企業(yè)普遍實(shí)現(xiàn)業(yè)績大幅增長或顯著減虧。 ? 就在近期,佰維存儲(chǔ)、瀾起科技、德明利、恒爍股份等四家代表性企業(yè)陸續(xù)發(fā)布2025年年度業(yè)績預(yù)告。電子發(fā)燒友網(wǎng)對(duì)其進(jìn)行統(tǒng)計(jì),可以看到佰維存儲(chǔ)和德明利在2025年迎來了百億營收,其
    的頭像 發(fā)表于 01-25 04:26 ?1.5w次閱讀
    百億營收、單季利潤暴增<b class='flag-5'>十倍</b>!存儲(chǔ)行業(yè)驚現(xiàn)“印鈔機(jī)”?

    博世智能座艙方案全球累計(jì)交付量突破1000萬套

    近日,博世基于高通驍龍座艙平臺(tái)打造的智能座艙方案,全球累計(jì)交付量正式突破1000萬套。從2023年百萬套交付,短短三年間實(shí)現(xiàn)十倍跨越式增長,這不僅是一個(gè)數(shù)字突破,更有力夯實(shí)了博世滿足全球差異化市場的智能座艙開發(fā)與交付體系。
    的頭像 發(fā)表于 04-16 14:55 ?297次閱讀

    存儲(chǔ)市場現(xiàn)罕見倒掛:DDR4價(jià)格漲幅十倍于DDR5漲價(jià)潮持續(xù)蔓延

    這一規(guī)律完全背離,上演了一幕令人瞠目的反常景象:DDR4內(nèi)存的價(jià)格漲幅不僅遠(yuǎn)超市場預(yù)期,更大幅超越了技術(shù)更先進(jìn)的DDR5。這種“前代產(chǎn)品價(jià)格漲幅碾壓新一代”的現(xiàn)象,在存儲(chǔ)行業(yè)數(shù)年的發(fā)展歷程中尚屬首次,引發(fā)了上下游產(chǎn)業(yè)鏈的廣泛關(guān)
    的頭像 發(fā)表于 02-04 15:23 ?518次閱讀
    存儲(chǔ)市場現(xiàn)罕見倒掛:DDR4價(jià)格漲幅<b class='flag-5'>十倍</b>于DDR5漲價(jià)潮持續(xù)蔓延

    施耐德電氣揭秘弘昇年實(shí)現(xiàn)業(yè)務(wù)規(guī)模十倍跨越的成長密碼

    作為系統(tǒng)集成商的優(yōu)秀代表,弘昇與施耐德電氣已攜手合作余年,從2014年簽約額僅三百萬人民幣的初創(chuàng)企業(yè),到2023年整體銷售額突破億元大關(guān),實(shí)現(xiàn)業(yè)務(wù)規(guī)模十倍跨越,2024年更保持營業(yè)額翻倍的強(qiáng)勁
    的頭像 發(fā)表于 01-24 16:51 ?2254次閱讀

    匯川技術(shù)朱興明亮相2026中國智能制造企業(yè)家生態(tài)峰會(huì)

    “創(chuàng)業(yè)很難,二次創(chuàng)業(yè)更難。”“低價(jià)競爭等于慢性自殺?!薄盎盍Ρ冉?jīng)驗(yàn)重要十倍。”在2026年1月16日的中國智能制造企業(yè)家生態(tài)峰會(huì)上,私董會(huì)聯(lián)盟會(huì)長、匯川技術(shù)董事長兼總裁朱興明拋出一系列硬核觀點(diǎn)。
    的頭像 發(fā)表于 01-21 11:54 ?896次閱讀

    NVIDIA Grace Blackwell平臺(tái)實(shí)現(xiàn)MoE模型性能十倍提升

    如今,幾乎任一前沿模型的內(nèi)部結(jié)構(gòu)都采用混合專家 (MoE) 模型架構(gòu),這種架構(gòu)旨在模擬人腦的高效運(yùn)作機(jī)制。
    的頭像 發(fā)表于 12-13 09:23 ?1062次閱讀
    NVIDIA Grace Blackwell平臺(tái)實(shí)現(xiàn)MoE模型性能<b class='flag-5'>十倍</b>提升

    什么是變鏡頭

    什么是變鏡頭變鏡頭是一種可以連續(xù)調(diào)節(jié)放大倍率或視場范圍的光學(xué)鏡頭。它通過內(nèi)部光學(xué)組的相對(duì)移動(dòng),實(shí)現(xiàn)倍率/焦距的連續(xù)變化,而且需要保證在變過程中成像仍然清晰、畸變小。特點(diǎn):適合需要多倍率觀察
    的頭像 發(fā)表于 12-01 15:31 ?781次閱讀
    什么是變<b class='flag-5'>倍</b>鏡頭

    AI算法開發(fā),SpeedDP打輔助!不止10效率

    。而那些能夠帶來10工作效率的AI自然能夠輕松取代人類。當(dāng)然這也是相對(duì)的,不是每個(gè)領(lǐng)域都適用,廚師再快,也無法讓實(shí)物快10熟;醫(yī)生再優(yōu)秀,也不可能讓病人快10
    的頭像 發(fā)表于 11-20 18:09 ?772次閱讀
    AI算法開發(fā),SpeedDP打輔助!不止10<b class='flag-5'>倍</b>效率

    壹連科技CCS產(chǎn)品全球累計(jì)出貨量突破一億

    近日,壹連科技自主研發(fā)生產(chǎn)的CCS電芯連接組件全球累計(jì)出貨量正式突破100,000,000片!一億片不僅僅是一個(gè)數(shù)字,它是市場與客戶的信任見證,是壹連人用智慧和汗水鑄就的里程碑,更是壹連科技賦能新能源產(chǎn)業(yè)的生動(dòng)注腳。
    的頭像 發(fā)表于 11-18 09:59 ?811次閱讀

    為什么FPU在MCU中很重要呢?

    性能飛躍: 這是最主要的原因。與軟件模擬相比,F(xiàn)PU 執(zhí)行浮點(diǎn)運(yùn)算的速度可以快幾十倍甚至上百。 單周期操作: 許多基本的浮點(diǎn)運(yùn)算(如加、乘)可以在一個(gè)或幾個(gè)時(shí)鐘周期內(nèi)完成,而軟件模擬可能需要數(shù)
    發(fā)表于 11-18 07:05

    三坐標(biāo)高效測量壓縮機(jī)渦旋盤精度解決方案

    Mizar Silver676三坐標(biāo)測量機(jī)及CP500S連續(xù)掃描測頭的完整測量方案,優(yōu)勢(shì)在于精準(zhǔn)采集+智能分析的全鏈路適配。連續(xù)掃描測頭實(shí)現(xiàn)勻速滑動(dòng)采集,相比傳統(tǒng)觸發(fā)式測頭,數(shù)據(jù)密度提升十倍以上
    發(fā)表于 11-13 14:06

    10G網(wǎng)速不是夢(mèng)!5G-A如何“榨干”毫米波,跑出比5G快10的速度?

    6G網(wǎng)絡(luò)的發(fā)展奠定了堅(jiān)實(shí)基礎(chǔ)。作為5G向6G過渡的關(guān)鍵技術(shù),5G-A通過多載波聚合、毫米波擴(kuò)展、時(shí)隙結(jié)構(gòu)優(yōu)化、1024QAM調(diào)制等創(chuàng)新技術(shù),實(shí)現(xiàn)了網(wǎng)絡(luò)能力的十倍質(zhì)變,為未來智能生活和產(chǎn)業(yè)數(shù)字化升級(jí)提供了強(qiáng)大的網(wǎng)絡(luò)支撐。 什么是5G-A?它在通信技術(shù)演進(jìn)中的位置 5G-A,全稱為
    的頭像 發(fā)表于 09-16 16:34 ?2025次閱讀

    步進(jìn)電機(jī)和伺服電機(jī)的區(qū)別是什么?

    強(qiáng)的 價(jià)格方面不同 步進(jìn)電機(jī)一個(gè)最大的優(yōu)點(diǎn)就是便宜;伺服電機(jī)的價(jià)格普遍是步進(jìn)電機(jī)的幾十倍 總結(jié):交流伺服系統(tǒng)在許多性能方面都優(yōu)于步進(jìn)電機(jī)但是控制也會(huì)更加復(fù)雜,如果我們對(duì)電機(jī)的需求是操作簡單、價(jià)格便宜、可以開環(huán)控制、距離誤差小在一些要求不高的場合可以選用步進(jìn)電機(jī)。
    發(fā)表于 06-18 13:27

    地平線余凱稱輔助駕駛的底層邏輯正在改寫

    從大模型黑馬DeepSeek,到春晚出圈的宇樹機(jī)器人,人工智能撬動(dòng)的科技創(chuàng)新引領(lǐng)又一輪產(chǎn)業(yè)革命。這印證了“生產(chǎn)力決定生產(chǎn)關(guān)系”的底層邏輯,當(dāng)科技動(dòng)能觸發(fā)的“十倍生產(chǎn)力”涌現(xiàn),行業(yè)格局必將引發(fā)重塑。
    的頭像 發(fā)表于 06-03 13:59 ?851次閱讀
    红桥区| 屯留县| 九江市| 广东省| 珠海市| 威海市| 兰溪市| 秭归县| 滁州市| 锡林浩特市| 来宾市| 云梦县| 萝北县| 手游| 左贡县| 张家界市| 南川市| 蒙城县| 朝阳区| 蓬溪县| 上饶市| 龙胜| 大新县| 平潭县| 离岛区| 荥经县| 莆田市| 五台县| 石嘴山市| 安阳县| 霍州市| 德阳市| 安平县| 偃师市| 皮山县| 凤城市| 嘉鱼县| 蓬安县| 收藏| 闽清县| 隆昌县|