哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大算力時代, 如何打破內(nèi)存墻

半導體芯科技SiSC ? 來源:Ambarella安霸 何小林 ? 作者:Ambarella安霸 何小林 ? 2024-03-06 19:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:Ambarella安霸 何小林

近年來,人工智能應用正經(jīng)歷一輪快速的發(fā)展與普及,而以ChatGPT等先進的大模型技術(shù)在此過程中起到了關(guān)鍵作用。這些模型對計算能力的需求不斷攀升,催生了AI芯片設計的不斷革新,進入了大算力時代。

目前,主流AI芯片的架構(gòu)仍然沿用了傳統(tǒng)的馮·諾依曼模型,這一設計將計算單元與數(shù)據(jù)存儲分離。在這種架構(gòu)下,處理器需要從內(nèi)存中讀取數(shù)據(jù),執(zhí)行計算任務,然后將結(jié)果寫回內(nèi)存。盡管AI芯片的算力在不斷提升,但僅僅擁有強大的數(shù)據(jù)計算能力并不足夠。當數(shù)據(jù)傳輸速度無法跟上計算速度時,數(shù)據(jù)傳輸時間將遠超過計算時間。

以Transformer架構(gòu)為基礎的AI大模型導致了模型參數(shù)量激增,短短兩年間模型大小擴大了驚人的410倍,運算量更是激增了高達750倍。盡管硬件的峰值計算能力在過去20年中提升了驚人的60,000倍,但DRAM帶寬的增長卻相對滯后,僅提高了100倍。計算能力與帶寬能力之間的巨大差距導致了內(nèi)存容量和數(shù)據(jù)傳輸速度難以跟上AI硬件的計算速度,這已成為限制AI芯片性能發(fā)揮的主要瓶頸,通常被稱為“內(nèi)存墻”問題。

內(nèi)存墻的應對方法

針對內(nèi)存墻問題,研究人員正積極探索多種解決方案,主要可分為以下三個研究方向:

1. 算法優(yōu)化:重新審視網(wǎng)絡模型設計,致力于優(yōu)化算法實現(xiàn),以減少對高速數(shù)據(jù)傳輸?shù)囊蕾?。這一方向旨在從根本上降低數(shù)據(jù)傳輸需求,提升算法效率,從而打破內(nèi)存墻的限制。

2. 模型壓縮:通過降低模型精度(如量化)或去除冗余參數(shù)(如剪枝)來壓縮推理模型。這種方法可以顯著減少模型大小,降低內(nèi)存占用,從而減輕內(nèi)存墻帶來的壓力。

3. AI芯片架構(gòu)設計:設計高效的AI芯片架構(gòu),以優(yōu)化數(shù)據(jù)流和計算流程。通過硬件層面的創(chuàng)新,減少數(shù)據(jù)搬運和計算量,提高整體系統(tǒng)效率。

算法的優(yōu)化與模型的壓縮是軟件研究人員追求的重要方向。在AI芯片架構(gòu)設計領(lǐng)域, 各大AI芯片公司也開始優(yōu)化芯片架構(gòu), 以實現(xiàn)更為高效的內(nèi)存?zhèn)鬏?。安霸同樣提出了其專有的解決方案。

CV3系列芯片如何打破內(nèi)存墻

2015年, 安霸收購了自動駕駛算法公司VisLab, 開始研究自動駕駛需要怎樣的芯片。 2017年,安霸推出第一代CVflow架構(gòu)芯片CV1, 用于加速AI視覺計算。2018年開始逐步推出并量產(chǎn)專門針對車載輔助駕駛市場的第二代CVflow架構(gòu)芯片CV2系列。 2019年,自動駕駛技術(shù)的突飛猛進,使得汽車行業(yè)對芯片算力的需求急劇增長,標志著大算力時代的來臨。在這樣的技術(shù)背景下,安霸前瞻性地啟動了CV3系列大算力芯片的設計工作,旨在為自動駕駛場景提供強大的計算能力。經(jīng)過三年的精心打磨與架構(gòu)設計, 2022年, CV3架構(gòu)的第一顆芯片CV3-HD成功點亮, 其最高算力達到了1500 eTOPS(等效算力),而功耗僅為50瓦,展示出了卓越的計算性能與能耗比。 2023年, 首個面向量產(chǎn)智駕域控制器的芯片CV3-AD685順利點亮并開始提供樣片, 其算力達到750 eTOPS(等效算力)。2024年1月,安霸再次推出了CV3-AD 汽車智駕域控制器芯片的最新成員:CV3-AD635 和 CV3-AD655。至此,CV3-AD 系列芯片已經(jīng)實現(xiàn)了從主流到中、高端乘用車市場高級輔助駕駛與自動駕駛解決方案的完整覆蓋。

在深入洞察自動駕駛場景的基礎上, 安霸的CV3系列芯片在設計之初就敏銳地預見到大算力時代所帶來內(nèi)存帶寬挑戰(zhàn)。為了突破內(nèi)存瓶頸,CV3在內(nèi)存控制器上采用了先進的LPDDR5技術(shù),每位DRAM的數(shù)據(jù)傳輸速率高達8Gb/s。針對不同應用場景的算力需求,設計了64位、128位和256位的內(nèi)存位寬,從而確保在各種計算場景下都能提供足夠的數(shù)據(jù)傳輸帶寬。

在AI加速器的架構(gòu)設計上,CV3系列芯片推出了安霸特有的第三代CVflow架構(gòu)。這一架構(gòu)賦予了CV3卓越的算力性能和優(yōu)異的能效比。如圖1所示,CVflow的總體架構(gòu)展示了其數(shù)據(jù)流和計算單元的組織結(jié)構(gòu)。

wKgaomXoWMiACubKAAKA_x0O2eE407.jpg

圖1 CVflow架構(gòu)圖

具體來說, CV3的高算力與低功耗得益于以下幾個精心設計的架構(gòu)特點。

· Partial buffer架構(gòu)

盡管許多AI芯片采用增大緩存的方式來減少DRAM訪問,但緩存系統(tǒng)存在幾個顯著問題:

1. 設計復雜性與成本:緩存系統(tǒng)的設計相對復雜,相較于同等容量的SRAM,它需要占據(jù)更大的芯片面積。這不僅增加了芯片的成本,還可能導致功耗上升。

2. 軟件優(yōu)化需求:為了充分利用緩存系統(tǒng),軟件算法需要針對其進行專門的優(yōu)化,以提高緩存命中率。這增加了軟件開發(fā)的復雜性和工作量。

3. 算力浪費:緩存系統(tǒng)通常遵循“使用時才加載”的策略,這導致計算單元在等待數(shù)據(jù)加載完成期間無法進行有效計算,從而造成算力的浪費。算力的有效利用率在很大程度上依賴于緩存命中率。

4. 性能不穩(wěn)定:在復雜的多核多線程環(huán)境中,緩存命中率與系統(tǒng)的負載密切相關(guān)。隨著負載的變化,緩存命中率可能會受到嚴重影響,導致系統(tǒng)性能的不穩(wěn)定。

與傳統(tǒng)的緩存系統(tǒng)不同,CVflow架構(gòu)采取了一種創(chuàng)新的策略,將片上內(nèi)存(On-chip Memory)分割成多個不同大小的內(nèi)存塊,這些內(nèi)存塊被稱為Partial Buffers(PB)。這些PB的主要用途是存儲計算過程中的中間結(jié)果,從而顯著減少對外部DRAM的訪問次數(shù)。Partial Buffers所帶來的優(yōu)勢如下:

· 簡化的硬件設計與成本優(yōu)化:PB的設計相較于傳統(tǒng)緩存更為簡單,這意味著在硬件實現(xiàn)上,CVflow架構(gòu)能夠節(jié)省更多的芯片面積,進而降低制造成本和功耗。

· 獨立的DMA通道:為了確保數(shù)據(jù)的高效傳輸,CVflow架構(gòu)為Partial Buffers配置了獨立的DMA(Direct Memory Access)通道。這使得數(shù)據(jù)能夠從DRAM中快速、無縫地傳輸?shù)絇B中,從而避免了數(shù)據(jù)傳輸?shù)钠款i。

· 訪存效率高:一次性從DRAM和PB之間傳輸大塊數(shù)據(jù)的策略, 替代了傳統(tǒng)的多次小塊數(shù)據(jù)傳輸?shù)姆绞? 減少了數(shù)據(jù)在內(nèi)存和向量處理器(NVP)之間的搬運數(shù)次,降低了數(shù)據(jù)傳輸?shù)难舆t和開銷

· 與計算單元并行處理:PB在CVflow內(nèi)部被組織成一個環(huán)形結(jié)構(gòu)。這意味著當一個PB的數(shù)據(jù)被使用后,CVflow的硬件調(diào)度器會智能地加載下一個所需的數(shù)據(jù)塊到空閑的PB中。這種設計允許數(shù)據(jù)預加載與計算單元的工作并行進行,從而消除了數(shù)據(jù)等待時間,提高了整體計算效率。

· 簡化的內(nèi)存管理:與需要手動優(yōu)化和管理的傳統(tǒng)緩存系統(tǒng)不同,CVflow轉(zhuǎn)換工具能夠自動、高效地管理PB。這意味著開發(fā)人員無需花費額外的時間和精力來管理片上內(nèi)存,從而可以更加專注于算法和應用的開發(fā)。

以圖2所示的卷積神經(jīng)網(wǎng)絡為例,在傳統(tǒng)的計算架構(gòu)中,該網(wǎng)絡通常需要12次的DRAM訪問來完成一次完整的計算過程。然而,在CVflow架構(gòu)下,通過利用高效的Partial Buffers(PB)設計,3到12過程的內(nèi)存訪問被低延遲的PB所取代。這意味著,中間計算結(jié)果可以直接在PB中完成,而無需頻繁地訪問外部的DRAM。因此,整個計算過程中,只需要在輸入和輸出階段各進行一次DRAM訪問,從而減少了10次的DRAM訪問。這種優(yōu)化不僅顯著降低了計算過程中的延遲,還因為減少了外部DRAM的訪問次數(shù),從而降低了整體的功耗。

wKgZomXoWMmAe5vOAADMbNWQ7F0735.jpg

圖2 CVflow卷積神經(jīng)網(wǎng)絡計算示例

· 并行的流式架構(gòu)

CVflow工具根據(jù)芯片的片上內(nèi)存大小,智能地將大型神經(jīng)網(wǎng)絡切割成多個連續(xù)的、緊湊的計算單元,這些單元被組織成有向無環(huán)圖(DAG)的形式。這種獨特的架構(gòu)帶來了多重優(yōu)勢:

· 高效內(nèi)存利用:每個DAG的中間計算步驟都在片上內(nèi)存內(nèi)完成,從而避免了頻繁訪問外部DRAM的需求。這不僅減少了數(shù)據(jù)傳輸?shù)难舆t,還提高了內(nèi)存的使用效率。

· 快速啟動與并行處理:網(wǎng)絡加載時間大大縮短,因為只需加載一部分網(wǎng)絡即可開始計算。同時,在計算過程中,CVflow能夠并行加載網(wǎng)絡的后續(xù)部分,實現(xiàn)了計算與數(shù)據(jù)加載的并行化,進一步提升了整體性能。

· 穩(wěn)健的性能表現(xiàn):由于大大減少了對DRAM的訪問次數(shù),并且實現(xiàn)了計算與數(shù)據(jù)加載的并行處理,CVflow架構(gòu)在面臨其他芯片模塊(如CPU、GPU、ISP)同時高負載運行的場景時,仍能保持穩(wěn)定的性能表現(xiàn),從而確保了在各種復雜環(huán)境下的可靠性。

wKgaomXoWMqAR1kGAACfTXIDyR8624.jpg

圖3 AI模型的DAG切割示意圖

· 硬件實現(xiàn)的算子

與GPU通過簡單地堆砌計算單元來提升算力的方式不同,CVflow架構(gòu)致力于通過實現(xiàn)高效的硬件算子來加速計算過程。CV3的CVflow架構(gòu),基于對深度學習網(wǎng)絡的前瞻性研究,實現(xiàn)了超過100種常用算子的硬件化。這種設計策略使得CVflow在晶體管數(shù)量更少的情況下實現(xiàn)了出色的算力。

以8x8的矩陣乘法為例,傳統(tǒng)的計算方式需要512個乘加(MAC)操作,但在CVflow架構(gòu)中,其特有的矩陣乘法算子能夠在單個計算指令周期內(nèi)完成。此外,CVflow還支持多種融合算子的應用。例如,對于常見的2D/3D卷積與池化操作,CVflow的轉(zhuǎn)換工具能夠自動將這兩個操作融合為一個硬件算子操作,從而有效減少了數(shù)據(jù)吞吐量和計算周期,進一步提升了整體性能。

· 非結(jié)構(gòu)化的稀疏加速

通過將AI模型稀疏化,去除冗余參數(shù), CVflow架構(gòu)帶來了顯著的性能提升, 具體而言:

· CVflow工具能夠自動壓縮網(wǎng)絡參數(shù),這減少了芯片端加載AI模型所需的時間。

· 芯片端的CVflow硬件調(diào)度器具備智能分析能力,可以自動識別并跳過不必要的計算,從而顯著降低了計算量。

· 無需對AI模型結(jié)構(gòu)進行調(diào)整, 從而實現(xiàn)了算法的一次性開發(fā)和無縫部署。這種特性簡化了模型部署過程,使得模型開發(fā)人員無需擔心模型結(jié)構(gòu)的兼容性問題,可以專注于算法的優(yōu)化和創(chuàng)新。

· CVflow工具鏈提供了多種稀疏策略來保證AI模型稀疏后的精度。

以7x7卷積為例,未進行稀疏化之前,每次卷積操作都需要用到全部的49個參數(shù),并且會執(zhí)行49次乘加(MAC)操作。然而,當實施了80%的稀疏化后,情況發(fā)生了顯著變化:參數(shù)量減少了60%,這意味著存儲和傳輸?shù)男蚀蟠筇嵘?;計算量減少了80%,從而極大地提高了卷積操作的效率。這種CVflow獨有的稀疏化技術(shù)對于優(yōu)化AI模型的性能和資源消耗至關(guān)重要。

wKgZomXoWMqAbW9vAAE_mWNmR64718.jpg

圖4 CVflow 網(wǎng)絡稀疏化示例

· 支持多種量化格式

CV3的CVflow架構(gòu)具有強大的數(shù)據(jù)格式支持能力, 可以支持 4, 8, 16, 32的定點數(shù)據(jù)格式和16, 32位的浮點數(shù)據(jù)格式。CVflow工具能夠針對每一層網(wǎng)絡參數(shù)和輸入輸出數(shù)據(jù)進行精確的動態(tài)范圍分析,從而確定最優(yōu)的量化精度,實現(xiàn)高效的混合精度部署。這一特性使得CV3在處理不同數(shù)據(jù)類型和規(guī)模的任務時,能夠靈活適應并發(fā)揮最佳性能。

2024年國際消費電子展(CES)期間,安霸展出了基于CV3平臺的自動駕駛研發(fā)車輛, 并為受邀客戶提供試駕體驗。此次展出進一步驗證了CV3 CVflow架構(gòu)芯片的強大實力, 即便面對自動駕駛場景的大算力、高帶寬的復雜計算需求,也能游刃有余地應對。

2023年, 特斯拉實現(xiàn)了首個端到端大模型自動駕駛系統(tǒng), 將原本龐大的30萬行的人工規(guī)則算法精簡至僅2000行代碼。隨著駕駛數(shù)據(jù)的不斷積累,自動駕駛技術(shù)正朝著端到端大模型的方向發(fā)展。 面對未來大模型自動駕駛時代的算力與內(nèi)存墻挑戰(zhàn), 專為自動駕駛設計的CV3-AD系列芯片憑借第三代CVflow架構(gòu),以芯片架構(gòu)創(chuàng)新的方式,突破大算力芯片的內(nèi)存墻的限制,為大模型算法提供了強大的硬件支持, 助力高級輔助駕駛以及自動駕駛技術(shù)的普及與發(fā)展。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 內(nèi)存
    +關(guān)注

    關(guān)注

    9

    文章

    3231

    瀏覽量

    76501
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41025

    瀏覽量

    302545
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1665

    瀏覽量

    16832
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    Molex收購Teramount:CPO互連技術(shù)開啟與能效的“雙贏時代

    ** 。Teramount的TeraVERSE?平臺以其獨特的“可拆卸光纖直連芯片”方案,為大規(guī)模共封裝光學(CPO)提供了可量產(chǎn)的互連接口,或?qū)⒊蔀槌笠?guī)模數(shù)據(jù)中心、AI集群突破“功耗”的關(guān)鍵技術(shù)支點。
    的頭像 發(fā)表于 04-22 14:44 ?197次閱讀

    “詞元”時代背后的“內(nèi)存戰(zhàn)爭”

    增長超三倍,產(chǎn)業(yè)規(guī)模呈現(xiàn)指數(shù)級擴張態(tài)勢。國家與地方相繼出臺詞元相關(guān)補貼及扶持政策,推動AI技術(shù)從前沿探索階段,快速走向規(guī)?;⑵栈莼涞貞?。 詞元調(diào)用量的持續(xù)激增,直接帶動全產(chǎn)業(yè)鏈加速布局,其中
    的頭像 發(fā)表于 04-15 10:09 ?135次閱讀

    國產(chǎn)出海元年開啟

    ? 國產(chǎn)開啟“大航?!?b class='flag-5'>時代。 黃仁勛前段時間訪華時曾表示:“華為AI芯片取代英偉達只是時間問題?!北藭r,這話多被解讀為對老對手的客套。但在剛剛結(jié)束的2025世界人工智能大會上,華為昇騰384超
    的頭像 發(fā)表于 03-24 15:15 ?493次閱讀
    國產(chǎn)<b class='flag-5'>算</b><b class='flag-5'>力</b>出海元年開啟

    監(jiān)控的下半場:從基礎設施報警到精算師

    摘要: 在十萬卡集群與萬億參數(shù)模型時代,基礎設施的穩(wěn)定性直接決定了模型訓練的邊際成本。當單次訓練成本高達千萬美元時,監(jiān)控系統(tǒng)不再是簡單的報警,而是衡量價值的精算師?;谝痪€智運維
    的頭像 發(fā)表于 03-18 11:13 ?390次閱讀

    邊緣AI臨界點:深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價值

    內(nèi)存革命:48GB/96GB LPDDR4X 背后的帶寬博弈 很多開發(fā)者容易陷入唯論的誤區(qū),但在實際部署大模型時,內(nèi)存容量和帶寬往往是真正的性能瓶頸。OrangePi AI St
    發(fā)表于 03-10 14:19

    軟通動力打造“基建+睿動Token經(jīng)濟+OpenClaw”的運營新體系

    認知,以“本地優(yōu)先+強執(zhí)行+零門檻”三大核心優(yōu)勢,重構(gòu)個人與企業(yè)的效率邊界,主打“真正能做事的AI”,堪稱2026年最值得入手的AI數(shù)字員工工具。在此背景下,軟通動力率先打破產(chǎn)業(yè)壁壘,將基礎設施、Token經(jīng)濟與OpenCl
    的頭像 發(fā)表于 03-06 14:13 ?782次閱讀

    革命下的隱形基石:存一體時代呼喚更精準的“時間心跳”

    正在浮現(xiàn):決定系統(tǒng)最終效率與可靠性的,往往并非峰值本身,而是數(shù)據(jù)在存儲與計算單元之間反復搬運所產(chǎn)生的巨大功耗與延遲瓶頸。為了突破這一“存儲”,產(chǎn)業(yè)界正將目光投
    的頭像 發(fā)表于 01-21 08:44 ?904次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>革命下的隱形基石:存<b class='flag-5'>算</b>一體<b class='flag-5'>時代</b>呼喚更精準的“時間心跳”

    將AI送上太空,是終極方案還是瘋狂幻想?評論區(qū)說出你的陣營!

    AI
    江蘇易安聯(lián)
    發(fā)布于 :2026年01月06日 09:43:34

    應對端側(cè)AI、內(nèi)存、功耗“三堵墻”困境,安謀科技Arm China “周易”X3給出技術(shù)錦囊

    AI大模型正加速從云端向邊緣與端側(cè)滲透,然而,、內(nèi)存、功耗等卻成了制約其規(guī)?;涞氐摹案邏Α?。專為AI計算而生的神經(jīng)網(wǎng)絡處理器(NPU),成為破關(guān)鍵。安謀科技Arm China“
    的頭像 發(fā)表于 12-18 13:45 ?522次閱讀
    應對端側(cè)AI<b class='flag-5'>算</b><b class='flag-5'>力</b>、<b class='flag-5'>內(nèi)存</b>、功耗“三堵墻”困境,安謀科技Arm China “周易”X3給出技術(shù)錦囊

    紫光國芯:以三維堆疊存儲技術(shù)突破,筑牢時代“數(shù)據(jù)基石”

    存儲技術(shù)的競賽,是智能時代一場沒有硝煙的戰(zhàn)爭。當需求呈指數(shù)級增長,傳統(tǒng)存儲架構(gòu)日益成為性能瓶頸,三維堆疊技術(shù)正成為打破內(nèi)存
    的頭像 發(fā)表于 12-05 20:21 ?4913次閱讀

    湘軍,讓變成生產(chǎn)?

    腦極體
    發(fā)布于 :2025年11月25日 22:56:58

    硅芯科技:AI突破,新型堆疊EDA工具持續(xù)進化

    電子發(fā)燒友網(wǎng)報道(文/黃晶晶)先進封裝是突破危機的核心路徑。2.5D/3D Chiplet異構(gòu)集成可破解內(nèi)存、功耗與面積
    的頭像 發(fā)表于 10-31 09:16 ?1.3w次閱讀
    硅芯科技:AI<b class='flag-5'>算</b><b class='flag-5'>力</b>突破,新型堆疊EDA工具持續(xù)進化

    板卡:驅(qū)動智能時代的核心引擎

    在人工智能、大數(shù)據(jù)和云計算高速發(fā)展的今天,已成為推動技術(shù)進步的關(guān)鍵資源。作為的物理載體,
    的頭像 發(fā)表于 08-01 10:25 ?1705次閱讀

    迅為RK3576核心板高AI開發(fā)板開啟智能應用新時代

    迅為RK3576核心板高AI開發(fā)板開啟智能應用新時代
    的頭像 發(fā)表于 06-10 14:13 ?1828次閱讀
    迅為RK3576核心板高<b class='flag-5'>算</b><b class='flag-5'>力</b>AI開發(fā)板開啟智能應用新<b class='flag-5'>時代</b>

    即國力,比克電池如何為AI時代“蓄能

    引擎》中明確提出,“是數(shù)字經(jīng)濟時代的新質(zhì)生產(chǎn),更是國家競爭的重要指標?!彪S著AI大模型訓練
    的頭像 發(fā)表于 06-04 14:22 ?1252次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>即國力,比克電池如何為AI<b class='flag-5'>時代</b>“蓄能
    商河县| 溧阳市| 华安县| 怀来县| 徐闻县| 澜沧| 潮州市| 江西省| 绥宁县| 腾冲县| 台安县| 驻马店市| 辉县市| 南充市| 南郑县| 遵化市| 丰城市| 宝丰县| 内江市| 衡阳市| 慈利县| 南安市| 湖北省| 徐州市| 平原县| 临湘市| 新余市| 鲁山县| 金山区| 木兰县| 辽阳市| 娄烦县| 犍为县| 巫溪县| 长沙市| 香河县| 岱山县| 邹城市| 安庆市| 松江区| 东莞市|