哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

機器學習全靠調(diào)參?谷歌大腦新研究:神經(jīng)網(wǎng)絡構建超強網(wǎng)絡

5RJg_mcuworld ? 來源:YXQ ? 2019-08-06 14:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機器學習全靠調(diào)參?這個思路已經(jīng)過時了。

谷歌大腦團隊發(fā)布了一項新研究:只靠神經(jīng)網(wǎng)絡架構搜索出的網(wǎng)絡,不訓練,不調(diào)參,就能直接執(zhí)行任務。這樣的網(wǎng)絡叫做WANN,權重不可知神經(jīng)網(wǎng)絡。它在MNIST數(shù)字分類任務上,未經(jīng)訓練和權重調(diào)整,就達到了92%的準確率,和訓練后的線性分類器表現(xiàn)相當。除了監(jiān)督學習,WANN還能勝任許多強化學習任務。

團隊成員之一的大佬David Ha,把成果發(fā)上了推特,已經(jīng)獲得了1300多贊:

那么,先來看看效果吧。

谷歌大腦用WANN處理了3種強化學習任務。(給每一組神經(jīng)元,共享同一個權重。)

第一項任務,Cart-Pole Swing-Up。

這是經(jīng)典的控制任務,一條滑軌,一臺小車,車上一根桿子。小車在滑軌的范圍里跑,要把桿子從自然下垂的狀態(tài)搖上來,保持在直立的位置不掉下來。(這個任務比單純的Cart-Pole要難一些:Cart-Pole桿子的初始位置就是向上直立,不需要小車把它搖上來,只要保持就可以。)

難度體現(xiàn)在,沒有辦法用線性控制器 (Linear Controller) 來解決。每一個時間步的獎勵,都是基于小車到滑軌一頭的距離,以及桿子擺動的角度。

WANN的最佳網(wǎng)絡 (Champion Network) 長這樣:

它在沒有訓練的狀態(tài)下,已經(jīng)表現(xiàn)優(yōu)異:

表現(xiàn)最好的共享權重,給了團隊十分滿意的結果:只用幾次擺動便達到了平衡狀態(tài)。

第二項任務,Bipedal Waker-v2。

一只兩足“生物”,要在隨機生成的道路上往前走,越過凸起,跨過陷坑。獎勵多少,就看它從出發(fā)到掛掉走了多長的路,以及電機扭矩的成本(為了鼓勵高效運動) 。每條腿的運動,都是由一個髖關節(jié)、和一個膝關節(jié)來控制的。有24個輸入,會指導它的運動:包括“激光雷達”探測的前方地形數(shù)據(jù),本體感受到的關節(jié)運動速度等等。比起第一項任務中的低維輸入,這里可能的網(wǎng)絡連接就更多樣了。所以,需要WANN對從輸入到輸出的布線方式,有所選擇。這個高維任務,WANN也優(yōu)質完成了。

你看,這是搜索出的最佳架構,比剛才的低維任務復雜了許多:

它在-1.5的權重下奔跑,長這樣:

第三項任務,CarRacing-v0。

這是一個自上而下的 (Top-Down) 、像素環(huán)境里的賽車游戲。一輛車,由三個連續(xù)命令來控制:油門、轉向、制動。目標是在規(guī)定的時間里,經(jīng)過盡可能多的磚塊。賽道是隨機生成的。研究人員把解釋每個像素 (Pixel Interpretation) 的工作交給了一個預訓練的變分自編碼器 (VAE) ,它可以把像素表征壓縮到16個潛在維度。這16維就是網(wǎng)絡輸入的維度。學到的特征是用來檢測WANN學習抽象關聯(lián) (Abstract Associations) 的能力,而不是編碼不同輸入之間顯式的幾何關系。

這是WANN最佳網(wǎng)絡,在-1.4共享權重下、未經(jīng)訓練的賽車成果:

雖然路走得有些蜿蜒,但很少偏離跑到。而把最佳網(wǎng)絡微調(diào)一下,不用訓練,便更加順滑了:

總結一下,在簡單程度和模塊化程度上,第二、三項任務都表現(xiàn)得優(yōu)秀,兩足控制器只用了25個可能輸入中的17個,忽略了許多LIDAR傳感器和膝關節(jié)的速度。

WANN架構不止能在不訓練單個權重的情況下完成任務,而且只用了210個網(wǎng)絡連接(Connections) ,比當前State-of-the-Art模型用到的2804個連接,少了一個數(shù)量級。做完強化學習,團隊又瞄準了MNIST,把WANN拓展到了監(jiān)督學習的分類任務上。一個普通的網(wǎng)絡,在參數(shù)隨機初始化的情況下,MNIST上面的準確率可能只有10%左右。

而新方法搜索到的網(wǎng)絡架構WANN,用隨機權重去跑,準確率已經(jīng)超過了80%;如果像剛剛提到的那樣,喂給它多個權值的合集,準確率就達到了91.6%。

對比一下,經(jīng)過微調(diào)的權重,帶來的準確率是91.9%,訓練過的權重,可以帶來94.2%的準確率。再對比一下,擁有幾千個權重的線性分類器:

也只是和WANN完全沒訓練、沒微調(diào)、僅僅喂食了一些隨機權重時的準確率相當。論文里強調(diào),MINST手寫數(shù)字分類是高維分類任務。WANN表現(xiàn)得非常出色。并且沒有哪個權值,顯得比其他值更優(yōu)秀,大家表現(xiàn)得十分均衡:所以隨機權重是可行的。

不過,每個不同的權重形成的不同網(wǎng)絡,有各自擅長分辨的數(shù)字,所以可以把一個擁有多個權值的WANN,用作一個自給自足的合集 (Self-Contained Ensemble) 。

實現(xiàn)原理

不訓練權重參數(shù)獲得極高準確度,WANN是如何做到的呢?神經(jīng)網(wǎng)絡不僅有權重偏置這些參數(shù),網(wǎng)絡的拓撲結構、激活函數(shù)的選擇都會影響最終結果。

谷歌大腦的研究人員在論文開頭就提出質疑:神經(jīng)網(wǎng)絡的權重參數(shù)與其架構相比有多重要?在沒有學習任何權重參數(shù)的情況下,神經(jīng)網(wǎng)絡架構可以在多大程度上影響給定任務的解決方案。

為此,研究人員提出了一種神經(jīng)網(wǎng)絡架構的搜索方法,無需訓練權重找到執(zhí)行強化學習任務的最小神經(jīng)網(wǎng)絡架構。谷歌研究人員還把這種方法用在監(jiān)督學習領域,僅使用隨機權重,就能在MNIST上實現(xiàn)就比隨機猜測高得多的準確率。

論文從架構搜索、貝葉斯神經(jīng)網(wǎng)絡、算法信息論、網(wǎng)絡剪枝、神經(jīng)科學這些理論中獲得啟發(fā)。為了生成WANN,必須將權重對網(wǎng)絡的影響最小化,用權重隨機采樣可以保證最終的網(wǎng)絡是架構優(yōu)化的產(chǎn)物,但是在高維空間進行權重隨機采樣的難度太大。研究人員采取了“簡單粗暴”的方法,對所有權重強制進行權重共享(weight-sharing),讓權重值的數(shù)量減少到一個。這種高效的近似可以推動對更好架構的搜索。

操作步驟

解決了權重初始化的問題,接下來的問題就是如何收搜索權重不可知神經(jīng)網(wǎng)絡。它分為四個步驟:

1、創(chuàng)建初始的最小神經(jīng)網(wǎng)絡拓撲群。

2、通過多個rollout評估每個網(wǎng)絡,并對每個rollout分配不同的共享權重值。

3、根據(jù)性能和復雜程度對網(wǎng)絡進行排序。

4、根據(jù)排名最高的網(wǎng)絡拓撲來創(chuàng)建新的群,通過競爭結果進行概率性的選擇。

然后,算法從第2步開始重復,在連續(xù)迭代中,產(chǎn)生復雜度逐漸增加的權重不可知拓撲(weight agnostic topologies )。

拓撲搜索

用于搜索神經(jīng)網(wǎng)絡拓撲的操作受到神經(jīng)進化算法(NEAT)的啟發(fā)。在NEAT中,拓撲和權重值同時優(yōu)化,研究人員忽略權重,只進行拓撲搜索操作。

上圖展示了網(wǎng)絡拓撲空間搜索的具體操作:

一開始網(wǎng)絡上是最左側的最小拓撲結構,僅有部分輸入和輸出是相連的。

然后,網(wǎng)絡按以下三種方式進行更改:

1、插入節(jié)點:拆分現(xiàn)有連接插入新節(jié)點。

2、添加連接:連接兩個之前未連接的節(jié)點,添加新連接。

3、更改激活函數(shù):重新分配隱藏節(jié)點的激活函數(shù)。

圖的最右側展示了權重在[2,2]取值范圍內(nèi)可能的激活函數(shù),如線性函數(shù)、階躍函數(shù)、正弦余弦函數(shù)、ReLU等等。

權重依然重要

WANN與傳統(tǒng)的固定拓撲網(wǎng)絡相比,可以使用單個的隨機共享權重也能獲得更好的結果。

雖然WANN在多項任務中取得了最佳結果,但WANN并不完全獨立于權重值,當隨機分配單個權重值時,有時也會失敗。WANN通過編碼輸入和輸出之間的關系起作用,雖然權重的大小的重要性并不高,但它們的一致性,尤其是符號的一致性才是關鍵。

隨機共享權重的另一個好處是,調(diào)整單個參數(shù)的影響變得不重要,無需使用基于梯度的方法。強化學習任務中的結果讓作者考慮推廣WANN方法的應用范圍。他們又測試了WANN在圖像分類基礎任務MNIST上的表現(xiàn),結果在權重接近0時效果不佳。

有Reddit網(wǎng)友質疑WANN的結果,對于隨機權重接近于0的情況,該網(wǎng)絡的性能并不好,先強化學習實驗中的具體表現(xiàn)就是,小車會跑出限定范圍。

對此,作者給出解釋,在權重趨于0的情況下,網(wǎng)絡的輸出也會趨于0,所以后期的優(yōu)化很難達到較好的性能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6257

    瀏覽量

    111949
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4840

    瀏覽量

    108147
  • 機器學習
    +關注

    關注

    67

    文章

    8561

    瀏覽量

    137208

原文標題:谷歌發(fā)布顛覆性研究:不訓練不調(diào)參,AI自動構建超強網(wǎng)絡!

文章出處:【微信號:mcuworld,微信公眾號:嵌入式資訊精選】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    神經(jīng)網(wǎng)絡的初步認識

    日常生活中的智能應用都離不開深度學習,而深度學習則依賴于神經(jīng)網(wǎng)絡的實現(xiàn)。什么是神經(jīng)網(wǎng)絡?神經(jīng)網(wǎng)絡的核心思想是模仿生物
    的頭像 發(fā)表于 12-17 15:05 ?452次閱讀
    <b class='flag-5'>神經(jīng)網(wǎng)絡</b>的初步認識

    自動駕駛中常提的卷積神經(jīng)網(wǎng)絡是個啥?

    在自動駕駛領域,經(jīng)常會聽到卷積神經(jīng)網(wǎng)絡技術。卷積神經(jīng)網(wǎng)絡,簡稱為CNN,是一種專門用來處理網(wǎng)格狀數(shù)據(jù)(比如圖像)的深度學習模型。CNN在圖像處理中尤其常見,因為圖像本身就可以看作是由像素排列成的二維網(wǎng)格。
    的頭像 發(fā)表于 11-19 18:15 ?2237次閱讀
    自動駕駛中常提的卷積<b class='flag-5'>神經(jīng)網(wǎng)絡</b>是個啥?

    CNN卷積神經(jīng)網(wǎng)絡設計原理及在MCU200T上仿真測試

    數(shù)的提出很大程度的解決了BP算法在優(yōu)化深層神經(jīng)網(wǎng)絡時的梯度耗散問題。當x&gt;0 時,梯度恒為1,無梯度耗散問題,收斂快;當x&lt;0 時,該層的輸出為0。 CNN
    發(fā)表于 10-29 07:49

    NMSIS神經(jīng)網(wǎng)絡庫使用介紹

    NMSIS NN 軟件庫是一組高效的神經(jīng)網(wǎng)絡內(nèi)核,旨在最大限度地提高 Nuclei N 處理器內(nèi)核上的神經(jīng)網(wǎng)絡的性能并最??大限度地減少其內(nèi)存占用。 該庫分為多個功能,每個功能涵蓋特定類別
    發(fā)表于 10-29 06:08

    構建CNN網(wǎng)絡模型并優(yōu)化的一般化建議

    通過實踐,本文總結了構建CNN網(wǎng)絡模型并優(yōu)化的一般化建議,這些建議將會在構建高準確率輕量級CNN神經(jīng)網(wǎng)絡模型方面提供幫助。 1)避免單層神經(jīng)網(wǎng)絡
    發(fā)表于 10-28 08:02

    在Ubuntu20.04系統(tǒng)中訓練神經(jīng)網(wǎng)絡模型的一些經(jīng)驗

    構建卷積神經(jīng)網(wǎng)絡模型 model = models.Sequential()model.add(layers.Conv2D(input_shape=(28, 28, 1), filters=4
    發(fā)表于 10-22 07:03

    CICC2033神經(jīng)網(wǎng)絡部署相關操作

    在完成神經(jīng)網(wǎng)絡量化后,需要將神經(jīng)網(wǎng)絡部署到硬件加速器上。首先需要將所有權重數(shù)據(jù)以及輸入數(shù)據(jù)導入到存儲器內(nèi)。 在仿真環(huán)境下,可將其存于一個文件,并在 Verilog 代碼中通過 readmemh 函數(shù)
    發(fā)表于 10-20 08:00

    液態(tài)神經(jīng)網(wǎng)絡(LNN):時間連續(xù)性與動態(tài)適應性的神經(jīng)網(wǎng)絡

    神經(jīng)元,但卻能產(chǎn)生復雜的行為。受此啟發(fā),與傳統(tǒng)的神經(jīng)網(wǎng)絡相比,LNN旨在通過模擬大腦神經(jīng)元之間的動態(tài)連接來處理信息,這種網(wǎng)絡能夠順序處理數(shù)
    的頭像 發(fā)表于 09-28 10:03 ?1529次閱讀
    液態(tài)<b class='flag-5'>神經(jīng)網(wǎng)絡</b>(LNN):時間連續(xù)性與動態(tài)適應性的<b class='flag-5'>神經(jīng)網(wǎng)絡</b>

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+神經(jīng)形態(tài)計算、類腦芯片

    奇妙的突觸結構,有多個分支,承載著多個突觸群,使復雜網(wǎng)絡的通信和處理成為可能。 不同的神經(jīng)網(wǎng)絡 五、自選波類腦芯片 書里的內(nèi)容越來越燒腦了, 需要不斷的學習才能理解 加油吧少年
    發(fā)表于 09-17 16:43

    神經(jīng)網(wǎng)絡的并行計算與加速技術

    問題。因此,并行計算與加速技術在神經(jīng)網(wǎng)絡研究和應用中變得至關重要,它們能夠顯著提升神經(jīng)網(wǎng)絡的性能和效率,滿足實際應用中對快速響應和大規(guī)模數(shù)據(jù)處理的需求。神經(jīng)網(wǎng)絡并行
    的頭像 發(fā)表于 09-17 13:31 ?1282次閱讀
    <b class='flag-5'>神經(jīng)網(wǎng)絡</b>的并行計算與加速技術

    如何在機器視覺中部署深度學習神經(jīng)網(wǎng)絡

    圖 1:基于深度學習的目標檢測可定位已訓練的目標類別,并通過矩形框(邊界框)對其進行標識。 在討論人工智能(AI)或深度學習時,經(jīng)常會出現(xiàn)“神經(jīng)網(wǎng)絡”、“黑箱”、“標注”等術語。這些概念對非專業(yè)
    的頭像 發(fā)表于 09-10 17:38 ?1042次閱讀
    如何在<b class='flag-5'>機器</b>視覺中部署深度<b class='flag-5'>學習</b><b class='flag-5'>神經(jīng)網(wǎng)絡</b>

    無刷電機小波神經(jīng)網(wǎng)絡轉子位置檢測方法的研究

    摘要:論文通過對無刷電機數(shù)學模型的推導,得出轉角:與三相相電壓之間存在映射關系,因此構建了一個以三相相電壓為輸人,轉角為輸出的小波神經(jīng)網(wǎng)絡來實現(xiàn)轉角預測,并采用改進遺傳算法來訓練網(wǎng)絡結構與參數(shù),借助
    發(fā)表于 06-25 13:06

    神經(jīng)網(wǎng)絡專家系統(tǒng)在電機故障診斷中的應用

    摘要:針對傳統(tǒng)專家系統(tǒng)不能進行自學習、自適應的問題,本文提出了基于種經(jīng)網(wǎng)絡專家系統(tǒng)的并步電機故障診斷方法。本文將小波神經(jīng)網(wǎng)絡和專家系統(tǒng)相結合,充分發(fā)揮了二者故障診斷的優(yōu)點,很大程度上降低了對電機
    發(fā)表于 06-16 22:09

    神經(jīng)網(wǎng)絡RAS在異步電機轉速估計中的仿真研究

    ,在一定程度上擴展了轉速估計范圍。 純分享帖,需要者可點擊附件免費獲取完整資料~~~*附件:神經(jīng)網(wǎng)絡RAS在異步電機轉速估計中的仿真研究.pdf【免責聲明】本文系網(wǎng)絡轉載,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權
    發(fā)表于 06-16 21:54

    基于FPGA搭建神經(jīng)網(wǎng)絡的步驟解析

    本文的目的是在一個神經(jīng)網(wǎng)絡已經(jīng)通過python或者MATLAB訓練好的神經(jīng)網(wǎng)絡模型,將訓練好的模型的權重和偏置文件以TXT文件格式導出,然后通過python程序將txt文件轉化為coe文件,(coe
    的頭像 發(fā)表于 06-03 15:51 ?1492次閱讀
    基于FPGA搭建<b class='flag-5'>神經(jīng)網(wǎng)絡</b>的步驟解析
    浦县| 天台县| 苏尼特左旗| 克东县| 仙居县| 健康| 永靖县| 乐昌市| 太仓市| 航空| 喜德县| 六枝特区| 凤庆县| 闽清县| 漾濞| 潮安县| 武邑县| 灵川县| 呼伦贝尔市| 平乡县| 襄樊市| 前郭尔| 福安市| 巴青县| 呼伦贝尔市| 雷波县| 阜平县| 日照市| 略阳县| 二连浩特市| 北海市| 嘉义县| 双鸭山市| 琼海市| 南投市| 建湖县| 盐亭县| 玛曲县| 汉沽区| 呼和浩特市| 封开县|