哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一文帶你了解RNN、LTSM、Seq2Seq、Attention機(jī)制

智能生物識(shí)別說(shuō) ? 來(lái)源:快商通AI ? 作者:快商通AI ? 2021-09-27 18:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

上一章我們?cè)敿?xì)介紹了小樣本做文本分類中的膠囊網(wǎng)絡(luò),那么這一章我們就來(lái)看看RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))。大神們準(zhǔn)備好了嗎,我們要發(fā)車了~

首先就是我們?yōu)槭裁葱枰猂NN?

舉個(gè)簡(jiǎn)單的例子,最近娛樂(lè)圈頂流明星吳亦凡又出新瓜,大家都吃了咩?(反正小編吃的很飽哈)那么就以我 吃 瓜為例,三個(gè)單詞標(biāo)注詞性為 我/nn 吃/v 瓜/nn。

那么這個(gè)任務(wù)的輸入就是:

我 吃 瓜 (已經(jīng)分詞好的句子)

這個(gè)任務(wù)的輸出是:

我/nn 吃/v 瓜/nn(詞性標(biāo)注好的句子)

很明顯,一個(gè)句子中,前一個(gè)單詞其實(shí)對(duì)于當(dāng)前單詞的詞性預(yù)測(cè)是有很大影響的,比如預(yù)測(cè)“瓜”的時(shí)候,由于前面的吃是一個(gè)動(dòng)詞,那么很顯然“瓜”作為名詞的概率就會(huì)遠(yuǎn)大于動(dòng)詞的概率,因?yàn)閯?dòng)詞后面接名詞很常見(jiàn),而動(dòng)詞后面接動(dòng)詞很少見(jiàn)。

所以為了更好的處理序列的信息,解決一些這樣類似的問(wèn)題,我們的RNN就誕生了。

rnn的結(jié)構(gòu)和原理

看完初步的概念我們來(lái)深入一點(diǎn)看看RNN的結(jié)構(gòu)和原理。rnn的結(jié)構(gòu)和原理

pYYBAGC4meiAAdlHAABjM2jJoEw935.jpg

剛開始看到這幅圖的同學(xué)會(huì)不會(huì)有一點(diǎn)懵懵?沒(méi)關(guān)系,我們來(lái)帶著解釋一遍~

首先通過(guò)這副圖,就能明白R(shí)NN的意義就是每個(gè)輸出的狀態(tài)都只由前一時(shí)刻的狀態(tài)和當(dāng)前時(shí)刻的輸入來(lái)決定。從等式左邊的一個(gè)環(huán)繞箭頭就能明白參數(shù)是共享的。

一個(gè)序列的每個(gè)詞就是每個(gè)時(shí)間步,每個(gè)詞都會(huì)對(duì)應(yīng)得到一個(gè)hidden_state,并將這個(gè)隱藏層狀態(tài)輸入下一個(gè)時(shí)間步。

最終會(huì)得到output和hidden,output是每一步運(yùn)算的輸出,因此output=(seqence_len, batch_size, hidden_size)。hidden_state是每一步的輸出,當(dāng)然有參數(shù)來(lái)控制可以取最后一步的輸出,所以RNN中一般output=hidden。

lstm的結(jié)構(gòu)和原理

聊完一圈RNN之后,我們來(lái)看看它的變種兄弟-LSTM吧!

別慌,我說(shuō)的不是變種成僵尸的那種東東,Lstm為長(zhǎng)短期記憶,是在RNN的基礎(chǔ)上引入了細(xì)胞狀態(tài),根據(jù)細(xì)胞狀態(tài)可決定哪些狀態(tài)應(yīng)該保留下來(lái),哪些狀態(tài)應(yīng)該被遺忘,可以在一定程度上解決梯度消失問(wèn)題。

那么為了能夠?qū)W習(xí)序列關(guān)系的長(zhǎng)期依賴,Lstm的輸出和rnn一樣都包含output和hidden,除此之外還有一個(gè)cell_state,這個(gè)就是學(xué)習(xí)序列信息lstm與rnn的差異。

在lstm里面理解的就是用“門”結(jié)構(gòu),來(lái)選擇信息通過(guò),關(guān)鍵是用了$sigmoid(\cdot)$函數(shù)來(lái)區(qū)分趨于0的和趨于1的特征數(shù)據(jù)。

遺忘門:通過(guò)$f_t=\sigma(W_f \cdot[h_{t-1},x_t] + b_f)$ 來(lái)判斷隱藏層信息的取舍。

輸入門:

poYBAGC4meWADv9WAAAccVYUC9w682.jpg

通過(guò)$\tanh(\cdot)$,來(lái)將隱藏層狀態(tài)映射到(-1,1)最后來(lái)更新$C_{t-1}$ 到$C_t $

輸出門:

pYYBAGC4meyAMy7aAAAWL7NbiQI218.jpg

會(huì)發(fā)現(xiàn)$f_t、i_t、o_t$的構(gòu)成是一致的。但是通過(guò)不同的權(quán)重來(lái)學(xué)習(xí)。因此優(yōu)化lstm是將遺忘門和輸入門合并成了一個(gè)更新門,這就是GRU:

可以理解為主要分為兩部分,第一部分:

pYYBAGC4me2AOoxXAAASZqSshqY694.jpg

$z_t$表示更新向量,$r_t$表示重置向量,于是在接下來(lái)就能夠考慮$r_t$與$h_{t-1}$的相關(guān)性來(lái)去對(duì)部分?jǐn)?shù)據(jù)進(jìn)行重置,也就相當(dāng)于舍棄。實(shí)現(xiàn)遺忘門的效果。

第二部分:

poYBAGC4meiAGOzMAAAd9tihyU0202.jpg

很好理解,就可以通過(guò)篩選得到的有效的隱藏層信息$\tilde{h}t$和更新向量來(lái)獲取最終的輸出結(jié)果$(1-z_t) * h{t-1}$表示對(duì)當(dāng)前一時(shí)刻隱藏層狀態(tài)選擇性“遺忘”。$z_t * \tilde{h}_t$就表示對(duì)當(dāng)前序列信息的“記憶”。

sequence-to-sequence的結(jié)構(gòu)和原理

也叫做Encoder-Decoder結(jié)構(gòu),在encoder和decoder中也都是用序列模型,就是將數(shù)據(jù)先encode成一個(gè)上下文向量context vector,這個(gè)context vector可以是1)最后一個(gè)隱藏層狀態(tài),2)可以是完整的隱藏層輸出,3)也可以是對(duì)隱藏層輸出做激活或者線性變換之后的輸出。

之后在decoder中,將context vector作為前一時(shí)刻初始化的狀態(tài)輸入從而將語(yǔ)義按監(jiān)督信息的需要解碼?;蛘邔ontext vector作為decoder每一個(gè)時(shí)間步的輸入。因此會(huì)發(fā)現(xiàn)seq2seq并不限制輸入和輸出的序列長(zhǎng)度,這就表示應(yīng)用范圍可以很廣。

Attention

會(huì)發(fā)現(xiàn)context vector并不能夠包含長(zhǎng)句的所有信息,或者說(shuō)會(huì)造成信息的丟失,因此attention機(jī)制就是能夠向decoder的每一個(gè)時(shí)間步輸入不同的文本信息,提升語(yǔ)義的理解能力。

因?yàn)閘stm會(huì)得到完整的包含每一個(gè)時(shí)間步的輸出得到的ouput和hidden,因此$h_i$和$C_j$的相關(guān)性就能夠表示在decode第$j$步序列時(shí)最關(guān)心的文本是那一步的 $h_i $,用 $\alpha_{ij}$來(lái)表示。

每一個(gè)encoder的hidden單元和每一個(gè)decoder的hidden單元做點(diǎn)乘,得到每?jī)蓚€(gè)單元之間的相關(guān)性,在lstm/rnn之后用attention就是計(jì)算hidden和ouput的每個(gè)單元之間的相關(guān)性,然后做一步$softmax$得到encoder的hidden或者說(shuō)是lstm的hidden每個(gè)單元的attention weights。因此:Attention 無(wú)非就是這三個(gè)公式:

poYBAGC4meqAKxjvAAAT3nJUrlE172.jpg

從常規(guī)的(Q,K,V)的角度來(lái)理解,可以如圖所示:

pYYBAGC4mfCAE2pwAAApg85OSxU468.jpg

在Attention中$Q$和$K$分別是hidden和output,同樣的$V$也是ouput,在self-attention中Q=K=V,并且$\sqrt{d_k}$有些情況下是不會(huì)加在attention過(guò)程中的。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7347

    瀏覽量

    94998
  • Gru
    Gru
    +關(guān)注

    關(guān)注

    0

    文章

    13

    瀏覽量

    7759
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    帶你了解雙目深度相機(jī)

    在如今的智能化時(shí)代,不管是工業(yè)車間里的機(jī)器人、家里的掃地機(jī)器人,還是AR眼鏡、自動(dòng)駕駛汽車,都需要雙能“看懂”三維世界的“眼睛”——雙目深度相機(jī)就是這樣款設(shè)備。可能有人會(huì)問(wèn),這東西到底是啥?其實(shí)
    的頭像 發(fā)表于 04-14 14:30 ?66次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>帶你</b><b class='flag-5'>了解</b>雙目深度相機(jī)

    看懂PCIe中斷機(jī)制

    PCIe 中斷機(jī)制主要分為兩類:類是繼承自傳統(tǒng) PCI 的 物理中斷線(INTx)中斷,通過(guò)硬件引腳觸發(fā);另類是 MSI(Message Signaled Interrupt)中斷,通過(guò)向指定內(nèi)存地址寫入數(shù)據(jù)來(lái)通知系統(tǒng)。
    的頭像 發(fā)表于 03-11 09:35 ?469次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b>看懂PCIe中斷<b class='flag-5'>機(jī)制</b>

    帶你了解鹵素

    當(dāng)你聽到“鹵素”這個(gè)詞,是否第時(shí)間想到的是汽車前大燈里那種明亮的燈泡?其實(shí),在化學(xué)的世界里,鹵素代表的是組非?;钴S的非金屬元素——氟、氯、溴、碘以及放射性元素砹。除了砹因放射性特殊處理外,前四位
    的頭像 發(fā)表于 03-09 15:42 ?188次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>帶你</b><b class='flag-5'>了解</b>鹵素

    帶你徹底搞懂K8s網(wǎng)絡(luò)

    說(shuō)實(shí)話,K8s 網(wǎng)絡(luò)是我見(jiàn)過(guò)最讓新手頭疼的知識(shí)點(diǎn),沒(méi)有之。記得我剛接觸 K8s 那會(huì)兒,看著流量在 Pod、Service、Node 之間穿梭,完全是臉懵逼。后來(lái)踩了無(wú)數(shù)坑,熬了無(wú)數(shù)夜,總算把這套網(wǎng)絡(luò)模型摸透了。今天這篇文章,我會(huì)用最接地氣的方式,
    的頭像 發(fā)表于 02-06 10:15 ?673次閱讀

    用zynq開發(fā)ads7865所遇見(jiàn)的問(wèn)題

    我用fpga開發(fā)ads7865芯片時(shí)遇見(jiàn)seq寄存器的讀取末尾始終為01,而且使用ila抓取的數(shù)據(jù)與測(cè)試使用的波動(dòng)較大,而且通道對(duì)不上。
    發(fā)表于 01-04 19:09

    DLP4500無(wú)法投影且有輕微聲音,黃燈閃爍

    DLP4500開機(jī)后觀察到黃燈閃爍,連接GUI沒(méi)問(wèn)題,進(jìn)入Seq. Running之后沒(méi)有投影,且有輕微聲音,可能是什么問(wèn)題
    發(fā)表于 12-26 21:29

    搞清 BLE 藍(lán)牙 UUID

    帶你搞清楚藍(lán)牙 UUID ...... 矜辰所致
    的頭像 發(fā)表于 12-18 11:23 ?4786次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b>搞清 BLE 藍(lán)牙 UUID

    讀懂LSTM與RNN:從原理到實(shí)戰(zhàn),掌握序列建模核心技術(shù)

    RNN的核心局限。今天,我們從原理、梯度推導(dǎo)到實(shí)踐,全面解析這兩大經(jīng)典模型。、基礎(chǔ)鋪墊:RNN的核心邏輯與痛點(diǎn)RNN的核心是讓模型“記住過(guò)去”——通過(guò)隱藏層的循環(huán)連
    的頭像 發(fā)表于 12-09 13:56 ?1824次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b>讀懂LSTM與<b class='flag-5'>RNN</b>:從原理到實(shí)戰(zhàn),掌握序列建模核心技術(shù)

    Xilinx高性能NVMe Host控制器IP+PCIe 3.0軟核控制器IP,純邏輯實(shí)現(xiàn),AXI4和AXI4-Stream DMA接口,支持PCIe 3.0和4.0

    ,使用NVMe的多隊(duì)列特性,NVMe AXI4 Host Controller IP支持靈活配置DMA讀寫的通道個(gè)數(shù),按照NVMe隊(duì)列優(yōu)先級(jí)仲裁(循環(huán)仲裁或加權(quán)循環(huán)仲裁)機(jī)制,實(shí)現(xiàn)多個(gè)DMA通道對(duì)同
    發(fā)表于 11-14 22:40

    OK3506-S12 Mini開發(fā)板開箱和基本使用(飛凌嵌入式)

    OK3506-S12 Mini開發(fā)板 圖2 OK3506-S12 Mini開發(fā)板 開發(fā)板簡(jiǎn)介 ? ?RK3506J/RK3506B是款高性能的三核Cortex-A7應(yīng)用處理器,專為智能語(yǔ)音交互、音頻輸入/輸出
    發(fā)表于 11-03 00:57

    帶你了解海凌科毫米波雷達(dá)

    什么是毫米波雷達(dá)?毫米波雷達(dá)有什么特點(diǎn)?毫米波雷達(dá)有什么作用?海凌科有哪些系列毫米波雷達(dá)?帶你了解!毫米波的定義毫米波是指頻率在30GHz至300GHz之間、波長(zhǎng)為1~10毫米的電
    的頭像 發(fā)表于 08-11 12:04 ?1991次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>帶你</b><b class='flag-5'>了解</b>海凌科毫米波雷達(dá)

    帶你了解什么是機(jī)器視覺(jué)網(wǎng)卡

    機(jī)器視覺(jué)網(wǎng)卡通常指的是在機(jī)器視覺(jué)系統(tǒng)中用于連接工業(yè)相機(jī)到計(jì)算機(jī)的以太網(wǎng)卡。它的核心作用是實(shí)現(xiàn)高速、穩(wěn)定、低延遲的圖像數(shù)據(jù)傳輸。以下是關(guān)于機(jī)器視覺(jué)網(wǎng)卡的關(guān)鍵信息:1.核心功能:高速圖像傳輸:處理來(lái)自千兆以太網(wǎng)或萬(wàn)兆以太網(wǎng)相機(jī)產(chǎn)生的大量圖像數(shù)據(jù)流。萬(wàn)兆網(wǎng)卡能提供更高的帶寬,滿足高分辨率、高幀率相機(jī)的需求。支持GigEVision協(xié)議:這是機(jī)器視覺(jué)領(lǐng)域最重要的工業(yè)
    的頭像 發(fā)表于 07-09 16:18 ?836次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>帶你</b><b class='flag-5'>了解</b>什么是機(jī)器視覺(jué)網(wǎng)卡

    帶你了解電源測(cè)試系統(tǒng)的功能!

    在當(dāng)今電子與電力技術(shù)飛速發(fā)展的時(shí)代,各類電子設(shè)備、電力系統(tǒng)以及新能源相關(guān)產(chǎn)品的研發(fā)、生產(chǎn)和維護(hù)過(guò)程中,電源測(cè)試系統(tǒng)扮演著至關(guān)重要的角色。本文將帶你了解源儀電子的電源測(cè)試系統(tǒng)的功能。
    的頭像 發(fā)表于 07-02 09:10 ?1186次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>帶你</b><b class='flag-5'>了解</b>電源測(cè)試系統(tǒng)的功能!

    了解電壓諧波

    我們經(jīng)常會(huì)聽到諧波,到底什么是諧波,怎么定義的?為什么要關(guān)注諧波?什么時(shí)候關(guān)注諧波?諧波如何計(jì)算或標(biāo)準(zhǔn)規(guī)定的諧波的算法是怎樣的?GB關(guān)于電壓諧波又是如何評(píng)估的?帶著諸多的問(wèn)題,我們一起來(lái)了解。
    的頭像 發(fā)表于 06-28 17:23 ?5176次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>了解</b>電壓諧波

    帶你了解工業(yè)計(jì)算機(jī)尺寸

    項(xiàng)艱巨的任務(wù)。本博客將指導(dǎo)您了解關(guān)鍵的工業(yè)計(jì)算機(jī)尺寸、使用案例。關(guān)鍵工業(yè)計(jì)算機(jī)外形要素及其使用案例、工業(yè)微型PC尺寸范圍:寬度:100毫米-180毫米深度:10
    的頭像 發(fā)表于 04-24 13:35 ?1182次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>帶你</b><b class='flag-5'>了解</b>工業(yè)計(jì)算機(jī)尺寸
    古丈县| 重庆市| 嘉义市| 南京市| 通河县| 华安县| 林口县| 孙吴县| 绥棱县| 盐山县| 介休市| 九龙城区| 砀山县| 庆安县| 霸州市| 特克斯县| 巩留县| 湟源县| 普宁市| 淮滨县| 东台市| 沧源| 泾阳县| 浠水县| 进贤县| 石家庄市| 古浪县| 博爱县| 洪洞县| 鲁甸县| 上虞市| 琼结县| 平舆县| 板桥市| 诸城市| 图木舒克市| 淮滨县| 秀山| 项城市| 景谷| 济南市|