哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

何愷明等人再出重磅新作:分割任務(wù)的TensorMask框架

電子工程師 ? 來源:lp ? 2019-04-04 17:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

看到今天要給大家介紹的論文,也許現(xiàn)在大家已經(jīng)非常熟悉 Ross Girshic、Piotr Dollár 還有我們的大神何愷明的三人組了。沒錯(cuò),今天這篇重磅新作還是他們的產(chǎn)出,營長感覺剛介紹他們的新作好像沒多久??!想要追趕大神腳步,確實(shí)是不能懈怠??!

不過這次一作是來自 FAIR 的陳鑫磊博士,雖然和三人組合比起來,一作陳鑫磊還沒有那么被大家所熟知,不過其實(shí)力也是不容小覷的(畢竟后面跟著三個(gè)實(shí)力響當(dāng)當(dāng)?shù)娜宋铮I長在陳鑫磊的個(gè)人主頁上看到他的學(xué)習(xí)經(jīng)歷和研究成果,也是忍不住點(diǎn)贊。陳鑫磊在浙江大學(xué)國家重點(diǎn)實(shí)驗(yàn)室 CAD&CG實(shí)驗(yàn)室學(xué)習(xí)時(shí),師從蔡登教授,隨后在 CMU 攻讀博士學(xué)位,現(xiàn)任職于 FAIR,畢業(yè)前曾在 Google Cloud 李飛飛和李佳組內(nèi)實(shí)習(xí)。在博士研究期間,每年和導(dǎo)師 Abhinav Gupta 教授都有論文發(fā)表在 AAAI、CVPR、ECCV、ICCV 等頂會(huì)上,考慮篇幅,營長就從每年成果中選一篇列舉出來,大家可以前往陳鑫磊的個(gè)人主頁中可以看到全部作品。

2013-2018 年間的主要作品:

[1]、Xinlei Chen, Li-Jia Li, Li Fei-Fei, Abhinav Gupta.Iterative Visual Reasoning Beyond Convolutions. The 31st IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2018.Spotlight

[2]、Xinlei Chen, Abhinav Gupta.Spatial Memory for Context Reasoning in Object Detection. The 15th International Conference on Computer Vision(ICCV), 2017

[3]、Gunnar A. Sigurdsson,Xinlei Chen, Abhinav Gupta.Learning Visual Storylines with Skipping Recurrent Neural Networks. The 14th European Conference on Computer Vision(ECCV), 2016

[4]、Xinlei Chen, Abhinav Gupta.Webly Supervised Learning of Convolutional Networks. The 15th International Conference on Computer Vision(ICCV), 2015.Oral

[5]、Xinlei Chen, C. Lawrence Zitnick.Mind's Eye: A Recurrent Visual Representation for Image Caption Generation. The 28th IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2015

[6]、Xinlei Chen, Alan Ritter, Abhinav Gupta, Tom Mitchell.Sense Discovery via Co-Clustering on Images and Text. The 28th IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2015.

[7]、Xinlei Chen, Abhinav Shrivastava, Abhinav Gupta.Enriching Visual Knowledge Bases via Object Discovery and Segmentation. The 27th IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2014

[8]、Xinlei Chen, Abhinav Shrivastava, Abhinav Gupta.NEIL: Extracting Visual Knowledge from Web Data. The 14th International Conference on Computer Vision(ICCV), 2013.Oral.

這幾個(gè)人從出道至今,都有非常多的佳作,出產(chǎn)率也非常高,最近大家還在重談去年三人組合的論文《Rethinking ImageNet Pre-training》,今天就有了這篇在密集掩碼預(yù)測新突破:《TensorMask: A Foundation for Dense Object Segmentation》,大神們簡直就是快要承包整個(gè) CV 界了!

“CV男團(tuán)”四人的個(gè)人主頁(一到四作的順序):

http://xinleic.xyz/#

http://www.rossgirshick.info/

http://kaiminghe.com/

http://pdollar.github.io/

接下來,營長就為大家?guī)怼癈V男團(tuán)”這篇最新力作的初解讀,因?yàn)檎撐闹猩婕昂芏嗯c TensorMask 框架相關(guān)的專業(yè)術(shù)語,函數(shù)定義等,還需要大家下來細(xì)細(xì)研究,感興趣的同學(xué)可以從下面的論文地址里下載論文進(jìn)一步學(xué)習(xí),也歡迎大家在后臺(tái)給我們留言,發(fā)表你的感想。

論文解讀

摘要

在目標(biāo)檢測任務(wù)中,采用滑窗方式生成目標(biāo)的檢測框是一種非常常用的方法。而在實(shí)例分割任務(wù)中,比較主流的圖像分割方法是首先檢測目標(biāo)邊界框,然后進(jìn)行裁剪和目標(biāo)分割,如 Mask RCNN。在這篇工作中,我們研究了密集滑窗實(shí)例分割(dense sliding-window instance segmentation)的模式,發(fā)現(xiàn)與其他的密集預(yù)測任務(wù)如語義分割,目標(biāo)檢測不同,實(shí)例分割滑窗在每個(gè)空間位置的輸出具有自己空間維度的幾何結(jié)構(gòu)。為了形式化這一點(diǎn),我們提出了一個(gè)通用的框架 TensorMask 來獲得這種幾何結(jié)構(gòu)。

我們通過張量視圖展示了相較于忽略這種結(jié)構(gòu)的 baseline 方法,它可以有一個(gè)大的效果提升,甚至比肩于 Mask R-CNN。這樣的實(shí)驗(yàn)結(jié)果足以說明TensorMask 為密集掩碼預(yù)測任務(wù)提供了一個(gè)新的理解方向,并可以作為該領(lǐng)域新的基礎(chǔ)方法。

引言

滑窗范式(在一張圖的每個(gè)滑動(dòng)窗口里面去尋找目標(biāo))是視覺任務(wù)里面最早且非常成功的方法,并且可以很自然的和卷積網(wǎng)絡(luò)聯(lián)系起來。雖然像 RCNN 系列方法需要在滑窗的方法上再進(jìn)行精修,但是像 SSD、RetinaNet 的方法就是直接利用滑窗預(yù)測。在目標(biāo)檢測里面非常受歡迎的方法,在實(shí)例分割任務(wù)中卻沒得到足夠的關(guān)注。因此本文的工作就是來填補(bǔ)該缺失。本文主要的 insight 就是定義密集掩碼的表示方式,并且在神經(jīng)網(wǎng)絡(luò)中有效的實(shí)現(xiàn)它。與低維、尺度無關(guān)的檢測框不同,分割掩碼需要一種更具有結(jié)構(gòu)化的表示方式。因此,本文在空域上,采用結(jié)構(gòu)化的 4 維張量定義了掩碼的表示方式,并提出了一個(gè)基于滑窗方法的密集實(shí)例分割框架——TensorMask。在 4 維張量(V,U,H,W)中,H 和 W 表示目標(biāo)的位置,而 V 和 U 表示相關(guān)掩碼的位置。與僅直接在通道上加一個(gè)掩碼分支的方法不同,這種方法是具有幾何意義的,并且可以直接在(V,U)張量上進(jìn)行坐標(biāo)轉(zhuǎn)換,尺度縮放等操作。在 TensorMask 框架中,作者還順手開發(fā)了一個(gè)張量尺度金字塔(tensor bipyramid),用于 4 維的尺度縮放。如下公式所示,其中 K 就是尺度。

? ? ?

掩碼的張量表示

TensorMask 框架的主要想法就是利用結(jié)構(gòu)化的高維張量去表示密集的滑動(dòng)窗口。在理解這樣的一個(gè)框架時(shí),需要了解幾個(gè)重要的概念。

單位長度(Unit of Length):在不同的軸和尺度上有不同的單位長度,且 HW 和 VU 的單位長度可以不相等。

? ? ?和 ? ? ? ? ? ? ?分別表示其單位長度。

自然表示(Natural Representation):在點(diǎn)(y,x)處的滑窗內(nèi),某點(diǎn)的掩碼值表示,如下截圖所示,其中 alpha 表示 VU 和 HW 的單位長度比率。

對齊表示(Aligned Representation):由于單位長度中 stride 的存在,自然表示存在著像素偏移的問題,因此這里有一個(gè)同 ROIAlign 相似的想法,需要從張量的角度定義一個(gè)像素級的表示。

坐標(biāo)轉(zhuǎn)換:用于自然表示和對齊表示間的轉(zhuǎn)換,論文給出了兩種情況下的轉(zhuǎn)換公式,一種是簡化版的( ? ? ?),一種是一般版的(就是任意的單位長度)。

上采樣轉(zhuǎn)換(Upscaling Transformation):下圖就是上采樣轉(zhuǎn)換的操作集合。實(shí)驗(yàn)證明它可以在不增加通道數(shù)的情況下,有效的生成高分辨率的掩碼。

張量尺度金字塔(Tensor Bipyramid):由于掩碼存在尺度問題,它需要隨目標(biāo)的大小而進(jìn)行縮放,為了保持恒定的分辨率密度,提出了這種基于尺度來調(diào)整掩碼像素?cái)?shù)量的方法。

TensorMask結(jié)構(gòu)

基于 TensorMask 表示的模型,有一個(gè)采用滑窗的掩碼預(yù)測分支和一個(gè)類似于檢測框回歸的分類分支。該結(jié)構(gòu)不需要增加檢測框的分支。掩碼預(yù)測分支可以采用卷積的 backbone,比如 ResNet50。因此,論文提出了多個(gè)基礎(chǔ)(baseline)分支和張量尺度金字塔分支,幫助使用者快速上手 TensorMask。需要指出的是,張量尺度金字塔分支是最有效的一個(gè)模型。在訓(xùn)練時(shí),作者采用 DeepMask 來幫助標(biāo)記數(shù)據(jù),以及 focal loss 等等。

實(shí)驗(yàn)

為了說明各分支或者操作的作用,論文做了大量的消融實(shí)驗(yàn)來進(jìn)行論證。具體結(jié)果見下圖表格的數(shù)據(jù)以及與 Mask-RCNN 可視化的對比。實(shí)驗(yàn)結(jié)果證明,TensorMask 能夠定性定量的比肩 MaskR-CNN。

該項(xiàng)工作將滑窗方法與實(shí)例分割任務(wù)直接聯(lián)系了起來,能夠幫助該領(lǐng)域的研究者對實(shí)例分割有新的理解,期待代碼早日開源。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4842

    瀏覽量

    108177
  • 框架
    +關(guān)注

    關(guān)注

    0

    文章

    404

    瀏覽量

    18497
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    4346

    瀏覽量

    46442

原文標(biāo)題:何愷明等人提TensorMask框架:比肩Mask R-CNN,4D張量預(yù)測新突破

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    RT-Thread任務(wù)+消息訂閱管理框架軟件包:thread_manager+event_loop

    一.有個(gè)簡單的問題(什么是愛情)為什么開源RTOS都只將我們送到Main?卻沒有一個(gè)開源的任務(wù)管理+消息訂閱框架+延時(shí)消息處理框架。就像LVGL好像沒有開源的類似于手表功能頁面切換框架
    的頭像 發(fā)表于 04-19 15:39 ?4244次閱讀
    RT-Thread<b class='flag-5'>任務(wù)</b>+消息訂閱管理<b class='flag-5'>框架</b>軟件包:thread_manager+event_loop

    LuatOS 系統(tǒng)框架的模塊化設(shè)計(jì)原理

    裁剪功能,適應(yīng)不同規(guī)模的嵌入式項(xiàng)目需求。 一、LuatOS框架中的概念 ? 在LuatOS中,有三個(gè)核心概念和一個(gè)調(diào)度器: 1、三個(gè)核心概念:任務(wù)(task),消息(message),定時(shí)器(timer
    的頭像 發(fā)表于 02-03 15:56 ?285次閱讀
    LuatOS 系統(tǒng)<b class='flag-5'>框架</b>的模塊化設(shè)計(jì)原理

    LuatOS框架的使用(上)

    環(huán)境搭建、模塊調(diào)用到任務(wù)調(diào)度,全面解析其開發(fā)流程與最佳實(shí)踐。 本篇文章主要講LuatOS 框架;LuatOS 框架是整個(gè) LuatOS 開發(fā)中最基礎(chǔ)也是最核心的內(nèi)容,無論使用 LuatOS 開發(fā)什么功能,都會(huì)用到它; LuatO
    的頭像 發(fā)表于 01-27 19:38 ?370次閱讀
    LuatOS<b class='flag-5'>框架</b>的使用(上)

    32億收購!晶豐源有布局?

    1月20日,上海晶豐源半導(dǎo)體股份有限公司發(fā)布公告,宣布擬以398.32萬元出售其持有的上海類比半導(dǎo)體技術(shù)有限公司(以下簡稱“類比半導(dǎo)體”)1.7778%股權(quán)。 相比于上海晶豐源的百億市值來說
    的頭像 發(fā)表于 01-26 10:28 ?512次閱讀
    32億收購!晶豐<b class='flag-5'>明</b>源有<b class='flag-5'>何</b>布局?

    手機(jī)板 layout 走線跨分割問題

    初學(xué)習(xí)layout時(shí),都在說信號線不可跨分割,但是在工作中為了成本不能跨分割似乎也非絕對。 在后續(xù)工作中,跨分割的基礎(chǔ)都是相鄰層有一面完整的GND參考,跨分割發(fā)生在相鄰的另外一層。 但
    發(fā)表于 09-16 14:56

    基于瑞芯微RK3576的resnet50訓(xùn)練部署教程

    Resnet50簡介ResNet50網(wǎng)絡(luò)是2015年由微軟實(shí)驗(yàn)室的提出,獲得ILSVRC2015圖像分類競賽第一名。在ResNet網(wǎng)絡(luò)提出之前,傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)都是將一系列的卷積層和池化層
    的頭像 發(fā)表于 09-10 11:19 ?1469次閱讀
    基于瑞芯微RK3576的resnet50訓(xùn)練部署教程

    Task任務(wù):LuatOS實(shí)現(xiàn)“任務(wù)級并發(fā)”的核心引擎

    Task任務(wù)通過其強(qiáng)大的并發(fā)處理能力,使LuatOS能夠在單線程環(huán)境中模擬多線程執(zhí)行,通過協(xié)程的掛起與恢復(fù)機(jī)制,實(shí)現(xiàn)任務(wù)級的并行操作,顯著提升系統(tǒng)效能。 sys核心庫是LuatOS運(yùn)行框架庫,也是
    的頭像 發(fā)表于 08-28 13:49 ?640次閱讀
    Task<b class='flag-5'>任務(wù)</b>:LuatOS實(shí)現(xiàn)“<b class='flag-5'>任務(wù)</b>級并發(fā)”的核心引擎

    揭秘LuatOS Task:多任務(wù)管理的“智能中樞”

    Task任務(wù)作為LuatOS的核心組成部分,通過智能化的任務(wù)管理機(jī)制,實(shí)現(xiàn)任務(wù)的創(chuàng)建、調(diào)度與協(xié)同運(yùn)行,讓復(fù)雜應(yīng)用得以高效并行處理,滿足實(shí)時(shí)場景下的嚴(yán)苛需求。 sys核心庫是LuatOS運(yùn)行框架
    的頭像 發(fā)表于 08-28 13:48 ?787次閱讀
    揭秘LuatOS Task:多<b class='flag-5'>任務(wù)</b>管理的“智能中樞”

    科技與華輝煌簽訂100萬臺(tái)AI智能硬件供貨框架協(xié)議

    框架協(xié)議。 根據(jù)協(xié)議,華輝煌未來將向洲采購100萬臺(tái)AI智能硬件及解決方案,共同推動(dòng)傳統(tǒng)LED護(hù)眼燈向新一代AI智能燈具升級。 #01 AI智能燈具 打造全新交互體驗(yàn) 與傳統(tǒng)燈具不同,新一代AI智能燈具不僅具備護(hù)眼功能,更融合前沿的AI語音交
    的頭像 發(fā)表于 08-19 09:58 ?1458次閱讀

    科技與香港科晫集團(tuán)簽署戰(zhàn)略合作協(xié)議

    8月13日下午,洲科技與香港科晫集團(tuán)(TechTure)在深圳福永總部簽署戰(zhàn)略合作協(xié)議,正式啟動(dòng)香港地鐵AI智能化升級項(xiàng)目,并簽署1500臺(tái)AI一體機(jī)批量交付框架協(xié)議,這意味著洲科技端側(cè)AI一體機(jī)批量化交付能力得到肯定,也是
    的頭像 發(fā)表于 08-14 14:17 ?1339次閱讀

    如何將32個(gè)步進(jìn)伺服驅(qū)動(dòng)器塞進(jìn)小型板材分割機(jī)中?

    板材分割機(jī)是工業(yè)制造中常見的裝備。機(jī)器的內(nèi)部空間狹小,如何將多達(dá)32個(gè)步進(jìn)伺服驅(qū)動(dòng)器安裝在其中顯得非常困難。本文將通過基于EtherCAT總線的插板式步進(jìn)伺服驅(qū)動(dòng)器剖析其破解之法!傳統(tǒng)銑刀式板材分割
    的頭像 發(fā)表于 07-08 11:37 ?674次閱讀
    如何將32個(gè)步進(jìn)伺服驅(qū)動(dòng)器塞進(jìn)小型板材<b class='flag-5'>分割</b>機(jī)中?

    科技2025上半年高光時(shí)刻回顧

    LED顯示屏上市公司營收榜首。2025年已過半程,我們在標(biāo)桿項(xiàng)目落地、產(chǎn)業(yè)生態(tài)構(gòu)建與產(chǎn)品技術(shù)突破上持續(xù)發(fā)力,步履堅(jiān)實(shí)。 今天,讓我們共同回顧洲 —— 01服務(wù)國家大事 精彩亮相2025大阪世博會(huì) 洲科技承接了2025大阪世博多個(gè)核心展館的建設(shè)
    的頭像 發(fā)表于 07-03 17:13 ?1817次閱讀

    通過vmRT-Thread和VirtIO-SCMI攻克硬件分割依賴難點(diǎn) | 前沿觀點(diǎn)

    硬件分割依賴難點(diǎn)是現(xiàn)代嵌入式系統(tǒng)和物聯(lián)網(wǎng)設(shè)備開發(fā)中常見的問題。在多任務(wù)或多應(yīng)用的系統(tǒng)中,不同任務(wù)或應(yīng)用需要訪問不同的硬件資源,傳統(tǒng)的系統(tǒng)設(shè)計(jì)中,硬件資源的分配往往與軟件緊密耦合,導(dǎo)致軟件的可移植性
    的頭像 發(fā)表于 06-24 19:38 ?1100次閱讀
    通過vmRT-Thread和VirtIO-SCMI攻克硬件<b class='flag-5'>分割</b>依賴難點(diǎn) | 前沿觀點(diǎn)

    【正點(diǎn)原子STM32MP257開發(fā)板試用】基于 DeepLab 模型的圖像分割

    是谷歌團(tuán)隊(duì)提出的一種用于語義分割的深度學(xué)習(xí)模型,屬于 DeepLab 系列模型的第三代版本。它在圖像語義分割任務(wù)中表現(xiàn)優(yōu)異,能夠高效地捕獲圖像的多尺度上下文信息,并生成高分辨率的分割
    發(fā)表于 06-21 21:11

    第三屆大會(huì)回顧第3期 | FFRT并發(fā)框架在OpenHarmony中的設(shè)計(jì)與實(shí)踐

    演講嘉賓 | 黃佑鐘 回顧整理 | 廖 ? 濤 排版校對 | 宋夕 嘉賓介紹 開發(fā)框架分論壇? 黃佑鐘 ,海思Kirin解決方案并行與異構(gòu)計(jì)算專家。 正文內(nèi)容 多任務(wù)并發(fā)能更有效地利用CPU資源
    的頭像 發(fā)表于 06-21 16:53 ?1462次閱讀
    第三屆大會(huì)回顧第3期 | FFRT并發(fā)<b class='flag-5'>框架</b>在OpenHarmony中的設(shè)計(jì)與實(shí)踐
    石阡县| 日喀则市| 盐城市| 临颍县| 博爱县| 龙井市| 沈阳市| 格尔木市| 兴安县| 龙海市| 巍山| 六枝特区| 康定县| 九江县| 台东县| 孝昌县| 突泉县| 临桂县| 临漳县| 白朗县| 沂水县| 哈密市| 浙江省| 台江县| 辽阳市| 县级市| 敖汉旗| 宜昌市| 彭水| 会昌县| 沙湾县| 卓资县| 荥阳市| 美姑县| 东城区| 大丰市| 高州市| 永登县| 中阳县| 武义县| 灵璧县|