哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

破解透明物體抓取難題,地瓜機(jī)器人 CASIA 推出幾何和語(yǔ)義融合的單目抓取方案|ICRA 2025

地瓜機(jī)器人 ? 2025-03-05 19:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

概述

近日,全球機(jī)器人領(lǐng)域頂會(huì)ICRA 2025(IEEE機(jī)器人與自動(dòng)化國(guó)際會(huì)議)公布論文錄用結(jié)果,地瓜機(jī)器人主導(dǎo)研發(fā)的DOSOD開(kāi)放詞匯目標(biāo)檢測(cè)算法MODEST單目透明物體抓取算法成功入選。前者通過(guò)動(dòng)態(tài)語(yǔ)義理解框架提升復(fù)雜場(chǎng)景識(shí)別準(zhǔn)確率,后者結(jié)合幾何建模與語(yǔ)義分析技術(shù)優(yōu)化透明物體操作精度,兩項(xiàng)技術(shù)成果均已在規(guī)模化商業(yè)場(chǎng)景中得到有效驗(yàn)證。此次投稿的兩篇論文全部入選,不僅彰顯了ICRA對(duì)機(jī)器人感知領(lǐng)域的高度重視,同時(shí)也印證了地瓜機(jī)器人團(tuán)隊(duì)在機(jī)器人視覺(jué)領(lǐng)域的領(lǐng)先優(yōu)勢(shì)。

DOSOD開(kāi)放詞匯目標(biāo)檢測(cè)算法,本期文章將圍繞MODEST單目透明抓取算法進(jìn)行重點(diǎn)介紹。

作為機(jī)器人執(zhí)行各項(xiàng)任務(wù)中繞不開(kāi)的操作對(duì)象,水杯、試管、窗戶(hù)等透明物體在人類(lèi)生活中無(wú)處不在。從精密制造、醫(yī)療實(shí)驗(yàn)室和家庭服務(wù)機(jī)器人等領(lǐng)域,透明物體的精確操作是提升自動(dòng)化和智能化水平的關(guān)鍵。然而,透明物體復(fù)雜的折射和反射特性給機(jī)器人感知造成了很大困難。在大多數(shù)RGB圖像中的透明物體往往缺乏清晰的紋理,而容易與背景混為一體。此外,商用深度相機(jī)也難以準(zhǔn)確捕捉這些物體的深度信息,導(dǎo)致深度圖缺失或噪聲過(guò)多,從而限制了機(jī)器人在多個(gè)領(lǐng)域的廣泛應(yīng)用。

為了解決透明物體的抓取問(wèn)題,地瓜機(jī)器人聯(lián)合中科院自動(dòng)化所(簡(jiǎn)稱(chēng):CASIA)多模態(tài)人工智能系統(tǒng)全國(guó)重點(diǎn)實(shí)驗(yàn)室,推出了針對(duì)透明物體的單目深度估計(jì)和語(yǔ)義分割的多任務(wù)框架(簡(jiǎn)稱(chēng):MODEST)。該框架借助創(chuàng)新性的語(yǔ)義和幾何融合模塊,結(jié)合獨(dú)特的特征迭代更新策略,顯著提升了深度估計(jì)和語(yǔ)義分割的效果,尤其在抓取成功率和系統(tǒng)泛化性方面取得了突破性進(jìn)展。

MODEST算法框架作為通用抓取模型的前置模塊,即插即用,靈活高效,且無(wú)需依賴(lài)額外傳感器,僅靠單張RGB圖像,便可實(shí)現(xiàn)透明物體的抓取,效果上甚至要優(yōu)于其它雙目和多視圖的方法,可以廣泛應(yīng)用于智能工廠、實(shí)驗(yàn)室自動(dòng)化、智慧家居等場(chǎng)景,降低設(shè)備成本并大幅提升機(jī)器人對(duì)透明物體的操作能力。

基本原理

當(dāng)前透明物體的抓取核心在于深度信息的獲取,目前無(wú)論是深度傳感器還是多視角重建的方法都無(wú)法獲取透明物體準(zhǔn)確完整的深度信息。為了解決透明物體感知難題,傳統(tǒng)方法大多依賴(lài)特殊傳感設(shè)備或多視角圖像,增加了時(shí)間和經(jīng)濟(jì)成本,并常常受限于應(yīng)用場(chǎng)景。MODEST單目框架首次突破了傳統(tǒng)傳感器處理透明物體時(shí)的限制,降低了設(shè)備成本和使用復(fù)雜度,提供了更加高效、經(jīng)濟(jì)和便捷的透明物體感知方案。

wKgZO2fIImaAUTNdAAIb7m0kV_s285.png

單目透明物體感知框架與其他方法之間的對(duì)比

MODEST主要聚焦于透明物體的深度估計(jì),通過(guò)設(shè)計(jì)的語(yǔ)義和幾何結(jié)合的多任務(wù)框架,獲取物體準(zhǔn)確的深度信息,之后結(jié)合基于點(diǎn)云的抓取網(wǎng)絡(luò)實(shí)現(xiàn)透明物體的抓取。相當(dāng)于在通用抓取網(wǎng)絡(luò)前面增加一個(gè)針對(duì)透明物體的增強(qiáng)模塊。

MODEST模型的整體架構(gòu)如圖所示,輸入為單目RGB圖像,輸出為透明物體的分割結(jié)果和場(chǎng)景深度預(yù)測(cè)。網(wǎng)絡(luò)主要由編碼、重組、語(yǔ)義幾何融合迭代解碼四個(gè)模塊組成。輸入圖像首先經(jīng)過(guò)基于ViT的編碼模塊進(jìn)行處理,隨后重組為對(duì)應(yīng)分割和深度兩個(gè)分支的多尺度特征。在融合模塊中對(duì)兩組特征進(jìn)行混合和增強(qiáng),最后通過(guò)多次迭代逐步更新特征,并獲得最終預(yù)測(cè)結(jié)果。

wKgZO2fIIqaAV0SNAAEczfrgSe4127.png

基于語(yǔ)義幾何融合和迭代策略的透明物體單目多任務(wù)框架

對(duì)于透明物體來(lái)說(shuō),語(yǔ)義分割任務(wù)可以為深度估計(jì)提供語(yǔ)義和上下文信息,而同樣深度估計(jì)可以為分割提供邊界、表面等幾何信息。為了充分挖掘兩個(gè)任務(wù)間的互補(bǔ)信息MODEST算法框架構(gòu)建了基于注意力機(jī)制的語(yǔ)義幾何融合模塊,旨在同時(shí)提升兩個(gè)任務(wù)的性能。

wKgZPGfIIuCAcWADAAG1aAjP7gQ052.png

語(yǔ)義幾何融合模塊結(jié)構(gòu)

當(dāng)人類(lèi)觀察透明物體等不顯著物體時(shí),我們會(huì)傾向于先注意物體的整體輪廓,然后是局部細(xì)節(jié)。受人眼啟發(fā),MODEST框架提出了一種由粗到細(xì)的特征更新策略,進(jìn)一步提升預(yù)測(cè)精度。

實(shí)驗(yàn)結(jié)果

為了測(cè)試MODEST全新算法框架的檢測(cè)效果,我們選取了透明物體領(lǐng)域兩個(gè)影響力廣泛的公開(kāi)仿真數(shù)據(jù)集Syn-TODD和真實(shí)數(shù)據(jù)集ClearPose,在其上與目前最先進(jìn)的透明物體雙目方法SimNet、多視圖方法MVTran以及多任務(wù)方法InvPT和TaskPrompter進(jìn)行對(duì)比實(shí)驗(yàn)。兩個(gè)大規(guī)模數(shù)據(jù)集都擁有超過(guò)100k的良好標(biāo)注圖像數(shù)據(jù),并且包含了嚴(yán)重遮擋等極端場(chǎng)景。

公開(kāi)數(shù)據(jù)集上的定性和定量對(duì)比實(shí)驗(yàn)

wKgZO2fII_yAGwb3AAGND1TNR0Q332.png

仿真數(shù)據(jù)集Syn-TODD上的定性對(duì)比結(jié)果

wKgZO2fIJCyANH5cAAGhND9LzzE443.png

真實(shí)數(shù)據(jù)集ClearPose上的定性對(duì)比結(jié)果

通過(guò)在兩個(gè)數(shù)據(jù)集上的定性對(duì)比結(jié)果可以看出,由于透明物體會(huì)錯(cuò)誤地折射背景,并且在RGB圖像中缺乏紋理,因此SimNet、MVTrans等方法無(wú)法獲得令人滿(mǎn)意的預(yù)測(cè),從而導(dǎo)致深度圖和分割掩膜的大面積缺失。然而,通過(guò)有效的融合和迭代,在某些即使人眼都難以分析和判斷的場(chǎng)景,我們的方法依然能夠產(chǎn)生完整和清晰的預(yù)測(cè)結(jié)果。

wKgZO2fIJL2ALzgEAAFq2pfyAa4566.png

仿真數(shù)據(jù)集Syn-TODD上的定量對(duì)比結(jié)果

wKgZO2fIJSyAF77cAACLqiDq9qc375.png

真實(shí)數(shù)據(jù)集ClearPose上的定量對(duì)比結(jié)果

從表格中的定量對(duì)比可以看出,MODEST算法框架在各項(xiàng)指標(biāo)上都要大幅超過(guò)其他所有方法。值得注意的是,盡管只使用單張RGB圖像作為輸入,MODEST在深度估計(jì)和語(yǔ)義分割方面都要明顯優(yōu)于其他雙目甚至多視圖方法。并且在Syn-TODD數(shù)據(jù)集上,與排名第二的方法相比,MODEST算法框架在RMSE和REL兩項(xiàng)指標(biāo)有著超過(guò)45%的提升,語(yǔ)義分割的精度也均超過(guò)了90%。

真實(shí)平臺(tái)抓取實(shí)驗(yàn)

我們將算法遷移到真實(shí)機(jī)器人平臺(tái),開(kāi)展了透明物體抓取實(shí)驗(yàn)。平臺(tái)主要由UR機(jī)械臂和深度相機(jī)構(gòu)成,在借助MODEST方法進(jìn)行透明物體精確感知的基礎(chǔ)之上,采用GraspNet進(jìn)行抓取位姿的生成。在多個(gè)透明物體上的實(shí)驗(yàn)結(jié)果表明,MODEST方法在真實(shí)平臺(tái)上具有良好的魯棒性泛化性。


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    31412

    瀏覽量

    223574
  • 人工智能
    +關(guān)注

    關(guān)注

    1820

    文章

    50304

    瀏覽量

    266848
  • 檢測(cè)算法
    +關(guān)注

    關(guān)注

    0

    文章

    122

    瀏覽量

    25777
  • 地瓜機(jī)器人
    +關(guān)注

    關(guān)注

    1

    文章

    33

    瀏覽量

    424
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    機(jī)器人主控核心板米爾RK3576 + ROS2,NPU加速實(shí)現(xiàn)目標(biāo)跟隨與機(jī)械臂抓取

    操作”——識(shí)別特定物體、主動(dòng)跟隨、近距離抓取。本文將在此基礎(chǔ)上,集成深度攝像頭,實(shí)現(xiàn)機(jī)器人核心功能: 使用米爾RK3576 NPU加速M(fèi)ixFormerV2進(jìn)行目標(biāo)跟蹤,替代傳統(tǒng)OpenCV算法
    發(fā)表于 04-10 21:23

    工廠內(nèi)物流機(jī)器人+無(wú)序抓取, 復(fù)合機(jī)器人機(jī)床上下料賦能智能制造升級(jí)

    ?一、智能制造風(fēng)口下,三大核心技術(shù)重構(gòu)工廠生產(chǎn)邏輯 當(dāng)前制造業(yè)向柔性化、智能化轉(zhuǎn)型,工廠內(nèi)物流機(jī)器人、無(wú)序抓取、復(fù)合機(jī)器人機(jī)床上下料已成為核心支撐技術(shù)。據(jù)百度SEO數(shù)據(jù)顯示,三者搜索量年增速均超35
    的頭像 發(fā)表于 03-13 16:14 ?223次閱讀

    世強(qiáng)硬創(chuàng)平臺(tái)榮獲地瓜機(jī)器人2025年度最佳代理商獎(jiǎng)

    2026年1月,在地瓜機(jī)器人2025年度營(yíng)銷(xiāo)總結(jié)會(huì)議上,世強(qiáng)硬創(chuàng)平臺(tái)再次被授予“2025最佳代理商獎(jiǎng)”。這已是世強(qiáng)硬創(chuàng)連續(xù)第三年獲此殊榮,標(biāo)志著雙方合作持續(xù)深化,并取得了扎實(shí)的商業(yè)成
    的頭像 發(fā)表于 02-06 18:02 ?2699次閱讀

    【案例分享】電子谷定制通訊線束:人形機(jī)器人穩(wěn)定律動(dòng)連接方案

    人形機(jī)器人的精準(zhǔn)抓取、復(fù)雜揮動(dòng)等靈巧動(dòng)作,離不開(kāi)左手臂通訊線的極致穩(wěn)定傳輸。電子谷定制機(jī)器人左臂通訊線束——專(zhuān)為人形機(jī)器人量身打造,融合高密
    的頭像 發(fā)表于 01-10 08:32 ?582次閱讀
    【案例分享】電子谷定制通訊線束:人形<b class='flag-5'>機(jī)器人</b>穩(wěn)定律動(dòng)連接<b class='flag-5'>方案</b>

    解鎖“試管自動(dòng)抓取搬運(yùn)”新紀(jì)元:富唯智能復(fù)合機(jī)器人重塑精準(zhǔn)物流

    在工業(yè)自動(dòng)化的浪潮中,如何高效、精準(zhǔn)地完成如“試管自動(dòng)抓取搬運(yùn)”這類(lèi)高要求的物料處理任務(wù),成為許多行業(yè)邁向智能化升級(jí)的關(guān)鍵挑戰(zhàn)。富唯智能推出的復(fù)合機(jī)器人解決方案,正以其高度集成、靈活部
    的頭像 發(fā)表于 12-31 17:01 ?1436次閱讀
    解鎖“試管自動(dòng)<b class='flag-5'>抓取</b>搬運(yùn)”新紀(jì)元:富唯智能復(fù)合<b class='flag-5'>機(jī)器人</b>重塑精準(zhǔn)物流

    如何使用機(jī)器人分析儀EtherCAT-Analyzer抓取主從站數(shù)據(jù)?

    EtherCAT總線在機(jī)器人控制總線里占據(jù)重要地位。這次,我們搭建了包含EtherCAT主從站和分析儀的完整環(huán)境,用機(jī)器人分析儀EtherCAT-Analyzer實(shí)際抓取主從站之間的通訊數(shù)據(jù)。實(shí)測(cè)
    的頭像 發(fā)表于 12-22 11:46 ?974次閱讀
    如何使用<b class='flag-5'>機(jī)器人</b>分析儀EtherCAT-Analyzer<b class='flag-5'>抓取</b>主從站數(shù)據(jù)?

    打造機(jī)器人母生態(tài)!一年開(kāi)發(fā)者數(shù)量翻倍,地瓜機(jī)器人發(fā)布具身智能大算力開(kāi)發(fā)平臺(tái)

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)2025年11月21日,在地瓜機(jī)器人舉辦的DDC2025開(kāi)發(fā)者大會(huì)上,地瓜
    的頭像 發(fā)表于 11-27 09:16 ?8189次閱讀
    打造<b class='flag-5'>機(jī)器人</b>母生態(tài)!一年開(kāi)發(fā)者數(shù)量翻倍,<b class='flag-5'>地瓜</b><b class='flag-5'>機(jī)器人</b>發(fā)布具身智能大算力開(kāi)發(fā)平臺(tái)

    廣和通亮相DDC 2025地瓜機(jī)器人開(kāi)發(fā)者大會(huì)

    11月21日,DDC2025地瓜機(jī)器人開(kāi)發(fā)者大會(huì)在深圳順利舉行。大會(huì)匯聚來(lái)自機(jī)器人全產(chǎn)業(yè)鏈的技術(shù)團(tuán)隊(duì)、生態(tài)伙伴與開(kāi)發(fā)者,共同探討機(jī)器人技術(shù)的
    的頭像 發(fā)表于 11-26 15:49 ?589次閱讀
    廣和通亮相DDC <b class='flag-5'>2025</b><b class='flag-5'>地瓜</b><b class='flag-5'>機(jī)器人</b>開(kāi)發(fā)者大會(huì)

    具身智能大算力開(kāi)發(fā)平臺(tái)S600重磅亮相,地瓜機(jī)器人引領(lǐng)端云一體機(jī)器人進(jìn)化新范式

    11月21日,以“無(wú)FUN不起浪”為主題的DDC2025地瓜機(jī)器人開(kāi)發(fā)者大會(huì)在深圳成功舉辦。作為業(yè)界領(lǐng)先的機(jī)器人軟硬件通用底座提供商,地瓜
    發(fā)表于 11-21 22:21 ?1645次閱讀
    具身智能大算力開(kāi)發(fā)平臺(tái)S600重磅亮相,<b class='flag-5'>地瓜</b><b class='flag-5'>機(jī)器人</b>引領(lǐng)端云一體<b class='flag-5'>機(jī)器人</b>進(jìn)化新范式

    為什么2025機(jī)器人都在搶SH602HA-AP?

    11月20日,在DDC2025地瓜機(jī)器人開(kāi)發(fā)者大會(huì)前夕,移遠(yuǎn)通信正式發(fā)布搭載地瓜機(jī)器人旭日5智能計(jì)算芯片的SH602HA-AP
    的頭像 發(fā)表于 11-20 19:03 ?1941次閱讀
    為什么<b class='flag-5'>2025</b>年<b class='flag-5'>機(jī)器人</b>都在搶SH602HA-AP?

    力傳感器在工業(yè)自動(dòng)化機(jī)器人中的應(yīng)用:精確抓取/裝配作業(yè)/搬運(yùn)作業(yè)/柔順控制

    具體應(yīng)用 精確抓取: 在自動(dòng)化生產(chǎn)線上,機(jī)器人需要精確抓取各種物品。力傳感器可以安裝在機(jī)器人的末端執(zhí)行器上,實(shí)時(shí)感知抓取
    的頭像 發(fā)表于 11-14 09:10 ?293次閱讀
    力傳感器在工業(yè)自動(dòng)化<b class='flag-5'>機(jī)器人</b>中的應(yīng)用:精確<b class='flag-5'>抓取</b>/裝配作業(yè)/搬運(yùn)作業(yè)/柔順控制

    機(jī)器人競(jìng)技幕后:磁傳感器芯片激活 “精準(zhǔn)感知力”

    2025 世界人形機(jī)器人運(yùn)動(dòng)會(huì)于 8 月 17 日?qǐng)A滿(mǎn)收官,賽場(chǎng)上機(jī)器人在跑步、跳躍、抓取等項(xiàng)目中的精彩表現(xiàn),背后是運(yùn)動(dòng)控制、環(huán)境感知等技術(shù)的迭代升級(jí)。而在這些技術(shù)中,磁傳感器芯片憑借
    發(fā)表于 08-26 10:02

    盤(pán)點(diǎn)#機(jī)器人開(kāi)發(fā)平臺(tái)

    地瓜機(jī)器人RDK X5開(kāi)發(fā)套件地瓜機(jī)器人RDK X5開(kāi)發(fā)套件產(chǎn)品介紹 旭日5芯片10TOPs算力-電子發(fā)燒友網(wǎng)機(jī)器人開(kāi)發(fā)套件 Kria KR
    發(fā)表于 05-13 15:02

    【「# ROS 2智能機(jī)器人開(kāi)發(fā)實(shí)踐」閱讀體驗(yàn)】視覺(jué)實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用

    結(jié)合IMU(慣性測(cè)量單元)進(jìn)行多傳感器融合。 三、總結(jié)與展望 技術(shù)融合趨勢(shì) 機(jī)器人視覺(jué)與SLAM的結(jié)合(如視覺(jué)慣性里程計(jì)VIO)是當(dāng)前研究熱點(diǎn),未來(lái)可能進(jìn)一步結(jié)合語(yǔ)義SLAM,讓
    發(fā)表于 05-03 19:41

    大象機(jī)器人攜手進(jìn)迭時(shí)空推出 RISC-V 全棧開(kāi)源六軸機(jī)械臂產(chǎn)品

    全球80多個(gè)國(guó)家和地區(qū)。 近日,大象機(jī)器人聯(lián)合進(jìn)迭時(shí)空推出全球首款RISC-V全棧開(kāi)源六軸機(jī)器臂“myCobot 280 RISC-V”,為開(kāi)發(fā)者打造全新的機(jī)器人開(kāi)源創(chuàng)新平臺(tái)。 “my
    發(fā)表于 04-25 17:59
    通辽市| 班戈县| 花莲市| 韶关市| 华亭县| 阜宁县| 北流市| 桐梓县| 德令哈市| 鸡东县| 彭泽县| 平江县| 合阳县| 图木舒克市| 汝南县| 十堰市| 江源县| 朝阳区| 桃园县| 正宁县| 柳州市| 大冶市| 大宁县| 额济纳旗| 徐水县| 定日县| 大姚县| 民权县| 西昌市| 旌德县| 河间市| 凯里市| 湘潭县| 石楼县| 沐川县| 长丰县| 新疆| 醴陵市| 武穴市| 遵化市| 南江县|