哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌AI發(fā)布3D物體數據集,附帶標記邊界框、相機位姿、稀疏點云

工程師鄧生 ? 來源:量子位 ? 作者:蕭簫 ? 2020-11-13 14:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

見過3D物體數據集,見過會動的3D物體數據集嗎?

每段動態(tài)視頻都 以目標為中心拍攝,不僅自帶標注整體的邊界框,每個視頻還附帶相機位姿和稀疏點云。

這是谷歌的開源3D物體數據集 Objectron,包含 15000份短視頻樣本,以及從五個大洲、十個國家里收集來的 400多萬張帶注釋的圖像。

谷歌認為,3D目標理解領域,缺少像2D中的ImageNet這樣的大型數據集,而Objectron數據集能在一定程度上解決這個問題。

數據集一經推出, 1.6k網友點贊。

有網友調侃,谷歌恰好在自己想“谷歌”這類數據集的時候,把它發(fā)了出來。

也有團隊前成員表示,很高興看到這樣的數據集和模型,給AR帶來進步的可能。

除此之外,谷歌還公布了用Objectron數據集訓練的針對 鞋子、椅子、杯子和相機4種類別的3D目標檢測模型。

來看看這個數據集包含什么,以及谷歌提供的3D目標檢測方案吧~ (項目地址見文末)

9類物體,對AR挺友好

目前,這個數據集中包含的3D物體樣本,包括自行車,書籍,瓶子,照相機,麥片盒子,椅子,杯子,筆記本電腦和鞋子。

當然,這個數據集,絕不僅僅只是一些以物體為中心拍攝的視頻和圖像,它具有如下特性:

注釋標簽 (3D目標立體邊界框)

用于AR數據的數據 (相機位姿、稀疏點云、二維表面)

數據預處理 (圖像格式為tf.example,視頻格式為SequenceExample)

支持通過腳本運行3D IoU指標的評估

支持通過腳本實現Tensorflow、PyTorch、JAX的數據加載及可視化,包含“Hello World”樣例

支持Apache Beam,用于處理谷歌云(Google Cloud)基礎架構上的數據集

所有可用樣本的索引,包括訓練/測試部分,便于下載

圖像部分的畫風,基本是這樣的,也標注得非常詳細:

而在視頻中,不僅有從各個角度拍攝的、以目標為中心的片段 (從左到右、從下到上):

也有不同數量的視頻類型 (一個目標、或者兩個以上的目標):

谷歌希望通過發(fā)布這個數據集,讓研究界能夠進一步突破3D目標理解領域,以及相關的如 無監(jiān)督學習等方向的研究應用。

怎么用?谷歌“以身示范”

拿到數據集的第一刻,并不知道它是否好用,而且總感覺有點無從下手?

別擔心,這個數據集的訓練效果,谷歌已經替我們試過了。

看起來還不錯:

此外,谷歌將訓練好的3D目標檢測模型,也一并給了出來。 (傳送見文末)

算法主要包括兩部分,第一部分是Tensorflow的2D目標檢測模型,用來“發(fā)現物體的位置”;

第二部分則進行圖像裁剪,來估計3D物體的邊界框 (同時計算目標下一幀的2D裁剪,因此不需要運行每個幀),整體結構如下圖:

在模型的評估上,谷歌采用了 Sutherland-Hodgman多邊形裁剪算法,來計算兩個立體邊界框的交點,并計算出兩個立方體的 相交體積,最終計算出3D目標檢測模型的 IoU。

簡單來說,兩個立方體重疊體積越大,3D目標檢測模型效果就越好。

這個模型是谷歌推出的MediaPipe中的一個部分,后者是一個開源的跨平臺框架,用于構建pipeline,以處理不同形式的感知數據。

它推出的MediaPipe Objectron實時3D目標檢測模型,用移動設備 (手機)就能進行目標實時檢測 。

看, (他們玩得多歡快)實時目標檢測的效果還不錯:

其他部分3D數據集

除了谷歌推出的數據集以外,此前視覺3D目標領域,也有許多類型不同的數據集,每個數據集都有自己的特點。

例如斯坦福大學等提出的 ScanNetV2,是個室內場景數據集,而ScanNet則是個RGB-D視頻數據集,一共有21個目標類,一共1513個采集場景數據,可做語義分割和目標檢測任務。

而目前在自動駕駛領域非常熱門的 KITTI數據集,也是一個3D數據集,是目前最大的自動駕駛場景下計算機視覺的算法評測數據集,包含市區(qū)、鄉(xiāng)村和高速公路等場景采集的真實圖像數據。

此外,還有Waymo、SemanticKITTI、H3D等等數據集,也都用在不同的場景中。 (例如SemanticKITTI,通常被專門用于自動駕駛的3D語義分割)

無論是視頻還是圖像,這些數據集的單個樣本基本包含多個目標,使用場景上也與谷歌的Objectron有所不同。

感興趣的小伙伴們,可以通過下方傳送門,瀏覽谷歌最新的3D目標檢測數據集,以及相關模型~

Objectron數據集傳送門:

https://github.com/google-research-datasets/Objectron/

針對4種物體的3D目標檢測模型:

https://google.github.io/mediapipe/solutions/objectron

參考鏈接:

https://ai.googleblog.com/2020/11/announcing-objectron-dataset.html

https://ai.googleblog.com/2020/03/real-time-3d-object-detection-on-mobile.html

責任編輯:PSY

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 3D
    3D
    +關注

    關注

    9

    文章

    3020

    瀏覽量

    115508
  • 谷歌
    +關注

    關注

    27

    文章

    6257

    瀏覽量

    111936
  • AI
    AI
    +關注

    關注

    91

    文章

    40908

    瀏覽量

    302489
  • 大數據
    +關注

    關注

    64

    文章

    9091

    瀏覽量

    144037
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    機器人主控核心板米爾RK3576 + ROS2,NPU加速實現目標跟隨與機械臂抓取

    獲取數據,無需直接操作/dev/video*節(jié)點。 關鍵:深度圖像與RGB圖像需要時間對齊和空間對齊(通常相機驅動已提供對齊后的深度圖),以便后續(xù)將目標2D
    發(fā)表于 04-10 21:23

    倍加福基于雙目視覺技術的SmartRunner 3D傳感器介紹

    當我們邁入自動化的“三維時代”,SmartRunner Explorer 3D不僅能生成清晰的2D圖像,還可輸出高精度的3D
    的頭像 發(fā)表于 04-08 10:39 ?282次閱讀
    倍加?;陔p目視覺技術的SmartRunner <b class='flag-5'>3D</b>傳感器介紹

    如何克服毫米波雷達稀疏問題?

    細致描繪物體輪廓的致密,毫米波雷達輸出的數據就顯得比較“吝嗇”,通常每幀圖像只能提供幾十個離散的探測。 這種
    的頭像 發(fā)表于 02-27 09:16 ?284次閱讀
    如何克服毫米波雷達<b class='flag-5'>點</b><b class='flag-5'>云</b><b class='flag-5'>稀疏</b>問題?

    FlexViz:KiCad 柔性電路板 3D 折疊可視化插件

    布局中定義 折疊標記 ,并通過數學變換實時渲染出 PCB 彎折后的? 3D 交互模型 。? ” 眾所周知,KiCad 原生的 3D 查看器雖然強大,但它默認只能顯示平面的板子。以前,對于使用 KiCad 設計撓性電路板(FPC)
    的頭像 發(fā)表于 02-03 11:21 ?306次閱讀
    FlexViz:KiCad 柔性電路板 <b class='flag-5'>3D</b> 折疊可視化插件

    iDS iToF Nion 3D相機,開啟高性價比3D視覺新紀元!

    一、友思特新品 友思特 iDS uEye Nion iTof 3D相機將 120 萬像素的卓越空間分辨率與可靠的深度精度相結合—即使在極具挑戰(zhàn)性的環(huán)境中也能確保獲取精細的 3D 數據
    的頭像 發(fā)表于 12-15 14:59 ?531次閱讀
    iDS iToF Nion <b class='flag-5'>3D</b><b class='flag-5'>相機</b>,開啟高性價比<b class='flag-5'>3D</b>視覺新紀元!

    3D傳感器到立體相機,解鎖工業(yè)應用新可能

    3D傳感器是實現深度感知的核心技術。這些傳感器廣泛應用于多種常見的3D視覺技術中,例如立體相機、激光雷達(LiDAR)、飛行時間(ToF)相機和激光三角測量。通常根據應用場景和技術要求
    的頭像 發(fā)表于 11-28 17:03 ?1985次閱讀
    從<b class='flag-5'>3D</b>傳感器到立體<b class='flag-5'>相機</b>,解鎖工業(yè)應用新可能

    iSUN3D即將推出單組分彈性樹脂3D打印解決方案!

    iSUN3D將在Formnext 2025發(fā)布單組分彈性樹脂3D打印方案,覆蓋設計到交付全流程,解決柔彈性制造成本與效率痛,現場可體驗高速打印與限量禮品。
    的頭像 發(fā)表于 11-17 11:45 ?834次閱讀
    iSUN<b class='flag-5'>3D</b>即將推出單組分彈性樹脂<b class='flag-5'>3D</b>打印解決方案!

    京東11.11直播技術全面升級,立影3D技術、JoyAI大模型重構沉浸式購物體

    隨著京東 11.11 大促的火熱進行,京東直播再度升級技術布局,以 “立影 3D 技術”“JoyAI大模型”等創(chuàng)新技術,打破傳統(tǒng)直播邊界,為用戶帶來更具沉浸感、趣味性的購物體驗,引領直播電商技術創(chuàng)新
    的頭像 發(fā)表于 10-27 14:58 ?710次閱讀

    iTOF技術,多樣化的3D視覺應用

    動態(tài)模糊,確保高耐光性,同時輸出2D(紅外)和3D(深度)數據。 ◆ Testing Principles ※ 測量脈沖光的飛行時間,以檢測 TOF 相機與被測
    發(fā)表于 09-05 07:24

    Zivid3D相機安裝使用教程

    Zivid3D相機小巧便攜,重量輕,分辨率高,速度快,適合高反光透明物體。本文介紹Zivid 3D相機的操作流程,幫助用戶掌握其功能。從硬件
    的頭像 發(fā)表于 08-26 15:34 ?771次閱讀
    Zivid<b class='flag-5'>3D</b><b class='flag-5'>相機</b>安裝使用教程

    奧比中光發(fā)布最新一代3D激光雷達及雙目深度相機

    近日,世界機器人大會現場,奧比中光發(fā)布最新一代3D激光雷達及雙目深度相機,以“場景拓展”與“極限感知”為核心優(yōu)勢,進階全領域能力矩陣,刷新機器人性能上限,為各類機器人帶來更靈活可靠的視覺解決方案。
    的頭像 發(fā)表于 08-15 15:05 ?1575次閱讀

    3D工業(yè)相機價格是?這種3D工業(yè)相機性價比最高

    3D 工業(yè)相機市場,一場價格與質量的博弈已然展開。企業(yè)在選擇時面臨著艱難困境,國際品牌筑起高高的價格壁壘,國產品牌又深陷低價低質的怪圈。我們該如何為打破這一局面?
    的頭像 發(fā)表于 07-29 11:25 ?1262次閱讀
    <b class='flag-5'>3D</b>工業(yè)<b class='flag-5'>相機</b>價格是?這種<b class='flag-5'>3D</b>工業(yè)<b class='flag-5'>相機</b>性價比最高

    英倫科技10.1英寸裸眼3D數碼相框升級了,玩轉AI文生圖太cool了!

    此次升級將AI內容生成與裸眼3D顯示深度結合,解決了傳統(tǒng)3D內容制作成本高的痛,使普通用戶也能輕松創(chuàng)作個性化立體圖像。配合無線傳輸、智能轉化等成熟功能,該產品已成為
    的頭像 發(fā)表于 07-03 11:31 ?13.5w次閱讀
    英倫科技10.1英寸裸眼<b class='flag-5'>3D</b>數碼相框升級了,玩轉<b class='flag-5'>AI</b>文生圖太cool了!

    2025年3D工業(yè)相機選型及推薦

    3D工業(yè)相機的選型
    的頭像 發(fā)表于 05-21 16:49 ?2047次閱讀
    2025年<b class='flag-5'>3D</b>工業(yè)<b class='flag-5'>相機</b>選型及推薦

    告別漫長等待! 3D測量竟然可以如此的絲滑

    原理介紹海伯森3D閃測傳感器HPS-DBL系列采用超高速投影方式向測量對象上投射出不同波長的特殊圖案,并采集物體表面的圖案信息,配合海伯森HPS-NB3200高性能視覺控制器和內置AI解碼算法對
    的頭像 發(fā)表于 05-12 18:01 ?756次閱讀
    告別漫長等待! <b class='flag-5'>3D</b>測量竟然可以如此的絲滑
    溆浦县| 崇左市| 玛纳斯县| 长沙县| 江津市| 丰城市| 平潭县| 淮北市| 木兰县| 丹江口市| 上栗县| 明光市| 克东县| 灵丘县| 寿宁县| 石景山区| 玛沁县| 永丰县| 新田县| 嘉荫县| 太保市| 田东县| 东海县| 三江| 兴安县| 梅河口市| 延川县| 咸宁市| 通城县| 东丰县| 锦屏县| 新建县| 岢岚县| 铜梁县| 通道| 颍上县| 永福县| 同仁县| 乌拉特前旗| 高雄市| 光泽县|