哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

高分工作!Uni3D:3D基礎大模型,刷新多個SOTA!

CVer ? 來源:CVer ? 2024-01-30 15:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

我們近期的工作:3D視覺大模型Uni3D在ICLR 2024的評審中獲得了688分,被選為Spotlight Presentation

02be4964-b8ed-11ee-8b88-92fbcf53809c.jpg

在本文中,我們第一次將3D基礎模型成功scale up到了十億(1B)級別參數(shù)量,并使用一個模型在諸多3D下游應用中取得SoTA結果。代碼和各個scale的模型(從6M-1B)均已開源,歡迎大家關注和使用:

論文:https://https://arxiv.org/pdf/2310.06773

代碼:https://https://github.com/baaivision/Uni3D

02cb5d02-b8ed-11ee-8b88-92fbcf53809c.jpg

我們主要探索了3D視覺中scale up模型參數(shù)量和統(tǒng)一模型架構的可能性。在NLP / 2D vision領域,scale up大模型(GPT-4,SAM,EVA等)已經(jīng)取得了很impressive的結果,但是在3D視覺中模型的scale up始終沒有成功。我們旨在將NLP/2D中scale up的成功復現(xiàn)到3D表征模型上。

02d03426-b8ed-11ee-8b88-92fbcf53809c.jpg

在這項工作中,我們提出了一個3D基礎大模型Uni3D,直接將3D backbone統(tǒng)一為ViT(Vision Transformer),以此利用豐富和強大的2D預訓練大模型作為初始化。Uni3D使用CLIP模型中的文本/圖像表征作為訓練目標,通過學習三個模態(tài)的表征對齊(點云-圖像-文本)實現(xiàn)3D點云對圖像和文本的感知。同時,通過使用ViT中成功的scale up策略,我們將Uni3D逐步 scale up,訓練了從Tiny到giant的5個不同scale的Uni3D模型,成功地將Uni3D擴展到10億級別參數(shù)。

02df8750-b8ed-11ee-8b88-92fbcf53809c.jpg

Uni3D模型不同scale下的參數(shù)量和zero-shot分類結果

Uni3D在多個3D任務上達到SoTA,如:zero-shot classification, few-shot classification,open-world understanding, open-world part segmentation.

02f5e8f6-b8ed-11ee-8b88-92fbcf53809c.jpg

Zero-shot classification

030673b0-b8ed-11ee-8b88-92fbcf53809c.jpg

Real-world zero-shot recognition

由于學到了強大的多模態(tài)表征能力,Uni3D還能夠做一些有意思的應用,如point cloud painting(點云繪畫),text/image-based 3D shape retrieval(基于圖像/文本的3D模型檢索),point cloud captioning(點云描述):

030d818c-b8ed-11ee-8b88-92fbcf53809c.jpg

Point cloud painting

03126e90-b8ed-11ee-8b88-92fbcf53809c.jpg

Image-based 3D shape retrieval

032b3eca-b8ed-11ee-8b88-92fbcf53809c.jpg

Text-based 3D shape retrieval

03421aaa-b8ed-11ee-8b88-92fbcf53809c.jpg

Point cloud captioning.

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 3D視覺
    +關注

    關注

    4

    文章

    488

    瀏覽量

    29305
  • 大模型
    +關注

    關注

    2

    文章

    3746

    瀏覽量

    5268

原文標題:ICLR 2024 | 高分工作!Uni3D:3D基礎大模型,刷新多個SOTA!

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何快速查找工業(yè)部件的 3D CAD 模型

    如何找到經(jīng)過認證的工業(yè)零件 3D CAD 模型,而無需猜測。 如果您是工程師、設計師或規(guī)劃師,您可能已經(jīng)花費了無數(shù)的時間來尋找 CAD 文件,但這些文件要么與真實零件不符,要么無法加載到您
    發(fā)表于 03-04 16:22

    常見3D打印材料介紹及應用場景分析

    3D打印材料種類豐富,不同材料性能差異明顯。本文介紹PLA、ABS、PETG等常見3D打印材料的特點與應用場景,幫助讀者了解3D打印用什么材料更合適,為選材提供基礎參考。
    的頭像 發(fā)表于 12-29 14:52 ?848次閱讀
    常見<b class='flag-5'>3D</b>打印材料介紹及應用場景分析

    探索TLE493D-P3XX-MS2GO 3D 2Go套件:開啟3D磁傳感器評估之旅

    探索TLE493D-P3XX-MS2GO 3D 2Go套件:開啟3D磁傳感器評估之旅 在電子工程師的日常工作中,評估和開發(fā)磁傳感器是一項常見且重要的任務。英飛凌(Infineon
    的頭像 發(fā)表于 12-18 17:15 ?1268次閱讀

    iDS iToF Nion 3D相機,開啟高性價比3D視覺新紀元!

    、uEye Nion iTof 3D相機 | 產(chǎn)品特點 1. 三大優(yōu)勢特點概括 精度卓越 具備120萬像素超高分
    的頭像 發(fā)表于 12-15 14:59 ?533次閱讀
    iDS iToF Nion <b class='flag-5'>3D</b>相機,開啟高性價比<b class='flag-5'>3D</b>視覺新紀元!

    京東11.11直播技術全面升級,立影3D技術、JoyAI大模型重構沉浸式購物體驗

    隨著京東 11.11 大促的火熱進行,京東直播再度升級技術布局,以 “立影 3D 技術”“JoyAI大模型”等創(chuàng)新技術,打破傳統(tǒng)直播邊界,為用戶帶來更具沉浸感、趣味性的購物體驗,引領直播電商技術創(chuàng)新
    的頭像 發(fā)表于 10-27 14:58 ?713次閱讀

    微納尺度的神筆——雙光子聚合3D打印 #微納3D打印

    3D打印
    楊明遠
    發(fā)布于 :2025年10月25日 13:09:29

    技術資訊 I 圖文詳解 Allegro X PCB Designer 中的 3D 模型映射

    本文要點面對市面上的一切要將PCB板放進一個盒子里的產(chǎn)品的設計都離不開3D模型映射這個功能,3D協(xié)同設計保證了產(chǎn)品的超薄化、高集成度的生命線;3D
    的頭像 發(fā)表于 10-17 16:16 ?1949次閱讀
    技術資訊 I 圖文詳解 Allegro X PCB Designer 中的 <b class='flag-5'>3D</b> <b class='flag-5'>模型</b>映射

    使用NVIDIA AI Blueprint打造3D世界

    在傳統(tǒng)工作流中,建模師必須構建占位模型、低精度資產(chǎn)來填充 3D 場景,優(yōu)化核心資產(chǎn)以完成場景。之后,可以優(yōu)化、細化并最終完成視覺效果。
    的頭像 發(fā)表于 09-23 14:35 ?1110次閱讀

    玩轉 KiCad 3D模型的使用

    “ ?本文將帶您學習如何將 3D 模型與封裝關聯(lián)、文件嵌入,講解 3D 查看器中的光線追蹤,以及如何使用 CLI 生成 PCBA 的 3D 模型
    的頭像 發(fā)表于 09-16 19:21 ?1.2w次閱讀
    玩轉 KiCad <b class='flag-5'>3D</b><b class='flag-5'>模型</b>的使用

    iTOF技術,多樣化的3D視覺應用

    。 ◆ 應用2—機艙內的 3D 傳感 應用3—自主移動機器人 (AMR) 在室外(~150,000 勒克斯)和黑暗環(huán)境中進行障礙物檢測。 高分辨率能力,可準確檢測細長物體,例如椅腿。 低抖動和低誤差
    發(fā)表于 09-05 07:24

    索尼與VAST達成3D業(yè)務合作

    近日,索尼空間現(xiàn)實顯示屏與VAST旗下的3D模型Tripo AI正式宣布達成業(yè)務合作:雙方將圍繞裸眼3D顯示技術、AI驅動的3D內容生成與交互創(chuàng)新展開深度協(xié)同,致力于通過索尼空間現(xiàn)實
    的頭像 發(fā)表于 08-28 17:32 ?1669次閱讀

    AD 3D封裝庫資料

    ?AD ?PCB 3D封裝
    發(fā)表于 08-27 16:24 ?8次下載

    3D打印能用哪些材質?

    3D打印的材質有哪些?不同材料決定了打印效果、強度、用途乃至安全性,本文將介紹目前主流的3D打印材質,幫助你找到最適合自己需求的材料。
    的頭像 發(fā)表于 07-28 10:58 ?4379次閱讀
    <b class='flag-5'>3D</b>打印能用哪些材質?

    3D AD庫文件

    3D庫文件
    發(fā)表于 05-28 13:57 ?6次下載

    2025年3D工業(yè)相機選型及推薦

    3D工業(yè)相機的選型
    的頭像 發(fā)表于 05-21 16:49 ?2051次閱讀
    2025年<b class='flag-5'>3D</b>工業(yè)相機選型及推薦
    都匀市| 巴楚县| 连江县| 罗平县| 留坝县| 池州市| 象山县| 永吉县| 兖州市| 东平县| 阜新市| 监利县| 延长县| 通许县| 阿城市| 泾源县| 麟游县| 长寿区| 临邑县| 林州市| 廊坊市| 万载县| 饶阳县| 榕江县| 朝阳市| 沙洋县| 亚东县| 景德镇市| 正阳县| 察哈| 静安区| 富平县| 永安市| 宜州市| 扬中市| 准格尔旗| 武平县| 克山县| 浦北县| 融水| 广饶县|