哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

終結(jié)機器人評測混戰(zhàn)時代,RoboChallenge帶來大規(guī)模真機測評基準

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2025-10-19 11:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

wKgZPGjzI5aAVVGPAApV8_LANDM676.jpg

當前機器人行業(yè)呈現(xiàn)兩極分化態(tài)勢。一邊是競技賽事的火熱,如2025年世界人形機器人運動會吸引了全球16個國家280支隊伍參與,另一邊卻是現(xiàn)實核心技術(shù)仍然面臨瓶頸,某企業(yè)人形機器人因末端執(zhí)行器精度不足,導致工業(yè)場景中的精密作業(yè)效率甚至比不上人工。

這種理想與現(xiàn)實的落差,在資本層面表現(xiàn)得更為明顯。今年前七個月,具身智能與機器人領(lǐng)域融資金額已突破240億元,遠超去年全年總和。面對層出不窮的機器人公司和產(chǎn)品,投資者卻陷入困惑:如何判斷哪些企業(yè)真正掌握核心技術(shù)?哪些產(chǎn)品具備長期落地的潛力?

行業(yè)缺乏的,正是一個能夠客觀衡量機器人能力的標尺。

對此,由Dexmal原力靈機聯(lián)合Huggingface共同發(fā)起的全球首個大規(guī)模真機基準測試集RoboChallenge,為具身智能真機評測提供了有效標準。

wKgZO2jzI5eAG47dAAH2OLl-F18404.jpg

那么,為什么具身智能行業(yè)急需一個統(tǒng)一測評標準?RoboChallenge真機基準測試平臺又從哪些層面攻克了行業(yè)難點呢?

wKgZPGjzI5iAKxilAAI6nwtiglE586.jpg

算法和模型的世界里,基準測試早已是推動進步的發(fā)動機。計算機視覺有ImageNet,自然語言處理有GLUE,每一項突破都以公開、可復現(xiàn)的排行榜為標尺,激發(fā)了無數(shù)創(chuàng)新。而機器人領(lǐng)域長期沒有類似的標準體系。

對機器人能力的評估始終在兩個極端搖擺。

一端是那些刷屏社交網(wǎng)絡(luò)的機器人項目。無論是后空翻的人形機器人,還是展會現(xiàn)場表演泡咖啡,炫技式的展示雖然極易出圈,吸引大眾眼球,但更偏向于娛樂和營銷,無法反映機器人在通用、非結(jié)構(gòu)化環(huán)境中的真實能力。

另一端是實驗室測試。在科研領(lǐng)域,研究人員會在仿真環(huán)境或高度結(jié)構(gòu)化的物理環(huán)境中測試機器人的某項特定能力,例如物體抓取成功率、路徑規(guī)劃效率等。但這些演示無法代表現(xiàn)實世界的復雜與不確定,也無法讓投資者、同行或市場知道,它們之間到底差多少、強在哪。

缺乏基準的后果,是整個行業(yè)信息失真。

投資角度,評估難。投資者缺乏有效的技術(shù)評估工具,往往只能依賴于光鮮的演示視頻和創(chuàng)始團隊的背景來做判斷,這可能導致擅長演示的團隊可能比技術(shù)扎實的團隊更容易獲得融資。

市場角度,劣幣驅(qū)逐良幣。當演示效果重于實際效用時,企業(yè)的資源分配就會自然傾斜。本應(yīng)用于核心技術(shù)突破的研發(fā)精力,被迫分流到能夠快速制造傳播熱點的炫技功能上。

而沒有公認的基準,技術(shù)就無法在同一維度上進行比較和衡量,也就難以形成清晰的技術(shù)演進路線圖。開發(fā)者們各自為戰(zhàn),重復造輪子。某個團隊已經(jīng)解決的經(jīng)典問題,可能在另一個團隊那里仍是攔路虎;某個領(lǐng)域的突破性進展,往往難以被準確識別并快速擴散到整個行業(yè),整個行業(yè)的創(chuàng)新效率大打折扣。

投資者、消費市場、技術(shù)發(fā)展都呼喚著一個更加強有力的真機測量標準來提供統(tǒng)一基座,推動具身智能行業(yè)良性發(fā)展。

wKgZPGjzI5mAfHNNAAImoZfM990124.jpg

行業(yè)急需一套更全面、科學的具身智能真機測試標準。然而,要在真實環(huán)境中對機器人進行公平、可復現(xiàn)的評測,難度遠超想象。

當前行業(yè)內(nèi)的測試體系普遍面臨著三大痛點:測試場景碎片化,各機構(gòu)使用的環(huán)境、任務(wù)千差萬別;評估標準不統(tǒng)一,導致結(jié)果缺乏可比性;評測方法不夠系統(tǒng),難以全面反映機器人的真實能力水平。這些問題使得不同算法、不同硬件平臺的機器人表現(xiàn)如同使用不同尺子測量的身高:數(shù)據(jù)再多,也難以進行有意義的橫向比較。

正是在這樣的行業(yè)背景下,由Dexmal原力靈機團隊和HuggingFace推出的RoboChallenge直面挑戰(zhàn),提出了全球首個大規(guī)模具身智能真機測評平臺,旨在通過科學評估體系為具身智能產(chǎn)業(yè)構(gòu)建一個開放、公正、可復現(xiàn)的真實考場。

RoboChallenge的第一個顛覆性創(chuàng)新,是規(guī)?;?、穩(wěn)定地解決了公平性難題。

過去,機器人領(lǐng)域的基準測試長期處于割裂狀態(tài):學術(shù)界的實驗多局限于單一模型或固定環(huán)境,缺乏跨平臺可比性,而企業(yè)的內(nèi)部測試又往往自成體系,難以形成行業(yè)共識。

RoboChallenge則以大規(guī)模真機測試為核心,通過統(tǒng)一任務(wù)標準、統(tǒng)一評估指標和跨模型對照機制,實現(xiàn)了真正的公平測評。

為精準評估VLA算法核心能力,RoboChallenge首期采用配備夾爪的機械臂作為標準化平臺,其傳感方案同步輸出多視角RGB與對齊深度信息。系統(tǒng)集成了UR5、Franka Panda、COBOT Magic Aloha和ARX-5四類主流機型,支持7×24小時不間斷運行。通過這種方式,在完全相同的初始條件和任務(wù)下,不同算法的實力得以被客觀地量化與呈現(xiàn)。RoboChallenge首次在真實物理環(huán)境中,實現(xiàn)了對多種主流機器人平臺的多任務(wù)、跨模型測試。

RoboChallenge的另一大創(chuàng)新,是推出了遠程機器人評測模式。

通過自研的遠程推理系統(tǒng),研究者即使不擁有實體機器人,也能在平臺上完成算法部署、任務(wù)執(zhí)行與結(jié)果驗證。

平臺采用無容器化設(shè)計,用戶通過標準化API可直接調(diào)用;RGB圖像等觀測數(shù)據(jù)均帶有毫秒級時間戳,便于多模型融合與復雜時間對齊;系統(tǒng)通過HTTP API實現(xiàn)異步處理,并提供實時隊列反饋。同時,智能作業(yè)調(diào)度模塊可實時查看任務(wù)狀態(tài),支持模型多任務(wù)并行,大幅提升測試效率與系統(tǒng)穩(wěn)定性。

這種“在線真機評測”在保證高精度與可復現(xiàn)性的同時,大幅降低了科研與創(chuàng)新門檻。對學術(shù)界,它提供了開放、免費的實驗資源;對產(chǎn)業(yè)界,它搭建了公平、高效的驗證平臺。全球研究者得以在統(tǒng)一環(huán)境、標準化流程下參與測試,真正實現(xiàn)“沒有機器人,一樣做實驗”。

wKgZO2jzI5mAIP6sAAHe8q1zHyg344.jpg

除了公平的測試基準與遠程評測模式,一套科學、精細的評分體系同樣是衡量機器人能力的核心。

當前行業(yè)內(nèi)的真機評測往往只包含3到5項任務(wù),難以系統(tǒng)、全面地評估算法的綜合表現(xiàn)與泛化能力。而作為RoboChallenge推出的首套測試集,Table30以“科學分類學”為設(shè)計理念,從VLA、機器人類型、任務(wù)場景環(huán)境和目標物體屬性等維度構(gòu)建了30個覆蓋多維度操作場景的桌面級任務(wù)。

評分機制上,Table30突破傳統(tǒng)二值化評估局限,引入更符合實際應(yīng)用需求的進度評分系統(tǒng):對復雜任務(wù)認可分步進展,對簡單任務(wù)優(yōu)化完成效率。分揀、倒液體、開瓶蓋、疊放物體……這些看似簡單的任務(wù),實則高度還原了人類日常生活中的細微操作需求。優(yōu)秀的模型不應(yīng)只在某些任務(wù)上表現(xiàn)出色,更應(yīng)在整個任務(wù)矩陣中展現(xiàn)出穩(wěn)健、全面的能力。通過這種精細化、系統(tǒng)化的設(shè)計,Table30 能夠清晰測出不同模型之間的代際差距,將算法差異量化、可視化,為技術(shù)演進提供了可靠的衡量依據(jù)。

官方學術(shù)論文《RoboChallenge: Real-robot based Large Scale Evaluation of Embodied Policies》則進一步證明了Table30基準測試是有效且具有區(qū)分度的。研究顯示,在系列真實測試中,Pi05 模型在成功率和得分上均顯著領(lǐng)先,而多任務(wù)模型版本(/multi)普遍表現(xiàn)不如單任務(wù)版本。研究揭示,當前不同VLA(視覺-語言-動作)模型之間存在顯著的性能差距,一個多指標、公平且大規(guī)模的具身智能真機評測平臺是有意義的。

wKgZPGjzI5qAIvLyAAJWg-oC1YY547.jpg

值得注意的是,訪問RoboChallenge官網(wǎng),每個用戶都能看到RoboChallenge的評測任務(wù)列表。每個任務(wù)都包含任務(wù)名稱、狀態(tài)、提交次數(shù)、提交者、提交時間和得分等信息。用戶可以通過點擊任務(wù)名稱查看任務(wù)詳情,包括任務(wù)描述、評測指標、提交記錄和模型表現(xiàn)等。此外,頁面還提供了篩選和排序功能,方便用戶查找感興趣的任務(wù)和評測結(jié)果。

wKgZO2jzI5qAZe-yAAFw5PN1tMs209.jpg

可以說,RoboChallenge并非一場短暫的賽事,而是一項長期構(gòu)建的行業(yè)基礎(chǔ)工程。它致力于建立一套可持續(xù)演進的任務(wù)體系,持續(xù)吸納來自社區(qū)和產(chǎn)業(yè)界的新挑戰(zhàn)場景;它要形成一個公開、可信的排行榜,使所有參與者都能從中看到自己在真實世界的坐標;它要積累起標準化的評測數(shù)據(jù),為投資、科研、產(chǎn)品化提供決策依據(jù)。

而它的意義,遠不止于建立一套測試標準,更在于打造一把源自中國的標尺,為整個具身智能行業(yè)的長遠發(fā)展,注入持續(xù)而深刻的動力。

wKgZPGjzI5uAUusbAAJRwXKnqEE187.jpg

每一項技術(shù)的成熟,都需要一把被全行業(yè)認可的公共標尺。
從ImageNet到COCO,從GLUE到MMLU,這些基準不僅塑造了技術(shù)發(fā)展的格局,也定義了產(chǎn)業(yè)迭代的節(jié)奏。

如今,RoboChallenge的問世讓具身智能也有了這樣的量尺:一個扎根現(xiàn)實、開放共建、可度量的真實舞臺。

更重要的是,這是一個向所有人開放的舞臺。

據(jù)悉,RoboChallenge堅持全面開放原則。平臺不僅向全球研究者免費提供測試服務(wù),還公開所有任務(wù)的演示數(shù)據(jù)與測試中間結(jié)果,真正實現(xiàn)了可復現(xiàn)、可驗證的透明度。這意味著,無論是頂尖實驗室還是初創(chuàng)團隊,都能在統(tǒng)一標準下對比成果、復現(xiàn)實驗、優(yōu)化算法。

這種開放性,將打破機器人研發(fā)長期以來的高門檻與孤島化局面,促進行業(yè)共識的形成,加速學術(shù)成果與產(chǎn)業(yè)能力的雙向轉(zhuǎn)化。但它的意義遠不止于服務(wù)學術(shù)論文的發(fā)表和B端產(chǎn)業(yè)鏈,更在于真正推動測評技術(shù)走向C端,實現(xiàn)廣泛落地。

如果你是研究人員,可以不再受限于仿真環(huán)境與實體硬件,在真實機器人上驗證你的想法;如果你是創(chuàng)業(yè)者,可以基于客觀數(shù)據(jù)展示你產(chǎn)品的真實能力,讓技術(shù)說話;技術(shù)愛好者甚至在校學生,也獲得了接觸前沿、親手參與的機會,人人都可以親手為機器人“跑個分”。

wKgZO2jzI5uANQJIAAKKNB2AnRM121.jpg

目前,RoboChallenge已正式登陸Hugging Face平臺,面向全球開放其真機評測任務(wù)與數(shù)據(jù)集。平臺已發(fā)布三十個真實世界任務(wù)數(shù)據(jù)集,涵蓋擦桌、澆花、開關(guān)電器、堆疊積木、分類物品等多種具身操作場景,全面展示了機器人在現(xiàn)實環(huán)境下的感知與行動能力。所有任務(wù)數(shù)據(jù)均支持公開訪問與復現(xiàn)實驗,體現(xiàn)了RoboChallenge對“可比性、可復現(xiàn)、可共建”的堅持。

wKgZPGjzI5yAYl_WAALgeLF1uiA052.jpg

正因如此,RoboChallenge不僅是一個評測平臺,它正逐漸成為機器人世界的公共基礎(chǔ)設(shè)施。

它讓機器人不再停留于看起來聰明,而是必須在真實世界中“確實聰明”;讓投資判斷不再憑故事,而是扎實的數(shù)據(jù);讓研究不再各自為政,而能在同一套規(guī)則中進化。

在未來幾年里,RoboChallenge也許會像當年的ImageNet一樣,成為推動一個時代加速的引擎。它不是一場比賽,而是一面鏡子,讓整個行業(yè)照見自己的真實能力。

而機器人世界的跑分時代,也終于要開始了。

wKgZO2jzI5yAeQqcAAINCBclRgk681.jpg

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40908

    瀏覽量

    302487
  • 人形機器人
    +關(guān)注

    關(guān)注

    7

    文章

    1038

    瀏覽量

    18540
  • 具身智能
    +關(guān)注

    關(guān)注

    0

    文章

    460

    瀏覽量

    904
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    效率翻3倍,寧德時代欲改寫制造業(yè),人形機器人正式進廠

    智能機器人規(guī)模化落地的新能源動力電池PACK生產(chǎn)線。 ? 由寧德時代生態(tài)企業(yè)千尋智能機器人公司研發(fā)的“小墨”人形機器人已能夠精準完成電池接插
    的頭像 發(fā)表于 12-20 05:26 ?1.1w次閱讀

    為什么說關(guān)節(jié)扭矩傳感器是高端機器人的“觸覺神經(jīng)”?

    :2024年全球機器人關(guān)節(jié)扭矩傳感器市場規(guī)模約6.5億美元,預計2031年達44億美元,年復合增長率超30%——這正是“觸覺神經(jīng)”價值的資本證明。 總結(jié) 關(guān)節(jié)扭矩傳感器之所以被譽為高端機器人的“觸覺神經(jīng)
    發(fā)表于 04-17 17:27

    NVIDIA 攜手全球機器人領(lǐng)導者,將物理 AI 帶入現(xiàn)實世界

    基于 NVIDIA 技術(shù),大規(guī)模開發(fā)并部署物理 AI。 NVIDIA 發(fā)布全新 NVIDIA Cosmos 世界模型、NVIDIA Isaac 仿真框架以及 NVIDIA Isaac GR00T N 系列模型,加速邁向智能機器人時代。 從高精密電子裝配、自動化施工部署,到
    的頭像 發(fā)表于 03-17 11:22 ?547次閱讀
    NVIDIA 攜手全球<b class='flag-5'>機器人</b>領(lǐng)導者,將物理 AI 帶入現(xiàn)實世界

    再談低溫燒結(jié)銀的應(yīng)用:從春晚四家機器人出鏡的幕后推手說起

    未來》和《立上游》:**MagicBot Z1/Gen1+MagicDog 四足,集群伴舞、多協(xié)同,主打快速響應(yīng)+低延遲+高集成。 **松延動力:《奶奶的最愛》:**E1/N2/Bumi+仿生機器人
    發(fā)表于 02-17 14:07

    人形機器人迅猛發(fā)展,可以給養(yǎng)老行業(yè)帶來哪些利好

    人形機器人迅猛發(fā)展,可以給養(yǎng)老行業(yè)帶來哪些利好,銀發(fā)經(jīng)濟在人形機器人時代是否會出現(xiàn)井噴式增長?時代的機遇是否已經(jīng)來臨?
    的頭像 發(fā)表于 12-11 15:23 ?1051次閱讀
    人形<b class='flag-5'>機器人</b>迅猛發(fā)展,可以給養(yǎng)老行業(yè)<b class='flag-5'>帶來</b>哪些利好

    探索RISC-V在機器人領(lǐng)域的潛力

    探索RISC-V在機器人領(lǐng)域的潛力 測評:洄溯 測評時間: 2025年11月 測評對象: MUSE Pi Pro開發(fā)板(基于進迭時空
    發(fā)表于 12-03 14:40

    CW32L012小型機器人控制評估板活動 四足機器人+智能小車 開箱評測

    一、評測前言 非常感謝CW32生態(tài)社區(qū),開源分享了許多比較好玩、優(yōu)質(zhì)的項目。這次活動都尾聲了還能有幸申請購買到 四足機器人+小車-智能小車(套件數(shù)量不多)的評測套件,多謝C32生態(tài)社區(qū)的大力支持
    發(fā)表于 11-24 23:44

    RK3576機器人核心:三屏異顯+八路攝像頭,重塑機器人交互與感知

    瑞芯微RK3576 AIoT處理器處理器憑借其卓越的多屏異顯與8路攝像頭接入能力,為機器人領(lǐng)域帶來革新。米爾電子MYD-LR3576開發(fā)板實測數(shù)據(jù)顯示,在高負載下CPU占用僅34%,完美實現(xiàn)多路視覺
    發(fā)表于 10-29 16:41

    小蘿卜機器人的故事

    經(jīng)過我的申請, 馬老師發(fā)放了, 小蘿卜機器人的, 開發(fā)權(quán)限, 原來的小蘿卜公司, 因為經(jīng)營不善倒閉, 作為科研產(chǎn)品, 幾個技術(shù)對此惋惜, 自掏腰包, 要讓小蘿卜機器人, 再生, 每次聽到小蘿卜說
    發(fā)表于 10-23 05:24

    機器人看點:寧德時代入股銀河通用機器人 機器人企業(yè)扎堆赴港上市

    給大家帶來一些機器人的行業(yè)資訊: 寧德時代入股銀河通用機器人 企查查APP數(shù)據(jù)顯示北京銀河通用機器人有限公司發(fā)生工商變更,寧德
    的頭像 發(fā)表于 09-29 15:27 ?3175次閱讀

    NVIDIA Jetson Thor:開啟通用機器人時代

    電子發(fā)燒友網(wǎng)報道(文 / 吳子鵬)2025 年,機器人技術(shù)正加速從專用機器時代邁向通用機器人時代。這一過程不僅預示著機器人應(yīng)用范圍的極大拓展
    發(fā)表于 08-28 16:32 ?4232次閱讀
    NVIDIA Jetson Thor:開啟通用<b class='flag-5'>機器人</b>新<b class='flag-5'>時代</b>

    機器人競技幕后:磁傳感器芯片激活 “精準感知力”

    。 同時,磁傳感器還是多傳感器融合中的 “穩(wěn)定錨點”。在機器人運動系統(tǒng)的融合定位中,它常作為核心基準。以 “足球機器人” 項目為例,當視覺傳感器因強光出現(xiàn)噪點、超聲波傳感器受聲波反射干擾時,內(nèi)置
    發(fā)表于 08-26 10:02

    藍思科技:今年承接智元機器人全系列多款人形機器人業(yè)務(wù)

    思科技表示,公司在 2016 年即成立智能機器人公司,研發(fā)和大規(guī)模量產(chǎn)工業(yè)機器人、機械臂、靈巧手。2024 年迅速與國內(nèi)外頭部人形機器人公司合作,量產(chǎn)人形
    的頭像 發(fā)表于 08-05 15:46 ?4421次閱讀

    工業(yè)機器人的特點

    單調(diào)、繁瑣的重復性操作,因此既可以避免由于工作本身的單調(diào)性給工人帶來的工作效率下降,又可以因為機器的不間斷操作提高單純性輸出。也正是因為機器人可勝任重復性工作,也避免了工人的職業(yè)病,同時也因為設(shè)定
    發(fā)表于 07-26 11:22

    盤點#機器人開發(fā)平臺

    地瓜機器人RDK X5開發(fā)套件地瓜機器人RDK X5開發(fā)套件產(chǎn)品介紹 旭日5芯片10TOPs算力-電子發(fā)燒友網(wǎng)機器人開發(fā)套件 Kria KR260機器人開發(fā)套件 Kria KR260-
    發(fā)表于 05-13 15:02
    江安县| 普陀区| 巫溪县| 石柱| 二连浩特市| 河北省| 彰武县| 淄博市| 松阳县| 贵溪市| 胶州市| 莲花县| 南召县| 济宁市| 九江县| 阿城市| 南召县| 海门市| 盐城市| 沽源县| 长治县| 榆林市| 昭觉县| 周口市| 阿鲁科尔沁旗| 蚌埠市| 迁西县| 水城县| 信阳市| 绥化市| 且末县| 怀集县| 集贤县| 镇康县| 景德镇市| 建湖县| 会泽县| 庐江县| 白银市| 洛宁县| 安塞县|