哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

自然語言控制機(jī)械臂:ChatGPT與機(jī)器人技術(shù)的融合創(chuàng)新(下)

大象機(jī)器人科技 ? 來源:大象機(jī)器人科技 ? 作者:大象機(jī)器人科技 ? 2024-04-11 15:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

引言


在我們的上一篇文章中,我們探索了如何將ChatGPT集成到myCobot 280機(jī)械臂中,實(shí)現(xiàn)了一個(gè)通過自然語言控制機(jī)械臂的系統(tǒng)。我們?cè)敿?xì)介紹了項(xiàng)目的動(dòng)機(jī)、使用的關(guān)鍵技術(shù)如ChatGPT和Google的Speech-to-text服務(wù),以及我們是如何通過pymycobot模塊來控制機(jī)械臂的。通過將自然語言處理和機(jī)械臂控制相結(jié)合,我們的項(xiàng)目旨在降低機(jī)器人編程的門檻,使得非專業(yè)人士也能輕松地進(jìn)行機(jī)器人編程和實(shí)驗(yàn)。

接下來,在這篇文章中,我們將討論在開發(fā)這一系統(tǒng)過程中遇到的挑戰(zhàn),我們是如何克服這些挑戰(zhàn)的,以及項(xiàng)目未來的擴(kuò)展可能性。我們的目標(biāo)是深入了解技術(shù)實(shí)施的具體問題,并探索該系統(tǒng)未來發(fā)展的新方向。

wKgZomYXhL2AWINGAHjQGzQa6LU646.png

開發(fā)當(dāng)中遇到的困難


在開發(fā)集成了ChatGPT的mycobot 280機(jī)械臂控制系統(tǒng)的過程中,我面臨了幾個(gè)主要的技術(shù)挑戰(zhàn)。

1.語音識(shí)別的準(zhǔn)確性和響應(yīng)時(shí)間


首先,我遇到的挑戰(zhàn)是語音識(shí)別的準(zhǔn)確性和反應(yīng)時(shí)間。盡管使用了Google的Speech-to-text,但在實(shí)際應(yīng)用中,我發(fā)現(xiàn)它有時(shí)難以準(zhǔn)確識(shí)別專業(yè)術(shù)語或在嘈雜環(huán)境中捕捉語音指令??赡苁且?yàn)椴惶斫獾讓舆壿嬤\(yùn)行的一個(gè)原理是什么,也不知道如何來正確的使用。此外,從語音輸入到文本輸出的過程延遲較長(zhǎng),如何來判斷這句話是不是說完了,通常響應(yīng)的時(shí)間較久。

wKgZomYXjQiAdddWAAA5T4Pbqmk535.png

在我說完之后,大概會(huì)有3s左右的響應(yīng)時(shí)間。

2.OpenAI API的實(shí)用性和地域限制


ChatGPT的API 是整個(gè)項(xiàng)目的核心功能點(diǎn),沒有了他就不能實(shí)現(xiàn)AI的機(jī)械臂控制系統(tǒng)了。在一開始測(cè)試代碼的時(shí)候我用的是WEB版本的ChatGPT,一開始沒有考慮到使用API是一個(gè)比較大的問題。

因?yàn)榈貐^(qū)的問題,沒有辦法直接通過API進(jìn)行訪問OpenAI,會(huì)出現(xiàn)網(wǎng)絡(luò)延遲,不能夠使用代理等軟件來實(shí)現(xiàn)訪問。除此之外還得確保網(wǎng)絡(luò)的穩(wěn)定性才能夠快快速的進(jìn)行處理。

wKgZomYXjTqAJnVDAAB5lnQ5YAc478.png

3.自然語言轉(zhuǎn)指令的處理


如果解決了上邊的生成代碼的問題,我們將會(huì)得到類似于命令行的字符串,需要將它轉(zhuǎn)變成可以編譯的代碼。一開始只考慮到了單行的命令行

"robot.move_to_zero()"


要將字符串轉(zhuǎn)化成執(zhí)行的代碼可以用到python的getattr(),他是一個(gè)內(nèi)置函數(shù),用于獲取對(duì)象的屬性值。

getattr(object, name[, default]) object:表示要獲取屬性的對(duì)象。 name:表示要獲取的屬性的名稱。 default:可選參數(shù),表示如果指定的屬性不存在時(shí)返回的默認(rèn)值。


getattr() 函數(shù)會(huì)嘗試獲取指定對(duì)象的指定屬性的值。如果對(duì)象具有該屬性,則返回屬性的值;如果對(duì)象沒有指定的屬性,但提供了默認(rèn)值,則返回默認(rèn)值;如果對(duì)象沒有指定的屬性,并且沒有提供默認(rèn)值,則會(huì)引發(fā) AttributeError 異常。

舉個(gè)例子直接調(diào)用類的方法

class Myclass: def print_1(self): print("halo word") obj = mycalss() getattr(obj,"print_1")() """ halo word


用這個(gè)方法就可以完美解決如何將字符串的形式輸出可執(zhí)行的代碼了!

接下來是將字符串轉(zhuǎn)化為可執(zhí)行代碼的過程:

我們收到的字符串是代碼的形式例如

"robot.move_to_zero()"


我們要將這一部分進(jìn)行拆分,分為obj和方法兩部分,就要用到python當(dāng)中的分割的方法。

# 以.為節(jié)點(diǎn)分為前后兩個(gè)部分 command_str = "robot.move_to_zero()" parts = command_str.split(".") parts[0] = "robot" part[1] = "move_to_zero()" # 去掉括號(hào)保留,方法名 method_name = part[1].split("()")[0] method = getatter(robot,method_name) method() #處理轉(zhuǎn)化方法 def execute_command(instance,command_str): try: #分割對(duì)象名和方法 parts = command_str.split(".") if len(parts) != 2 or parts[0] != 'robot': print("Invalid command format.") return method_name = parts[1].split("()")[0] #移除括號(hào) #使用getattr 安全的獲取方法引用 if hasattr(instance, method_name): method = getattr(instance, method_name) method() else: print(f"the method {method_name} does not exist!") except Exception as e: print(f"An error occurred: {e}")

這樣就完成了,能夠處理單行的字符串,但是在測(cè)試的時(shí)候使用產(chǎn)生多行的命令的時(shí)候,這個(gè)代碼就不行了,它會(huì)變成一長(zhǎng)串,所以這個(gè)方法是無效的。

上述三個(gè)是我主要遇到的問題,接下來我將一一的進(jìn)行解答。

解決方案和應(yīng)對(duì)策略


1.優(yōu)化語音識(shí)別


根據(jù)我上述描寫的識(shí)別延遲的問題,我是通過設(shè)置時(shí)間來優(yōu)化我的程序。

# 設(shè)置timeout為3秒,phrase_time_limit為10秒 audio = recognizer.listen(source, timeout=3, phrase_time_limit=10)


默認(rèn)設(shè)置沒有聽到聲音,一直的進(jìn)行監(jiān)聽,我設(shè)置了時(shí)間上的限制10s,也能夠保證我在說完話之后較快的一個(gè)響應(yīng)。

接下來完成的功能代碼

import speech_recognition as sr def speech_to_text(): # 初始化識(shí)別器 recognizer = sr.Recognizer() with sr.Microphone() as source: print("start speaking...") # 監(jiān)聽源,設(shè)置timeout和phrase_time_limit # timeout:在這段時(shí)間內(nèi)沒有檢測(cè)到聲音,則停止監(jiān)聽 # phrase_time_limit:監(jiān)聽的最大時(shí)長(zhǎng) try: audio = recognizer.listen(source, timeout=3, phrase_time_limit=10) except sr.WaitTimeoutError: print("No speech was detected within the timeout period.") return None try: # 使用Google的語音識(shí)別服務(wù) text = recognizer.recognize_google(audio, language='en-US') print("You said: " + text) return text except sr.UnknownValueError: print("Google Speech Recognition could not understand audio") return None except sr.RequestError as e: print(f"Could not request results from Google Speech Recognition service; {e}") return None

這目前已經(jīng)可以滿足大部分的需求了,實(shí)際的使用情況下來來看,整個(gè)的功能還是比較完整的,能夠有效的識(shí)別出語音內(nèi)容,特別是讓我說數(shù)字的時(shí)候他主動(dòng)轉(zhuǎn)化成阿拉伯?dāng)?shù)字,在進(jìn)行交互的過程中省了處理數(shù)字的問題。

1.自然語言轉(zhuǎn)化優(yōu)化


如何來解決多行的指令問題呢。

當(dāng)我們收到,多行的指令就不能跟之前單純的分離來進(jìn)行處理了得考慮其他的方式,以下的情況默認(rèn)ChatGPT生成的指令是下面這種換行行的字符串,沒有帶注釋的(ChatGPT很喜歡寫注釋)。

"robot.move_to_zero() robot.grab_position() robot.plus_z_coords(20)"


只要把多個(gè)當(dāng)成一個(gè)來看就好了!

# 分割成多行 commands = command_str.strip().split('n') #萬一里面存在一些空白符,得先進(jìn)行處理 for cmd in commands: cmd = cmd.strip() if not cmd: continue # 我們默認(rèn)obj 是robot,就只需要獲取方法名字就可以了 if cmd.startswith("robot."): cmd = cmd[6:] # 分割方法名,和參數(shù) if '(' in cmd and cmd.endswith(")"): method_name, args_str = cmd.split('(', 1) method_name = method_name.strip() #刪除前后空格 args_str = args_str.rstrip(")") #刪除右側(cè)的) # 移除可能的空白字符,并按逗號(hào)分隔參數(shù) args = [arg.strip() for arg in args_str.split(',')] if args_str else []

wKgaomYXj6qAJXcQAABhB7CAPh4382.png

it works!

3.ChatGPT API的問題

關(guān)于這個(gè)問題,我目前并沒能很好的進(jìn)行解決,大家如果有好的方法可以,私信我跟我溝通,因?yàn)榈貐^(qū)的問題,并不能夠直接的用API獲取響應(yīng)。

項(xiàng)目的擴(kuò)展功能和未來展望
視覺功能


在本次記錄當(dāng)中,缺少了最重要的一個(gè)模塊,視覺模塊,單獨(dú)有一個(gè)機(jī)械臂沒有眼睛的話跟瞎子又有什么區(qū)別呢。 對(duì)于這一部分的開發(fā),會(huì)需要花費(fèi)較大的經(jīng)歷,如果以后有完成一定程度上的開發(fā),我也會(huì)及時(shí)出來跟大家進(jìn)行分享。

之前也有看到日本的Shirokuma 開發(fā)個(gè)類似的項(xiàng)目,用到了ChatGPT4-vision的功能,做了說出目標(biāo)進(jìn)行抓取的一個(gè)功能。

https://twitter.com/neka_nat/status/1733517151947108717

這個(gè)項(xiàng)目也是相當(dāng)?shù)挠幸馑迹o了我不少開發(fā)這個(gè)項(xiàng)目的想法。

wKgaomYXkAOAfa1rAAbFhnzWR4E408.png

更加智能的“賈維斯”


相信大家的肯定都有看過鋼鐵俠,隨著AI的不斷發(fā)展,我覺得在不久的將來,肯定會(huì)出現(xiàn)一款如同電影當(dāng)中的機(jī)械臂,能夠通過交流的方式來幫助你完成一些工作。

近幾年也能說是人工智能的突發(fā)猛進(jìn)的幾年,AIGC是近期最火熱的內(nèi)容,只要接收到內(nèi)容就可以生成對(duì)應(yīng)的文本,圖像,視頻和音頻等等。

總結(jié)


很期待未來,AI和機(jī)器人相結(jié)合能夠融合到怎樣的一個(gè)程度,是不是已經(jīng)能夠幫助人類做一定的事情了!如果你有一些好的想法,或者對(duì)我的項(xiàng)目修改的意見歡迎隨時(shí)跟我提出!

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    31442

    瀏覽量

    223656
  • 人工智能
    +關(guān)注

    關(guān)注

    1820

    文章

    50325

    瀏覽量

    266951
  • 機(jī)械臂
    +關(guān)注

    關(guān)注

    14

    文章

    601

    瀏覽量

    26186
  • ChatGPT
    +關(guān)注

    關(guān)注

    31

    文章

    1600

    瀏覽量

    10393
  • 大象機(jī)器人
    +關(guān)注

    關(guān)注

    0

    文章

    87

    瀏覽量

    405
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    智能機(jī)器人從0到1系統(tǒng)入門課程 帶源碼課件 百度網(wǎng)盤下載

    歷著從“指令式”向“對(duì)話式”的轉(zhuǎn)變。 未來的機(jī)器人將具備更強(qiáng)的抗噪能力和語義理解能力。通過集成先進(jìn)的語音識(shí)別引擎,機(jī)器人能夠在高噪環(huán)境準(zhǔn)確分離人聲與背景音。更重要的是,結(jié)合自然語言
    發(fā)表于 04-11 16:41

    機(jī)器人主控核心板米爾RK3576 + ROS2,NPU加速實(shí)現(xiàn)目標(biāo)跟隨與機(jī)械抓取

    。本文采用“眼在手上”配置(相機(jī)固定在機(jī)械末端),需同時(shí)考慮固定偏移和關(guān)節(jié)運(yùn)動(dòng)。 自研逆運(yùn)動(dòng)學(xué) 控制6軸機(jī)械精準(zhǔn)抓?。ú灰蕾嘙oveIt
    發(fā)表于 04-10 21:23

    Neway電機(jī)方案在機(jī)器人技術(shù)方面的優(yōu)勢(shì)

    系統(tǒng)穩(wěn)定性背景:工業(yè)機(jī)器人需長(zhǎng)時(shí)間連續(xù)運(yùn)行,電源故障可能導(dǎo)致機(jī)械失控、生產(chǎn)線停機(jī)等嚴(yán)重后果。Neway方案:具備過壓、過流、短路三重保護(hù)功能,提供OCP(過流保護(hù))、OTP(過溫保護(hù))信號(hào)輸出,支持
    發(fā)表于 03-30 09:39

    人形機(jī)器人爆發(fā)背后,一個(gè)被忽視的核心技術(shù)機(jī)器人運(yùn)動(dòng)學(xué)控制

    前言近兩年,中國人形機(jī)器人產(chǎn)業(yè)進(jìn)入快速發(fā)展階段。從特斯拉Optimus到國內(nèi)眾多創(chuàng)新企業(yè),人形機(jī)器人正逐漸從實(shí)驗(yàn)室走向工業(yè)制造、服務(wù)機(jī)器人、醫(yī)療康復(fù)等更多應(yīng)用場(chǎng)景。但在炫目的
    的頭像 發(fā)表于 03-10 17:04 ?1289次閱讀
    人形<b class='flag-5'>機(jī)器人</b>爆發(fā)背后,一個(gè)被忽視的核心<b class='flag-5'>技術(shù)</b>:<b class='flag-5'>機(jī)器人</b>運(yùn)動(dòng)學(xué)<b class='flag-5'>控制</b>

    自然語言處理NLP的概念和工作原理

    自然語言處理 (NLP) 是人工智能 (AI) 的一個(gè)分支,它會(huì)教計(jì)算機(jī)如何理解口頭和書面形式的人類語言。自然語言處理將計(jì)算語言學(xué)與機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 01-29 14:01 ?593次閱讀
    <b class='flag-5'>自然語言</b>處理NLP的概念和工作原理

    《AI機(jī)器人控制進(jìn)階教程(入門版)》閱讀指引

    的預(yù)編程,只能在結(jié)構(gòu)化環(huán)境中工作。AI的引入(如計(jì)算機(jī)視覺、自然語言處理),賦予機(jī)器人感知、理解和決策的能力,使其能適應(yīng)開放、動(dòng)態(tài)的真實(shí)世界。2.解決復(fù)雜任務(wù)的核心本
    的頭像 發(fā)表于 01-07 10:56 ?2430次閱讀
    《AI<b class='flag-5'>機(jī)器人</b><b class='flag-5'>控制</b>進(jìn)階教程(入門版)》閱讀指引

    復(fù)合機(jī)器人對(duì)比傳統(tǒng)AGV和機(jī)械的優(yōu)勢(shì)何在?

    標(biāo)準(zhǔn)傳統(tǒng)AGV僅能解決“點(diǎn)對(duì)點(diǎn)搬運(yùn)”,機(jī)械局限于“固定工位操作”,而經(jīng)世智能復(fù)合機(jī)器人通過AGV底盤+機(jī)械+視覺系統(tǒng)+一體化
    的頭像 發(fā)表于 11-21 15:32 ?1797次閱讀
    復(fù)合<b class='flag-5'>機(jī)器人</b>對(duì)比傳統(tǒng)AGV和<b class='flag-5'>機(jī)械</b><b class='flag-5'>臂</b>的優(yōu)勢(shì)何在?

    高精度機(jī)器人控制的核心——基于 MYD-LT536 開發(fā)板的精密運(yùn)動(dòng)控制方案

    算法與 C++ 實(shí)時(shí)模塊開發(fā); - 可作為控制核心部署在高精度測(cè)量機(jī)器人、激光切割機(jī)械、協(xié)作機(jī)械
    發(fā)表于 11-14 15:48

    機(jī)器人機(jī)械效率提升的革命性解決方案:上海永銘電容器實(shí)踐

    在現(xiàn)代自動(dòng)化與精密制造中,機(jī)器人機(jī)械(人形/工業(yè))的穩(wěn)定性與效率至關(guān)重要。電容器作為電路中的基本組件,對(duì)機(jī)器人機(jī)械的性能發(fā)揮著至關(guān)重要的作用。01
    的頭像 發(fā)表于 09-01 10:06 ?692次閱讀
    <b class='flag-5'>機(jī)器人機(jī)械</b><b class='flag-5'>臂</b>效率提升的革命性解決方案:上海永銘電容器實(shí)踐

    機(jī)器人競(jìng)技幕后:磁傳感器芯片激活 “精準(zhǔn)感知力”

    2025 世界人形機(jī)器人運(yùn)動(dòng)會(huì)于 8 月 17 日?qǐng)A滿收官,賽場(chǎng)上機(jī)器人在跑步、跳躍、抓取等項(xiàng)目中的精彩表現(xiàn),背后是運(yùn)動(dòng)控制、環(huán)境感知等技術(shù)的迭代升級(jí)。而在這些
    發(fā)表于 08-26 10:02

    海默RC系列機(jī)器人控制

    器,基于自主研發(fā)技術(shù)打造,致力于推動(dòng)機(jī)器人核心技術(shù)的持續(xù)突破。RC系列控制器/HMControllerSeriesRC80控制器RC40
    的頭像 發(fā)表于 08-01 15:35 ?1335次閱讀
    海默RC系列<b class='flag-5'>機(jī)器人</b><b class='flag-5'>控制</b>器

    MT6701 磁性角度編碼器 IC:引領(lǐng)機(jī)器人控制技術(shù)創(chuàng)新

    在科技日新月異的今天,機(jī)器人技術(shù)的發(fā)展可謂是突飛猛進(jìn)。從工業(yè)生產(chǎn)線上不知疲倦的機(jī)械,到服務(wù)領(lǐng)域靈活貼心的智能伙伴,機(jī)器人正逐漸深入到我們生
    的頭像 發(fā)表于 07-18 17:02 ?966次閱讀

    RDK × 腿機(jī)器人:這只 “機(jī)械汪” 竟會(huì)說人話、走花路!

    開源:Github:https://github.com/Hello-XSJ/RDK\_vlm\_demo.git-本項(xiàng)目聚焦腿機(jī)器人在多模態(tài)環(huán)境感知、自然語言交互和自主行為控制方面
    的頭像 發(fā)表于 07-01 20:27 ?1431次閱讀
    RDK × 腿<b class='flag-5'>臂</b><b class='flag-5'>機(jī)器人</b>:這只 “<b class='flag-5'>機(jī)械</b>汪” 竟會(huì)說人話、走花路!

    大象機(jī)器人攜手進(jìn)迭時(shí)空推出 RISC-V 全棧開源六軸機(jī)械產(chǎn)品

    大象機(jī)器人成立于2016年,專注協(xié)作機(jī)器人研發(fā)與應(yīng)用,產(chǎn)品線涵蓋輕量級(jí)協(xié)作機(jī)器人、人形機(jī)器人、仿生機(jī)器人等多種形態(tài)。拳頭產(chǎn)品myCobot系
    的頭像 發(fā)表于 06-06 16:55 ?1671次閱讀
    大象<b class='flag-5'>機(jī)器人</b>攜手進(jìn)迭時(shí)空推出 RISC-V 全棧開源六軸<b class='flag-5'>機(jī)械</b><b class='flag-5'>臂</b>產(chǎn)品

    詳細(xì)介紹機(jī)場(chǎng)智能指路機(jī)器人的工作原理

    免與行人發(fā)生碰撞,為旅客提供安全、舒適的引導(dǎo)服務(wù)。 智能交互系統(tǒng) 語音識(shí)別與理解 :智能指路機(jī)器人利用先進(jìn)的語音識(shí)別技術(shù),將旅客輸入的語音信號(hào)轉(zhuǎn)化為文字信息。然后,通過自然語言處理算法對(duì)文字進(jìn)行分析
    發(fā)表于 05-10 18:26
    永昌县| 游戏| 昌黎县| 特克斯县| 图木舒克市| 开原市| 昌平区| 千阳县| 新郑市| 高清| 岳池县| 闸北区| 舟曲县| 崇州市| 溧阳市| 安龙县| 新巴尔虎右旗| 中西区| 日照市| 五峰| 察哈| 新安县| 吉隆县| 舒兰市| 永州市| 巩留县| 新昌县| 惠州市| 陇南市| 北安市| 罗定市| 镇原县| 杭锦旗| 涟水县| 涟源市| 攀枝花市| 遵化市| 伊金霍洛旗| 麻城市| 东方市| 米林县|