哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

基于TensorFlow的開源JS庫的網(wǎng)頁前端人物動作捕捉的實現(xiàn)

張康康 ? 2019-08-13 20:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:極鏈科技 曾啟澔


前言


隨著前端生態(tài)的發(fā)展,Java已經(jīng)不僅僅局限于作為網(wǎng)頁開發(fā),也越來越活躍于服務器端,移動端小程序等應用開發(fā)中。甚至通過Electron等打包工具,甚至能夠開發(fā)多系統(tǒng)的桌面應用。其涉足的領域?qū)挿阂彩沟媚軌驅(qū)崿F(xiàn)的功能也不再是簡單的UI控件制作和內(nèi)容的展示,在互動娛樂,小游戲領域也有著極大的發(fā)展前景。本文以通過Java開發(fā)一個基于瀏覽器攝像頭的實時人物動作捕捉小程序為例,介紹一下前端在這一領域的可行性。

什么是TensorFlow

TensorFlow 最初是由Google大腦小組的研究員和工程師們開發(fā)出來,采用數(shù)據(jù)流圖(Data Flow Graphs)用于機器學習和深度神經(jīng)網(wǎng)絡方面數(shù)值計算的開源軟件庫。其高度的可移植性和多語言性使得它可以通過各種常用編程語言編寫,輕松的運行在多種平臺的設備上。是一個集性能,可靠性,通用性,易用性為一體的強大開源庫。

本文所使用的開源Java模型庫:

l tfjs-models/posenet: 一個機器學習模型,功能為對圖像或者視頻中的人物進行動作捕捉,輸出人體各個部位的keypoints(坐標集)。具有單一人物分析和多人物分析的特點。

l tfjs-models/body-pix: 一個機器學習模型,功能為對圖像或者視頻中人物和背景進行分析,將人物從背景中剝離出來,輸出結(jié)果為人體24個部位在畫面中的像素位置。具有將人物與背景分離的功能。

實現(xiàn)原理

本文所介紹的基于瀏覽器和網(wǎng)絡攝像頭的人物實時動作捕捉方法,其實現(xiàn)原理是通過Java調(diào)用

*在基本的原理中并不是必須的組成部分,但在下文中會簡單介紹一種通過的圖像繪制功能,提升人物捕捉精度的方法。

通過tfjs-models/posenet模型庫實現(xiàn)人物動作捕捉

l基本配置

· 導入JS

7675f2c6ea9e411eb9c9f4a422b25b54.png

· HTML

df7c716bcb814e79b1bb2ce4d48390d3.png

· 初始化網(wǎng)絡攝像頭

3daaf70911944b1982171be31591868f.png

· 生成posenet對象

1c91cb128c464aa1b19d50ccc7471fdf.png

參數(shù)說明:

architecture:分為MobileNetV1和ResNet50兩個體系,其中ResNet50精度更高但處理速度較慢。

outputStride:輸出結(jié)果每個像素占用字節(jié)數(shù),數(shù)字越小結(jié)果越精確,但處理的成本和時間更多。

inputResolution:輸入圖像壓縮后的尺寸,數(shù)字越大越精確,但處理的成本和時間更多。

multiplier:僅在MobileNetV1體系中使用,卷積運算的深度(通道數(shù)),數(shù)字越大層數(shù)越多越精確,但處理的成本和時間更多。

l執(zhí)行實時分析

2833e7c75f6e4c68a1248417a053378a.png

l結(jié)果

· 多人捕捉:多人捕捉時能夠獲得畫面中人物的keypoints,互相之間有一定的干擾但影響并不是特別大。

· 單人捕捉:很容易被背景及身邊人物干擾,導致人體keypoint定位不準確。

l缺點

通過實際的效果可以看到,該模型可以在多人物的時候準確捕捉到各個人物的動作和身體部位的keypoints,雖然存在若干干擾和不穩(wěn)定但基本能夠接受,實時性效果好,但是無法區(qū)分主要人物和次要人物,需要開發(fā)者對結(jié)果數(shù)據(jù)進行處理。

其score的生成是根據(jù)形狀準確度來計算,沒有場景深度的分析,因此無法判斷人物前后位置關系。

由于以上的問題,該方法在單一人物動作捕捉時被周圍環(huán)境干擾的影響極大。在背景存在其他人物時會因無法判斷主次人物關系,極大的降低準確率。對單一人物動作捕效果非常的不理想,需要進行改進。

改進方案

單一人物的動作捕捉被外界干擾的影響太大導致結(jié)果并不理想,因此首先要考慮的就是屏蔽掉周圍干擾物體,突出主體人物。由此引入了tfjs-models/body-pix模型庫。

**tfjs-models/body-pix模型庫的主要功能:**實時分析人物結(jié)構(gòu),將人物從背景中剝離。其作用對象為單一捕捉對象,正好適用于上述單人捕捉結(jié)果不理想的情況。

l基本配置

· 導入JS

f97f879121b0461b9654597f91a20dd5.png

· 生成bodyPixNet對象

dca1c4f005984c13b5dc878a7d3c88bd.png

ltfjs-models/body-pix與tfjs-models/posenet的混合使用

298fe16954534859a253e6fb7c148c89.png

l結(jié)果

tfjs-models/body-pix與tfjs-models/posenet的混合使用,雖然加大了canvas處理的負擔,加大了描繪和圖像處理的次數(shù),但是由于tfjs-models/body-pix已經(jīng)先將人物與背景剝離,在tfjs-models/posenet只使用用最高效但低準確度的參數(shù)配置下,也能夠產(chǎn)生遠高于使用高精確度但消耗處理性能極大的配置所不能達到的準確度。從而實現(xiàn)了高效,高準確度,流暢的實時單人動作捕捉功能。

結(jié)論

通過TensorFlow的開源庫,能夠輕松的在瀏覽器上通過網(wǎng)絡攝像頭實現(xiàn)人物動作的實時捕捉。

由于基于圖像分析,因此表現(xiàn)能力極大的依賴于對canvas的描繪性能,移動端由于瀏覽器canvas描繪能力以及硬件性能限制的原因,表現(xiàn)并不出色,無法做到長時間實時捕捉。甚至部分瀏覽器限制了網(wǎng)絡攝像頭的調(diào)用。在移動端的表現(xiàn)并不出色。

在單一人物的動作捕捉時,tfjs-models/body-pix與tfjs-models/posenet的混合使用能夠使精確度大大提升。

由于需要對canvas進行描繪,結(jié)合其他canvas的JS庫可以進行交互UI,交互小游戲等不同場合APP的開發(fā)。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    動作捕捉和盲人導航眼鏡的接合與應用,web的開發(fā)代碼和調(diào)試步驟

    MediaPipe Holistic 完成頭部姿態(tài)(偏航 / 俯仰)+ 上肢動作(摸臉 / 抬手 / 擺手) 捕捉,同時對接導航核心接口(地圖 / POI / 避障),實現(xiàn)動作指令解
    發(fā)表于 02-02 07:10

    從納伏信號到精準數(shù)據(jù):多功能炭素材料電阻率測試儀的前端與算法

    炭素材料的電阻率測試,往往始于微弱的納伏級電信號—— 這一信號承載著材料的導電本質(zhì),卻極易被干擾淹沒、被噪聲扭曲。多功能炭素材料電阻率測試儀實現(xiàn)從微弱信號到精準數(shù)據(jù)的跨越,核心在于前端信號捕捉與后端
    的頭像 發(fā)表于 01-15 09:26 ?240次閱讀
    從納伏信號到精準數(shù)據(jù):多功能炭素材料電阻率測試儀的<b class='flag-5'>前端</b>與算法

    恒訊科技解析:如何安裝MySQL并創(chuàng)建數(shù)據(jù)

    管理系統(tǒng)(RDBMS),使用結(jié)構(gòu)化查詢語言(SQL)高效地組織和管理數(shù)據(jù)。它是全球最受歡迎的開源數(shù)據(jù)系統(tǒng)之一,廣泛應用于網(wǎng)頁開發(fā)、電子商務和商業(yè)應用。 常見用例? MySQL 是多種應用的可靠選擇,包括: 網(wǎng)絡應用:管理用戶認
    的頭像 發(fā)表于 01-14 14:25 ?365次閱讀

    OpenTenBase核心貢獻者分享開源數(shù)據(jù)的破局之路

    “在開源數(shù)據(jù)已成一片‘紅?!漠斚?,單純比拼‘快’或‘省’,已很難在開發(fā)者心中建立獨特的護城河?!監(jiān)penTenBase核心貢獻者、騰訊云數(shù)據(jù)專家工程師李晉鋼這樣闡述他對當前數(shù)據(jù)
    的頭像 發(fā)表于 12-29 14:00 ?547次閱讀

    基于開源鴻蒙的星鴻EOS電網(wǎng)移動作業(yè)終端解決方案

    應用場景 以開源鴻蒙為技術底座的星鴻EOS電網(wǎng)移動作業(yè)終端可應用于(不限于)以下多種作業(yè)場景: 低壓營配融合作業(yè)場景:低壓營配融合作業(yè)要求一線人員從單一工種向復合工種轉(zhuǎn)型,這對原本分專業(yè)配置的作業(yè)
    的頭像 發(fā)表于 12-17 16:16 ?663次閱讀
    基于<b class='flag-5'>開源</b>鴻蒙的星鴻EOS電網(wǎng)移<b class='flag-5'>動作</b>業(yè)終端解決方案

    人工智能AI必備的5款開源軟件推薦!

    在技術浪潮洶涌的當下,越來越多的企業(yè)與開發(fā)者開始意識到:“開源”已經(jīng)不只是一個口號,而是創(chuàng)新的源泉。 從算法研究到智能應用落地,無數(shù)項目的起點,都是一個個免費的開源工具。今天,我們就來盤點五款在智能
    的頭像 發(fā)表于 11-19 15:35 ?867次閱讀
    人工智能AI必備的5款<b class='flag-5'>開源</b>軟件推薦!

    【上海晶珩睿莓1開發(fā)板試用體驗】TensorFlow-Lite物體歸類(classify)

    目前尚未得知睿莓1開發(fā)板上面有NPU或者DPU之類的額外處理器,因此使用樹莓派系列使用最廣泛的TensorFlow-Lite進行物體歸類,使用CPU運行代碼,因此占用的是CPU的算力。在
    發(fā)表于 09-12 22:43

    普華基礎軟件亮相2025 CCF中國開源大會

    作為中國車用操作系統(tǒng)開源領域的領航者,受邀參會并發(fā)表主題演講,與來自學術界和產(chǎn)業(yè)界的一線專家及開源領域領軍人物深度探討開源技術的前沿進展和協(xié)同路徑,共繪
    的頭像 發(fā)表于 08-11 09:21 ?1298次閱讀

    鴻蒙非侵入式彈窗新解法,企查查正式開源“QuickDialog”彈窗組件

    近日,企查查將其自研的鴻蒙彈窗組件“QuickDialog”開源,并上線至?OpenHarmony 三方中心倉。這是鴻蒙生態(tài)首個支持“彈窗堆棧暫存能力”的非侵入式彈窗解決方案,憑借其靈活、高效
    的頭像 發(fā)表于 07-31 10:40 ?846次閱讀
    鴻蒙非侵入式彈窗新解法,企查查正式<b class='flag-5'>開源</b>“QuickDialog”彈窗組件<b class='flag-5'>庫</b>

    ESP32-運行網(wǎng)頁服務器(Web Server)-實用篇

    在前一篇文章《ESP32-運行網(wǎng)頁服務器(WebServer)-入門篇》,我們介紹了ESP32運行網(wǎng)頁服務器(WebServer)的原理,然后我們基于ESP32實現(xiàn)了一個demo代碼;看到很多同學都留言發(fā)表了自己的看法,有很多同
    的頭像 發(fā)表于 07-28 18:05 ?4044次閱讀
    ESP32-運行<b class='flag-5'>網(wǎng)頁</b>服務器(Web Server)-實用篇

    100%開源!行業(yè)首個企業(yè)級智能體

    近日,京東云正式開源JoyAgent智能體。作為行業(yè)首個100%開源的企業(yè)級智能體,實現(xiàn)了產(chǎn)品級開源,包括前端、后端、框架、引擎和核心子智能
    的頭像 發(fā)表于 07-26 09:26 ?1309次閱讀

    2025 CCF中國開源大會即將開幕:RT-Thread睿賽德邀您共同見證中國開源新征程

    8月2日至3日,由中國計算機學會主辦的2025CFF中國開源大會將于上海召開。本屆大會將依托上海國際化創(chuàng)新生態(tài)與科技產(chǎn)業(yè)集聚優(yōu)勢,匯聚一眾頂尖專家學者及開源領軍人物,共同探索開源操作系
    的頭像 發(fā)表于 07-17 14:40 ?1181次閱讀
    2025 CCF中國<b class='flag-5'>開源</b>大會即將開幕:RT-Thread睿賽德邀您共同見證中國<b class='flag-5'>開源</b>新征程

    飛書富文本組件RichTextVista開源

    近日,飛書正式將其自研的富文本組件 RichTextVista(簡稱“RTV”)開源,并上線OpenHarmony 三方中心倉。該組件以領先的性能、流暢的渲染體驗與高度的開放性,為鴻蒙生態(tài)提供了更高效的富文本解決方案。
    的頭像 發(fā)表于 07-16 16:47 ?1150次閱讀

    請問EZ-Serial固件是否使用任何OSS(開源軟件)或軟件?

    EZ-Serial 固件是否使用任何 OSS(開源軟件)或軟件?
    發(fā)表于 07-02 08:14

    基于STM32 HAL與標準的esp8266接入機智云方案(二)

    ,我們還將討論如何移植HAL和標準實現(xiàn)與機智云的兼容,幫助開發(fā)者更高效地完成項目的云平臺接入。代碼下載注意:此時手機app端的該設備為網(wǎng)頁端的虛擬設備僅僅是
    的頭像 發(fā)表于 05-28 18:02 ?1645次閱讀
    基于STM32 HAL<b class='flag-5'>庫</b>與標準<b class='flag-5'>庫</b>的esp8266接入機智云方案(二)
    武功县| 崇明县| 汶川县| 简阳市| 富民县| 璧山县| 孝昌县| 樟树市| 临海市| 托克托县| 射阳县| 恭城| 江油市| 龙游县| 大兴区| 德格县| 垦利县| 调兵山市| 札达县| 通山县| 时尚| 宜章县| 河东区| 蒙山县| 准格尔旗| 芷江| 日照市| 冀州市| 清丰县| 桃园县| 辰溪县| 宜兰市| 泰宁县| 永昌县| 牡丹江市| 洛隆县| 鄂托克旗| 贞丰县| 宝坻区| 明溪县| 靖西县|