哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

三步驟快速實現(xiàn)PaddleOCR實時推理

英特爾物聯(lián)網(wǎng) ? 來源:英特爾物聯(lián)網(wǎng) ? 作者:武卓 ? 2022-06-09 17:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者

英特爾AI軟件布道師

武卓博士

曾主持國家級及省部級科研項目十余項,已授權(quán)國際國內(nèi)專利十余項。

前言:該技術(shù)能讓PaddleOCR的開發(fā)者在筆記本電腦上即可獲得超越40FPS的速度,極大降低了PaddleOCR的部署成本。

簡介

在上篇文章中我們介紹過,光學(xué)字符識別(OCR)技術(shù)可以將文件、圖片或自然場景中的文字信息進行識別并提取,與一系列的自然語言處理技術(shù)聯(lián)合使用,能夠完成諸如文檔票據(jù)的文字信息自動化處理、實時圖片文字翻譯等任務(wù)。通過機器的自動化處理,可以幫助財務(wù)人員在處理票據(jù)時省卻大量手工輸入的工作量,也能夠方便我們在出國旅游時隨時對異域中的外國文字信息進行實時翻譯、減少語言不通帶來的不便。

既然OCR技術(shù)如此實用,有沒有什么方法能讓我們利用自己手邊的設(shè)備,隨時使用到這項技術(shù)呢?答案當(dāng)然是肯定的。接下來,我們將以百度開源的PaddleOCR1-2 技術(shù)為例,具體介紹如何利用英特爾開源的OpenVINO 工具套件,僅使用我們手邊都有的CPU就能輕松實現(xiàn)對PaddleOCR的實時推理。

本篇是用OpenVINO 工具套件實現(xiàn)基于OCR及NLP輕松實現(xiàn)信息自動化提取的系列博客中的第二篇。我們將簡要介紹PaddleOCR的原理,以及利用OpenVINO 工具套件實現(xiàn)PaddleOCR推理加速的工作流程。同樣只需利用一頁Jupyter notebook,依照簡單的三個步驟,即可利用CPU實現(xiàn)基于PaddleOCR的實時文字信息提取。

PaddleOCR原理簡介

PaddleOCR是基于深度學(xué)習(xí)框架PaddlePaddle的一項OCR技術(shù),具有超輕、模型小、便于移動端及服務(wù)器端部署等特點。整個PaddleOCR技術(shù)的工作流程如下圖所示,主要包括文本檢測、方向分類、以及文本識別三部分。

28d278c6-db51-11ec-ba43-dac502259ad0.png

文本檢測任務(wù)是找出圖像或視頻中的文字位置。不同于目標(biāo)檢測任務(wù),目標(biāo)檢測不僅要解決定位問題,還要解決目標(biāo)分類問題。但是,文本檢測也面臨一些難點,比如:自然場景中的文本具有多樣性,文字大小、方向、長度、形狀、語言都會有不同。有的時候,文字重疊或者密度較高,這些都會影響最終文本檢測的效果。目前常用的文本檢測方法有基于回歸以及基于分割的方法。而在PaddleOCR中,我們選取的是基于分割的DBNet3方法。

DBNet的工作原理如下圖所示。針對基于分割的方法需要使用閾值進行二值化處理而導(dǎo)致后處理耗時的問題,DBNet提出了一種可學(xué)習(xí)閾值的方法,并巧妙地設(shè)計了一個近似于階躍函數(shù)的二值化函數(shù),使得分割網(wǎng)絡(luò)在訓(xùn)練的時候能端對端的學(xué)習(xí)文本分割的閾值。自動調(diào)節(jié)閾值不僅帶來精度的提升,同時簡化了后處理,提高了文本檢測的性能。

2914895a-db51-11ec-ba43-dac502259ad0.png

方向分類指的是針對圖片中某些經(jīng)文本檢測得到的bounding box中的文字方向為非水平排列的情況,對bounding box的方向進行檢測。如果發(fā)現(xiàn)bounding box中的文字方向為非水平排列,則對該bounding box的方向進行糾正,使其旋轉(zhuǎn)為文字水平排列的方向,方便下一步的文本識別。

文本識別的任務(wù)是將文本檢測得到的bounding box中的具體的文字內(nèi)容識別出來。文本識別的算法有針對規(guī)則文本以及不規(guī)則文本識別的算法。對于規(guī)則文本,主流的算法CTC(Conectionist Temporal Classification)和基于Sequence2Sequence 的方法。

在本文demo中,我們采用的是基于CTC的方法。由于文本識別任務(wù)的特殊性,輸入數(shù)據(jù)中存在大量的上下文信息,卷積神經(jīng)網(wǎng)絡(luò)的卷積核特性使其更關(guān)注于局部信息,缺乏長依賴的建模能力,因此僅使用CNN很難挖掘到文本之間的上下文聯(lián)系。

為了解決這一問題,首先通過使用CRNN (Convolutional Recurrent Neural Network)4 ,利用卷積網(wǎng)絡(luò)提取圖像特征,并同時引入了雙向 LSTM(Long Short-Term Memory) 用來增強上下文建模。最終將輸出的特征序列輸入到CTC模塊, 通過ctc歸納字符間的連接特性,直接解碼序列結(jié)果。該結(jié)構(gòu)被驗證有效,并廣泛應(yīng)用在文本識別任務(wù)中, 如下圖所示。

2952c0b2-db51-11ec-ba43-dac502259ad0.png

5分鐘 3步驟

快速實現(xiàn)PaddleOCR實時推理

在最新版本的OpenVINO 2022.1中,已經(jīng)實現(xiàn)了對基于PaddlePaddle深度學(xué)習(xí)框架的深度學(xué)習(xí)模型的支持。而PaddleOCR作為一項深受廣大開發(fā)者喜愛的開源技術(shù),其中開源的預(yù)訓(xùn)練模型已經(jīng)可以在OpenVINO 2022.1版本中直接進行模型讀取以及加速推理。

接下來,我們將通過代碼示例,介紹如何按照簡單的三個步驟,實現(xiàn)OpenVINO 工具套件對PaddleOCR的加速推理。整個工作流程如下圖所示:

299100de-db51-11ec-ba43-dac502259ad0.png

其中OpenVINO 工具套件會對PaddleOCR中的文本檢測以及文本識別模型進行讀取以及推理加速。本次demo中我們展示的是利用自己的網(wǎng)絡(luò)攝像頭,將實時獲取的視頻流中的文字信息利用PaddleOCR進行提取。當(dāng)然,開發(fā)者也可以上傳圖片,利用OpenVINO 工具套件對PaddleOCR的推理實現(xiàn)對圖片中的文字信息進行提取。

步驟一:下載需要使用的PaddleOCR預(yù)訓(xùn)練模型,并完成模型的讀取與加載

在導(dǎo)入需要使用到的相應(yīng)Python包后,首先需要對將要使用的PaddleOCR開源預(yù)訓(xùn)練模型進行下載。本次demo中使用到的是輕量化的"Chinese and English ultra-lightweight PP-OCR model (9.4M)"模型。由于PaddleOCR中包含了文本檢測及文本識別兩個深度學(xué)習(xí)模型,因此,我們首先定義一個模型下載函數(shù),如下圖所示。

2a182064-db51-11ec-ba43-dac502259ad0.png

接下來,完成文本檢測模型的下載,

2a52e316-db51-11ec-ba43-dac502259ad0.png

以及推理引擎的初始化、文本檢測模型的讀取以及在 CPU上面的加載。

2a91e19c-db51-11ec-ba43-dac502259ad0.png

再然后,完成文本識別模型的下載,

2adfa008-db51-11ec-ba43-dac502259ad0.png

以及文本識別模型的讀取以及在CPU上面的加載。其中,有一步需要特別說明的是,動態(tài)輸入的處理

由于文本識別模型的輸入是文本檢測得到的一系列bounding box圖像,而圖像中的字體由于大小和文字長短程度不一,就造成了文本識別模型的輸入是動態(tài)輸入的。與以往版本需要對圖像尺寸進行重調(diào)整(resize)而將模型輸入尺寸固定、從而可能引起性能損失的處理方法不同的是,OpenVINO 2022. 1版本已經(jīng)可以很好的支持模型的動態(tài)輸入。

在CPU上進行文本識別模型加載之前,只需要對于輸入的若干維度中具有動態(tài)輸入的維度賦值-1或申明動態(tài)輸入尺寸的上限值,比如Dimension(1,512),即可完成對模型動態(tài)輸入的處理。接下來,即可按常規(guī)步驟完成在CPU上加載文本識別模型。

2b000ff0-db51-11ec-ba43-dac502259ad0.png

步驟二:為文本檢測及文本識別定義必要的前處理及后處理函數(shù)。

為文本檢測模型定義必要的前處理函數(shù),如下圖所示

2b3b59fc-db51-11ec-ba43-dac502259ad0.png

為文本識別模型定義必要的前處理函數(shù),如下圖所示

2b7b294c-db51-11ec-ba43-dac502259ad0.png

2bbd3b98-db51-11ec-ba43-dac502259ad0.png

2bdc2742-db51-11ec-ba43-dac502259ad0.png

為文本檢測模型定義后處理函數(shù),將文本檢測模型的推理結(jié)果轉(zhuǎn)為bounding box形式,作為文本識別模型的輸入,如下圖所示。

2c14223c-db51-11ec-ba43-dac502259ad0.png

步驟三:利用OpenVINO 工具套件推理引擎(Runtime)針對攝像頭采集視頻進行實時推理

2c9cb12e-db51-11ec-ba43-dac502259ad0.png

定義運行PaddleOCR模型推理的主函數(shù),主要包括以下四個部分:

01運行網(wǎng)絡(luò)攝像頭,將捕捉到的視頻流作為paddleOCR的輸入

2cc9adbe-db51-11ec-ba43-dac502259ad0.png

02準(zhǔn)備進行文本檢測和文本識別的視頻幀

2d28f3aa-db51-11ec-ba43-dac502259ad0.png

03針對文本檢測進行推理

2d81d36c-db51-11ec-ba43-dac502259ad0.png

根據(jù)文本檢測得到的bounding box,進行文本識別推理

2e02ab54-db51-11ec-ba43-dac502259ad0.png

04將文本提取的結(jié)果可視化

2e2581d8-db51-11ec-ba43-dac502259ad0.png

結(jié)果討論

下面我們來看看運行結(jié)果吧:

我們可以看到,對于網(wǎng)絡(luò)攝像頭采集的視頻流中的文字提取效果還是很不錯的。僅僅利用CPU進行推理,也可以得到30FPS以上的性能,可以說能夠達(dá)到實時的推理效果!當(dāng)然,除了視頻流作為輸入,開發(fā)者還可以上傳圖片,進行文本信息提取。以下是針對上傳圖片中印刷體文字和手寫體文字信息提取的一些測試效果。

你還在等什么,快來根據(jù)我們提供的源代碼,在自己的個人電腦上嘗試一下吧!

小結(jié)

OCR具有將圖片、掃描文檔或自然場景中的文字信息識別轉(zhuǎn)化為數(shù)字化、機器編碼方式存儲的優(yōu)勢。將OCR進行文字識別的結(jié)果與自然語言處理中的NLP技術(shù)相結(jié)合,能夠?qū)崿F(xiàn)自動化的信息提取,為我們免去手動輸入信息填寫的麻煩,并有助于信息的結(jié)構(gòu)化存儲與查找。在本次系列博客的第二篇中,我們簡要介紹了PaddleOCR的工作原理,并提供了一個基于OpenVINO 工具套件實現(xiàn)PaddleOCR的Jupyter notebook demo。可以方便讀者在閱讀的同時,下載源碼并在自己的電腦端利用CPU來輕松實現(xiàn)PaddleOCR的加速推理。

原文標(biāo)題:用OpenVINO? 輕松實現(xiàn)PaddleOCR實時推理 | 開發(fā)者實戰(zhàn)

文章出處:【微信公眾號:英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10321

    瀏覽量

    181084
  • OCR
    OCR
    +關(guān)注

    關(guān)注

    0

    文章

    176

    瀏覽量

    17278
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5607

    瀏覽量

    124629

原文標(biāo)題:用OpenVINO? 輕松實現(xiàn)PaddleOCR實時推理 | 開發(fā)者實戰(zhàn)

文章出處:【微信號:英特爾物聯(lián)網(wǎng),微信公眾號:英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    菱FX3U串口PLC遠(yuǎn)程編程實現(xiàn)方法(下)

    下面介紹如何利用華辰智通Hinet網(wǎng)關(guān)完成對菱FX3U串口PLC的遠(yuǎn)程編程操作。 遠(yuǎn)程編程整體分為五個步驟: 第一:開啟華辰智通Hinet工業(yè)智能網(wǎng)關(guān),配置串口相關(guān)參數(shù); 第二
    的頭像 發(fā)表于 04-21 11:22 ?200次閱讀
    <b class='flag-5'>三</b>菱FX3U串口PLC遠(yuǎn)程編程<b class='flag-5'>實現(xiàn)</b>方法(下)

    三步教你鑒別星貼片電容CL21B104KBCNNNC 的真?zhèn)?/a>

    要鑒別星貼片電容CL21B104KBCNNNC的真?zhèn)危赏ㄟ^以下三步進行詳細(xì)觀察與比對: ? 第一:觀察外觀與包裝細(xì)節(jié) 字跡與表面處理 真品字跡清晰、字體標(biāo)準(zhǔn),無模糊或重影;表面光滑勻稱,無氣泡
    的頭像 發(fā)表于 04-03 15:50 ?109次閱讀
    <b class='flag-5'>三步</b>教你鑒別<b class='flag-5'>三</b>星貼片電容CL21B104KBCNNNC 的真?zhèn)? />    </a>
</div>                              <div   id=

    如何在邊緣AI應(yīng)用場景中實現(xiàn)高性能、低功耗推理(上)

    送回EndPoint設(shè)備。這種方法需要巨大的帶寬才能將海量數(shù)據(jù)傳輸?shù)皆贫?。邊緣設(shè)備越來越多地使用AI推理技術(shù),以實現(xiàn)快速實時響應(yīng)并提高數(shù)據(jù)隱私和安全性,同時避免與云連接產(chǎn)生的延遲
    的頭像 發(fā)表于 03-03 14:18 ?6595次閱讀
    如何在邊緣AI應(yīng)用場景中<b class='flag-5'>實現(xiàn)</b>高性能、低功耗<b class='flag-5'>推理</b>(上)

    如何在邊緣AI應(yīng)用場景中實現(xiàn)高性能、低功耗推理(上)

    。這種方法需要巨大的帶寬才能將海量數(shù)據(jù)傳輸?shù)皆贫恕?邊緣設(shè)備越來越多地使用AI推理技術(shù),以實現(xiàn)快速實時響應(yīng)并提高數(shù)據(jù)隱私和安全性,同時避免與云連接產(chǎn)生的延遲和成本。這也降低了功耗,使其
    的頭像 發(fā)表于 02-27 07:48 ?1w次閱讀
    如何在邊緣AI應(yīng)用場景中<b class='flag-5'>實現(xiàn)</b>高性能、低功耗<b class='flag-5'>推理</b>(上)

    CANDTU設(shè)備上云實戰(zhàn):兩完成接入,三步玩轉(zhuǎn)數(shù)據(jù)

    CANDTU云平臺既能本地看數(shù),又能遠(yuǎn)程上云分析,但設(shè)備怎么接入?本期手把手教你兩完成配置,三步掌握數(shù)據(jù)查看技巧。CANDTU系列設(shè)備:滿足多樣化傳輸需求ZLG致遠(yuǎn)電子CANDTU系列包含
    的頭像 發(fā)表于 02-14 11:39 ?244次閱讀
    CANDTU設(shè)備上云實戰(zhàn):兩<b class='flag-5'>步</b>完成接入,<b class='flag-5'>三步</b>玩轉(zhuǎn)數(shù)據(jù)

    沐曦曦云C500/C550 GPU產(chǎn)品適配PaddleOCR-VL-1.5模型

    PaddleOCR-VL 系列的全新迭代版本PaddleOCR-VL-1.5今天正式上線,沐曦曦云C500/C550 Day 0 適配PaddleOCR-VL-1.5模型,助力PaddleOC
    的頭像 發(fā)表于 01-30 10:19 ?1309次閱讀
    沐曦曦云C500/C550 GPU產(chǎn)品適配<b class='flag-5'>PaddleOCR</b>-VL-1.5模型

    200V/346V相電適配秘訣!優(yōu)比施UPS三步解決跨區(qū)域供電難題

    相電壓時,是選擇冒著風(fēng)險強行運行,還是投入巨資改造整個電力基礎(chǔ)設(shè)施?這道難題,如今有了更優(yōu)雅、更高效的破解之道。優(yōu)比施憑借深厚的電力電子技術(shù)積淀,提煉出三步核心秘訣,幫助
    的頭像 發(fā)表于 12-19 08:35 ?539次閱讀
    200V/346V<b class='flag-5'>三</b>相電適配秘訣!優(yōu)比施UPS<b class='flag-5'>三步</b>解決跨區(qū)域供電難題

    使用 Docker 一鍵部署 PaddleOCR-VL: 新手保姆級教程

    作者:飛槳開發(fā)者技術(shù)專家 劉力 | 適合人群:剛接觸 PaddleOCR-VL + Docker部署的同學(xué) | 學(xué)習(xí)目標(biāo):從一臺剛裝好的 Ubuntu 24.04 開始,完成 Docker 環(huán)境準(zhǔn)備
    的頭像 發(fā)表于 12-18 18:26 ?6783次閱讀
    使用 Docker 一鍵部署 <b class='flag-5'>PaddleOCR</b>-VL: 新手保姆級教程

    變頻器調(diào)試三步驟

    變頻器作為現(xiàn)代工業(yè)自動化控制的核心設(shè)備,其調(diào)試過程直接關(guān)系到設(shè)備運行效率與穩(wěn)定性。本文將系統(tǒng)介紹變頻器調(diào)試的大關(guān)鍵步驟——參數(shù)設(shè)置、空載測試與負(fù)載測試,并結(jié)合實際案例解析常見問題及解決方案,幫助
    的頭像 發(fā)表于 12-03 07:35 ?1363次閱讀
    變頻器調(diào)試<b class='flag-5'>三步驟</b>

    迅為RK3588開發(fā)環(huán)境搭建“三步曲”,從零到一輕松上手!

    迅為RK3588開發(fā)環(huán)境搭建“三步曲”,從零到一輕松上手!
    的頭像 發(fā)表于 12-01 11:51 ?1329次閱讀
    迅為RK3588開發(fā)環(huán)境搭建“<b class='flag-5'>三步</b>曲”,從零到一輕松上手!

    利用Verdi調(diào)試協(xié)處理器的實現(xiàn)步驟

    本次給大家介紹的是利用Verdi調(diào)試協(xié)處理器的實現(xiàn)步驟。 有時為了觀察協(xié)處理器運行情況,需要查看協(xié)處理器接口的信號波形,此時可以用Verdi來查看主處理器發(fā)給協(xié)處理器的自定義指令以進一追蹤協(xié)處理器
    發(fā)表于 10-30 08:26

    工程師整理:UPS電源選購“三步法”,從看懂參數(shù)到下單不出錯

    將分享一套簡單實用的"三步選型法",幫助技術(shù)主管和企業(yè)輕松選出最適合的UPS電源。第一:讀懂關(guān)鍵參數(shù),不再被專業(yè)術(shù)語迷惑核心參數(shù)解析:容量(VA/W):這是最重
    的頭像 發(fā)表于 09-05 09:26 ?1403次閱讀
    工程師整理:UPS電源選購“<b class='flag-5'>三步</b>法”,從看懂參數(shù)到下單不出錯

    杭州靈汐類腦智算集群實現(xiàn)大模型快速推理

    據(jù)悉,“杭州靈汐類腦智算集群”已于7月底實現(xiàn)了大模型快速推理API的企業(yè)服務(wù)試運行。該集群由杭州靈汐類腦科技有限公司牽頭搭建運營,中國電信、中國電子科技南湖研究院以及腦啟社區(qū)作為合作方參與,由杭州
    的頭像 發(fā)表于 08-18 16:06 ?1117次閱讀

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡(luò)智能診斷邁向 “自愈”時代

    診斷方案,為網(wǎng)絡(luò)運維帶來顯著的實用價值:1.快速提升故障處理效率l 實時監(jiān)控與智能預(yù)警: AI引擎持續(xù)分析海量流量、設(shè)備狀態(tài)及日志數(shù)據(jù),實時識別異常模式(如流量突增、延遲抖動、微小丟包),實現(xiàn)
    發(fā)表于 07-16 15:29

    迅為RK3576開發(fā)板攝像頭實時推理測試-ppseg?圖像分割

    迅為RK3576開發(fā)板攝像頭實時推理測試-ppseg 圖像分割
    的頭像 發(fā)表于 07-11 14:31 ?1036次閱讀
    迅為RK3576開發(fā)板攝像頭<b class='flag-5'>實時</b><b class='flag-5'>推理</b>測試-ppseg?圖像分割
    义乌市| 满洲里市| 儋州市| 合江县| 驻马店市| 东至县| 桦川县| 富蕴县| 千阳县| 荣昌县| 响水县| 阿坝| 泸西县| 英山县| 天津市| 综艺| 天门市| 清徐县| 仁化县| 塘沽区| 临沧市| 桦川县| 达州市| 盘山县| 湛江市| 井陉县| 溆浦县| 澎湖县| 旌德县| 壤塘县| 徐水县| 丰城市| 思茅市| 彩票| 滨海县| 荆州市| 麟游县| 峨边| 五莲县| 潞西市| 视频|