哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Python pacp模塊:自動識別文字中的省市區(qū)并將其繪圖

python爬蟲知識分享 ? 來源:python爬蟲知識分享 ? 作者:python爬蟲知識分享 ? 2022-06-27 17:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一個用于提取簡體中文字符串中省,市和區(qū)并能夠進行映射,檢驗和簡單繪圖的python模塊。

舉個例子:

["徐匯區(qū)虹漕路461號58號樓5樓", "泉州市洛江區(qū)萬安塘西工業(yè)區(qū)"]
        ↓ 轉(zhuǎn)換
|省    |市   |區(qū)    |地址                 |
|上海市|上海市|徐匯區(qū)|虹漕路461號58號樓5樓  |
|福建省|泉州市|洛江區(qū)|萬安塘西工業(yè)區(qū)        |

注:“地址”列代表去除了省市區(qū)之后的具體地址

也可以將大段文本中所有提到的地址提取出來,并且自動將相鄰的存在所屬關(guān)系的地址歸并到一條記錄中(0.5.5版本新功能):

"分店位于徐匯區(qū)虹漕路461號58號樓5樓和泉州市洛江區(qū)萬安塘西工業(yè)區(qū)以及南京鼓樓區(qū)"
        ↓ 轉(zhuǎn)換
|省    |市   |區(qū)    |
|上海市|上海市|徐匯區(qū)|
|福建省|泉州市|洛江區(qū)|
|江蘇省|南京市|鼓樓區(qū)|

代碼目前僅僅支持python3

pip install cpca

注:cpca是chinese province city area的縮寫

如果覺得本模塊對你有用的話,施舍個star,謝謝。

常見安裝問題:

在 windows 上可能會出現(xiàn)類似如下問題

Building wheel for pyahocorasick (setup.py) ... error

先去下載 Microsoft Visual C++ Build Tools, 安裝完成后,再重新使用 pip install cpca 安裝,即可解決問題

開始使用

本模塊中最主要的方法是cpca.transform,該方法可以輸入任意的可迭代類型(如list,pandas的Series類型等),然后將其轉(zhuǎn)換為一個DataFrame,下面演示一個最為簡單的使用方法:

location_str = ["徐匯區(qū)虹漕路461號58號樓5樓", "泉州市洛江區(qū)萬安塘西工業(yè)區(qū)", "北京朝陽區(qū)北苑華貿(mào)城"]
import cpca
df = cpca.transform(location_str)
df

輸出的結(jié)果為(adcode為官方地址編碼):

   省     市    區(qū)          地址              adcode
0 上海市 上海市  徐匯區(qū)     虹漕路461號58號樓5樓  310104
1 福建省 泉州市  洛江區(qū)     萬安塘西工業(yè)區(qū)        350504
2 北京市 市轄區(qū)  朝陽區(qū)     北苑華貿(mào)城           110105

如果你想獲知程序是從字符串的那個位置提取出省市區(qū)名的,可以添加一個pos_sensitive=True參數(shù):

location_str = ["徐匯區(qū)虹漕路461號58號樓5樓", "泉州市洛江區(qū)萬安塘西工業(yè)區(qū)", "北京朝陽區(qū)北苑華貿(mào)城"]
import cpca
df = cpca.transform(location_str, pos_sensitive=True)
df

輸出如下:

     省    市    區(qū)        地址               adcode        省_pos  市_pos 區(qū)_pos
0  上海市  上海市  徐匯區(qū)  虹漕路461號58號樓5樓   310104     -1     -1      0
1  福建省  泉州市  洛江區(qū)  萬安塘西工業(yè)區(qū)         350504     -1      0      3
2  北京市  市轄區(qū)  朝陽區(qū)  北苑華貿(mào)城            110105     -1     -1      0

從大段文本中提取多個地址(0.5.5版本新功能):

import cpca
df = cpca.transform_text_with_addrs("分店位于徐匯區(qū)虹漕路461號58號樓5樓和泉州市洛江區(qū)萬安塘西工業(yè)區(qū)以及南京鼓樓區(qū)")
df

結(jié)果為(注意 transform_text_with_addrs 獲得的數(shù)據(jù),“地址”列都是空的):

    省     市     區(qū)    地址   adcode
0  上海市  市轄區(qū)  徐匯區(qū)       310104
1  福建省  泉州市  洛江區(qū)       350504
2  江蘇省  南京市  鼓樓區(qū)       320106

transform_text_with_addrs 還支持和 transform 類似的 index, pos_sensitive 以及 umap 參數(shù)

繪圖:

模塊中還自帶一些簡單繪圖工具,可以在地圖上將上面輸出的數(shù)據(jù)以熱力圖的形式畫出來.

這個工具依賴folium,為了減小本模塊的體積,所以并不會預(yù)裝這個依賴,在使用之前請使用pip install folium .

代碼如下:

import cpca
from cpca import drawer
df = cpca.transform_text_with_addrs("分店位于徐匯區(qū)虹漕路461號58號樓5樓和泉州市洛江區(qū)萬安塘西工業(yè)區(qū)以及南京鼓樓區(qū)")
drawer.draw_locations(df[cpca._ADCODE], "df.html")

繪圖展示

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 自動識別
    +關(guān)注

    關(guān)注

    3

    文章

    239

    瀏覽量

    23982
  • python
    +關(guān)注

    關(guān)注

    58

    文章

    4885

    瀏覽量

    90307
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    振弦式應(yīng)變計讀數(shù)儀的自動識別與多設(shè)備管理技巧

    在結(jié)構(gòu)安全監(jiān)測項目中,高效、準確地讀取大量振弦式應(yīng)變計的數(shù)據(jù)是一項核心工作。現(xiàn)代智能讀數(shù)儀,例如VW-102A型,其自動識別功能與多設(shè)備管理策略,為現(xiàn)場工程師提供了極大的便利,顯著提升了工作效率
    的頭像 發(fā)表于 04-01 17:26 ?89次閱讀
    振弦式應(yīng)變計讀數(shù)儀的<b class='flag-5'>自動識別</b>與多設(shè)備管理技巧

    中國工程院院士王耀南一行蒞臨新大陸自動識別調(diào)研指導(dǎo)

    3月27日,中國工程院院士、機器人視覺感知與控制技術(shù)國家工程研究中心主任王耀南教授、湖南大學(xué)、福建省科協(xié)、福州市科協(xié)等專家學(xué)者組成的調(diào)研團隊,蒞臨新大陸自動識別公司就機器視覺、自動識別技術(shù)與物聯(lián)網(wǎng)應(yīng)用開展調(diào)研。
    的頭像 發(fā)表于 03-31 11:36 ?429次閱讀

    新大陸自動識別2026年供應(yīng)商大會圓滿舉行

    春回鷺島,萬物競發(fā)。3月13日,以“共筑新生態(tài) 聚力贏未來”為主題的新大陸自動識別公司2026年度供應(yīng)商大會在廈門隆重舉行。來自全國各地的核心供應(yīng)商伙伴齊聚一堂,在溫暖的春日里共敘情誼、共話產(chǎn)業(yè)未來。
    的頭像 發(fā)表于 03-17 11:21 ?528次閱讀

    如何使用Python讀取不間斷數(shù)據(jù),并將其傳輸?shù)絃abVIEW進行處理?

    使用Python讀取Count,如何將讀取到的數(shù)據(jù)傳輸至Labview;傳輸過程Python要保持讀取的動作,不能停止。
    發(fā)表于 01-23 11:09

    瑞芯微(EASY EAI)RV1126B OCR文字識別

    1.OCR文字識別簡介文字識別也是圖像領(lǐng)域一個常見問題。然而,對于自然場景圖像,首先要定位圖像文字
    的頭像 發(fā)表于 01-12 10:19 ?7041次閱讀
    瑞芯微(EASY EAI)RV1126B OCR<b class='flag-5'>文字</b><b class='flag-5'>識別</b>

    AIDC:自動識別數(shù)據(jù)的未來趨勢與算力基石的雙重演進

    在數(shù)字化轉(zhuǎn)型浪潮席卷全球的背景下,自動識別與數(shù)據(jù)采集(AIDC)技術(shù)不僅是連接物理世界與數(shù)字系統(tǒng)的“眼睛”,更是各行業(yè)提升效率的核心引擎。與此同時,隨著人工智能的爆發(fā),AI數(shù)據(jù)中心(同樣縮寫為AIDC)作為承載這些海量數(shù)據(jù)處理的“心臟”,正在經(jīng)歷一場深刻的變革。
    的頭像 發(fā)表于 12-30 16:56 ?2331次閱讀

    沒有專利的opencv-python 版本

    所有 官方發(fā)布的 opencv-python 核心版本(無 contrib 擴展)都無專利風(fēng)險——專利問題僅存在于 opencv-contrib-python 擴展模塊的少數(shù)算法(如
    發(fā)表于 12-13 12:37

    新大陸自動識別馬來西亞智造基地順利量產(chǎn)

    馬來西亞檳城,歷來是海外華人的創(chuàng)業(yè)福地。作為海外華商網(wǎng)絡(luò)歷經(jīng)百年沉淀的關(guān)鍵節(jié)點,其不僅延續(xù)著深厚的百年商脈,更傳承著華人堅韌不拔的開拓精神。如今,在這片熱土上,新大陸自動識別公司與當(dāng)?shù)仡I(lǐng)先的電子制造服務(wù)商NationGate正式啟動量產(chǎn)合作,共同見證中國智造揚帆遠航的重要時刻。
    的頭像 發(fā)表于 10-11 17:53 ?1872次閱讀

    新大陸自動識別亮相2025國國際工業(yè)博覽會

    9月23日,工業(yè)領(lǐng)域年度盛會——CIIF2025國工業(yè)博覽會正式拉開帷幕!新大陸自動識別聚焦工業(yè)制造核心需求,以“AI驅(qū)動 開拓工業(yè)識別新大陸”為主題,攜 AI 驅(qū)動的智能識別產(chǎn)品組
    的頭像 發(fā)表于 09-30 15:24 ?1126次閱讀

    【EASY EAI Orin Nano開發(fā)板試用體驗】PP-OCRV5文字識別實例搭建與移植

    參數(shù)填上dec模型的路徑,在第三個參數(shù)填上rec模型的路徑,在第四個參數(shù)填上需要進行文字識別的源圖片: 看看效果: RK3588
    發(fā)表于 08-18 16:57

    基于LockAI視覺識別模塊:手寫數(shù)字識別

    手寫數(shù)字識別是一種經(jīng)典的模式識別和圖像處理問題,旨在通過計算機自動識別用戶手寫的數(shù)字。本文將教會你如何使用基于RV1106的LockAI視覺識別模塊
    的頭像 發(fā)表于 06-30 15:44 ?1280次閱讀
    基于LockAI視覺<b class='flag-5'>識別</b><b class='flag-5'>模塊</b>:手寫數(shù)字<b class='flag-5'>識別</b>

    揭秘單裝自動識別銘牌:基于RFID的毫秒級非接觸群讀如何革新大型裝備管理

    單裝自動識別銘牌安裝于大型裝備的規(guī)定位置,采用射頻識別技術(shù),用于裝備的遠距離自動識別。該設(shè)備的核心功能是依托RFID技術(shù),實現(xiàn)目標個體身份及關(guān)鍵屬性數(shù)據(jù)的自動化、非接觸式采集與
    的頭像 發(fā)表于 06-25 15:55 ?752次閱讀
    揭秘單裝<b class='flag-5'>自動識別</b>銘牌:基于RFID的毫秒級非接觸群讀如何革新大型裝備管理

    工信部電子信息司領(lǐng)導(dǎo)蒞臨行芯科技調(diào)研

    近日,工業(yè)和信息化部電子信息司王世江副司長一行到行芯科技進行專題調(diào)研,省市區(qū)經(jīng)信部門相關(guān)負責(zé)人隨行陪同。
    的頭像 發(fā)表于 06-11 10:38 ?1578次閱讀

    新大陸自動識別亮相印尼市場行業(yè)盛會

    這個5月,新大陸自動識別(Newland AIDC)攜手印尼合作伙伴,以一場硬核科技盛宴掀起東南亞智能浪潮!作為本次活動的金牌贊助商,新大陸自動識別全面展示了在智能數(shù)據(jù)采集方面的最新成果。來自制造、物流、汽車等多領(lǐng)域的行業(yè)決策者和技術(shù)專家齊聚,見證數(shù)據(jù)賦能的無限可能。
    的頭像 發(fā)表于 05-29 16:14 ?963次閱讀

    # 基于LockAI視覺識別模塊:C++尋找色塊

    在傳統(tǒng)計算機視覺場景,顏色識別是目標檢測和分割的重要手段之一。通過識別特定顏色的色塊,可以在相對純凈的背景下快速定位目標區(qū)域。本實驗提供了一個簡單的色塊識別案例,
    的頭像 發(fā)表于 05-12 14:27 ?914次閱讀
    # 基于LockAI視覺<b class='flag-5'>識別</b><b class='flag-5'>模塊</b>:C++尋找色塊
    雷波县| 东平县| 华宁县| 武邑县| 竹山县| 四会市| 岳阳县| 安仁县| 广水市| 台山市| 洞口县| 鹤壁市| 湖口县| 余姚市| 原平市| 酉阳| 甘肃省| 弥勒县| 鹤山市| 肥城市| 漠河县| 肃北| 大足县| 淅川县| 乌兰察布市| 三亚市| 夏津县| 英超| 洪江市| 霍州市| 天柱县| 安达市| 拉萨市| 施秉县| 彭泽县| 乌鲁木齐县| 正安县| 徐州市| 射洪县| 长子县| 远安县|