哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費注冊]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

TF-IDF算法的改進及在語義檢索中應(yīng)用

大?。?/span>0.78 MB 人氣: 2018-01-02 需要積分:3

 針對傳統(tǒng)的TF-IDF算法、K-means算法、自適應(yīng)遺傳算法在網(wǎng)絡(luò)檢索結(jié)果中含有大量不相關(guān)數(shù)據(jù)、語義檢索準(zhǔn)確性不高的問題,研究了TF-IDF算法的改進及其在語義檢索中的應(yīng)用。將正則表達式和語義分析技術(shù)相結(jié)合,從而實現(xiàn)對TF-IDF算法的改進。利用語義庫對搜索主題進行描述,根據(jù)正則原予語義的重要性和在網(wǎng)頁標(biāo)簽中的不同位置進行加權(quán)計算,得到正則原子在文檔中的相似度。通過空間向量模型對文檔相似度和主題模型進行余弦運算,從而獲取最終的搜索結(jié)果。最后,將改進的TF-IDF算法、傳統(tǒng)的TF-IDF算法、K-means算法和自適應(yīng)遺傳算法運用于聚焦主題網(wǎng)絡(luò)爬蟲中,對其檢索結(jié)果進行了對比分析。計算結(jié)果表明,在聚焦主題網(wǎng)絡(luò)爬蟲語義分析的垂直搜索中,改進TF-IDF算法的相似度準(zhǔn)確率比傳統(tǒng)的TF-IDF算法檢索準(zhǔn)確率提高了17.1個百分點,遺漏率降低了7.76個百分點;比K-means算法檢索準(zhǔn)確率提高6個百分點;比自適應(yīng)遺傳算法檢索準(zhǔn)確率提高了8.1個百分點??傊?,改進的TF-IDF算法可以有效地提高文檔相似度檢測的準(zhǔn)確率,很好地改善聚焦主題網(wǎng)絡(luò)爬蟲在語義分析中的缺陷。

TF-IDF算法的改進及在語義檢索中應(yīng)用

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價:好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關(guān)規(guī)定!

      ?
      桐庐县| 东海县| 周宁县| 修水县| 樟树市| 西乌珠穆沁旗| 海晏县| 琼海市| 六安市| SHOW| 祥云县| 霍邱县| 青铜峡市| 祁阳县| 兰西县| 习水县| 石狮市| 武定县| 绥中县| 新龙县| 阿拉善右旗| 共和县| 南汇区| 盐亭县| 宣化县| 临沂市| 清涧县| 盐山县| 安远县| 宜州市| 同仁县| 阜城县| 金乡县| 普格县| 新乐市| 蓬莱市| 绵阳市| 延川县| 房山区| 集安市| 铜陵市|