哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Python機(jī)器學(xué)習(xí)庫談Scikit-learn技術(shù)

深度學(xué)習(xí)自然語言處理 ? 來源:NewBeeNLP公眾號(hào) ? 作者:Rebecca Vickery ? 2020-08-27 17:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Scikit-learn是使用最廣泛的Python機(jī)器學(xué)習(xí)庫之一。它有標(biāo)準(zhǔn)化和簡(jiǎn)單的接口,用于數(shù)據(jù)預(yù)處理和模型訓(xùn)練、優(yōu)化以及評(píng)估。

這個(gè)項(xiàng)目最初是由David Cournapeau 開發(fā)的Google Summer of Code 項(xiàng)目,并于2010年首次公開發(fā)布。自創(chuàng)建以來,該庫已經(jīng)發(fā)展成為一個(gè)豐富的生態(tài)系統(tǒng),用于開發(fā)機(jī)器學(xué)習(xí)模型。隨著時(shí)間的推移,該項(xiàng)目開發(fā)了許多方便的功能,以增強(qiáng)其易用性。在本文中,我將介紹你可能不知道的10個(gè)關(guān)于Scikit-learn最有用的特性。

1. 內(nèi)置數(shù)據(jù)集

Scikit-learn API內(nèi)置了各種toy和real-world數(shù)據(jù)集[1]。這些可以便捷地通過一行代碼訪問,如果你正在學(xué)習(xí)或只是想快速嘗試新功能,這會(huì)非常有用。

你還可以使用make_regression()、make_blobs()和make_classification()生成合成數(shù)據(jù)集。所有加載實(shí)用程序都提供了返回已拆分為X(特征)和y(目標(biāo))的數(shù)據(jù)選項(xiàng),以便它們可以直接用于訓(xùn)練模型。

2. 獲取公開數(shù)據(jù)集

如果你想直接通過Scikit-learn訪問更多的公共可用數(shù)據(jù)集,請(qǐng)了解,有一個(gè)方便的函數(shù)datasets.fetch_openml,可以讓您直接從openml.org網(wǎng)站[2]獲取數(shù)據(jù)。這個(gè)網(wǎng)站包含超過21000個(gè)不同的數(shù)據(jù)集,可以用于機(jī)器學(xué)習(xí)項(xiàng)目。

3. 內(nèi)置分類器來訓(xùn)練baseline

在為項(xiàng)目開發(fā)機(jī)器學(xué)習(xí)模型時(shí),首先創(chuàng)建一個(gè)baseline模型是非常有必要的。這個(gè)模型在本質(zhì)上應(yīng)該是一個(gè)“dummy”模型,比如一個(gè)總是預(yù)測(cè)最頻繁出現(xiàn)的類的模型。這就提供了一個(gè)基準(zhǔn),用來對(duì)你的“智能”模型進(jìn)行基準(zhǔn)測(cè)試,這樣你就可以確保它的性能比隨機(jī)結(jié)果更好。

Scikit learn包括用于分類任務(wù)的DummyClassifier() 和用于基于回歸問題的 DummyRegressor()。

4. 內(nèi)置繪圖api

Scikit learn有一個(gè)內(nèi)置的繪圖API,允許你在不導(dǎo)入任何其他庫的情況下可視化模型性能。包括以下繪圖:部分相關(guān)圖、混淆矩陣、精確召回曲線和ROC曲線。

5. 內(nèi)置特征選擇方法

提高模型性能的一種技術(shù)是只使用最好的特征集或通過刪除冗余特征來訓(xùn)練模型。這個(gè)過程稱為特征選擇。

Scikit learn有許多函數(shù)來執(zhí)行特征選擇。一個(gè)示例為 SelectPercentile(),該方法根據(jù)所選的統(tǒng)計(jì)方法選擇性能最好的X百分位特征進(jìn)行評(píng)分。

6. 機(jī)器學(xué)習(xí)pipeline

除了為機(jī)器學(xué)習(xí)提供廣泛的算法外,Scikit learn還具有一系列用于「預(yù)處理」「轉(zhuǎn)換數(shù)據(jù)」的功能。為了促進(jìn)機(jī)器學(xué)習(xí)工作流程的再現(xiàn)性和簡(jiǎn)單性,Scikit learn創(chuàng)建了管道(pipeline),允許將大量預(yù)處理步驟與模型訓(xùn)練階段鏈接在一起。

管道將工作流中的所有步驟存儲(chǔ)為單個(gè)實(shí)體,可以通過「fit」「predict」方法調(diào)用該實(shí)體。在管道對(duì)象上調(diào)用fit方法時(shí),預(yù)處理步驟和模型訓(xùn)練將自動(dòng)執(zhí)行。

7. ColumnTransformer

在許多數(shù)據(jù)集中,你將擁有不同類型的特征,需要應(yīng)用不同的預(yù)處理步驟。例如,可能有分類數(shù)據(jù)和連續(xù)數(shù)據(jù)的混合,你可能希望通過one-hot編碼將分類數(shù)據(jù)轉(zhuǎn)換為數(shù)字,并縮放數(shù)字變量。

Scikit-learn管道有一個(gè)名為ColumnTransformer的函數(shù),它允許你通過索引或指定列名來輕松指定要對(duì)哪些列應(yīng)用最適當(dāng)?shù)念A(yù)處理。

8. 管道的HTML形式

管道通常會(huì)變得非常復(fù)雜,尤其是在處理真實(shí)世界的數(shù)據(jù)時(shí)。因此,scikit-learn提供了一種方法來輸出管道中步驟的HTML圖表[3],非常方便。

9. 可視化 樹模型

plot_tree() 函數(shù)允許你創(chuàng)建決策樹模型中的步驟圖。

10. 豐富的第三方擴(kuò)展

許多第三方庫可以更好地?cái)U(kuò)展scikit-learn的特性。舉個(gè)栗子,category-encoders庫,它為分類特性提供了更大范圍的預(yù)處理方法,以及ELI5包以實(shí)現(xiàn)更大的模型可解釋性。這兩個(gè)包也可以直接在Scikit-learn管道中使用。

本文參考資料

[1]toy和real-world數(shù)據(jù)集: https://scikit-learn.org/stable/datasets/index.html

[2]openml.org網(wǎng)站: https://www.openml.org/home

[3]HTML圖表: https://scikit-learn.org/stable/modules/compose.html#visualizing-composite-estimators

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    67

    文章

    8561

    瀏覽量

    137208
  • python
    +關(guān)注

    關(guān)注

    58

    文章

    4882

    瀏覽量

    90290

原文標(biāo)題:關(guān)于Scikit-Learn你(也許)不知道的10件事

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    強(qiáng)強(qiáng)聯(lián)合:imc FAMOS內(nèi)嵌Python接口,提高分析效率!

    語言,在以下方面非常強(qiáng)大:提供數(shù)學(xué)、云連接、機(jī)器學(xué)習(xí)和您幾乎能想到的所有數(shù)據(jù)選擇高性能處理大數(shù)據(jù)自動(dòng)生成報(bào)告(如在MicrosoftWord中)imcFAMOS作
    的頭像 發(fā)表于 03-18 09:05 ?456次閱讀
    強(qiáng)強(qiáng)聯(lián)合:imc FAMOS內(nèi)嵌<b class='flag-5'>Python</b>接口,提高分析效率!

    如何在 Vision Five 2 上安裝 python

    這可能是一個(gè)完全愚蠢的問題,但我如何在 Vision Five 2 上安裝 python 。 使用該命令后,它給了我這個(gè)錯(cuò)誤。 默認(rèn)為用戶安裝,因?yàn)槠胀ㄕ军c(diǎn)包不可寫 錯(cuò)誤:找不到滿足要求
    發(fā)表于 03-06 07:51

    算法工程師需要具備哪些技能?

    開發(fā)(如NumPy、Pandas、Scikit-learn)。C++/Java:高性能場(chǎng)景(如大規(guī)模矩陣運(yùn)算、分布式系統(tǒng)開發(fā))。 開發(fā)工具Linux命令行:文件操作、進(jìn)程管理、日志分析等。Shell腳本
    發(fā)表于 02-27 10:53

    無法去除 Python VisionFive.i2c 的終端輸出?

    燒的官方最新八月份的 debian 12 的系統(tǒng)。 根據(jù)這個(gè)案例安裝好了 python 環(huán)境和 VisionFive 。 執(zhí)行下面這條代碼: import VisionFive.i2c
    發(fā)表于 02-25 06:13

    人工智能與機(jī)器學(xué)習(xí)在這些行業(yè)的深度應(yīng)用

    自人工智能和機(jī)器學(xué)習(xí)問世以來,多個(gè)在線領(lǐng)域的數(shù)字化格局迎來了翻天覆地的變化。這些技術(shù)從誕生之初就為企業(yè)賦予了競(jìng)爭(zhēng)優(yōu)勢(shì),而在線行業(yè)正是受其影響最為顯著的領(lǐng)域。人工智能(AI)與機(jī)器
    的頭像 發(fā)表于 02-04 14:44 ?655次閱讀

    AGV機(jī)器人如何精準(zhǔn)識(shí)別位有無貨物?

    AGV機(jī)器人如何精準(zhǔn)判斷位狀態(tài)?激光傳感器、視覺識(shí)別和壓力傳感器三大技術(shù)協(xié)同作戰(zhàn):激光測(cè)距穿透空位,視覺捕捉貨物特征,壓力感知重量變化,多技術(shù)
    的頭像 發(fā)表于 01-13 17:03 ?702次閱讀
    AGV<b class='flag-5'>機(jī)器</b>人如何精準(zhǔn)識(shí)別<b class='flag-5'>庫</b>位有無貨物?

    CIE全國(guó)RISC-V創(chuàng)新應(yīng)用大賽 人臉識(shí)別系統(tǒng)介紹與移植

    、scikit-learn 等依賴的編譯需求,執(zhí)行以下命令(需管理員權(quán)限): 打開命令行,不要進(jìn)入venv環(huán)境,直接輸入: sudo apt update && sudo apt
    發(fā)表于 11-08 11:19

    一文了解Mojo編程語言

    Mojo 語言的具體介紹: 核心特點(diǎn) Python 兼容性 Mojo 支持大部分 Python 語法和標(biāo)準(zhǔn),可直接調(diào)用 Python 生態(tài)系統(tǒng)中的
    發(fā)表于 11-07 05:59

    Python調(diào)用API教程

    兩個(gè)不同系統(tǒng)之間的信息交互。在這篇文章中,我們將詳細(xì)介紹Python調(diào)用API的方法和技巧。 一、用Requests發(fā)送HTTP請(qǐng)求 使用Python調(diào)用API的第一步是發(fā)送HTTP請(qǐng)求,通常
    的頭像 發(fā)表于 11-03 09:15 ?1150次閱讀

    貿(mào)澤電子2025邊緣AI與機(jī)器學(xué)習(xí)技術(shù)創(chuàng)新論壇回顧(上)

    2025年,隨著人工智能技術(shù)的快速發(fā)展,邊緣AI與機(jī)器學(xué)習(xí)市場(chǎng)迎來飛速增長(zhǎng),據(jù)Gartner預(yù)計(jì),2025年至2030年,邊緣AI市場(chǎng)將保持23%的復(fù)合年增長(zhǎng)率。
    的頭像 發(fā)表于 07-21 11:08 ?1306次閱讀
    貿(mào)澤電子2025邊緣AI與<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>技術(shù)</b>創(chuàng)新論壇回顧(上)

    linux虛擬環(huán)境中調(diào)用Linux 版matlab編譯的python時(shí)出錯(cuò)

    matlab代碼編譯為CAO_pythonpython,其中cp_Main_python.m為入口文件,編譯后生成的文件有mccExcludedFiles.log、setup.py
    發(fā)表于 07-18 10:40

    FPGA在機(jī)器學(xué)習(xí)中的具體應(yīng)用

    隨著機(jī)器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場(chǎng)可編程門陣列)作為一種靈活且高效的硬件加速平臺(tái)
    的頭像 發(fā)表于 07-16 15:34 ?3069次閱讀

    基于米爾瑞芯微RK3576開發(fā)板的創(chuàng)建機(jī)器學(xué)習(xí)環(huán)境方案

    】 【米爾-瑞芯微RK3576核心板及開發(fā)板】具有6TpsNPU以及GPU,因此是學(xué)習(xí)機(jī)器學(xué)習(xí)的好環(huán)境,為此結(jié)合《深度學(xué)習(xí)的數(shù)學(xué)——使用Python語言》 1、使用vscode 連接遠(yuǎn)
    發(fā)表于 06-27 11:33

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】機(jī)器人入門的引路書

    的限制和調(diào)控) 本書還有很多前沿技術(shù)項(xiàng)目的擴(kuò)展 比如神經(jīng)網(wǎng)絡(luò)識(shí)別例程,機(jī)器學(xué)習(xí)圖像識(shí)別的原理,yolo圖像追蹤的原理 機(jī)器學(xué)習(xí)訓(xùn)練三大點(diǎn):
    發(fā)表于 04-30 01:05

    NanoEdge AI Studio 面向STM32開發(fā)人員機(jī)器學(xué)習(xí)(ML)技術(shù)

    NanoEdge? AI Studio*(NanoEdgeAIStudio)是一種新型機(jī)器學(xué)習(xí)(ML)技術(shù),可以讓終端用戶輕松享有真正的創(chuàng)新成果。只需幾步,開發(fā)人員便可基于最少量的數(shù)據(jù)為其項(xiàng)目創(chuàng)建
    的頭像 發(fā)表于 04-22 11:09 ?1522次閱讀
    NanoEdge AI Studio 面向STM32開發(fā)人員<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>(ML)<b class='flag-5'>技術(shù)</b>
    沙洋县| 梁河县| 特克斯县| 介休市| 包头市| 苗栗市| 水富县| 汝南县| 高碑店市| 卓资县| 宣威市| 万载县| 河北省| 措美县| 蒙城县| 宽甸| 安乡县| 乾安县| 周至县| 闽侯县| 潞西市| 盖州市| 犍为县| 乡宁县| 淮阳县| 阿图什市| 濮阳县| 乐东| 宜城市| 拜城县| 曲阜市| 思南县| 西城区| 兰西县| 舞阳县| 潼南县| 平乡县| 修水县| 信宜市| 楚雄市| 维西|