什么是sklearn
Sklearn原稱(chēng)是Scikit learn,是機(jī)器學(xué)習(xí)領(lǐng)域中最知名的python模塊之一,是基于Python語(yǔ)言的機(jī)器學(xué)習(xí)的工具。他主要建立在NumPy,SciPy,matplotlib之上,提供簡(jiǎn)單高效,用于數(shù)據(jù)挖掘,數(shù)據(jù)分析等的工具,最重要的是,他是開(kāi)源的,基于BSD許可證,可以商業(yè)使用。這樣子,就給了我們無(wú)限的想象。
sklearn與tensorflow優(yōu)劣勢(shì)
目前,在社區(qū)中,tensorflow會(huì)比較火,很多同學(xué)會(huì)問(wèn),為什么不用tensorflow,這兩個(gè)有什么區(qū)別,我想,主要從以下這方面來(lái)做對(duì)比
1、sklearn主要定位是一種通用的機(jī)器學(xué)習(xí)的學(xué)習(xí)庫(kù),tf主要定位還是深度學(xué)習(xí)。
2、特征工程上,sklearn提供了例如維度壓縮、特征選擇等,但是這樣子并不代表這tf就比sklearn弱。在傳統(tǒng)的機(jī)器學(xué)習(xí)中,sklearn需要使用者自行對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)處理,例如進(jìn)行特征選擇,維度壓縮,轉(zhuǎn)換格式等,但是tf可以在開(kāi)始進(jìn)行數(shù)據(jù)訓(xùn)練的過(guò)程中,自行從數(shù)據(jù)中提取有效的特征,從而減少人為的干預(yù)。
3、易用性及封裝度上,sklearn更高,這點(diǎn)上,我想很多用過(guò)的人都清楚,不做累贅描述。
4、面對(duì)項(xiàng)目的不同,sklearn更適合中小型,特別是數(shù)據(jù)量不大的項(xiàng)目,此時(shí)更需要手動(dòng)者對(duì)數(shù)據(jù)進(jìn)行處理,并且選擇合適模型的項(xiàng)目,這些計(jì)算是可以在CPU直接計(jì)算的,沒(méi)有什么硬件要求。相對(duì)的,tf的應(yīng)用領(lǐng)域上,往往更加注重?cái)?shù)據(jù)量較大,一般情況下需要GPU進(jìn)行加速運(yùn)算。目前很多公司并沒(méi)有很大量的數(shù)據(jù),在選擇上,可以作為參考。
機(jī)器學(xué)習(xí)有幾種方式
針對(duì)sklearn來(lái)講,經(jīng)常用到的主要有:數(shù)據(jù)預(yù)處理、分類(lèi)、回歸、分監(jiān)督分類(lèi)(聚類(lèi)),模型選擇,數(shù)據(jù)降維
應(yīng)用領(lǐng)域有哪些
目前,sklearn在應(yīng)用中,主要有四類(lèi)算法:聚類(lèi),分類(lèi),回歸,降維
聚類(lèi):即非監(jiān)督學(xué)習(xí)的方式,例如我有一堆人,這堆數(shù)據(jù)是沒(méi)有男孩或者女孩這些標(biāo)簽的,此時(shí)我需要給這堆數(shù)據(jù)進(jìn)行聚類(lèi),根據(jù)一些身體特征,分成兩類(lèi),并標(biāo)記為男孩,女孩。
分類(lèi)/回歸:監(jiān)督學(xué)習(xí)的方式,還是那堆人,但是已經(jīng)分好類(lèi)了,男孩,女孩,此時(shí)來(lái)了一個(gè)新人,我根據(jù)這個(gè)新人的特征,給他歸類(lèi)。
降維:如果按照字面意思來(lái)理解,那就有問(wèn)題,當(dāng)數(shù)據(jù)集有很多屬性的時(shí)候,我們此時(shí)需要把100個(gè)屬性變成10個(gè),并不是挑出10個(gè),而是壓縮成10個(gè),這10個(gè)屬性,就集合了100個(gè)屬性特征,簡(jiǎn)單理解,就是重要的特征就拿起來(lái),不重要的就吸收了。
至此結(jié)束,在下一章節(jié)中,我們將會(huì)介紹怎么來(lái)開(kāi)發(fā)一個(gè)機(jī)器學(xué)習(xí)應(yīng)用。
-
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
67文章
8564瀏覽量
137221 -
tensorflow
+關(guān)注
關(guān)注
13文章
336瀏覽量
62371 -
sklearn
+關(guān)注
關(guān)注
0文章
2瀏覽量
3546
發(fā)布評(píng)論請(qǐng)先 登錄
PSLC模式SD NAND(存儲(chǔ)卡)解析:穩(wěn)定性、優(yōu)劣勢(shì)及市場(chǎng)前景
在MCU方面,能不能給出芯源的MCU與主流的MCU之前的對(duì)比,包括優(yōu)劣勢(shì)、替換狀態(tài)等?
快充電流檢測(cè)芯片全面橫評(píng) TI INA199 SGM8199 FP130A的優(yōu)劣勢(shì)解析#電流檢測(cè)放大器
CS創(chuàng)世SD NAND與TF卡的區(qū)別有什么優(yōu)劣勢(shì)#硬件 #TF卡 #貼片式tf卡 #SDNAND #存儲(chǔ)
無(wú)功補(bǔ)償策略優(yōu)劣勢(shì)分析—高采低補(bǔ)與空載直補(bǔ)
無(wú)功補(bǔ)償策略優(yōu)劣勢(shì)分析—高采低補(bǔ)與空載直補(bǔ)
GaN(氮化鎵)與硅基功放芯片的優(yōu)劣勢(shì)解析及常見(jiàn)型號(hào)
DC/DC 與 AC/DC:技術(shù)原理、應(yīng)用場(chǎng)景及優(yōu)劣勢(shì)全解析
無(wú)功補(bǔ)償策略優(yōu)劣勢(shì)分析——高采低補(bǔ)與空載直補(bǔ)
固態(tài)電容和電解電容的優(yōu)劣勢(shì)對(duì)比,怎么選?
碳化硅襯底 TTV 厚度測(cè)量方法的優(yōu)劣勢(shì)對(duì)比評(píng)測(cè)
集成式網(wǎng)絡(luò)變壓器優(yōu)劣勢(shì)
工業(yè)網(wǎng)關(guān)與工業(yè)電腦的優(yōu)劣勢(shì)在哪
晶圓級(jí)封裝技術(shù)的概念和優(yōu)劣勢(shì)
sklearn與tensorflow優(yōu)劣勢(shì)
評(píng)論