哈哈哈哈哈操欧洲电影,久草网在线,亚洲久久熟女熟妇视频,麻豆精品色,久久福利在线视频,日韩中文字幕的,淫乱毛视频一区,亚洲成人一二三,中文人妻日韩精品电影

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一文帶你快速讀懂支持向量機 SVM 算法

h1654155999.2342 ? 來源:博客園 ? 作者: JerryLead ? 2021-08-26 15:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

簡介

支持向量機基本上是最好的有監(jiān)督學習算法了。最開始接觸SVM是去年暑假的時候,老師要求交《統(tǒng)計學習理論》的報告,那時去網上下了一份入門教程,里面講的很通俗,當時只是大致了解了一些相關概念。

這次斯坦福提供的學習材料,讓我重新學習了一些SVM知識。我看很多正統(tǒng)的講法都是從VC 維理論和結構風險最小原理出發(fā),然后引出SVM什么的,還有些資料上來就講分類超平面什么的。

這份材料從前幾節(jié)講的logistic回歸出發(fā),引出了SVM,既揭示了模型間的聯系,也讓人覺得過渡更自然。

重新審視logistic回歸

Logistic回歸目的是從特征學習出一個0/1分類模型,而這個模型是將特性的線性組合作為自變量,由于自變量的取值范圍是負無窮到正無窮。

因此,使用logistic函數(或稱作sigmoid函數)將自變量映射到(0,1)上,映射后的值被認為是屬于y=1的概率。

形式化表示就是

假設函數

aa5ecf14-f846-11eb-9bcf-12bb97331649.png

其中x是n維特征向量,函數g就是logistic函數。

aa77a2dc-f846-11eb-9bcf-12bb97331649.png的圖像是

aa93046e-f846-11eb-9bcf-12bb97331649.png

可以看到,將無窮映射到了(0,1)。

而假設函數就是特征屬于y=1的概率。

aabd24d8-f846-11eb-9bcf-12bb97331649.png

當我們要判別一個新來的特征屬于哪個類時,只需求aaeb088a-f846-11eb-9bcf-12bb97331649.png,若大于0.5就是y=1的類,反之屬于y=0類。

再審視一下aaeb088a-f846-11eb-9bcf-12bb97331649.png,發(fā)現aaeb088a-f846-11eb-9bcf-12bb97331649.png只和ab32d732-f846-11eb-9bcf-12bb97331649.png有關,ab32d732-f846-11eb-9bcf-12bb97331649.png>0,那么ab60cbce-f846-11eb-9bcf-12bb97331649.png,g(z)只不過是用來映射,真實的類別決定權還在ab32d732-f846-11eb-9bcf-12bb97331649.png。還有當ab869638-f846-11eb-9bcf-12bb97331649.png時,aaeb088a-f846-11eb-9bcf-12bb97331649.png=1,反之aaeb088a-f846-11eb-9bcf-12bb97331649.png=0。

如果我們只從ab32d732-f846-11eb-9bcf-12bb97331649.png出發(fā),希望模型達到的目標無非就是讓訓練數據中y=1的特征ab869638-f846-11eb-9bcf-12bb97331649.png,而是y=0的特征abd0d748-f846-11eb-9bcf-12bb97331649.png。

Logistic回歸就是要學習得到abef8eea-f846-11eb-9bcf-12bb97331649.png,使得正例的特征遠大于0,負例的特征遠小于0,強調在全部訓練實例上達到這個目標。

圖形化表示如下:

ac0c8c5c-f846-11eb-9bcf-12bb97331649.png

中間那條線是ac2780c0-f846-11eb-9bcf-12bb97331649.png,logistic回顧強調所有點盡可能地遠離中間那條線。學習出的結果也就中間那條線。

考慮上面3個點A、B和C。從圖中我們可以確定A是×類別的,然而C我們是不太確定的,B還算能夠確定。這樣我們可以得出結論,我們更應該關心靠近中間分割線的點,讓他們盡可能地遠離中間線,而不是在所有點上達到最優(yōu)。

因為那樣的話,要使得一部分點靠近中間線來換取另外一部分點更加遠離中間線。我想這就是支持向量機的思路和logistic回歸的不同點,一個考慮局部(不關心已經確定遠離的點),一個考慮全局(已經遠離的點可能通過調整中間線使其能夠更加遠離)。這是我的個人直觀理解。

形式化表示

我們這次使用的結果標簽是y=-1,y=1,替換在logistic回歸中使用的y=0和y=1。同時將abef8eea-f846-11eb-9bcf-12bb97331649.png替換成w和b。

以前的ac5a1a08-f846-11eb-9bcf-12bb97331649.png,其中認為ac8034f4-f846-11eb-9bcf-12bb97331649.png。現在我們替換aca11cfa-f846-11eb-9bcf-12bb97331649.png為b,后面替換acbfbaf2-f846-11eb-9bcf-12bb97331649.pngacdc3b1e-f846-11eb-9bcf-12bb97331649.png(即ad0adbea-f846-11eb-9bcf-12bb97331649.png)。這樣,我們讓ad2249ce-f846-11eb-9bcf-12bb97331649.png,進一步ad4341e2-f846-11eb-9bcf-12bb97331649.png。

也就是說除了y由y=0變?yōu)閥=-1,只是標記不同外,與logistic回歸的形式化表示沒區(qū)別。再明確下假設函數

ad715730-f846-11eb-9bcf-12bb97331649.png

上一節(jié)提到過我們只需考慮ab32d732-f846-11eb-9bcf-12bb97331649.png的正負問題,而不用關心g(z),因此我們這里將g(z)做一個簡化,將其簡單映射到y(tǒng)=-1和y=1上。映射關系如下:

ad98c93c-f846-11eb-9bcf-12bb97331649.png

函數間隔(functional margin)和幾何間隔(geometric margin)

給定一個訓練樣本adb55e08-f846-11eb-9bcf-12bb97331649.png,x是特征,y是結果標簽。i表示第i個樣本。我們定義函數間隔如下:

addd8388-f846-11eb-9bcf-12bb97331649.png

可想而知,當ae151190-f846-11eb-9bcf-12bb97331649.png時,在我們的g(z)定義中,ae30ac84-f846-11eb-9bcf-12bb97331649.png,ae4fc01a-f846-11eb-9bcf-12bb97331649.png的值實際上就是ae6752b6-f846-11eb-9bcf-12bb97331649.png。反之亦然。

為了使函數間隔最大(更大的信心確定該例是正例還是反例),當ae151190-f846-11eb-9bcf-12bb97331649.png時,ae8e9f6a-f846-11eb-9bcf-12bb97331649.png應該是個大正數,反之是個大負數。因此函數間隔代表了我們認為特征是正例還是反例的確信度。

繼續(xù)考慮w和b,如果同時加大w和b,比如在aeac850c-f846-11eb-9bcf-12bb97331649.png前面乘個系數比如2,那么所有點的函數間隔都會增大二倍,這個對求解問題來說不應該有影響,因為我們要求解的是aec9ada8-f846-11eb-9bcf-12bb97331649.png,同時擴大w和b對結果是無影響的。

這樣,我們?yōu)榱讼拗苭和b,可能需要加入歸一化條件,畢竟求解的目標是確定唯一一個w和b,而不是多組線性相關的向量。這個歸一化一會再考慮。

剛剛我們定義的函數間隔是針對某一個樣本的,現在我們定義全局樣本上的函數間隔

aee7afba-f846-11eb-9bcf-12bb97331649.png

說白了就是在訓練樣本上分類正例和負例確信度最小那個函數間隔。

接下來定義幾何間隔

假設我們有了B點所在的aec9ada8-f846-11eb-9bcf-12bb97331649.png分割面。任何其他一點,比如A到該面的距離以af54e79c-f846-11eb-9bcf-12bb97331649.png表示,假設B就是A在分割面上的投影。

我們知道向量BA的方向是af7d4476-f846-11eb-9bcf-12bb97331649.png(分割面的梯度),單位向量是afb3cdac-f846-11eb-9bcf-12bb97331649.png。A點是adb55e08-f846-11eb-9bcf-12bb97331649.png,所以B點是x=afdf28bc-f846-11eb-9bcf-12bb97331649.png(利用初中的幾何知識),帶入aec9ada8-f846-11eb-9bcf-12bb97331649.png得,

進一步得到

b02d5640-f846-11eb-9bcf-12bb97331649.png

af54e79c-f846-11eb-9bcf-12bb97331649.png實際上就是點到平面距離。

再換種更加優(yōu)雅的寫法:

b057aa76-f846-11eb-9bcf-12bb97331649.png

b075fd32-f846-11eb-9bcf-12bb97331649.png時,不就是函數間隔嗎?是的,前面提到的函數間隔歸一化結果就是幾何間隔。

他們?yōu)槭裁磿粯幽??因為函數間隔是我們定義的,在定義的時候就有幾何間隔的色彩。同樣,同時擴大w和b,w擴大幾倍,b09437e8-f846-11eb-9bcf-12bb97331649.png就擴大幾倍,結果無影響。同樣定義全局的幾何間隔b0b3917e-f846-11eb-9bcf-12bb97331649.png

最優(yōu)間隔分類器(optimal margin classifier)

回想前面我們提到我們的目標是尋找一個超平面,使得離超平面比較近的點能有更大的間距。也就是我們不考慮所有的點都必須遠離超平面,我們關心求得的超平面能夠讓所有點中離它最近的點具有最大間距。

形象的說,我們將上面的圖看作是一張紙,我們要找一條折線,按照這條折線折疊后,離折線最近的點的間距比其他折線都要大。形式化表示為:

b0ce205c-f846-11eb-9bcf-12bb97331649.png

這里用b09437e8-f846-11eb-9bcf-12bb97331649.png=1規(guī)約w,使得b0f630a6-f846-11eb-9bcf-12bb97331649.png是幾何間隔。

到此,我們已經將模型定義出來了。如果求得了w和b,那么來一個特征x,我們就能夠分類了,稱為最優(yōu)間隔分類器。接下的問題就是如何求解w和b的問題了。

由于b112b91a-f846-11eb-9bcf-12bb97331649.png不是凸函數,我們想先處理轉化一下,考慮幾何間隔和函數間隔的關系,b12f9620-f846-11eb-9bcf-12bb97331649.png,我們改寫一下上面的式子:

b149fb8c-f846-11eb-9bcf-12bb97331649.png

這時候其實我們求的最大值仍然是幾何間隔,只不過此時的w不受b112b91a-f846-11eb-9bcf-12bb97331649.png的約束了。然而這個時候目標函數仍然不是凸函數,沒法直接代入優(yōu)化軟件里計算。我們還要改寫。

前面說到同時擴大w和b對結果沒有影響,但我們最后要求的仍然是w和b的確定值,不是他們的一組倍數值,因此,我們需要對b1b4ebd6-f846-11eb-9bcf-12bb97331649.png做一些限制,以保證我們解是唯一的。

這里為了簡便我們取b1d495d0-f846-11eb-9bcf-12bb97331649.png。這樣的意義是將全局的函數間隔定義為1,也即是將離超平面最近的點的距離定義為b1ed6cc2-f846-11eb-9bcf-12bb97331649.png。由于求b1ed6cc2-f846-11eb-9bcf-12bb97331649.png的最大值相當于求b21a0b6a-f846-11eb-9bcf-12bb97331649.png的最小值,因此改寫后結果為:

b23844cc-f846-11eb-9bcf-12bb97331649.png

這下好了,只有線性約束了,而且是個典型的二次規(guī)劃問題(目標函數是自變量的二次函數)。代入優(yōu)化軟件可解。

到這里發(fā)現,這個講義雖然沒有像其他講義一樣先畫好圖,畫好分類超平面,在圖上標示出間隔那么直觀,但每一步推導有理有據,依靠思路的流暢性來推導出目標函數和約束。

—版權聲明—

僅用于學術分享,版權屬于原作者。

若有侵權,請聯系 刪除或修改!

轉自:JerryLead

http://www.cnblogs.com/jerrylead/archive/2011/03/13/1982639.html

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4805

    瀏覽量

    98555
  • 向量機
    +關注

    關注

    0

    文章

    166

    瀏覽量

    21721
  • SVM
    SVM
    +關注

    關注

    0

    文章

    154

    瀏覽量

    33730

原文標題:優(yōu)雅的讀懂支持向量機 SVM 算法

文章出處:【微信號:gh_f39db674fbfd,微信公眾號:尖刀視】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    全自動劃片與半自動劃片怎么選?讀懂選型關鍵

    全自動劃片與半自動劃片怎么選?讀懂選型關鍵在半導體封裝、LED制造、光伏電池加工等精密加工領域,劃片
    的頭像 發(fā)表于 03-16 20:54 ?529次閱讀
    全自動劃片<b class='flag-5'>機</b>與半自動劃片<b class='flag-5'>機</b>怎么選?<b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>選型關鍵

    無線通信的“隱形骨架”:讀懂OSI七層模型

    帶你快速理解OSI七層的核心思想——分層。從物理層到應用層,每層負責什么?為什么說它是網絡通信的“圣經”?如何用它來排查網絡故障?
    的頭像 發(fā)表于 03-16 09:41 ?418次閱讀
    無線通信的“隱形骨架”:<b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>OSI七層模型

    讀懂VCSEL芯片為何與眾不同

    VCSEL芯片是如何誕生的?是德科技帶你走進慧芯激光產業(yè)園探究竟!
    的頭像 發(fā)表于 01-09 14:19 ?854次閱讀

    搞清 BLE 藍牙 UUID

    帶你搞清楚藍牙 UUID ...... 矜辰所致
    的頭像 發(fā)表于 12-18 11:23 ?4870次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b>搞清 BLE 藍牙 UUID

    帶你讀懂“脈沖輸入輸出模塊”

    在自動化生產的世界里,傳感器、執(zhí)行器、控制器每天都在“對話”??蓡栴}是,它們說的語言千奇百怪——有的輸出電壓信號,有的傳輸電流信號,還有的發(fā)出連串高速脈沖。如果沒有“翻譯官”,系統(tǒng)就亂了套。 而
    的頭像 發(fā)表于 11-24 17:10 ?1226次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>帶你</b><b class='flag-5'>讀懂</b>“脈沖輸入輸出模塊”

    如何快速讀懂三星貼片電容規(guī)格書?

    快速讀懂三星貼片電容規(guī)格書,可從封裝尺寸、容量、電壓、精度、溫度系數、其他參數及命名規(guī)則等方面入手,以下為具體分析: 1、封裝尺寸 :三星貼片電容的封裝尺寸多樣,常見的有0201、0402
    的頭像 發(fā)表于 11-11 16:10 ?808次閱讀

    漢威科技推動養(yǎng)老機構智慧消防建設

    養(yǎng)老市場持續(xù)增長,而養(yǎng)老機構消防建設水平滯后,矛盾之下如何破局?漢威科技帶你讀懂。
    的頭像 發(fā)表于 11-10 17:23 ?1375次閱讀

    SM4算法實現分享(算法原理

    對明文進行分組加密變換。SM4加密算法由32次迭代運算和次反序變換R組成。 設輸入明文為(X0,X 1,X 2,X 3),共128位,設密輸出為(Y0,Y 1,Y 2,Y 3),輪密鑰為rki
    發(fā)表于 10-30 08:10

    使用MATLAB的支持向量解決方案

    支持向量 (SVM) 是種有監(jiān)督機器學習算法,它能找到分離兩個類的數據點的最佳超平面。
    的頭像 發(fā)表于 10-21 15:00 ?767次閱讀
    使用MATLAB的<b class='flag-5'>支持</b><b class='flag-5'>向量</b><b class='flag-5'>機</b>解決方案

    網絡路由器關鍵知識,讀懂!

    在互聯網深度融入日常的今天,網絡路由器作為不可或缺的樞紐設備,承擔著連接世界的關鍵任務。但你真正了解它嗎?本文將帶你系統(tǒng)認識路由器的基礎功能、發(fā)展歷程與常見接口,幫助你更好地理解和使用這設備。
    的頭像 發(fā)表于 09-19 18:10 ?1719次閱讀

    讀懂計量型三坐標測量

    個工件的關鍵尺寸都可控、可追溯。精度溯源:為什么是”計量型“?計量型三坐標測量與生產設備的本質區(qū)別,在于其從材料到結構的全鏈條精度設計。這類設備的測量不確定通
    的頭像 發(fā)表于 09-18 13:35 ?2117次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>計量型三坐標測量<b class='flag-5'>機</b>

    讀懂:CWDM和DWDM的核心差異

    光纖通信里的“兩兄弟”CWDM和DWDM,名字只差個字母,差別可大了去!今天講透核心差異,小易幫你快速分清~
    的頭像 發(fā)表于 09-17 18:19 ?1425次閱讀
    <b class='flag-5'>一</b><b class='flag-5'>文</b><b class='flag-5'>讀懂</b>:CWDM和DWDM的核心差異

    讀懂 PWM控制背光亮度原理

    關于PWM控制背光亮度原理的詳細介紹 讀懂PWM調光:為何你的屏幕亮度可隨心而變? 你是否曾好奇,手機或電腦屏幕的亮度是如何從最暗無級調整到最亮的?這背后的魔法,主要歸功于項名為
    發(fā)表于 09-03 08:48

    快速讀懂麥科信MOIP系列光隔離探頭

    ,滿足多樣化測試需求? 探頭支持0dB(1X)與20dB(100mX)檔位快速切換,并可通過搭配不同規(guī)格衰減器,實現從±0.01V至±6250V的寬范圍差模信號測量,且在全量程范圍內均可實現滿量程輸出
    發(fā)表于 06-27 18:39

    柔性生產新標配:聚徽解碼安卓工控如何支持多用」快速換線

    其獨特的技術優(yōu)勢,正逐漸成為柔性生產的新標配,為「多用」快速換線提供了有力支持。 協(xié)議兼容,打破設備連接壁壘 ()多協(xié)議解析能力 工業(yè)
    的頭像 發(fā)表于 06-10 16:48 ?669次閱讀
    长阳| 英德市| 靖江市| 莱州市| 舞钢市| 景德镇市| 萍乡市| 太仓市| 航空| 定结县| 天全县| 大悟县| 乌拉特后旗| 大悟县| 呼玛县| 石泉县| 郑州市| 肃南| 台江县| 长宁区| 香格里拉县| 鹤庆县| 宁都县| 丰原市| 宣恩县| 芮城县| 从化市| 岢岚县| 隆回县| 宁晋县| 虞城县| 中宁县| 明水县| 来宾市| 沿河| 沂水县| 萨迦县| 穆棱市| 万州区| 崇信县| 呼玛县|