網(wǎng)站首頁 編程語言 正文
前言
Logistic回歸涉及到高等數(shù)學(xué),線性代數(shù),概率論,優(yōu)化問題。本文盡量以最簡單易懂的敘述方式,以少講公式原理,多講形象化案例為原則,給讀者講懂Logistic回歸。如對數(shù)學(xué)公式過敏,引發(fā)不適,后果自負(fù)。
Logistic回歸原理與推導(dǎo)
Logistic回歸中雖然有回歸的字樣,但該算法是一個分類算法,如圖所示,有兩類數(shù)據(jù)(紅點和綠點)分布如下,如果需要對兩類數(shù)據(jù)進(jìn)行分類,我們可以通過一條直線進(jìn)行劃分(w0 * x0 + w1 * x1+w2 * x2)。當(dāng)新的樣本(x1,x2)需要預(yù)測時,帶入直線函數(shù)中,函數(shù)值大于0,則為綠色樣本(正樣本),否則為紅樣本(負(fù)樣本)。
推廣到高維空間中,我們需要得到一個超平面(在二維是直線,在三維是平面,在n維是n-1的超平面)切分我們的樣本數(shù)據(jù),實際上也就是求該超平面的W參數(shù),這很類似于回歸,所以取名為Logistic回歸。
sigmoid函數(shù)
當(dāng)然,我們不直接使用z函數(shù),我們需要把z值轉(zhuǎn)換到區(qū)間[0-1]之間,轉(zhuǎn)換的z值就是判斷新樣本屬于正樣本的概率大小。 我們使用sigmoid函數(shù)完成這個轉(zhuǎn)換過程,公式如下。通過觀察sigmoid函數(shù)圖,如圖所示,當(dāng)z值大于0時,σ值大于0.5,當(dāng)z值小于0時,σ值小于于0.5。利用sigmoid函數(shù),使得Logistic回歸本質(zhì)上是一個基于條件概率的判別模型。
目標(biāo)函數(shù)
其實,我們現(xiàn)在就是求W,如何求W呢,我們先看下圖,我們都能看出第二個圖的直線切分的最好,換句話說,能讓這些樣本點離直線越遠(yuǎn)越好,這樣對于新樣本的到來,也具有很好的劃分,那如何用公式表示并計算這個目標(biāo)函數(shù)呢?
這時就需要這個目標(biāo)函數(shù)的值最大,以此求出θ。
梯度上升法
在介紹梯度上升法之前,我們看一個中學(xué)知識:求下面函數(shù)在x等于多少時,取最大值。
解:求f(x)的導(dǎo)數(shù):2x,令其為0,求得x=0時,取最大值為0。但在函數(shù)復(fù)雜時,求出導(dǎo)數(shù)也很難計算函數(shù)的極值,這時就需要使用梯度上升法,通過迭代,一步步逼近極值,公式如下,我們順著導(dǎo)數(shù)的方向(梯度)一步步逼近。
利用梯度算法計算該函數(shù)的x值:
def f(x_old):
return -2*x_old
def cal():
x_old = 0
x_new = -6
eps = 0.01
presision = 0.00001
while abs(x_new-x_old)>presision:
x_old=x_new
x_new=x_old+eps*f(x_old)
return x_new
-0.0004892181072978443
Logistic回歸實踐
數(shù)據(jù)情況
讀入數(shù)據(jù),并繪圖顯示:
def loadDataSet():
dataMat = [];labelMat = []
fr = open('數(shù)據(jù)/Logistic/TestSet.txt')
for line in fr.readlines():
lineArr = line.strip().split()
dataMat.append([1.0, float(lineArr[0]), float(lineArr[1])])
labelMat.append(int(lineArr[2]))
return dataMat, labelMat
訓(xùn)練算法
利用梯度迭代公式,計算W:
def sigmoid(inX):
return 1.0/(1 + np.exp(-inX))
def gradAscent(dataMatIn, labelMatIn):
dataMatrix = np.mat(dataMatIn)
labelMat = np.mat(labelMatIn).transpose()
m,n = np.shape(dataMatrix)
alpha = 0.001
maxCycles = 500
weights = np.ones((n,1))
for k in range(maxCycles):
h = sigmoid(dataMatrix * weights)
error = labelMat - h
weights = weights + alpha * dataMatrix.transpose() * error
return weights
通過計算的weights繪圖,查看分類結(jié)果
算法優(yōu)缺點
- 優(yōu)點:易于理解和計算
- 缺點:精度不高
原文鏈接:https://juejin.cn/post/7081155423838928903
相關(guān)推薦
- 2022-04-01 .Net使用SuperSocket框架實現(xiàn)WebSocket后端_實用技巧
- 2022-12-06 python中的代碼運行時間獲取方式_python
- 2022-12-04 C++?Boost.Range與Adapters庫使用詳解_C 語言
- 2022-06-13 詳解Python+Matplotlib繪制面積圖&熱力圖_python
- 2022-04-10 用python實現(xiàn)讀取xlsx表格操作_python
- 2022-09-17 C/C++?控制臺等待指令解析_C 語言
- 2022-09-18 iOS?xcconfig編寫示例教程_IOS
- 2022-05-20 MybatisCodeHelpPro生成持久層代碼
- 最近更新
-
- window11 系統(tǒng)安裝 yarn
- 超詳細(xì)win安裝深度學(xué)習(xí)環(huán)境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎(chǔ)操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區(qū)別,Jav
- spring @retryable不生效的一種
- Spring Security之認(rèn)證信息的處理
- Spring Security之認(rèn)證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權(quán)
- redisson分布式鎖中waittime的設(shè)
- maven:解決release錯誤:Artif
- restTemplate使用總結(jié)
- Spring Security之安全異常處理
- MybatisPlus優(yōu)雅實現(xiàn)加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務(wù)發(fā)現(xiàn)-Nac
- Spring Security之基于HttpR
- Redis 底層數(shù)據(jù)結(jié)構(gòu)-簡單動態(tài)字符串(SD
- arthas操作spring被代理目標(biāo)對象命令
- Spring中的單例模式應(yīng)用詳解
- 聊聊消息隊列,發(fā)送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠(yuǎn)程分支