日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學(xué)無先后,達(dá)者為師

網(wǎng)站首頁 編程語言 正文

Python機(jī)器學(xué)習(xí)應(yīng)用之樸素貝葉斯篇_python

作者:柚子味的羊 ? 更新時間: 2022-03-30 編程語言

樸素貝葉斯(Naive Bayes,NB):樸素貝葉斯分類算法是學(xué)習(xí)效率和分類效果較好的分類器之一。樸素貝葉斯算法一般應(yīng)用在文本分類,垃圾郵件的分類,信用評估,釣魚網(wǎng)站檢測等。

1、鳶尾花案例

#%%庫函數(shù)導(dǎo)入
import warnings
warnings.filterwarnings('ignore')
import numpy as np
# 加載鶯尾花數(shù)據(jù)集
from sklearn import datasets
# 導(dǎo)入高斯樸素貝葉斯分類器
from sklearn.naive_bayes import GaussianNB
from sklearn.model_selection import train_test_split
#%%數(shù)據(jù)導(dǎo)入&分析
X, y = datasets.load_iris(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
#%%查看數(shù)據(jù)集
print(X)#特征集
print(y)#現(xiàn)象
#%%模型訓(xùn)練
# 假設(shè)每個特征都服正態(tài)分布,使用高斯樸素貝葉斯進(jìn)行計(jì)算
clf = GaussianNB(var_smoothing=1e-8)
clf.fit(X_train, y_train)
#%%模型預(yù)測
# 評估
y_pred = clf.predict(X_test)
acc = np.sum(y_test == y_pred) / X_test.shape[0]
print("Test Acc : %.3f" % acc)

# 預(yù)測
#對第一行數(shù)據(jù)預(yù)測
y_proba = clf.predict_proba(X_test[:1])
#使用predict()函數(shù)得到預(yù)測結(jié)果
print(clf.predict(X_test[:1]))
#輸出預(yù)測每個標(biāo)簽的概率,預(yù)測標(biāo)簽為0,1,2的概率分別為數(shù)組的三個值
print("預(yù)計(jì)的概率值:", y_proba)

運(yùn)行結(jié)果

2、小結(jié)

predict()函數(shù)和predict_proba()函數(shù)的區(qū)別: predict()函數(shù)用于預(yù)測標(biāo)簽,直接得到預(yù)測標(biāo)簽。predict_proba()函數(shù)得到的是測試集預(yù)測得到的每個標(biāo)簽的概率。如果測試集一共有30個數(shù)據(jù)集,數(shù)據(jù)原本有3個標(biāo)簽,那么使用predict()函數(shù)將會得到30個具體預(yù)測得到的標(biāo)簽值,是一個【130】的數(shù)組,使用predict_proba()函數(shù)得到的是30個數(shù)據(jù)集分別取得3個標(biāo)簽的概率,是一個【303】的數(shù)組。

我又回來了,繼續(xù)更新~ 歡迎交流

原文鏈接:https://blog.csdn.net/qq_43368987/article/details/122297194

欄目分類
最近更新