使用 Logistic 迴歸分類
在 LR 分類器中,使用邏輯函式對描述單個試驗的可能結果的概率進行建模。它在 linear_model
庫中實現
from sklearn.linear_model import LogisticRegression
sklearn LR 實現可以適合二元,一對多或多元邏輯迴歸,並具有可選的 L2 或 L1 正則化。例如,讓我們考慮樣本 sklearn 資料集的二進位制分類
from sklearn.datasets import make_hastie_10_2
X,y = make_hastie_10_2(n_samples=1000)
其中 X 是 n_samples X 10
陣列,y 是目標標籤 -1 或+1。
使用列車測試拆分將輸入資料劃分為訓練和測試集(70%-30%)
from sklearn.model_selection import train_test_split
#sklearn.cross_validation in older scikit versions
data_train, data_test, labels_train, labels_test = train_test_split(X,y, test_size=0.3)
使用 LR 分類器與其他示例類似
# Initialize Classifier.
LRC = LogisticRegression()
LRC.fit(data_train, labels_train)
# Test classifier with the test data
predicted = LRC.predict(data_test)
使用 Confusion 矩陣視覺化結果
from sklearn.metrics import confusion_matrix
confusion_matrix(predicted, labels_test)