使用 Logistic 迴歸分類

在 LR 分類器中,使用邏輯函式對描述單個試驗的可能結果的概率進行建模。它在 linear_model 庫中實現

from sklearn.linear_model import LogisticRegression

sklearn LR 實現可以適合二元,一對多或多元邏輯迴歸,並具有可選的 L2 或 L1 正則化。例如,讓我們考慮樣本 sklearn 資料集的二進位制分類

from sklearn.datasets import make_hastie_10_2

X,y = make_hastie_10_2(n_samples=1000)

其中 X 是 n_samples X 10 陣列,y 是目標標籤 -1 或+1。

使用列車測試拆分將輸入資料劃分為訓練和測試集(70%-30%)

from sklearn.model_selection import train_test_split 
#sklearn.cross_validation in older scikit versions

data_train, data_test, labels_train, labels_test = train_test_split(X,y, test_size=0.3)

使用 LR 分類器與其他示例類似

# Initialize Classifier. 
LRC = LogisticRegression()
LRC.fit(data_train, labels_train)

# Test classifier with the test data
predicted = LRC.predict(data_test)

使用 Confusion 矩陣視覺化結果

from sklearn.metrics import confusion_matrix

confusion_matrix(predicted, labels_test)