使用 Logistic 回归分类

在 LR 分类器中,使用逻辑函数对描述单个试验的可能结果的概率进行建模。它在 linear_model 库中实现

from sklearn.linear_model import LogisticRegression

sklearn LR 实现可以适合二元,一对多或多元逻辑回归,并具有可选的 L2 或 L1 正则化。例如,让我们考虑样本 sklearn 数据集的二进制分类

from sklearn.datasets import make_hastie_10_2

X,y = make_hastie_10_2(n_samples=1000)

其中 X 是 n_samples X 10 数组,y 是目标标签 -1 或+1。

使用列车测试拆分将输入数据划分为训练和测试集(70%-30%)

from sklearn.model_selection import train_test_split 
#sklearn.cross_validation in older scikit versions

data_train, data_test, labels_train, labels_test = train_test_split(X,y, test_size=0.3)

使用 LR 分类器与其他示例类似

# Initialize Classifier. 
LRC = LogisticRegression()
LRC.fit(data_train, labels_train)

# Test classifier with the test data
predicted = LRC.predict(data_test)

使用 Confusion 矩阵可视化结果

from sklearn.metrics import confusion_matrix

confusion_matrix(predicted, labels_test)