使用 Logistic 回归分类
在 LR 分类器中,使用逻辑函数对描述单个试验的可能结果的概率进行建模。它在 linear_model
库中实现
from sklearn.linear_model import LogisticRegression
sklearn LR 实现可以适合二元,一对多或多元逻辑回归,并具有可选的 L2 或 L1 正则化。例如,让我们考虑样本 sklearn 数据集的二进制分类
from sklearn.datasets import make_hastie_10_2
X,y = make_hastie_10_2(n_samples=1000)
其中 X 是 n_samples X 10
数组,y 是目标标签 -1 或+1。
使用列车测试拆分将输入数据划分为训练和测试集(70%-30%)
from sklearn.model_selection import train_test_split
#sklearn.cross_validation in older scikit versions
data_train, data_test, labels_train, labels_test = train_test_split(X,y, test_size=0.3)
使用 LR 分类器与其他示例类似
# Initialize Classifier.
LRC = LogisticRegression()
LRC.fit(data_train, labels_train)
# Test classifier with the test data
predicted = LRC.predict(data_test)
使用 Confusion 矩阵可视化结果
from sklearn.metrics import confusion_matrix
confusion_matrix(predicted, labels_test)