【sklearn中LinearRegression，logisticregression函数及其参数】-个人在线分享

前言

本文将介绍 sklearn 库中 LinearRegression 和 LogisticRegression 函数及其参数配置。线性回归和逻辑回归是机器学习中两种基本且重要的算法，广泛应用于回归和分类问题中。

from sklearn.linear_model import LinearRegression

import numpy as np
X = np.array([[1, 1], [1, 2], [2, 2], [2, 3]])
y = np.dot(X, np.array([1, 2])) + 3

model = LinearRegression()
model.fit(X, y)

predictions = model.predict(np.array([[3, 5]]))
print(predictions)

from sklearn.linear_model import LogisticRegression

penalty: 使用的正则化惩罚。可选值为 l1、l2、elasticnet 或 none。默认为 l2。
dual: 对偶或原始方法。对于 l2 惩罚来说，仅适用于 liblinear 解决器。
tol: 停止迭代的标准。默认为 1e-4。
C: 正则化强度的倒数。必须是正浮点数。默认为 1.0。
fit_intercept: 是否计算截距。默认为 True。
solver: 使用的优化算法。可选值为 newton-cg、lbfgs、liblinear、sag、saga。默认为 lbfgs。
max_iter: 迭代的最大次数。默认为 100。
multi_class: 分类方式。可选值为 auto、ovr、multinomial。默认为 auto。
n_jobs: 用于计算的作业数。默认为 None，表示使用1个作业。如果设置为 -1，则使用所有CPU。

from sklearn.datasets import make_classification
X, y = make_classification(n_samples=1000, n_features=20, n_classes=2, random_state=42)

model = LogisticRegression()
model.fit(X, y)

predictions = model.predict(X[:10])
print(predictions)