已跪!终于有人把Python线性回归全面解释清楚了
发布日期:2021-05-07 05:46:36 浏览次数:28 分类:精选文章

本文共 1494 字,大约阅读时间需要 4 分钟。

简单的线性回归用于预测分析和推断。在这种类型中,存在一个自变量和一个因变量。每当建模中存在因果关系时,我们都会进行回归分析。当我们使用因子分析技术时,性能在实时分析中更加准确。回归分析基础知识在有监督的机器学习中的使用。这里要注意的三件事:

  • 我们需要数据来进行分析,对于整个人群来说,这是一个非常繁琐的任务,因此我们需要获取样本数据进行分析。
  • 获取数据后,我们需要设计一个模型,使其适用于整个人群。
  • 建模之后,我们可以对总体进行预测。

直线方程为

y = mx + b

这里,

Y是因变量(结果)或预测变量。

X是一个 自变量。

M是一个斜率,或者我们可以说是梯度。

B是y轴上的值截距。

Y是X的函数。回归模型是线性近似。为了获得良好的预测,我们需要找到BM。

例子:

假设我们具有“能量”和“公里数”的适应性数据。

已跪!终于有人把Python线性回归全面解释清楚了

 

我们需要找到中号。查找这些值得公式如下:

M =样本数*(XY总和-X总和* Y总和)/样本数*(X平方总和-X总和的平方)

B = Y总和-M * X总和/样本数

该图显示了这些值。

已跪!终于有人把Python线性回归全面解释清楚了

 

计算出该值之后,M变为1.89,B的值为0.667。从这些值,我们可以从公式中得出预测。

Y = 1.89 * X + 0.667

在检查了一些X值后,可以预测公里数。一个例子如下所示:

已跪!终于有人把Python线性回归全面解释清楚了

 

我们得到了模型,但是是一种简单的技术。让我们用python检查是否获得相同的值。

#import all the librariesimport numpy as np import pandas as pdimport matplotlib.pyplot as pltimport statsmodels.api as sm

读取Excel文件

df = pd.read_excel("fitness.xlsx")

使用describe函数查看统计信息。

已跪!终于有人把Python线性回归全面解释清楚了

 

将数据分为x和y。

y = df['Y1']x = df['X1']#plot the scatter plot between themplt.scatter(x,y)plt.xlabel('Energy', fontsize =20)plt.ylabel('Kms Covered', fontsize =20)plt.show()

我们几乎得到了线性相关。

已跪!终于有人把Python线性回归全面解释清楚了

 

现在,将OLS模型拟合到我们的数据上。

x_new = sm.add_constant(x)output = sm.OLS(y, x_new).fit()output.summary()#output:                coef        ---------------------------------const          0.667   x1             1.89

得到摘要后,我们得到相同的值。在这里,我们使用statsmodels,这是用于统计和推断的出色库。

拟合之后,OLS模型允许使用拟合线检查散布图。

plt.scatter(x1,y)y_pred = 1.89*X + 0.667fig = plt.plot(x1, y_pred, lw = 5, c='red', label='regression line' plt.xlabel('Energy', fontsize =20)plt.ylabel('Kms Covered', fontsize =20)plt.show()

这是拟合最佳线后的散点图。

已跪!终于有人把Python线性回归全面解释清楚了

 

结论:

OLS提供了简单的线性回归近似值,而statsmodel提供了对数据统计信息的绝佳见解。

上一篇:膜拜!终于有人能把人工智能算法的“逻辑回归”讲得明明白白了
下一篇:Python内置算法与数据结构

发表评论

最新留言

关注你微信了!
[***.104.42.241]2025年03月21日 17时38分54秒