python房价数据分析波士顿代码数据_python数据分析-波士顿房价预测-Go语言中文社区...
发布日期:2021-06-24 10:02:36 浏览次数:4 分类:技术文章

本文共 893 字,大约阅读时间需要 2 分钟。

MOOC”用python玩转数据“里面的一个课程实例,我对代码做了一些修改。

源码:

import matplotlib.pyplot as plt

import pandas as pd

import statsmodels.api as sm

from sklearn import datasets

#导入数据源 sklearn

boston = datasets.load_boston()

X = boston.data

y = boston.target

print(X.shape)

# print(boston.DESCR)

#输出所有属性

i = 0

while i<=12:

fig,ax = plt.subplots(figsize=(3,3))

ax.scatter(X[:,i], y, color='blue')

i = i+1

# 将每列数据与价格之间的关系用散点图输出

# plt.subplot(13,1,i+1) 子图实现方式

Z = pd.DataFrame(X, columns = boston.feature_names)

w = pd.DataFrame(y, columns = ['MEDV'])

Z.drop('AGE', axis = 1, inplace = True)

Z.drop('INDUS', axis = 1, inplace = True)

#drop删除列需要手动添加axis=1

#如果手动设定为True(默认为False),那么原数组直接就被替换。

Z_add1 = sm.add_constant(Z)

model = sm.OLS(w, Z_add1).fit()

# sm.OLS()为普通最小二乘回归模型, fit()用于拟合

print(model.summary())

print(model.params)

结果中主要的指标是修正后的

,表示模型对现实数据拟合的程度, 它是皮尔逊相关系数的平方, 从数值上说, R²介于 0~1 之间,越接近 1 表示拟合效果越好。本文的模拟结果是0.74左右。

转载地址:https://blog.csdn.net/weixin_31990755/article/details/112830507 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:redis线程阻塞原因排插_Redis阻塞原因详解
下一篇:添加绝对路径_网站中如何添加绝对路径

发表评论

最新留言

关注你微信了!
[***.104.42.241]2024年04月12日 01时22分24秒