【课程作业】数据挖掘之具有定性变量的回归模型
发布日期:2021-06-29 02:15:36
浏览次数:3
分类:技术文章
本文共 897 字,大约阅读时间需要 2 分钟。
参考资料
具有定性变量的回归模型
作业要求
流程与代码
原始数据:400条,11列(11个属性)
library(MASS) #加载库library(ISLR) #安装库install.packages("ISLR") library(car) #测试:有此行才能运行后面的vif(tlm) 多重共线性检验#Introduction to statistical learning中的ISLR package#fix(Carseats) # 查看Carseats数据集#names(Carseats) # 查看数据集的列名#?Carseats # 查看数据集的更多信息#多元线性回归tlm<-lm(Sales~., data = Carseats) #~后面的. 表示用上全部变量summary(tlm) #查看回归结果(最后一列*,没有*的变量即没有显著关系,应当去掉)#逐步回归,自动排除不显著的变量tstep<-step(tlm)summary(tstep)#逐步回归的优化drop1(tstep)#再:多元线性回归tlm<-lm(Sales~CompPrice+Income+Advertising+Price+ShelveLoc+Age, data = Carseats)#显著(有*)的变量:CompPrice+Income+Advertising+Price+ShelveLoc+Agesummary(tlm)tlm# 自动将定性变量转变为虚拟变量,并通过contrasts()返回虚拟变量的编码attach(Carseats)contrasts(ShelveLoc)#变量的多重共线性vif(tlm)#方差膨胀因子。一般认为,当0运行结果<10,不存在多重共线性(注意:在《R语言实战》第2版P182中认为VIF>4就存在多重共线性);当10≤VIF<100,存在较强的多重共线性,当VIF>=100,多重共线性非常严重。vif是判断多重共线性的比较常用方法。 #残差分析和异常点检测(判断方法见下图)par(mfrow=c(2,2))plot(tlm)
转载地址:https://blog.csdn.net/YWP_2016/article/details/106111777 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!
发表评论
最新留言
关注你微信了!
[***.104.42.241]2024年04月09日 17时45分10秒
关于作者
喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
LinuxGPIO操作和MTK平台GPIO
2021-06-30
Linux下的图形库curses写贪吃蛇,酷
2021-06-30
【毕业设计】自动泊车系统(APS)记录
2021-07-01
UVA 10100- Longest Match(dp之最长公共子序列)
2021-07-01
SDUT 3364-数据结构实验之图论八:欧拉回路(并查集)
2019-04-28
图的基础(C++)
2019-04-28
SAP用户增强总结-采购订单建立增加客户数据增强示例
2019-04-28
journal of neuroscience:面孔的神经表征与眼动模式相协调
2019-04-28
The Neuroscientist:运动性脑震荡的长期影响
2019-04-28
机器学习实战学习笔记一
2019-04-28
【vn.py】 策略实盘自动交易
2019-04-28
仿牛客社区项目2.5登录模块———登录退出功能
2019-04-28
LeetCode 190. 颠倒二进制位
2019-04-29
LeetCode 268. 丢失的数字
2019-04-29
LeetCode 231. 2 的幂
2019-04-29
[经典排序算法][集锦]
2019-04-29
无处不在的二分查找
2019-04-29
Java集合框架List,Map,Set等全面介绍
2019-04-29
Java 泛型(二) 泛型之中的通配符(Wildcards)使用
2019-04-29