R教材2&19&23 图形初阶&ggplot2&lattice&ggiraph&plotly
发布日期:2022-02-06 02:22:01 浏览次数:50 分类:技术文章
设置基础图形参数par()设置图形特征,直到会话结束opar<-par(no.readonly=T)……par(opar),将默认图形属性保存,在修改图形属性的作图后,恢复默认值par(mfrow=c(1,1))设置画板分隔成1*1的等大区域符号和线条pch=1|2|3|......点的符号(形状)cex点的形状的大小,默认为1lty线条类型,1到6lwd线条宽度,默认为1颜色col默认绘图颜色,......
1 基础
发布日期:2022-02-06 02:22:01 浏览次数:21 分类:技术文章
anaconda是python的集成包和环境*resources_cn.jar放入pycharm的lib文件夹内,改为中文AnacondaAnacondaNavigator:管理工具包和环境的图形用户界面,类似mysqlJupyternotebook:基于web的交互式计算环境,编辑易于人们阅读的文档,展示数据分析过程,类似Rmarkdownqtconsole:可执行IPython的仿终端图形界面......
2 字符串&列表&元祖&集合&字典&浅拷贝和深拷贝(针对可变对象)
发布日期:2022-02-06 02:22:01 浏览次数:24 分类:技术文章
String'',反斜杠\代表部分符号的本意,也用于特殊字符,如换行符等*字符串对象调用函数可赋值给其他对象切片:截取字符串,字符串变量[起始:结束:步长],包含起始值不包含结束值,步长默认为1,第一个字符的下标为0,负数则为倒数,倒数从-1开始;下标即索引a[::-1]倒序输出字符串连接字符串,必须是相同格式的字符串才能运算+表示连接字符串*表示复制字符串其他注意:逗号在打印的时候表示空格r用在......
第五章(4) 分类:人工神经网络
发布日期:2022-02-06 02:21:58 浏览次数:23 分类:技术文章
人工神经网络ANN由一组互相连接的结点和有向链构成感知器:包含输入结点和一个输出结点,每个输入结点通过一个加权的链连接到输出结点,而权值代表神经元之间连接的强度,训练一个感知器模型相当于不断调整链的权值,直到拟合训练数据的输入输出关系为止感知器的输入结点简单的把接收到的值传递给输出链,不做任何转换;输出结点则是计算输入的加权和,减去偏置项,然后根据结果产生输出学习感知器模型:重点是权值更新公式,新......
第六章(1) 关联分析:基本概念
发布日期:2022-02-06 02:21:59 浏览次数:22 分类:技术文章
关联分析:发现隐藏在大型数据集中的有意义的联系;所发现的联系可以用关联规则和频繁项集来表示两个问题:从大型事务数据集中发现联系的开销大所发现的联系需要验证问题定义:二元表示:购物篮事务每行对应一个事务,每列对应一个项,项在事务中的值为0或1,出现很重要,所以是非对称二元变量项集和支持度计数:事务的宽度是事务中出现项的个数;项集的支持度计数即包含该项集的事务个数关联规则:关联规则的强度用支持度和置信......
第六章(2) 关联分析:FP增长算法
发布日期:2022-02-06 02:21:59 浏览次数:29 分类:技术文章
FP增长算法:使用FP树的紧凑数据结构组织数据,并从中提取频繁项集FP树表示法:FP树是一种输入数据的压缩表示,把每个事务映射到FP树中的一条路径来构造;步骤:扫描一次数据集,确定每个项的支持度,事务数据去除非频繁项,将事务中的项按支持度降序第二次扫描数据集,构建FP树,读入第一个事务,路径上结点的频数计数为1继续读入事务,如果有共同的前缀项则前缀项合并,计数+1,没有则另开一条路径继续该过程直到......
第六章(3) 关联分析:关联模式评估(客观度量)
发布日期:2022-02-06 02:21:59 浏览次数:27 分类:技术文章
关联分析会产生大量的模式,建立一组广泛接受的评价关联模式质量的标准是很重要的;分为两种:通过统计论据建立:相互独立的项的模式或者覆盖少量事务的模式可能是伪联系;使用客观兴趣度度量:支持度、置信度、相关性通过主观论据建立:模式被主观的判断,希望模式是提供有利信息的或者预料不到的,这需要来自领域专家的大量先验信息;主观信息加入到模式发现:可视化基于模板的方法主观兴趣度度量客观兴趣度度量:支持度的缺点:......
第七章(1) 关联分析:高级概念
发布日期:2022-02-06 02:21:59 浏览次数:20 分类:技术文章
之前的项是非对称的二元属性,项组成事务,并且只有频繁模式是有用的;接下来探索的不同:处理分类属性:将分类属性和对称二元属性转换成项,就可以用已有的关联规则挖掘算法;将每个不同的属性-值对创建一个新的项(即转化为非对称二元属性)来实现对于二元化后的数据,需要考虑:有些属性值不够频繁,特别是具有很多可能属性值的分类属性;不能降低阈值,可以将相关的属性值分组,形成少数类别,或者将不频繁的属性值聚合为“其......
第七章(2) 关联分析:子图模式
发布日期:2022-02-06 02:21:59 浏览次数:25 分类:技术文章
子图模式:将关联分析方法应用到复杂实体、文档数据的建模,运用到图形表示频繁子图挖掘:在图的集合中发现一组公共子结构图与子图:图是一种表示实体集之间联系的数据结构,由顶点集和连接顶点对的边集组成;当一个图的顶点集是另一个图的子集且其边集也是这个图的子集,那么前者是后者的子图;顶点vi是顶点的序列,而给每个顶点vi赋予一个标号l(vi)代表实体;每条边(vi,vj)也可以给予一个边标号l(vi,vj)......
第七章(3) 关联分析:非频繁模式
发布日期:2022-02-06 02:22:00 浏览次数:28 分类:技术文章
非频繁模式是支持度=minsup负关联规则:有如下的性质:规则时从负项集提取出来的规则的支持度>=minsup规则的置信度>=minconf负项集和负关联统称为负模式负相关模式:负相关项集:s(AB)/s(A)*s(B)Y是负相关的;但是X和Y中的项一般是正相关的,所以用部分条件(即上式)来定义负相关关联规则负相关项集和负相关关联规则统称为负相关模式其实负项集可以看做项集(都为非对称二元变量)中的......
共 49040279 条, 总 4904028 页, 当前第 2242414 页
首 页
上一页
下一页
尾 页