Weka算法介绍
发布日期:2021-08-21 13:18:09 浏览次数:17 分类:技术文章

本文共 1515 字,大约阅读时间需要 5 分钟。

RWeka () : 
1) 数据输入和输出 
WOW():查看Weka函数的参数。 
Weka_control():设置Weka函数的参数。 
read.arff():读Weka Attribute-Relation File Format (ARFF)格式的数据。 
write.arff:将数据写入Weka Attribute-Relation File Format (ARFF)格式的文件。 
2) 数据预处理 
Normalize():无监督的标准化连续性数据。 
Discretize():用MDL(Minimum Description Length)方法,有监督的离散化连续性数值数据。 
3) 分类和回归 
IBk():k最近邻分类 
LBR():naive Bayes法分类 
J48():C4.5决策树算法(决策树在分析各个属性时,是完全独立的)。 
LMT():组合树结构和Logistic回归模型,每个叶子节点是一个Logistic回归模型,准确性比单独的决策树和Logistic回归方法要好。 
M5P():M5 模型数算法,组合了树结构和线性回归模型,每个叶子节点是一个线性回归模型,因而可用于连续数据的回归。 
DecisionStump():单层决策树算法,常被作为boosting的基本学习器。 
SMO():支持向量机分类 
AdaBoostM1():Adaboost M1方法。-W参数指定弱学习器的算法。 
Bagging():通过从原始数据取样(用替换方法),创建多个模型。 
LogitBoost():弱学习器采用了对数回归方法,学习到的是实数值 
MultiBoostAB():AdaBoost 方法的改进,可看作AdaBoost 和 “wagging”的组合。 
Stacking():用于不同的基本分类器集成的算法。 
LinearRegression():建立合适的线性回归模型。 
Logistic():建立logistic回归模型。 
JRip():一种规则学习方法。 
M5Rules():用M5方法产生回归问题的决策规则。 
OneR():简单的1-R分类法。 
PART():产生PART决策规则。 
4) 聚类 
Cobweb():这是种基于模型方法,它假设每个聚类的模型并发现适合相应模型的数据。不适合对大数据库进行聚类处理。 
FarthestFirst():快速的近似的k均值聚类算法 
SimpleKMeans():k均值聚类算法 
XMeans():改进的k均值法,能自动决定类别数 
DBScan():基于密度的聚类方法,它根据对象周围的密度不断增长聚类。它能从含有噪声的空间数据库中发现任意形状的聚类。此方法将一个聚类定义为一组“密度连接”的点集。 
5)关联规则 
Apriori():Apriori是关联规则领域里最具影响力的基础算法,是一种广度优先算法,通过多次扫描数据库来获取支持度大于最小支持度的频繁项集。它的理论基础是频繁项集的两个单调性原则:频繁项集的任一子集一定是频繁的;非频繁项集的任一超集一定是非频繁的。在海量数据的情况下,Apriori 算法的时间和空间成本非常高。 
Tertius():Tertius算法。 
6)预测和评估: 
predict():根据分类或聚类结果预测新数据的类别 
table():比较两个因子对象 
evaluate_Weka_classifier():评估模型的执行,如:TP Rate,FP Rate,Precision,Recall,F-Measure。

---- 整理自

转载于:https://www.cnblogs.com/payton/p/4260929.html

转载地址:https://blog.csdn.net/weixin_33720078/article/details/93727481 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:R语言快速深度学习进行回归预测(转)
下一篇:python中base64编码与解码

发表评论

最新留言

初次前来,多多关照!
[***.217.46.12]2023年02月22日 09时02分54秒

关于作者

    喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!

最新文章

发布Silverlight项目自动生成模板,自动生成Silverlight调用RIA Service实现数据增删查改 2019-11-29 14:27:53
发布新Java Andriod 项目模板组件,生成Java Andriod 项目源代码 2019-11-29 14:27:53
VC 数据类型 BYTE WORD DWORD 2019-11-29 14:27:53
不同层次的程序员对"C#判断奇偶数的函数"的不同写法 2019-11-29 14:27:53
C#代码片段 导入一个txt文本,快速过滤重复行 2019-11-29 14:27:51
在线增加/修改/删除Flash轮换图片,很实用哦 2019-11-29 14:27:51
C#代码片段 在工作线程中刷新主界面线程的进度条显示 2019-11-29 14:27:51
猛犸代码助手V3.0 最新版代码生成器 可以生成C#Winform \VC++MFC代码 2019-11-29 14:27:51
unzip 解压中文文件名乱码解决办法 2019-11-29 14:27:52
asp代码生成器,运用三层模式,分层情况为MODEL,BLL,DAL和Web 2019-11-29 14:27:52
SL项目 web.g.s 实体从 ComplexObject 继承改为从Entity 继承了 2019-11-29 14:27:52
CString/string 区别及其转化 2019-11-29 14:27:50
使用BackgroundWorker组件 2019-11-29 14:27:50
猛犸代码助手V3.6版发布 2019-11-29 14:27:50
猛犸Winform分页控件 2019-11-29 14:27:50
EF增删查改,获取翻页及一对多关系保存与读取的通用示例代码 2019-11-29 14:27:51
ASP调用存储过程,并获取异常信息 2019-11-29 14:27:51
LC.exe 已退出 错误解决方法 2019-11-29 14:27:51
ASP三层模式实践源码(未完待续) 2019-11-29 14:27:48
asp 应用ADODb.Command使用adLongVarChar参数类型保存Access备注字段 2019-11-29 14:27:49