机器学习 | 分类 —— 决策树:分支标准(熵/Gini系数)
发布日期:2021-07-01 02:32:15 浏览次数:2 分类:技术文章

本文共 200 字,大约阅读时间需要 1 分钟。

1.Gini系数

设pk为节点S包含的K个不同的类别的数据记录所占的比例,则结点S的基尼系数G(S)定义如下:

 基尼系数位于[0,1]区间,数字越小表明区分度越大。一次划分的整体基尼系数等于划分得到的孩子节点的基尼系数的加权平均,且权值被定义为孩子节点包含的数据量。因此,如果S1和S2为节点S在二元决策树中的孩子节点,n1和n2为S1和S2包含的记录数,则划分S→(S1,S2)的基尼系数定义如下:

 

转载地址:https://maxin.blog.csdn.net/article/details/93377818 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:python3__机器学习__朴素贝叶斯分类
下一篇:距离(相似度)计算方法

发表评论

最新留言

初次前来,多多关照!
[***.217.46.12]2024年04月19日 19时42分02秒