决策树方法的基本思想是什么

发布网友

共4个回答

热心网友

决策树的基本思想
决策树算法是最早的机器学习算法之一。
算法框架
1.决策树主函数
各种决策树的主函数都大同小异，本质上是一个递归函数。该函数的主要功能是按照某种规则生长出决策树的各个分支节点，并根据终止条件结束算法。一般来讲，主函数需要完成如下几个功能。
（1）输入需要分类的数据集和类别标签
（2）根据某种分类规则得到最优的划分特征，并创建特征的划分节点--计算最优特征子函数
（3）按照该特征的每个取值划分数据集为若干部分--划分数据集子函数
（4）根据划分子函数的计算结果构建出新的节点，作为树生长出的新分支
（5）检验是否符合递归的终止条件
（6）将划分的新节点包含的数据集和类别标签作为输入，递归执行上述步骤。
2.计算最优特征子函数
计算最优特征子函数是除主函数外最重要的函数。每种决策树之所以不同，一般都是因为最优特征选择的标准上有所差异，不同的标准导致不同类型的决策树。如：ID3的最优特征选择标准是信息增益、C4.5是信息增益率、CART是节点方差的大小等。
在算法逻辑上，一般选择最优特征需要遍历整个数据集，评估每个特征，找到最优的那一个特征返回。
3.划分数据集函数
划分数据集函数的主要功能是分隔数据集，有的需要删除某个特征轴所在的数据列，返回剩余的数据集；有的干脆将数据集一分为二。
4.分类器
所有的机器学习算法都要勇于分类或回归预测。决策树的分类器就是通过遍历整个决策树，使测试集数据找到决策树中叶子节点对应的类别标签。这个标签就是返回的结果。

热心网友

对数据进行处理，利用归纳算法生成可读的规则和决策树，然后使用决策对新数据进行分析。即通过一系列规则对数据进行分类的过程。

顺便问句，是拿去看的还是打成电子稿的啊，o(∩_∩)o 考试。

热心网友

决策树算法是一种*近离散函数值的方法。它是一种典型的分类方法，首先对数据进行处理，利用归纳算法生成可读的规则和决策树，然后使用决策对新数据进行分析。本质上决策树是通过一系列规则对数据进行分类的过程。
决策树方法最早产生于上世纪60年代，到70年代末。由J Ross Quinlan提出了ID3算法，此算法的目的在于减少树的深度。但是忽略了叶子数目的研究。C4.5算法在ID3算法的基础上进行了改进，对于预测变量的缺值处理、剪枝技术、派生规则等方面作了较大改进，既适合于分类问题，又适合于回归问题。

热心网友

对数据进行处理，利用归纳算法生成可读的规则和决策树，然后使用决策对新数据进行分析。即通过一系列规则对数据进行分类的过程。

顺便问句，是拿去看的还是打成电子稿的啊！o(∩_∩)o 考试顺利啊~~~~

全部栏目

决策树方法的基本思想是什么