
决策树算法是一种逼近离散函数值的方法 。它是一种典型的分类方法,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析 。本质上决策树是通过一系列规则对数据进行分类的过程 。
简介:
【决策树算法是什么】决策树方法最早产生于上世纪60年代,到70年代末 。由J Ross Quinlan提出了ID3算法,此算法的目的在于减少树的深度 。但是忽略了叶子数目的研究 。C4.5算法在ID3算法的基础上进行了改进,对于预测变量的缺值处理、剪枝技术、派生规则等方面作了较大改进,既适合于分类问题,又适合于回归问题 。
决策树算法构造决策树来发现数据中蕴涵的分类规则.如何构造精度高、规模小的决策树是决策树算法的核心内容 。决策树构造可以分两步进行 。第一步,决策树的生成:由训练样本集生成决策树的过程 。一般情况下,训练样本数据集是根据实际需要有历史的、有一定综合程度的,用于数据分析处理的数据集 。第二步,决策树的剪枝:决策树的剪枝是对上一阶段生成的决策树进行检验、校正和修下的过程,主要是用新的样本数据集(称为测试数据集)中的数据校验决策树生成过程中产生的初步规则,将那些影响预衡准确性的分枝剪除 。
猜你喜欢
- 3月24号是什么星座
- 女士去湿气最好的方法,女性祛寒气湿气的方法是什么?
- 梦到开车撞人了是什么预兆 梦到开车撞人了具体是什么预兆
- 麻雀战术是什么战术
- 绿豆的功效是什么 绿豆的功效有哪些
- 女人骑自行车的好处和坏处 女人骑自行车的好处和坏处是什么
- 橘子和橙子的区别是什么
- 什么植物被称作植物界的大熊猫 被称作植物界的大熊猫是什么
- 橡皮筏是什么意思 橡皮筏是什么含义
- 企业文化是什么意思 什么是企业文化
