• 回答数

    2

  • 浏览数

    255

汉口小霸王
首页 > 学术期刊 > 毕业论文决策树算法的应用

2个回答 默认排序
  • 默认排序
  • 按时间排序

陈709479558

已采纳

关于决策树算法,我打算分两篇来讲,一篇讲思想原理,另一篇直接撸码来分析算法。本篇为原理篇。 通过阅读这篇文章,你可以学到: 1、决策树的本质 2、决策树的构造过程 3、决策树的优化方向

决策树根据使用目的分为:分类树和回归树,其本质上是一样的。本文只讲分类树。

决策树,根据名字来解释就是,使用树型结构来模拟决策。 用图形表示就是下面这样。

其中椭圆形代表:特征或属性。长方形代表:类别结果。 面对一堆数据(含有特征和类别),决策树就是根据这些特征(椭圆形)来给数据归类(长方形) 例如,信用贷款问题,我根据《神奇动物在哪里》的剧情给银行造了个决策树模型,如下图:

然而,决定是否贷款可以根据很多特征,然麻鸡银行选择了:(1)是否房产价值>100w;(2)是否有其他值钱的抵押物;(3)月收入>10k;(4)是否结婚;这四个特征,来决定是否给予贷款。 先不管是否合理,但可以肯定的是,决策树做了特征选择工作,即选择出类别区分度高的特征。

由此可见, 决策树其实是一种特征选择方法。 (特征选择有多种,决策树属于嵌入型特征选择,以后或许会讲到,先给个图)即选择区分度高的特征子集。

那么, 从特征选择角度来看决策树,决策树就是嵌入型特征选择技术

同时,决策树也是机器学习中经典分类器算法,通过决策路径,最终能确定实例属于哪一类别。 那么, 从分类器角度来看决策树,决策树就是树型结构的分类模型

从人工智能知识表示法角度来看,决策树类似于if-then的产生式表示法。 那么, 从知识表示角度来看决策树,决策树就是if-then规则的集合

由上面的例子可知,麻鸡银行通过决策树模型来决定给哪些人贷款,这样决定贷款的流程就是固定的,而不由人的主观情感来决定。 那么, 从使用者角度来看决策树,决策树就是规范流程的方法

最后我们再来看看决策树的本质是什么已经不重要了。 决策树好像是一种思想,而通过应用在分类任务中从而成就了“决策树算法”。

下面内容还是继续讲解用于分类的“决策树算法”。

前面讲了决策树是一种 特征选择技术 。

既然决策树就是一种特征选择的方法,那么经典决策树算法其实就是使用了不同的特征选择方案。 如: (1)ID3:使用信息增益作为特征选择 (2)C4.5:使用信息增益率作为特征选择 (3)CART:使用GINI系数作为特征选择 具体选择的方法网上一大把,在这里我提供几个链接,不细讲。

但,不仅仅如此。 决策树作为嵌入型特征选择技术结合了特征选择和分类算法,根据特征选择如何生成分类模型也是决策树的一部分。 其生成过程基本如下:

根据这三个步骤,可以确定决策树由:(1)特征选择;(2)生成方法;(3)剪枝,组成。 决策树中学习算法与特征选择的关系如下图所示:

原始特征集合T:就是包含收集到的原始数据所有的特征,例如:麻瓜银行收集到与是否具有偿还能力的所有特征,如:是否结婚、是否拥有100w的房产、是否拥有汽车、是否有小孩、月收入是否>10k等等。 中间的虚线框就是特征选择过程,例如:ID3使用信息增益、C4.5使用信息增益率、CART使用GINI系数。 其中评价指标(如:信息增益)就是对特征的要求,特征需要满足这种条件(一般是某个阈值),才能被选择,而这一选择过程嵌入在学习算法中,最终被选择的特征子集也归到学习算法中去。 这就是抽象的决策树生成过程,不论哪种算法都是将这一抽象过程的具体化。 其具体算法我将留在下一篇文章来讲解。

而决策树的剪枝,其实用得不是很多,因为很多情况下随机森林能解决决策树带来的过拟合问题,因此在这里也不讲了。

决策树的优化主要也是围绕决策树生成过程的三个步骤来进行优化的。 树型结构,可想而知,算法效率决定于树的深度,优化这方面主要从特征选择方向上优化。 提高分类性能是最重要的优化目标,其主要也是特征选择。 面对过拟合问题,一般使用剪枝来优化,如:李国和基于决策树生成及剪枝的数据集优化及其应用。 同时,决策树有很多不足,如:多值偏向、计算效率低下、对数据空缺较为敏感等,这方面的优化也有很多,大部分也是特征选择方向,如:陈沛玲使用粗糙集进行特征降维。 由此,决策树的优化方向大多都是特征选择方向,像ID3、C4.5、CART都是基于特征选择进行优化。

参考文献 统计学习方法-李航 特征选择方法综述-李郅琴 决策树分类算法优化研究_陈沛玲 基于决策树生成及剪枝的数据集优化及其应用-李国和

266 评论

糖果屋de芒果

决策树算法有很多种,比喻有ID3(利用信息增益来选择决策变量),C4.5(利用信息增益率来选择决策变量),CART,chain以及quest等,不同的决策树适用情况也不一样,有机会可以多多交流。。

343 评论

相关问答

  • 算法的发展与应用论文参考文献

    计算机论文参考文献 在学习、工作中,大家都跟论文打过交道吧,论文对于所有教育工作者,对于人类整体认识的提高有着重要的意义。你知道论文怎样才能写的好吗?下面是我为

    瘦子你好 3人参与回答 2023-12-11
  • 行道树的选择与应用毕业论文

    城区道路以树冠广袤、绿荫如盖、形态优美的落叶阔叶乔木为主。 (1)结合城市特色,优先选择市花、市树及骨干树种。 例如北京,市树为国槐和侧柏,国槐冠大荫浓,适应城

    玉米卧熊 4人参与回答 2023-12-07
  • 遗传算法怎么在毕业论文中应用

    遗传算法的搜索策略和优化搜索方法是不依附于梯度信息及其它的辅助知识,而只需要影响搜索方向的目标函数和相应的适应度函数,所以遗传算法提供了一种求解复杂系统问题的通

    幸福的考拉721 3人参与回答 2023-12-06
  • 计算器应用毕业论文

    计算机应用技术的毕业论文怎么写?学术堂给了九条建议:1、写论文是个系统工程.跟写paper不一样,所以从一开始就要有个整体思维和计划,比如文献管理,文献索引,数

    欧比诺橱柜 4人参与回答 2023-12-05
  • 计算机技术与应用的毕业论文

    随着科学技术的不断发展,计算机应用技术是人类社会发展的一个重要里程碑。计算机技术的应用为人们提供了非常多的便利条件。下面是我给大家推荐的计算机应用技术毕业论文精

    飞天小懒猫er 2人参与回答 2023-12-07