RapidMiner介绍与实践(一)决策树

前言

也不算回馈 会(只是这段时间里面,在 上查阅了不少相关的资料,因为很多大神们手敲的智慧,对一些算法和RapidMiner软件有了进一步的理解和相关时间,所以想要将这段时间,自己一点点小小的理解以及利用RapidMiner进行算法分析的过程分享到 上。也是希望能够对像我这种想要学习这个软件的小伙伴们一点我的理解。

目录

  1. 什么是RapidMiner
  2. 决策树基本原理及步骤
  3. RapidMiner实现决策树预测分析

什么是RapidMiner

首先,它是一个数据挖掘的工具。其次,它无需编程,避免大量的编程工作。最后,你能利用RapidMiner(下面简称RP)连接其中算子形成数据处理流程,实现对数据文件的挖掘,最重要的是,能够帮助对整个挖掘流程的理解

但是缺点也是有的,据说是在处理更大量数据方面可能不是很合适。但是在我软件里面看到有与hadoop连接,但是由于本身自己对软件的了解有限,所以对于这个缺点,自己也不是很确定,所以之后有机会再补充吧。

数据挖掘过程

综上,熵值、基尼系数符合纯度要求。因此可以利用这两种标准来衡量,也就因此出现了决策树中各种相关算法。由于自己也是各种理解有限,如有相关理解请指出。

Step
  1. 计算某属性中各类别的熵值
  2. 计算此属性熵值的加权平均和
  3. 计算信息增益
  4. 为其他属性重复以上步骤
  5. 选择信息增益最大为根节点

以上可以结合相关习题加以理解。

RapidMiner实现决策树预测分析

数据准备:RM中repository中 Sample>data>golf/golf-testset

RapidMiner介绍与实践(一)决策树
下篇预告:RapidMiner介绍与实践(二)贝叶斯分类器

以上仅是简要记录下,自己实验过程,如上,有问题,可以留言~看到后,会及时回复哒。

文章知识点与官方知识档案匹配,可进一步学习相关知识算法技能树首页概览33905 人正在系统学习中

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2019年5月3日
下一篇 2019年5月4日

相关推荐