组件名称

  决策树分类 [版本号:1] [更新时间:2018-05-08]

简介

  Classification And Regression Tree(CART)是一种很重要的机器学习算法,既可以用于创建分类树(Classification Tree),也可以用于创建回归树(Regression Tree)。分类树就是通过一系列规则对数据进行分类的一种算法,可以分为分类树和回归树两类,分类树用于处理预测变量是离散的,支持用于二分类、多分类问题。

输入和输出

  输入端口个数:1

  输出端口个数:1

参数配置

参数名称 参数说明 参数默认值 是否必填
计算信息增益的准则 用于信息增益计算的标准(不区分大小写)。可支持的选项: entropy,gini gini -
最小实例数 每个子项在拆分后必须具有的最小实例数。 如果拆分后导致左或右子节点少于最小实例数,则此拆分将作为无效丢弃。 可选 1 -
种子数 设置随机种子数值,大于0的整数. 默认是空 可选 -
最大树深 5 -
最小信息增益值 分裂节点时所需最小信息增益值 可选 0 -
最大的划分数 连续型特征离散化的最大数量 可选 32 -

字段配置

字段名称 字段说明 字段默认值 是否必配
训练特征列 必选 支持Double/Int类型字段 必填
目标列 必选 必填

输出节点的字段配置说明

  运行后不生成新字段。后续节点可以直接选择字段。

results matching ""

    No results matching ""