组件名称:决策树分类

  [版本号:5] [更新时间:2019-10-28]

简介

  决策树分类:决策树标准英文名称"Classification And Regression Tree"(CART),是一种很重要的机器学习算法。主要用于处理预测变量是离散的情况。决策树分类归类于监督学习,能够将数据集最好的分类,之后递归构成分类树。【该组件执行后可以生成模型,后续将保存在左侧组件栏下方的模型列表,直接拖拽到画布使用或在快速应用页面直接使用。】

输入和输出

  输入端口个数:1

  输出端口个数:1

参数配置

参数名称 参数说明 参数默认值 是否必填
计算信息增益的准则 用于信息增益计算的标准(不区分大小写)。可支持的选项:entropy,gini gini -
最小实例数 每个子项在拆分后必须具有的最小实例数。如果拆分后导致左或右子节点少于最小实例数,则此拆分将作为无效丢弃。可选 1 -
种子数 设置随机种子数值,大于0的整数.默认是空可选 -
最大树深 5 -
最小信息增益值 分裂节点时所需最小信息增益值可选 0 -
最大的划分数 连续型特征离散化的最大数量可选 32 -

字段配置

字段名称 字段说明 字段默认值 是否必配
训练特征列必选支持Double/Int类型字段 -
目标列必选 必填

运行后生成的字段列

  运行之后生成的字段列是该组件新增的字段列,在结果数据中会体现出来,后续节点可以选择到这些字段列。

字段名称 字段说明 字段类型
__prediction 预测结果字段列 双精度类型
__probability 概率模型预测详细结果列 双精度类型

results matching ""

    No results matching ""