组件名称:GBDT二分类

  [版本号:5] [更新时间:2019-10-28]

简介

  GBDT二分类:GDBT中文名称"梯度提升决策树算法",与原始Boost算法类似,是集成学习家族Boosting的一种。所做分类是在回归的基础上对预测的连续型变量通过概率函数变换为类别。平台的GBDT算法基于J.H. Friedman. "Stochastic Gradient Boosting" 1999,该组件仅支持二分类,特征变量可以是连续或者离散类型。【该组件执行后可以生成模型,后续将保存在左侧组件栏下方的模型列表,直接拖拽到画布使用或在快速应用页面直接使用。】

输入和输出

  输入端口个数:1

  输出端口个数:1

参数配置

参数名称 参数说明 参数默认值 是否必填
步长 每次优化迭代的步长大小(>=0)可选 0.1 必填
最小实例数 每个子项在拆分后必须具有的最小实例数。如果拆分后导致左或右子节点少于最小实例数,则此拆分将作为无效丢弃。可选 1 必填
种子数 设置随机种子数值,大于0的整数.默认是空可选 必填
损失函数类型 GBT试图最小化(不区分大小写)的损失函数。支持的选项有:logistic.可选 logistic 必填
迭代次数 最大迭代次数(>=0)可选 20 必填
最小信息增益值 分裂节点时所需最小信息增益值可选 0 必填
最大的划分数 连续型特征离散化的最大数量可选 100 必填
用于学习每个决策树的训练数据的比例分数 在范围(0,1]可选 1 必填
最大树深 5 必填

字段配置

字段名称 字段说明 字段默认值 是否必配
特征列 输入模型的样本特征列,必须是数值型字段列必选 必填
标签列 输入模型的样本类别标签列,必须是数值型字段列必选 必填

运行后生成的字段列

  运行之后生成的字段列是该组件新增的字段列,在结果数据中会体现出来,后续节点可以选择到这些字段列。

字段名称 字段说明 字段类型
__prediction 预测结果字段列 双精度类型
__probability 概率模型预测详细结果列 双精度类型

results matching ""

    No results matching ""