组件名称:随机森林回归

  [版本号:5] [更新时间:2019-10-28]

简介

  随机森林回归:回归算法与随机森林分类算法类似。实现过程通过自助法(bootstrap)重采样技术,从原始训练样本集N中有放回地重复随机抽取k个样本生成新的训练样本集合,然后根据自助样本集生成k个回归树组成随机森林,单棵树的预测能力可能很小,但在随机产生大量的决策树后,一个测试样品可以通过每一棵树的预测结果经统计后均值作为最终结果。它在对数据进行分类的同时,还可以给出各个变量(基因)的重要性评分,评估各个变量在分类中所起的作用。【该组件执行后可以生成模型,后续将保存在左侧组件栏下方的模型列表,直接拖拽到画布使用或在快速应用页面直接使用。】

输入和输出

  输入端口个数:1

  输出端口个数:1

参数配置

参数名称 参数说明 参数默认值 是否必填
最大树深 树的最大树深,超过会自动截取可填 5 必填
最大的划分数 连续型特征离散化的最大数量可填 100 必填
最小实例数 每个子项在拆分后必须具有的最小实例数。如果拆分后导致左或右子节点少于最小实例数,则此拆分将作为无效丢弃。可填 1 必填
最小信息增益值 分裂节点时所需最小信息增益值可填 0 必填
森林中决策树的个数 训练过程用到的树的个数可填 20 必填
每个决策树的训练数据的比例分数 用于学习每个决策树的训练数据的比例分数,在范围(0,1]可填 1 必填
每棵树每次分裂选取特征策略 设置特征维度属性子集选取策略(随机森林有两个随机,构成树的样本随机,每棵树分裂的特征属性是随机的。支持的选项有:auto,all,onethird,sqrt,log2可填 auto 必填
种子数 设置随机种子数值,大于0的整数.默认是空可填 -

字段配置

字段名称 字段说明 字段默认值 是否必配
特征列 输入模型的样本特征列,必须是数值型字段列必选 必填
标签列 输入模型的样本类别标签列,必须是数值型字段列必选 必填

运行后生成的字段列

  运行之后生成的字段列是该组件新增的字段列,在结果数据中会体现出来,后续节点可以选择到这些字段列。

字段名称 字段说明 字段类型
__prediction 预测结果字段列 双精度类型

results matching ""

    No results matching ""