组件名称:值区间离散化

  [版本号:5] [更新时间:2019-09-20]

简介

  区间离散化:主要作用是将连续数值特征转换为离散类别特征。基本原理是将数值字段列划定区间离散化为索引值,等于区间值上界值取值为后面索引值。索引值是从0开始的整数。

输入和输出

  输入端口个数:1

  输出端口个数:1

参数配置

参数名称 参数说明 参数默认值 是否必填
全量数据表名 全量数据表名,表名不可以是中文可选 -
非法值处理方法 用于二值化的阈值,大于此阈值则元素值取1,否则取0必填 离散为最大索引 -
离散区间设定 按照如下设定多个区间,float("inf")代表无穷大,例如默认值例子按照三个区间离散索引为3个值。 [-float("inf"),0.5,1.4,float("inf")] -
全量数据保存 节点输出的全量数据是否保存至数据库;若保存,会增加时间及存储资源开销可选 No -

字段配置

字段名称 字段说明 字段默认值 是否必配
字段列必选 选择需要处理的字段列 必填

results matching ""

    No results matching ""