组件名称

  二分K均值聚类 [版本号:1] [更新时间:2018-05-08]

简介

  二分K均值聚类(Bisecting K-means),是K-means的改进算法,可以加速K-means算法的执行速度,避免出现局部最优化。二分K均值聚类步骤: 1.初始化质心和并算出每个点到质心的距离 2.对每个簇尝试分成两个簇后计算误差平方和(衡量聚类优质性的指标),选取最小误差为最好的分配方法 3.重新分配簇和质心 4.重复2和3达到K个类

输入和输出

  输入端口个数:1

  输出端口个数:1

参数配置

参数名称 参数说明 参数默认值 是否必填
要聚类的簇的个数 2 必填
种子数 设置随机种子数值,大于0的整数. 默认是空 可选 必填
每个分簇中的样本数 每个分簇中最小的样本个数(若大于等于1.0)或者最小的样本比例数(小于1.0)可选 必填
最大迭代次数(> = 0) 20 必填

字段配置

字段名称 字段说明 字段默认值 是否必配
特征列 输入模型的样本特征列 必选 支持Double/Int类型字段 必填

输出节点的字段配置说明

  运行后不生成新字段。后续节点可以直接选择字段。

results matching ""

    No results matching ""