组件名称

  频繁项挖掘 [版本号:1] [更新时间:2018-05-08]

简介

  项集:最基本的模式是项集,它是指若干个项的集合。频繁模式是指数据集中频繁出现的项集、序列或子结构。频繁项集是指支持度大于等于最小支持度(min_sup)的集合。其中支持度是指某个集合在所有事务中出现的频率。频繁项集的经典应用是购物篮模型。 数据超市使用“FP-树频集算法(FP-growth)”,实验表明,该对不同长度的规则都有很好的适应性,同时在效率上较之Apriori算法有巨大的提高。

输入和输出

  输入端口个数:1

  输出端口个数:1

参数配置

参数名称 参数说明 参数默认值 是否必填
最小置信度 控制序列间最小置信度的数,在关联规则的先决条件X下发生的条件下,关联结果Y发生的概率,即含有X的项集中,同时含有Y的可能性 支持double/float类型,在(0,1)之间 -
最小支持度 控制序列频繁度的系数,指在所有项集中{X,Y}出现的可能性,即项集中同时含有X和Y的概率 支持double/float类型,在(0,1)之间 -

字段配置

字段名称 字段说明 字段默认值 是否必配
项集列 输入模型的项集样本列 必选 支持Double/Int类型字段 必填

输出节点的字段配置说明

  运行后不生成新字段。后续节点可以直接选择字段。

results matching ""

    No results matching ""