组件名称

  朴素贝叶斯分类 [版本号:1] [更新时间:2018-05-08]

简介

  朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。朴素贝叶斯分类器(Naive Bayes Classifier,或 NBC)发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,NBC模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。NBC模型假设属性之间相互独立,在属性个数比较多或者属性之间相关性较大时,分类效果不好。

输入和输出

  输入端口个数:1

  输出端口个数:1

参数配置

参数名称 参数说明 参数默认值 是否必填
模型类型 支持multinomial(多分类贝叶斯)和bernoulli(伯努利贝叶斯)两种,多项式贝叶斯能处理有限的离散数据,比如将文本数据转换成TF_IDF向量被用于文档分类,将向量转换成0/1的数值,则通常使用伯努利贝叶斯,特征值不可为负 可选 multinomial 必填
平滑项参数 默认是1.0,为Laplace smoothing,大于0小于1是Lidstone smoothing,可选 1 必填

字段配置

字段名称 字段说明 字段默认值 是否必配
特征列 输入模型的样本特征列 必选 支持Double/Int类型字段 必填
标签列 输入模型的样本类别标签列 必选 支持Double/Int类型字段 必填

输出节点的字段配置说明

  运行后不生成新字段。后续节点可以直接选择字段。

results matching ""

    No results matching ""