组件名称:词语过滤

  [版本号:5] [更新时间:2019-09-20]

简介

  词语过滤:用来对分词后的文本进行停用词的过滤。两个输入端口,左边为分词后的结果,右边是可选择的停用词表(单列),右边不输入则采用系统内置的默认停用词。

输入和输出

  输入端口个数:2

  输出端口个数:1

参数配置

参数名称 参数说明 参数默认值 是否必填
是否过滤单字词 可以选择过滤单个字的词语,默认过滤 Yes -
添加过滤词 在停用词表的基础上,添加自定义过滤的词。 -
全量数据保存 节点输出的全量数据是否保存至数据库;若保存,会增加时间及存储资源开销可选 No -
全量数据表名 全量数据表名,表名不可以是中文可选 -

字段配置

字段名称 字段说明 字段默认值 是否必配
选择字段列 选择需要过滤词语的字段(字符串数组类型) 必填

运行后生成的字段列

  运行之后生成的字段列是该组件新增的字段列,在结果数据中会体现出来,后续节点可以选择到这些字段列。

字段名称 字段说明 字段类型
__words_filtered 分词结果过滤后字段列 字符串数组

results matching ""

    No results matching ""