组件名称:长句拆分

  [版本号:5] [更新时间:2019-10-28]

简介

  长句拆分:用来对长文本根据默认标点符号【? ! ; ? ! 。 ; …… …】或自定义添加的符合,将句子拆分成各个短句,得到各个短句的字符串列表。

输入和输出

  输入端口个数:1

  输出端口个数:1

参数配置

参数名称 参数说明 参数默认值 是否必填
自定义句子的间隔字符集合 默认包含【?!;?!。;………】,其他可以添加。多个符号,则每个一行可填 -
全量数据保存 节点输出的全量数据是否保存至数据库;若保存,会增加时间及存储资源开销可选 No -
全量数据表名 全量数据表名,表名不可以是中文可选 -

字段配置

字段名称 字段说明 字段默认值 是否必配
选择字段列 必填

运行后生成的字段列

  运行之后生成的字段列是该组件新增的字段列,在结果数据中会体现出来,后续节点可以选择到这些字段列。

字段名称 字段说明 字段类型
__seg_sentences 长句拆分后的短句字段列 字符串数组

results matching ""

    No results matching ""