组件名称:命名实体提取

  [版本号:5] [更新时间:2019-09-20]

简介

  命名实体提取:又称作“专名识别”,是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。平台基于工业级别的Spacy实现了命名实体提取。【该组件执行后可以生成模型,后续将保存在左侧组件栏下方的模型列表,直接拖拽到画布使用或在快速应用页面直接使用。】

输入和输出

  输入端口个数:1

  输出端口个数:1

参数配置

参数名称 参数说明 参数默认值 是否必填
命名实体类型 选择需要提取的命名实体类型,每次只能设置提取一个类别 "人物", "国家", "组织", "政治组织", "区域实体" -
语言类型 支持中文和英文 中文 -
全量数据保存 全量HashingTF特征向量数据是否保存至数据库;若保存,会增加时间及存储资源开销可选 No -
全量数据表名 全量数据表名,表名不可以是中文可选 -

字段配置

字段名称 字段说明 字段默认值 是否必配
选择字段列 需要分词的字段 必填

运行后生成的字段列

  运行之后生成的字段列是该组件新增的字段列,在结果数据中会体现出来,后续节点可以选择到这些字段列。

字段名称 字段说明 字段类型
__ner_words 命名实体结果列 字符串数组

results matching ""

    No results matching ""