组件名称:命名实体表格
[版本号:5] [更新时间:2019-09-20]
简介
命名实体表格:主要用来从将从多篇文章中抽取的命名实体,展示为二维表格的形式,行是每一篇文章,列是每一个实体,元素是文章出现实体的个数。输入数据是命名实体抽取之后的实体数组。
输入和输出
输入端口个数:1
输出端口个数:1
参数配置
参数名称 | 参数说明 | 参数默认值 | 是否必填 |
---|---|---|---|
最高词频词个数 | 根据语料库中的词频排序选出前TOPn个实体,默认选择100个实体,在语料库大的情况下,可以截取词频最大的n个可选 | 100 | - |
在所有文档中词语出现的文档数 | 过滤以忽略文档中的稀有字词。对应所有文档,忽略词语出现的文档数小于阈值的词语。默认值为1可选 | 1 | - |
词语在单个文档中最少出现的次数 | 过滤以忽略文档中的稀有字词。对于每个文档,忽略频数小于给定阈值的词语。默认值为1可选 | 1 | - |
字段配置
字段名称 | 字段说明 | 字段默认值 | 是否必配 |
---|---|---|---|
选择字段列 | 需要展现为实体表格的字段。数组类型的实体列表 | 必填 |