组件名称

  杰卡德距离LSH [版本号:1] [更新时间:2018-05-08]

简介

  杰卡德距离度量的LSH类,LSH(Locality Sensitive Hashing),中文叫做“局部敏感哈希”,它是一种针对海量高维数据的快速最近邻查找算法,可应用于近似重复的检测、全基因组的相关研究、大规模的图片搜索、音频/视频指纹识别等领域。平台上模型输入是密集的(dense)或稀疏的(sparse)矢量,每个矢量表示为0和1的集合,杰卡德相似度算法没有考虑向量中潜在数值的大小,而是简单的处理为0和1,不过,做了这样的处理之后,杰卡德方法的计算效率肯定是比较高的,毕竟只需要做集合操作。。输出将是可配置维度的向量。相同维度中的哈希值由相同的哈希函数计算。算法参考【https://en.wikipedia.org/wiki/MinHash】

输入和输出

  输入端口个数:1

  输出端口个数:1

参数配置

  

字段配置

  

输出节点的字段配置说明

  运行后不生成新字段。后续节点可以直接选择字段。

results matching ""

    No results matching ""