组件名称:PCA主成分分析

  [版本号:5] [更新时间:2019-10-28]

简介

  PCA主成分分析:可用于提取数据的主要特征分量,常用于高维数据的降维。PCA是一种统计方法,通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。信息的大小通常用离差平方和或方差来衡量。

输入和输出

  输入端口个数:1

  输出端口个数:1

参数配置

参数名称 参数说明 参数默认值 是否必填
全量特征数据表名 全量降维后的特征数据表名,表名不可以是中文可选 -
主成分的个数 设置主成分的个数也即降维后的数据维度可选不能为空 2 -
全量特征数据保存 节点输出的全量降维后的特征数据是否保存至数据库;若保存,会增加时间及存储资源开销可选 No -

字段配置

字段名称 字段说明 字段默认值 是否必配
选择字段列 选择需要PCA降维的字段列 必填

运行后生成的字段列

  运行之后生成的字段列是该组件新增的字段列,在结果数据中会体现出来,后续节点可以选择到这些字段列。

字段名称 字段说明 字段类型
__pca_features 主成分分析的结果列 向量

results matching ""

    No results matching ""