组件名称

  PCA主成分分析 [版本号:1] [更新时间:2018-05-08]

简介

  PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,它是无监督学习。PCA的思想是将n维特征映射到k维空间上(k小于n),这k维特征是全新的正交特征,是重新构造出来的k维特征,而不是简单地从n维特征中去除其余n−k维特征。可用于提取数据的主要特征分量,常用于高维数据的降维。

输入和输出

  输入端口个数:1

  输出端口个数:1

参数配置

参数名称 参数说明 参数默认值 是否必填
主成分的个数 设置主成分的个数也即降维后的数据维度 可选 不能为空 2 -
全量特征数据表名 全量降维后的特征数据表名,表名可以是中文 可选 -
全量特征数据保存 节点输出的全量降维后的特征数据是否保存至数据库;若保存,会增加时间及存储资源开销 可选 No -

字段配置

字段名称 字段说明 字段默认值 是否必配
原样输出列 推荐添加id列,方便评估 必填
选择字段列 选择需要PCA降维的字段列 可选 必填

输出节点的字段配置说明

  运行后不生成新字段。后续节点可以直接选择字段。

results matching ""

    No results matching ""