组件名称:广义线性回归

  [版本号:5] [更新时间:2019-10-28]

简介

  广义线性回归:是一般线性回归模型的直接扩展,它使因变量的总体均值通过一个非线性连接函数进行变换,从而依赖于线性预测值。广义线性回归在两个方面对普通线性回归模型进行了扩展:1.一般线性回归中要求因变量是连续的且服从正态分布。在广义线性回归中,因变量的分布可扩展到非连续的分布族,如高斯分布、二项分布、泊松分布等。2.一般线性回归中,自变量的线性预测值就是因变量的估计值,而广义线性回归中,自变量的线性预测值是因变量的连接函数估计值。【该组件执行后可以生成模型,后续将保存在左侧组件栏下方的模型列表,直接拖拽到画布使用或在快速应用页面直接使用。】

输入和输出

  输入端口个数:1

  输出端口个数:1

参数配置

参数名称 参数说明 参数默认值 是否必填
正则化项系数 平衡loss和正则化项的大小以使得模型的训练误差和泛化能力达到最优 0 必填
因变量分布族 广义线性回归适用于预测的因变量不遵循正态分布的情况,需要根据预测变量(因变量)的分布确定分布族类型。 高斯分布【gaussian】 必填
模型训练优化算法 包括l-bfgs、normal和auto。l-bfgs是BFGS算法在受限内存时的一种近似算法,也即一种受限内存的拟牛顿优化方法;normal是使用normalequation去解决线性回归模型的一种方法;auto是优化算法自动选择。 auto 必填
是否设置截距项 Yes 必填
连接函数名称 描述线性预测器和因变量分布族函数的均值之间关系,不同因变量分布族的预测器与连接函数的对应关系如下:高斯分布【gaussian】可选identity、log、inverse;二项式分布【binomial】可选logit、probit、cloglog;泊松分布【poisson】可选log、identity、sqrt;伽马分布【gamma】可选inverse、identity、log; identity 必填
最小收敛误差 1e-06 必填
最大迭代次数 100 必填

字段配置

字段名称 字段说明 字段默认值 是否必配
特征列 输入模型的样本特征列,必须是数值型字段列必选 必填
标签列 输入模型的样本类别标签列,必须是数值型字段列必选 必填

运行后生成的字段列

  运行之后生成的字段列是该组件新增的字段列,在结果数据中会体现出来,后续节点可以选择到这些字段列。

字段名称 字段说明 字段类型
__prediction 预测结果字段列 双精度类型

results matching ""

    No results matching ""