快捷搜索:  汽车  科技

广义线性模型的应用实例(广义线性模型)

广义线性模型的应用实例(广义线性模型) 诗人通过“草木”有“知”、惜春争艳的场景描写,反映的其实是自己对春天大好风光的珍惜之情。面对晚春景象,诗人一反常见的惜春伤感之情,变被动感受为主观参与,情绪乐观向上,很有新意。你看,“杨花榆荚”不因“无才思”而藏拙,不畏“班门弄斧”之讥,为“晚春”添色。这就给人以启示:一个人“无才思”并不可怕,要紧的是珍惜光阴,不失时机,“春光”是不负“杨花榆荚”这样的有心人的。韩愈这首诗平中翻新,颇富奇趣,还在于诗中拟人化手法的奇妙运用,糅人与花于一体。“草木”本属无情物,竟然能“知”能“解”还能“斗”,而且还有“才思”高下有无之分。想象之奇,实为诗中所罕见。末二句尤其耐人咀嚼,读者大可根据自己的生活体验进行毫无羁绊的大胆想象,使人思之无穷,味之不尽。【赏析】身在沪,沪疫情疯狂;春尚在,人围于小区,不得赏春。现以韩愈《晚春》赏析分享给大家。在晚春中,用拟人化的手法描绘了晚春的繁丽景色,它还寄寓着人们应

序曲

晚春

韩愈(唐代)

草树知春不久归,百般红紫斗芳菲。

杨花榆荚无才思,惟解漫天作雪飞

【赏析】

身在沪,沪疫情疯狂;春尚在,人围于小区,不得赏春。现以韩愈《晚春》赏析分享给大家。

在晚春中,用拟人化的手法描绘了晚春的繁丽景色,它还寄寓着人们应该乘时而进,抓紧时机去创造有价值的东西这一层意思。但这里值得一提的是,榆荚杨花虽缺乏草木的“才思”,但不因此藏拙,而为晚春增添一景,虽然不美,但尽了努力,这种精神是值得赞扬了。

韩愈这首诗平中翻新,颇富奇趣,还在于诗中拟人化手法的奇妙运用,糅人与花于一体。“草木”本属无情物,竟然能“知”能“解”还能“斗”,而且还有“才思”高下有无之分。想象之奇,实为诗中所罕见。末二句尤其耐人咀嚼,读者大可根据自己的生活体验进行毫无羁绊的大胆想象,使人思之无穷,味之不尽。

 诗人通过“草木”有“知”、惜春争艳的场景描写,反映的其实是自己对春天大好风光的珍惜之情。面对晚春景象,诗人一反常见的惜春伤感之情,变被动感受为主观参与,情绪乐观向上,很有新意。你看,“杨花榆荚”不因“无才思”而藏拙,不畏“班门弄斧”之讥,为“晚春”添色。这就给人以启示:一个人“无才思”并不可怕,要紧的是珍惜光阴,不失时机,“春光”是不负“杨花榆荚”这样的有心人的。

注:来源于 古诗文网

广义线性模型简介

广义线性模型(Generalized Linear model)由Nelder & Wedderburn(1972)收下提出,是一般线性模型的直接推广,它使因变量的总体均值通过一个非线性连接函数(Link Function)而依赖于线性预测值,同时还允许响应概率分布为指数分布族中的任何一员。许多广泛应用的统计模型均属于广义线性模型,如Logistic回归模型、Probit回归模型、Poission回归模型、负二项回归模型等。

广义线性模型的应用实例(广义线性模型)(1)

一个线性模型包括以下三个组成部分:

(1)线性成分:在给定的回归中,用来解释研究现象的部分,好像很抽象,我理解的就是System Component描述了这个问题的形态,比如在GLM中,系统成分是linear predictor(线性预测算子)

(2)随机成分:随机成分则是用来定义待预测的未知的形态,即响应变量的形态。在GLM中,就是指数分布族模型

(3)连接函数:述了随机成分与系统成分之间的关系,在GLM中,联结函数连接了响应变量的期望(也就是我们的预测目标)与linear predictor(线性预测算子)。连接函数为一单调可微(连续且充分光滑)的函数。

广义线性模型在两个方面对经典线性模型进行了推广:

(1)一般线性模型中要求因变量是连续的且服从正态分布,在广义线性模型中,因变量的分布可扩展到非连续的资料,如二项分布、Possion分布、负二项分布等。广义线性模型通过放松因变量的分布限制,将因变量的分布范围从正态分布扩展到符合二项分布、Poisson分布、负二项分布等指数分布族。

(2)一般线性模型中,自变量的线性预测值就是因变量的估计值,而广义线性模型中,自变量的线性预测值是因变量的函数估计值。广义线性模型通过连接函数,把因变量取值变换到自变量的线性预测的取值范围(-∞ ∞),把指数分布族的变量统一到一个模型的框架中,具有极大的灵活性。

SPSS实现广义线性模型

示例1:某研究分析居住地类型与蚊虫幼虫孳生的关系,对299个不同居住地的家庭进行调查,资料呈负二项分布,具体数据见下表。

广义线性模型的应用实例(广义线性模型)(2)

1. 数据转换
  • 将原始数据转换为SPSS数据格式

广义线性模型的应用实例(广义线性模型)(3)

2. 数据加权
  • 打开 数据—个案加权:选择count 作为权重

广义线性模型的应用实例(广义线性模型)(4)

3. 广义线性模型
  • 打开 分析—广义线性模型—广义线性模型

广义线性模型的应用实例(广义线性模型)(5)

(1)模型类型 选项框:为模型指定分布和关联函数

广义线性模型的应用实例(广义线性模型)(6)

  • 标度响应

线性:将正态指定为分布,将恒等指定为关联函数。

Gamma与对数链接:将Gamma指定为分布,将对数指定为关联函数。

  • 有序响应

有序logistic:将多项(序数)指定为分布,将累积 logit 指定为关联函数。

有序概率:将多项(序数)指定为分布,将累积 probit 指定为关联函数。

  • 计数

泊松对数线性:将泊松指定为分布,将对数指定为关联函数

负二项式与对数连接:将负二项式(拥有值为 1 的辅助参数)指定为分布,将对数指定为关联函数。在本例中将选择 负二项式与对数连接。

  • 二元响应或事件/试验数据

二元 logistic:将二项式指定为分布,将 Logit 指定为关联函数。

二元 probit:将二项式指定为分布,将 Probit 指定为关联函数

区间隔检查生存:将二项式指定为分布,将互补双对数指定为关联函数。

  • 混合

Tweedie与对数链接的:将 Tweedie 指定为分布,将对数指定为关联函数。

Tweedie与恒等式链接:将 Tweedie 指定为分布,将恒等指定为关联函数。

(2)响应 选项框:为模型指定因变量

仅采用两个值的变量和记录试验中事件的响应需要额外注意:

  • 二元响应:如果因变量仅采用两个值,那么可以为参数估计指定参考类别。二元响应变量可以是字符串或数值。
  • 一组试验中发生的事件数量:当响应是一系列试验中发生的事件数时,因变量包含事件数,可以额外选择一个包含试验数的变量。或者,如果试验数在所有主体中都相同,则可以使用固定值指定试验。试验数应大于等于每个个案的事件数。事件应为非负整数,试验应为正整数。

广义线性模型的应用实例(广义线性模型)(7)

(3)预测变量 选项框:为模型指定自变量或协变量

  • 因子:因子是分类预测变量,可以是数值或字符串。
  • 协变量:协变量为标度预测变量,必须为数值。
  • 偏移量:偏移量项是"结构化"预测变量。模型不估计该预测变量的系数,但假定其值为 1;因此,偏移量值只是简单地加到目标的线性预测变量中。这在每个个案对于被观察事件都可能具有不同显现水平的泊松回归模型中尤其有用。 例如,当对各个驾驶员事故率进行建模时,3 年驾驶经历出现 1 次事故和 25 年出现 1 次事故的驾驶员之间 有着重大的差别!如果将驾驶员经历的自然对数纳入偏移量项,则事故数可以建模为具有对数关联的泊松或负 二项式响应。

广义线性模型的应用实例(广义线性模型)(8)

(4)模型:指定模型效应。缺省模型是仅截距模型,因此必须明确指定其他模型效应。还可以构建嵌套或非嵌套项。

  • 在模型中,可构建主效应或交互效应
  • 嵌套项:有助于对其值不与另一个因子的水平交互作用的因子或协变量的效应进行建模。例如,杂货连锁店可能在不同商店位置迎合顾客的不同消费习惯。由于每位顾客只经常光顾某一位置的商店,因此可以说客户效应嵌套在商店位置效应中

广义线性模型的应用实例(广义线性模型)(9)

(5)EM平均值:显示因子级别和因子交互的估计边际平均值。您还可以要求显示整体估计平均值。

  • 显示以下项的平均值:计算所选因子和因子交互的估计平均值。对比决定如何设定假设检验以比较估计平均值。简单对比需要一个用于比较其他项的参考类别或因子级别。在对比项中可选择 成对、简单、偏差、差异等比较方式
  • 多重比较调整:在执行包含多重比较的假设检验时,总体显著性水平可从所包含的比较的显著性水平进行调节
  • 显著性最低的差异:此方法并不控制拒绝某些线性对比不同于原假设值这一假设的总体概率。

Bonferroni:根据多项对比检验调整观察到的显著性水平。

连续 Bonferroni (Sequential Bonferroni):按顺序逐步降低的拒绝 Bonferroni 过程,在拒绝个别假设方面不保守,但维持相同的总体显著性水平。

Sidak:提供比 Bonferroni 方法更严格的界限。

连续 Sidak (Sequential Sidak):一个逐步下降的排斥性 Sidak 过程,就排斥单个假设而言,其保守性小得多,且保持了相同的总体显著性水平。

广义线性模型的应用实例(广义线性模型)(10)

4. 参数选择
  • 响应 选项卡:将 y 选入 因变量
  • 预测 选项卡:将 x 选入 因子 列表框
  • 模型 选项卡:将 x 选入 模型 列表框
  • EM平均值 选项卡:将 x选入显示均值 列表,将 对比 方式 选为 成对,并将 调节多重比较 选择为 斯迪克 方法。
5. 结果分析
  • 模型基本信息

广义线性模型的应用实例(广义线性模型)(11)

  • 模型效应检验:本模型只有1个自变量,其p<0.05,说明差异有统计学意义。说明不同居住地家庭蚊虫幼虫孳生情况不同

广义线性模型的应用实例(广义线性模型)(12)

  • 参数估计值:可看出农村和城郊结合部的蚊虫幼虫孳生情况高于城市。

广义线性模型的应用实例(广义线性模型)(13)

  • 两两比较:可看出,农村与城郊结合部之间没有显著性差异,而农村和城郊结合部与城市均有显著性差异,且均值高于城市。

广义线性模型的应用实例(广义线性模型)(14)

6. 语法

* 加权. WEIGHT BY count. * 广义线性模型. GENLIN y BY x (ORDER=ASCENDING) /MODEL x INTERCEPT=YES DISTRIBUTION=NEGBIN(1) LINK=LOG /CRITERIA METHOD=FISHER(1) SCALE=1 COVB=MODEL MAXITERATIONS=100 MAXSTEPHALVING=5 PCONVERGE=1E-006(ABSOLUTE) SINGULAR=1E-012 ANALYSISTYPE=3(WALD) CILEVEL=95 CITYPE=WALD LIKELIHOOD=FULL /EMMEANS TABLES=x SCALE=ORIGINAL COMPARE=x CONTRAST=PAIRWISE PADJUST=SIDAK /MISSING CLASSMISSING=EXCLUDE /PRINT CPS DESCRIPTIVES MODELINFO FIT SUMMARY SOLUTION.

猜您喜欢: