快捷搜索:  汽车  科技

多元logistics回归分析结果解读(Logistics回归分析之有序多分类逻辑回归)

多元logistics回归分析结果解读(Logistics回归分析之有序多分类逻辑回归)这首赏荷词,词风清韵,如月下荷塘,清新雅舒,暗香袭人。赏荷而不仅见荷,天光云影,山容水态皆入眼帘,而处处都烘托出一种赏荷时的恬淡温馨的气氛。遣词造句中,精挑细拣,“秀、静、瘦、远 ”字字含情。有人谓“ 莲体实肥,不宜言瘦”,(王若虚《滹南诗话》)并尝易“腻”字,意虽同物,而词境界全无。这首咏荷词描写的初秋时节,黄昏月下的荷塘月色。月下荷塘,清虚骚雅,暗香袭人,天光云影间,山容水态貌给人一种幽静温馨的氛围。山黛远,月波长,暮云秋影蘸潇湘。醉魂应逐凌波梦,分付西风此夜凉。【赏析】

序曲

鹧鸪天·赏荷

【宋】蔡松年

秀樾横塘十里香,水花晚色静年芳。

胭脂雪瘦熏沉水,翡翠盘高走夜光。

山黛远,月波长,暮云秋影蘸潇湘。

醉魂应逐凌波梦,分付西风此夜凉。

【赏析】

这首咏荷词描写的初秋时节,黄昏月下的荷塘月色。月下荷塘,清虚骚雅,暗香袭人,天光云影间,山容水态貌给人一种幽静温馨的氛围。

这首赏荷词,词风清韵,如月下荷塘,清新雅舒,暗香袭人。赏荷而不仅见荷,天光云影,山容水态皆入眼帘,而处处都烘托出一种赏荷时的恬淡温馨的气氛。遣词造句中,精挑细拣,“秀、静、瘦、远 ”字字含情。有人谓“ 莲体实肥,不宜言瘦”,(王若虚《滹南诗话》)并尝易“腻”字,意虽同物,而词境界全无。

注:选自 古诗文网

有序多分类逻辑回归分析

既然我们在前面一节中提到 无序多分类逻辑回归,那么既然有无序,相对应的,应该也有 有序多分类逻辑回归。其顾名思义是因变量为有序的分类变量,所进行的逻辑回归分析则为有序多分类逻辑回归。有序回归可用于对药物疗效的分析,因变量可分为无效、缓解、好转、治愈4个等级,其中缓解与好转是病人的主观体验,难以测量与量化,而有序回归就可以进行分析。

有序回归是20世纪80年代发展而来的一种统计技术,有序逻辑回归是其中的一种,应用最为广泛的是累计Logit模型

(1)累计Logit模型

设因变量Y是取值1 2 3,….,k的多项有序变量,X=(X1,X2,X3,…..,Xp)是自变量,则变量Y在X上的逻辑回归模型为:

多元logistics回归分析结果解读(Logistics回归分析之有序多分类逻辑回归)(1)

其中Pj表示 Y<=j的累计概率,aj为常数项,表示所有自变量为0时,出现某一累计结果的概率;B1,B2,….,Bp为回归系数,a和B可用最大似然法求出。

从上述公式我们可以推导出Y取每个值的概率模型,如:Y取1 2 3时拟合的逻辑回归模型为:

多元logistics回归分析结果解读(Logistics回归分析之有序多分类逻辑回归)(2)

其中P1表示Y=1的概率,P2表示Y<=2时的概率,而Y=3作为基础水平,模型中的回归系数保持不变,改变的仅仅是常数项,因此,用回归系数计算的OR值的意义为:在其他自变量固定不变的情况下,某一个自变量每改变一个单位,因变量提高一个和一个以上等级的优势比。SPSS中的回归系数Bk反映自变量Xk对因变量Y>J的效应大小(SAS恰好相反)。

  • Bk=0,表示自变量Xk与因变量Y独立,即Xk对于Y的贡献无统计学意义
  • Bk>0,表示自变量Xk的增加,Y更可能落在有序分类值更大的一端
  • Bk<0,表示自变量Xk的增加,Y更可能落在有序分类值更小的一端

同之前的逻辑回归解释一样,同样可采用优势比来解释,即Xk每增加衣蛾单位,则Y>j的优势将改变exp(Bk)倍

(2) 假设检验

  • 模型参数的检验:对于有序逻辑回归模型中的回归系数的假设检验可以用似然比检验、WALD检验和计分检验。与多重线性回归分析一样,可以用逐步回归的方法对自变量进行筛选,建立只包括有统计学意义自变量的模型。
  • 模型的拟合优度检验:检验模型的拟合优度可以用Perarson拟合优度检验、离差、似然比检验和计分检验等。当检验结果P>0.05(默认为0.05)时,可认为模型拟合较好,反之则拟合较差
  • 平行性检验:有序逻辑回归分析拟合K-1各模型,每个模型的回归系数相等只有常数项不同,即形成k-1条平行的直线,因此,需要对数据的平行性进行检验,看资料是否平行条件。平行性检验也称比例优势假设检验,常用计分检验。当检验结果为P>0.05(通常默认为0.05)时,可认为平行性成立,则有序多项回归分析有统计学意义。反之,平行性不成立。此时则要尝试将因变量的某些取值合并,即减少因变量取值个数,以达到平行性成立的目的
SPSS实现有序多元逻辑回归分析

示例:某大学附属医院采用两种不同的绷带和两种不同的包扎方式对腿部溃疡进行治疗,治疗结果分为3种。分析治疗方式对治疗效果的影响。数据如下:

多元logistics回归分析结果解读(Logistics回归分析之有序多分类逻辑回归)(3)

1.数据描述

  • 设置四个变量,X1—表示绷带,数值型,values:1=bandage-4-layer,0=convatee;X2—表示包扎,数值型,values:1=Granuflex,0=Na;Y—表示治疗效果,数值型;F—表示频数,数值型;

2. 数据加权

  • 打开 数据—个案加权,选择 频数-f 为权重

多元logistics回归分析结果解读(Logistics回归分析之有序多分类逻辑回归)(4)

3. 打开 分析—回归—多元逻辑回归分析

多元logistics回归分析结果解读(Logistics回归分析之有序多分类逻辑回归)(5)

4. 参数选择与说明

(1)主页面

  • 因变量:选择分类变量作为因变量
  • 因子:因素,选择分类自变量作为影响因素,可选择多个
  • 协变量:自变量或协变量,需选择连续变量,1个或多个均可以

多元logistics回归分析结果解读(Logistics回归分析之有序多分类逻辑回归)(6)

(2)选项:设置关于迭代参数的选项

多元logistics回归分析结果解读(Logistics回归分析之有序多分类逻辑回归)(7)

(3)输出:选择模型的输出选项

a.显示

  • 每次迭代到以下步数打印一次迭代历史记录:输出每隔n步的迭代记录,n为在后面空格指定数值;但总会输出迭代第一步和最后一步。
  • 拟合优度统计:输出皮尔逊卡方和似然比卡方统计量,其计算都基于分析变量的分类信息。
  • 摘要统计:输出Cox&Snell卡方、Nagelkerke卡方和McFadden卡方等统计量
  • 参数估算值:输出参数估计值、估计值的标准误和置信区间
  • 参数估算值的渐进相关性:输出参数估计值的相关系数矩阵
  • 参数估算值的渐进协方差:输出参数估计值的协方差矩阵
  • 单元格信息:输出观察和期望频数、累计频数、频率与累积频率的皮尔逊残差、观察概率和预测概率等内容
  • 平行性检验:检验参数估计(斜率系数)在各相应类别中是否相同

b.保存的变量

  • 估算响应概率:把观测记录按相应变量进行分类的估计概率,响应变量有几个水平就保存几个变量
  • 预测类别:保存模型的预测响应分类
  • 预测类别概率:保存最大的估计响应概率
  • 实际类别概率:保存预测正确时的估计响应概率

c.打印对数似然

  • 包括多项常量:默认选项
  • 排除多项常量:如果要比较不包括常数项的预测结果,选择该项

多元logistics回归分析结果解读(Logistics回归分析之有序多分类逻辑回归)(8)

(4)位置:指定模型中的各种主效应和交叉效应

a.指定模型

  • 主效应:表示采用主效应模型,只包括协变量和因素变量的主效应,不包括任何交叉效应
  • 定制:表示采用自定义模型,由用户指定模型分析中的各种效应。

b.交叉效应指定

  • 因子/协变量:显示在主页面选择因子变量和协变量
  • 位置模型:选择模型分析中要用到的各个效应
  • 构建项:指定效应的种类,可选择主效应、交叉效应和所有二阶/三阶/四阶/五阶等交互效应。
  • 选择某个效应的步骤:因子/协变量列表中选择与此效应有关的所有变量,然后在构建项中选择效应类型,在单击黑色尖头把所选变量的指定效应加入位置模型列表中。

多元logistics回归分析结果解读(Logistics回归分析之有序多分类逻辑回归)(9)

(5)标度:设置离差测量模型,内容与 位置模型 对话框相同。

多元logistics回归分析结果解读(Logistics回归分析之有序多分类逻辑回归)(10)

5. 结果输出与解释

(1) 基本描述

  • 显示 各个类别的样本数、百分比等信息。

多元logistics回归分析结果解读(Logistics回归分析之有序多分类逻辑回归)(11)

(2)模型拟合信息表

  • 卡方值为15.522,其显著性p=0.000<0.05,所以模型具有统计学意义

多元logistics回归分析结果解读(Logistics回归分析之有序多分类逻辑回归)(12)

(3)拟合优度与伪R2

  • 在拟合优度表中,p>=0.915>0.05,说明拟合优度较好
  • 伪R2统计量:其三个不同的R2值较小,R2<=0.171。

多元logistics回归分析结果解读(Logistics回归分析之有序多分类逻辑回归)(13)

(4)参数估计值

  • 显示了模型中参数估计值和假设检验的结果,X1(绷带)对治疗效果有影响(p<0.05),而包扎方式(x2)对治疗效果没有影响(p=0.650>0.05)。
  • 绷带的OR值为 0.193(e^(-1.643)),即使用第二种绷带治愈腿部溃疡的可能性仅为第一种别绷带的19.3%,或使用第一种绷带治愈腿溃疡的可能性是使用第二种绷带的5.172倍(e^(1.643)=5.172)。也可以表示为使用第二种绷带治疗腿溃疡至少有效的可能性仅为第一种绷带的19.3%,或使用第一种绷带治疗溃疡至少有效的可能性是使用第二种绷带的5.172倍。

多元logistics回归分析结果解读(Logistics回归分析之有序多分类逻辑回归)(14)

(5)平行性检验

  • 下表给出了平行性检验结果,卡方=0.671,p=0.715>0.05,可认为平行性成立

多元logistics回归分析结果解读(Logistics回归分析之有序多分类逻辑回归)(15)

6.注意事项

  • 有序多项逻辑回归分析的因变量为多项等级资料的回归分析,而自变量可以是数值变量、无序分类变量或有序分类变量。从流行病学的角度,自变量为分类变量时,有利于对结果的解释
  • 如果自变量的编码顺序相反偏回归系数的绝对值不变但符号相反。如上例中,使用第1种绷带为0时得偏回归系数-1.643,而将第二种绷带设定为0时,偏回归系数边数为1.643。
  • 累计逻辑回归分析比二分类回归的参数估计误差小,因此,所需样本量也较少。

7.语法

******************** 加权 ******************. WEIGHT BY f. ******************** 有序多元逻辑回归 ******************. PLUM Y BY X1 X2 /CRITERIA=CIN(95) DELTA(0) LCONVERGE(0) MXITER(100) MXSTEP(5) PCONVERGE(1.0E-6) SINGULAR(1.0E-8) /LINK=LOGIT /PRINT=CELLINFO FIT PARAMETER SUMMARY TPARALLEL /SAVE=ESTPROB PREDCAT PCPROB ACPROB.

猜您喜欢: