相关分析假设检验步骤:连续变量假设检验
相关分析假设检验步骤:连续变量假设检验2. 重复测量数据方差分析参数说明1. 数据录入:重复测量数据设计的优缺点:示例:一项药物代谢动力学研究,目的是对比某种药物的不同剂型在体内的代谢速度。剂型分胶囊型和片剂型。将16名受试者随机分为2组,每组8名。一组给予胶囊,另一组给予片剂,分别在服药后1/2/4/6/8小时测定药物浓度。说明:受试者服药后药物浓度在5个时间点上重复测量,即重复测量有5个水平。剂型对代谢速度的效应属于组间效应,测量时间效应及其剂型的交互作用属于组内效应。
重复测量数据方差分析概述重复测量数据(Repeated Measures Data)是医学领域十分常见的一种数据形式,是指对同一批研究对象的同一观测指标或多个测量指标,在不同时间点(或同一个体不同部位等)的多次测量结果。其目的就是观察不同时间点的动态变化趋势特征。因为数据的类型分为数值变量、分类变量和等级变量,因此重复测量数据分析就会相应产生这三类资料的重复测量数据分析,因数值变量的重复测量更为常用。
重复测量数据方差分析的分析条件如下所述:
- 正态性:处理因素的各处理水平的样本个体之间是相互独立的随机样本,其总体均数服从正态分布;
- 方差齐性:相互比较的各处理水平的总体方差相等,即具有方差齐性;
- 时间点组成的协方差阵(covariance matrix)具有球形性(sphericity)特征:Box(1954)指出,若球形性质得不到满足,则方差分析的F 值是有偏差的,这会造成过多的拒绝本来是真的无效假设(增加了I 型错误)。
重复测量设计最常见的情况是前后测量设计(Premeasure-Postmeasure Design)。当前后测量设计的重复测量次数m>=3时,可称之为重复测量设计或重复测量数据。
在重复测量设计中,研究者对同一研究对象在几个固定观测点做动态观测,各观测点固定,不能随机分配;不同观测点数据间彼此不独立或者不完全独立,存在一定的相关性。因此,重复测量数据有专门的统计分析方法,一是采用多元分析方法,如多元方差分析或轮廓分析;二是重复测量数据的一元方差分析。
重复测量数据设计的优缺点:
- 优点:把单个个体作为自身的对照,克服了个体之间的差异,分析时能更好地集中于研究效应;同时,把自身当做对照,研究所需的样本就相对减少。
- 缺点:滞留效应,前面处理的效应有可能滞留到下一次的处理;潜隐效应,前面处理的效应有可能激活原本不活跃的效应;学习效应,由于逐步熟悉了实验方式,研究对象的反应能力在后面的处理中也可能逐步提高。
示例:一项药物代谢动力学研究,目的是对比某种药物的不同剂型在体内的代谢速度。剂型分胶囊型和片剂型。将16名受试者随机分为2组,每组8名。一组给予胶囊,另一组给予片剂,分别在服药后1/2/4/6/8小时测定药物浓度。
说明:受试者服药后药物浓度在5个时间点上重复测量,即重复测量有5个水平。剂型对代谢速度的效应属于组间效应,测量时间效应及其剂型的交互作用属于组内效应。
1. 数据录入:
- 在SPSS的“变量视图”中设置共七个变量:id 表示编号,数值型;type 表示药物剂型,数值型,1=胶囊型,2=片剂型;time1-time5 表示服药后1h、2h、4h、6h、8h的血药浓度。
2. 重复测量数据方差分析参数说明
(1) 打开 分析—一般线性模型—重复测量
(2) 参数说明
a. 因子定义
- 同其他方差分析不同的是,使用“重复测量”,必须正确设置数据。在此对话框中定义主体内因子。注意,这些因子不是数据现有变量,而是在这里定义的因子。
- 主体内因子:定义组内因素名称,不能是数据文件中的变量名。在本例中,定义为 time
- 级别数:定义因素的水平,每个水平代表对受试者的一次观测。在本例中,为5次测量,级别数定义为5。
- 测量名称:定义测量的名称,当重复测量的反应变量多于1个时,可进行多变量测量分析。
b. 重复测量
- 主体内变量:为每个组内因素水平的组合选择一个反应变量。(n,浓度)n代表浓度的不同测量水平。必须选项。在本例中,将time1-time5 选入 主体间变量
- 主体间因子:选择一个或多个组间因素。非必须选项。在本例中,将 剂型 选入 主体间因子。
- 协变量:定义协变量,非必须选项
c. 模型
- 全因子:系统默认。系统将分析所有的因素变量、协变量主效应以及因素与因素间的交互作用,但不包括协变量的交互作用
- 构建项:可以仅指定其中一部分的交互或指定因子协变量交互。必须指定要包含在模型中的所有项
- 构建定制项:如果要包含嵌套项,或者想要按变量显式构建任何项,则可选择该项
- 因子与协变量:列出因子与协变量
- 模型:显示选中的因素变量与交互作用
- 构建项—类型:在选择构建项后,类型会被激活。包括交互效应、主效应、所有二阶、三阶、四阶和五阶选项。交互效应=可以建立所有被选变量的最高水平的交互效应。主效应=分析因素不同水平之间的差异,但不考虑交互项。所有二阶/三阶/四阶/五阶:表示模型中考虑所有二维/三维/四维的交互效应
- 平方和:类型1=表示分层处理平方和,仅处理主效应项,适用于平衡的ANOVA和嵌套模型。类型2=表示处理所有其他效应,进行调整,适用于平衡的ANOVA、主因子效应模型、回归模型和嵌套模型等。类型3=表示可以处理类型1和类型2的所有效应,使用范围广。类型4=表示对任何效应度处理。
- 在模型中包括截距:表示计算模型中含有截距。
- 在本例中,采取默认选项,即全因子模型
d. 对比:对比用来检验因子的水平之间的差值
- 因子:显示主对话框中的因素,每个因素其后括号显示对比的方法
- 对比:选择对比的方法,默认为无。偏差=将每个水平(参考类别除外)的平均值与所有水平的平均值(总平均值)进行比较。因子的水平可以为任何顺序。简单=将每个水平的平均值与指定水平的平均值进行比较。当存在控制组时,此类对比很有用。可以选择第一个或最后一个类别作为参考类别。差分=将每个水平的平均值(第一个水平除外)与前面水平的平均值进行比较。(有时候称为逆 Helmert 对比。)Helmert=将因子的每个水平的平均值(最后一个水平除外)与后面水平的平均值进行比较。重复= 将每个水平的平均值(最后一个水平除外)与后一个水平的平均值进行比较。多项式=比较线性效应、二次效应、三次效应等等。第一自由度包含跨所有类别的线性效应;第二自由度包含二次效应,依此类推。这些对比常常用来估计多项式趋势。
e. 图:对比用来检验因子的水平之间的差值
- 水平轴:水平坐标轴,从因子中选择因素变量
- 单独的线条:从因子列表中选入一个因素变量,对其每个取值水平,单独做一条直线
- 单独的图:从因子列表中选入一个因素变量,对其每个取值水平,分别输出一个图形
f. 选项:显示各类统计指标
- 本例中选择 效应量估算和齐性检验
3. 数据结果与说明
(1) 组内因素和组间因素表:组内因素间表A,测量为浓度,因素为time,水平数为5,分别对应time1-time5。组内因素间表B,因素为剂型,两个水平。
(2) 博克斯组间方差-协方差矩阵齐性检验:重复测量数据的多元方差分析是有条件的:多元正态分布、方差齐性。从下表看到,显著性p=0.122>0.05,说明各组方差齐性。
(3) 组间多因素方差分析:如下图所示
o 因素time的4个多元检验统计量P<0.05,可认为不同时间点上患者血药浓度差异有显著性统计学意义。
o 因素time和type的交互作用p=0.253>0.05,所以不能认为剂型和时间有交互作用。
(4) 莫奇来(Mauchly’s)球对称检验结果:
o 无效假设是对数据进行正交对比变化后的协方差矩阵与单位矩阵I成比例,即资料满足H型协方差矩阵的条件。检验显著性p=0.002<0.05,由此可见,数据不满足H型方差矩阵的条件,应对重复测量一元方差分析中组内效应的自由度进行校正。
(5) 重复测量数据组内效应一元方差分析:
- 此表与一般的方差分析表的最大区别是对于每个效应项,同时给出了4种方法的检验结果:球对称检验、Greenhouse-Geisser校正结果、Huynh-Feldt校正结果、Lower-bound校正结果。在校正结果中,Greenhouse-Geisser校正结果更常用。
- 本例由于不满足球对称检验,所有检验结果应以校正后的结果为准。其他3种校正的p<0.05,说明不同时间点的受试者血药浓度的差异具有统计学意义。
- 而时间与剂型之间无交互作用(3种校正的p值均大于0.05).
(6) 对比检验:
- 方差分析针对的是各组均数效应的差异是否有统计学意义,而重复测量数据往往反映是的统计指标的变化趋势。
- 在本例中,重复测量了5次,所以可拟合4次曲线。
- 从下表可见time的,线性和二次曲线拟合P<0.05,也就是说血药浓度随时间变化成线性或二次关系。但两者哪个更符合,我们需要查看各自的F值,线性的F值=181.972>二次曲线的F值=138.939,因此,线性关系更符合。
- 在time*type中,二次曲线的p=0.023<0.05,所以可认为两组患者服药后1-8小时的变化趋势是不相同的。
(7) 单变量组间方差齐性检验
- 由下表可知,time1-time5变量的显著性p>0.05,说明各组间方差齐性。
(8) 重复测量数据组间效应一元方差分析
- 在下表中,给出处理因素剂型效应的统计检验结果:p=0.064>0.05,故不能认为服用不同剂型药物后血药浓度的差异有统计学意义。
(9) 轮廓图
o 按照不同剂型给出5个时间点上受试者血药浓度的均数变化曲线,可看出:两种剂型的浓度随时间变化,基本可以看出是抛物线,支持对比检验的结果。
(10) 研究结论:
- 本例处理的是对服用不同剂型药物后患者的血药浓度,以剂型为组间处理因素、以time1-time5为重复测量变量,进行重复测量数据方差分析。
- 组间效应方差分析结果发现:分析不同剂型药物后患者血药浓度的差异无统计学意义。
- 对组内效应的检验有两种方法:一是多元方差分析:在95%的置信度下,因素time的4个多元检验统计量p<0.05,认为不同时间点上患者血药浓度的差异有统计学意义;而因素time和type的交互作用p>0.05,所以不能认为剂型和时间有交互作用。二是一元方差分析,因为数据不满足H型协方差矩阵的条件,所以采用校正结果分析,检验结果与多元方差分析结果相同,
- 对趋势进行的对比结果显示:不同剂型的二次项检验的p<0.05,所以两组受试者服药后1-8h血药浓度的变化是不相同的。其趋势变化可用二次曲线反映。
4. 语法
GLM time1 time2 time3 time4 time5 BY type
/WSFACTOR=time 5 Polynomial
/MEASURE=浓度
/METHOD=SSTYPE(3)
/PLOT=PROFILE(time*type) TYPE=LINE ERRORBAR=NO MEANREFERENCE=NO YAXIS=AUTO
/PRINT=ETASQ HOMOGENEITY
/CRITERIA=ALPHA(.05)
/WSDESIGN=time
/DESIGN=type.