生存率和1年总生存率:生存曲线的比较
生存率和1年总生存率:生存曲线的比较在生存曲线的比较中,我们就是用每组中实际死亡数和理论死亡数之间的差异来判断各组的生存率是否有差异的。为什么这个公式是这样的?为什么要计算平方?看看之前发过的这篇文章你就懂了!总体的生存情况是由总体生存曲线来反映的,我们知道,生存曲线的横轴为生存时间,纵轴为生存率。因此,比较总体生存状况是否有差异,就是比较相同生存时间所对应的生存率是否有差异。一、比较率的差异!如此熟悉说到『率的差异』,你是否想起了我们熟悉的卡方检验?在之前的文章中讲过,卡方检验的基本思想是:
公众号: 丁点帮你
作者:丁点helper
最近我们用三篇文章详细介绍了如何整理生存资料,进而以此为基础计算生存率和中位生存时间,并绘制生存曲线。
但这仅仅是对样本中个体的生存率随生存时间的变化过程的统计描述,在实际工作中,我们往往也需要关注不同样本所代表的总体的生存情况是否存在差异。
总体的生存情况是由总体生存曲线来反映的,我们知道,生存曲线的横轴为生存时间,纵轴为生存率。因此,比较总体生存状况是否有差异,就是比较相同生存时间所对应的生存率是否有差异。
一、比较率的差异!如此熟悉
说到『率的差异』,你是否想起了我们熟悉的卡方检验?在之前的文章中讲过,卡方检验的基本思想是:
- 假设每组中结局的发生率相同,均为P%;
- 我们可以计算在这个假设前提下,每组中结局发生的次数,这个次数叫做理论次数。理论次数的意义是,假设每组的率相同时,理论上每组发生结局的次数是多少;
- 如果1.中的假设成立,“实际观察到的次数”和“理论次数”之间不会差很多。如果两者的差距过大,达到我们规定的某个水平,就认为在1.中假设成立的情况下是不会出现的,此时就会拒绝原假设,即不能认为每组中结局的发生率是相同的。这个差距就是通过值来体现的,计算方法为:
为什么这个公式是这样的?为什么要计算平方?看看之前发过的这篇文章你就懂了!
在生存曲线的比较中,我们就是用每组中实际死亡数和理论死亡数之间的差异来判断各组的生存率是否有差异的。
下面我们用一个生存资料的例子来看看上面3个步骤如何实现:
二、2种治疗方法的效果比较
案例:某医生在工作中观察到肺癌患者在其手术后辅以化学药物治疗,其存活时间有所变化。为明确肺癌患者术后辅以化学药物治疗的效果,他对该院3年前收治的肺癌患者术后进行辅助化疗的12人和同期仅进行手术治疗的患者10人进行了回顾性调查,他们的生存资料整理在下表中(1)~(5)、(7)~(9)列。忘记生存资料如何整理的同学戳此复习~那么两组治疗方案的患者生存率是否不同?
三、检验过程
1. 建立检验假设,确定检验水准
H0:两种治疗方案下,肺癌患者的生存率相同
H1:两种治疗方案下,肺癌患者的生存率不同
假设中所指的两组生存率相同应该如何理解?首先要明确,生存率是由每一期的生存概率计算得到的,而每一期的生存概率是由每一期的死亡概率计算得到的。详细计算步骤参见之前的文章。因此假设生存率相同,归根结底是假设每一期的死亡概率相同。由于我们假设两组每一期的死亡概率相同,那么将两组患者作为一个整体,这个整体每一期的死亡概率应该分别等于各组每一期的死亡概率。
整体每一期的死亡概率就是每一期两组总死亡人数/ 期初两组总病人数,即
。
- ,为期初总病人数,见上表第(11)列。。
- ,为各期总死亡人数,见上表第(12)列。
2.计算检验统计量
通过相等的死亡概率,再反推每一组的理论死亡数,然后计算实际观察到的死亡数与理论死亡数的
值来判断差距是否足够大,从而决定假设是否可以被拒绝。
辅助化疗组每一期的理论死亡数
,见上表第(6)列。
单纯手术组每一期的理论死亡数
,见上表第(10)列。
由表可知,两组合计的理论死亡数分别为12.8860和5.1140。
接下来就可以计算
值:
如果两组各期的死亡概率相同,那么两组的理论死亡人数和实际死亡人数之差应该不大。
3. 确定P值,作出推断
由于
值服从自由度为(组数-1)的
分布,因此查
界值表得,
。两组肺癌患者术后每期死亡概率的差异有统计学意义、其生存曲线的差异有统计学意义。
以上方法就是常用的比较多组生存曲线的方法,被称为对数秩检验(log-rank test)法。
该方法的基本思想是假定拟进行比较的不同总体生存函数无差别,根据不同生存时间的期初观察人数和理论死亡概率,计算两个(或多个)比较组的理论死亡数,并与实际观察到的死亡数进行比较。衡量观察数与理论数差别大小的统计量为
值,服从自由度为(组数-1)的
分布。
这段话引自统计学教科书,正是对本文例子中的3个步骤进行了一个概括。