目前最科学的人体临床试验研究(AI改写癌症临床试验入组标准)
目前最科学的人体临床试验研究(AI改写癌症临床试验入组标准)Flatiron Health EHR-derived 数据库(简称Flatiron数据库)是一个囊括美国280家肿瘤中心患者数据的数据库。秉承着样本量越大越好的原则,研究者选择进展期非小细胞肺癌(aNSCLC)患者进行研究,共计61094名。资格标准制定的主要难点在于临床试验人群与真实世界人群存在差异,只有在真实世界人群中才能评判标准制定是否合理,可现实中又很难进行高质量大样本的真实世界队列研究。近年来,随着电子健康记录(EHR)的逐步完善,研究人员能够从中获得足够多的真实世界数据进行研究。近日,来自斯坦福大学的James Zou教授,及基因泰克的Ryan Copping团队实现了对资格标准的优化。研究者利用AI技术,使用真实世界数据模拟已完成的非小细胞肺癌试验,证明一些常见的标准,比如实验室检查指标,几乎不会影响试验的风险比率。同时,使用数据驱动的方法将标准放宽,不仅能将入组人数扩大到
循证医学起源于上世纪80年代,意为“遵循证据的医学”。其核心思想是在医疗决策中将临床证据、个人经验与患者的实际状况和意愿三者相结合,以制定出最合理的治疗措施。
大样本的随机对照临床试验(RCT)是临床证据的主要来源。然而,临床试验的入组标准通常有很严格的限制。举例来说,大约80%的进展期非小细胞肺癌(aNSCLC)患者不符合临床试验的资格标准[1],这也导致约86%的临床试验由于无法按时招募足够的受试者而终止[2]。
大多数临床试验将参与者限制为“低风险人群”,比如年轻且健康的人群,以提高样本的一致性。然而,这可能将一些本能够从试验中获益的人群排除在试验之外,从而无法获得针对这部分人群的安全性和有效性信息。
近年来,研究人员逐渐意识到应当减少临床试验的限制,但资格标准涵盖方方面面,哪些标准可以适当放宽松,能放宽到什么程度,依然缺乏足够的循证证据指导。
近日,来自斯坦福大学的James Zou教授,及基因泰克的Ryan Copping团队实现了对资格标准的优化。研究者利用AI技术,使用真实世界数据模拟已完成的非小细胞肺癌试验,证明一些常见的标准,比如实验室检查指标,几乎不会影响试验的风险比率。
同时,使用数据驱动的方法将标准放宽,不仅能将入组人数扩大到之前的两倍,同时总生存期的风险比率还降低了0.05。这表明有很多不符合最初试验标准的人,也有可能从该治疗方法中获益。相关论文发表在《自然》杂志中[3]。
论文封面截图
资格标准制定的主要难点在于临床试验人群与真实世界人群存在差异,只有在真实世界人群中才能评判标准制定是否合理,可现实中又很难进行高质量大样本的真实世界队列研究。近年来,随着电子健康记录(EHR)的逐步完善,研究人员能够从中获得足够多的真实世界数据进行研究。
Flatiron Health EHR-derived 数据库(简称Flatiron数据库)是一个囊括美国280家肿瘤中心患者数据的数据库。秉承着样本量越大越好的原则,研究者选择进展期非小细胞肺癌(aNSCLC)患者进行研究,共计61094名。
在选定真实世界样本后,研究者在临床试验信息网站(ClinicalTrials.gov)中检索了已完成的aNSCLC相关的三期临床试验。研究者选择仅有两个组别(只有一个试验组和一个对照组)的试验进行研究,且每组都能在Flatiron数据库中找到至少250名符合入组标准的患者。经过详细筛选,总共有10个队列纳入了本研究。
那么,要如何将Flatiron数据库中的数据与已完成的临床试验结合起来呢?本文的研究者开发出一个开源的人工智能工具,称为Trial Pathfinder。该工具可以使用EHR数据模拟临床试验,按照不同的入组标准自动整合EHR数据,并分析总体生存风险比率。同时,使用逆概率加权法来调整基线混杂因素和模拟随机化。
临床试验模拟及分析流程图
通过Trial Pathfinder,研究人员从Flatiron数据库中与选出与这些aNSCLC临床试验使用相同治疗方式的患者,平均每种治疗方式包括5167名患者。随后,研究人员使用每个试验不同的入组资格标准对患者进行了限制,发现仅有30%接受过该治疗的患者能满足其入组要求。
更重要的,对入组标准进行限制之后并没有降低患者的生存风险,有时甚至会增加患者的生存风险。这意味着那些被排除在入组标准之外的患者同样能在从治疗中获益。
那么,不同的入组标准究竟是如何影响合格患者数量及试验结果呢?为了回答这个问题,研究人员在每个aNSCLC临床试验中使用不同的随机资格标准进行了数千次模拟,并通过Shapley值法度量每种标准对总体生存的影响(在本实验中,Shapley值小于0被认为是包含该标准可以降低风险比率)。
经过模拟后研究人员发现,将几种常见的入组标准(如血压,白蛋白水平,前期治疗方法等)放宽后,对总体生存风险比率几乎不会产生什么影响,但以其作为限制却会极大的影响入组人数(比如对淋巴细胞数的限制每增加500个/微升,就会有6.3%的患者无法进入到临床试验中)。
不同资格标准对于风险比率及入组人数的影响
进一步的,研究人员探索了将入组标准放宽后的影响。研究人员保留了上述实验中Shapley值小于0(即能够降低患者风险比率)的入组标准,并将其他标准全部解除。
结果发现,平均入组人数从1553 增加到了3209,增加了107%。这其中包括了更多的女性患者及年龄大于75岁的患者。与此同时,患者的总体生存风险比率甚至还降低了0.05,说明被排除在初始标准之外的患者也能从这些治疗中获益。
总体来说,这项研究为如何确定临床试验入组标准提供了非常有效的循证证据,并为aNSCLC临床试验资格标准的设置提供了指导。同时,也为其他疾病的临床试验标准设置提供了思路。希望日后每种疾病的临床试验标准都能设置的更合理,更普遍化,让更多的人能够从临床试验中获益。
参考文献:
1. Fehrenbacher L. Ackerson L. & Somkin C. Randomized clinical trial eligibility rates for chemotherapy (CT) and antiangiogenic therapy (AAT) in a population-based cohort of newly diagnosed non-small cell lung cancer (NSCLC) patients. J. Clin. Oncol. 27 6538 (2009).
2. Huang G. D. et al. Clinical trials recruitment planning: a proposed framework from the Clinical Trials Transformation Initiative. Contemp. Clin. Trials 66 74–79 (2018).
3. Liu R Rizzo S Whipple S Pal N Pineda AL Lu M Arnieri B Lu Y Capra W Copping R Zou J. Evaluating eligibility criteria of oncology trials using real-world data and AI. Nature. 2021 Apr;592(7855):629-633. doi: 10.1038/s41586-021-03430-5. Epub 2021 Apr 7. PMID: 33828294.
责任编辑丨BioTalker