早期实体瘤试验疗效评估——统计分析方法应用与实现

有临
2024.04.29
124

抗肿瘤药物临床试验多年来一直是重点领域。由于该领域的数据特征,相应统计分析方法的应用、统计分析软件实现(如SAS和R),以及前期数据集的准备(如SDTM和ADaM)都是行业关注热点。本系列文章尝试从实际工作出发,从数据集准备开始,然后逐个环节及评估指标介绍,一直到统计分析方法描述和最终统计图表生成。本文为该系列首篇,侧重于实体瘤疗效评估统计分析方法,尤其在早期临床试验中的应用。

  

01. 肿瘤试验数据流程和分析数据集准备

早期实体瘤临床试验常见肿瘤相关的原始数据(raw data)集包括靶病灶、非靶病灶、新病灶和肿瘤总体评估数据集,经过数据整合及逻辑处理最终生成疗效分析图表前的分析数据集。数据整合流程如下:


图片8.png


《药物临床试验数据递交指导原则(试行)》中提到“鼓励申办方参照临床数据交换标准协会(Clinical Data Interchange Standards Consortium,CDISC)标准递交临床试验数据及相关的申报资料”。从合规性和数据处理高效的双重角度出发,依据CDISC数据标准来处理肿瘤相关数据无疑是明智之举。下面,我们将从SDTM(Study Data Tabulation Model,研究数据列表模型)和ADaM(Analysis Data Model,分析数据模型)两个核心标准出发,简要阐述这一数据处理流程。


1.1 肿瘤试验原始数据SDTM标准格式

肿瘤/病灶标识(TU):单一的肿瘤 ID;肿瘤的解剖学位置;标识肿瘤的方法;独立标识肿瘤的角色;以及时间信息。

肿瘤/病灶测量(TR):单一的肿瘤 ID;测试和结果;肿瘤评估者的角色;以及时间信息。



图片9.png

1:靶病灶页

图片10.png

2:非靶病灶页

图片11.png

3:新病灶页


疾病效应/状态评估(RS):TR数据决定的反应评估。

图片12.png

4:肿瘤总体评估页

1.2 肿瘤试验常见分析数据集ADaM标准格式

 

肿瘤/病灶测量分析数据集(ADTR):涉及SDTM数据集中的TU和TR以及受试者水平分析数据集(ADSL),经由同一受试者相同的TULNKID、TRLNKID进行合并,根据分析需要衍生变量,如基线(ABLFL)、相对基线变化(CHG)、相对基线变化百分比(PCHG)等。

 

疾病效应/状态评估分析数据集(ADRS):涉及SDTM数据集中的RS以及分析数据集ADSL和ADTR,依据RECIST 1.1评估标准,衍生最佳疗效评估(BOR)(每个受试者一条记录),未经确认BOR、客观缓解率(ORR)、疾病控制率(DCR),经确认BOR、ORR、DCR。

 

时间事件分析数据集(ADTTE):涉及分析数据集ADRS和ADSL;根据各个终点指标的删失规则,进行删失数据的处理;常用1表示删失,0表示事件;分析值(AVAL)=ADT-STARTDT+1(天);EVNTDESC来源于统计分析计划(SAP)中的各类删失情形描述。

 

 

02. 疗效指标定义及衍生过程

最佳疗效评估(BOR)

考虑各种需要确认的要求后,从研究治疗开始至试验结束的最佳疗效记录。患者的最佳疗效评估主要依赖靶病灶和非靶病灶的结果以及新病灶的出现情况。此外,还依赖于试验性质、方案要求及结果衡量标准。具体来说,在以肿瘤缓解为主要终点的非随机试验中,部分缓解(PR)或完全缓解(CR)的疗效确认是必须的,以确认哪个是最佳整体疗效评估。


指标BOR的计算基于分析数据集ADRS,BOR的产生依据RECIST 1.1标准

疗效评估按最佳程度排序为:完全缓解(CR)>部分缓解(PR)>疾病稳定(SD)>疾病进展(PD)>不可评价(NE)

分析天数(ADY)=每个访视疗效结果对应的影像学检查日期(ADT)-首次给药日期(TRTSDT)+1(天)

当BOR为SD时,SD持续最短时间≥4周(或方案中规定的时间间隔),即ADY≥28,否则BOR为NE。CR、PR的受试者需4周后进行疗效确认,即要看随后时间点的疗效结果(详细判断规则详见图5)。

图片13.png

5:BOR判断规则


客观缓解率 (Objective response rate, ORR)

是指肿瘤体积缩小达到预先规定值并能维持最低时限要求的患者比例(主要针对实体肿瘤而言),根据肿瘤缩小程度分为完全缓解(CR)和部分缓解(PR)。

指标ORR的计算基于分析数据集ADRS,变量X1表示BOR为CR和PR的受试者例数,Y1表示纳入对应分析集的例数(如疗效可评估分析集),ORR=X1/Y1*100%。

 

疾病控制率 (Disease control rate, DCR)

指按照公认的缓解评价标准(如实体瘤 RECIST 1.1 版),肿瘤经治疗后获得缓解(CR+PR)和疾病稳定(SD)并能维持最低时限要求的患者比例。

指标DCR的计算基于分析数据集ADRS,变量X2表示BOR为CR、PR和SD的受试者例数,Y2表示纳入对应分析集的例数(如疗效可评估分析集),DCR=X2/Y2*100%。

 

对于时间-事件指标

涉及生存时间、完全数据以及删失数据。

生存时间:指从规定的观察起点到某一特定终点事件出现经历的时间长度。其三要素,观察起点、终点事件和时间的度量单位。

完全数据:在规定的观察期内,对某些观察对象如观察到终点事件发生,从起点到终点事件发生所经历的时间,成为生存时间的完全数据。完全数据提供的是准确的生存时间。

删失数据:随访期间并非所有患者都会出现研究者所关心的结局。对某些观察对象由于某种原因未能观察到终点事件的发生,并不知道确切的生存时间,成为生存时间的删失数据。

图片14.png

6:常见时间-事件疗效指标的删失规则


总生存期 (Overall survival, OS)

指从首次给药至因任何原因引起死亡的时间。

指标衍生方法:OS的计算基于分析数据集ADTTE,ADT表示死亡日期或删失日期,STARTDT表示首次给药日期,OS= ADT- STARTDT+1(天)。

 

无进展生存期 (Progression freesurvival , PFS)

从首次给药至首次出现疾病进展或死亡的时间。

指标衍生方法:PFS的计算基于分析数据集ADTTE,ADT表示疾病进展或死亡日期或删失日期,STARTDT表示首次给药日期,PFS=ADT-STARTDT+1(天)。

 

缓解持续时间(DoR)

定义为肿瘤第一次评估为 CR 或 PR 开始到第一次评估为 PD或任何原因导致死亡的时间。

指标衍生方法:DoR的计算基于分析数据集ADTTE,ADT表示第一次疾病进展或死亡日期或删失日期,STARTDT表示第一次评估CR或PR对应的影像学检查日期,DoR= ADT- STARTDT+1(天)。

 

肿瘤进展时间(TTP)

从首次给药至明确的疾病进展之日所经历的时间。不包括死亡。

指标衍生方法:TTP的计算基于分析数据集ADTTE,ADT表示疾病进展或删失日期,STARTDT表示首次给药日期,TTP= ADT- STARTDT+1(天)。

 

 

 

03. 统计分析方法常见描述

肿瘤总体评估

BOR的分析基于xxx分析集。

汇总肿瘤总体评估情况,计算ORR和DCR及其95%置信区间。

绘制各受试者缓解情况的游泳图

 

PFS、DoR、TTP和OS

PFS、DoR、TTP和OS的分析基于xxx分析集。

利用Kaplan-Meier方法计算中位生存时间及其95%的置信区间。

利用Kaplan-Meier方法绘制生存曲线。

 

靶病灶直径总和

靶病灶直径总和的分析基于xxx分析集。

对靶病灶直径总和相对基线的最大改变基于总体最佳疗效绘制相应的瀑布图。

对靶病灶直径总和相对基线变化绘制相应的蜘蛛图。


04. 统计分析常见图表模板

图片15.png

7:肿瘤最佳总体疗效评价总结模板

图片16.png

8:缓解持续时间总结模板

图片17.png

9:缓解持续时间生存曲线图模板

图片18.png

10:游泳图模板

图片19.png

11:瀑布图模板

图片20.png

12:蜘蛛图模板


05. SAS程序实现代码

1)临床试验中常使用二项分布精确概率法(Exact (Clopper-Pearson) Confidence Limits)计算率的置信区间。

图片21.png


基于分析数据集ADRS进行分析,求得DCR与ORR取值为“是”和“否”的例数,用变量COUNT表示。

EVENT=“1”表示ORR/DCR取值为“是”的情况,EVENT=“0”表示ORR/DCR取值为“否”的情况。

使用EVENT产生单向表,missing的作用是将缺失值视为非缺失值。Level=“1”指定检验的变量级别。

由于存在某一剂量组所有受试者DCR取值均为“否”的情况,若不在weight中加zeros,会出现ERRO:“BINOMIAL LEVEL=“1”没有找到(针对变量 event)。”, table中指定单个变量,因为一些观察值的权重为0,可以在WEIGHT语句中指定ZEROS选项,以便在分析中包括这些观察值。



2)对时间-事件类型指标使用Kaplan-Meier法,该方法由Kaplan和Meier于1958年提出,又名乘积极限法。乘积的含义:生存率=生存概率的乘积;极限的含义:标准寿命表法中的时间区间长度趋近于0。


图片23.png

基于分析数据集ADTTE进行分析。

ARM表示剂量组或各分析队列。

method=KM指定方法为Kaplan-Meier,与method=pl是一样的,也是默认方法。

alphaqt指定四分位数的置信水平。

time中AVAL表示生存时间,CNSR表示删失情况,1表示删失数据。

strata指定分组变量ARM。

 

 

3)生存曲线图程序实例

图片24.png


基于分析数据集ADTTE进行分析

ARM表示剂量组或各分析队列,作为分层因素

plots=s等同于plots = survival

注:有时出现中位PFS置信区间不存在,是因为事件数太少,删失数大于事件数。这时从生存曲线图中会看到不同分析队列生存时间对应的概率都大于0.5,中位生存时间不存在,同时也无法计算置信区间。

 

4)对于瀑布图、游泳图和蜘蛛图每个公司都有自己的template或宏程序,这里不再放置。

 

 

参考文献:

[1] 国家药品监督管理局,《药物临床试验数据递交指导原则(试行)》 ,2020年7月

[2] https://www.cdisc.org/standards/foundational/sdtmig,SDTMIG v3.3, 20 November 2018

[3] 国家药品监督管理局, 《抗肿瘤药物临床试验技术指导原则》 2012年5月

[4] 国家药品监督管理局,《抗肿瘤药物临床试验终点技术指导原则》, 2012年5月

[5] 国家药品监督管理局, 《抗肿瘤药物临床试验统计学设计指导原则(试行)》, 2020年12月

 

有临来雅

上海有临医药子公司,成立于 2019 年,致力于给国内外创新药、疫苗与医疗器械企业。提供临床试验统计咨询、试验设计、数据管理统计分析与编程等多方面专业服务。团队由数十位来自国内外知名药企和临床 CRO,拥有平均十年左右行业经验的核心技术人员及专家构成。洞悉行业政策及标准,以客户需求为导向,不断优化迭代形成最佳实践和服务模式。适应不同业务需求,开创灵活创新的合作模式: 包括数统全方位大包服务、业务流程外包(FSP)、战略合作、专家咨询与培训、监督管理及人员外派。为客户降本增效,加速新药研发与上市进程。

 

生物统计服务

有临来雅生物统计团队致力于为客户提供全方位生物统计专业服务,包括临床开发策略咨询、试验设计和临床方案撰写、试验启动相关统计准备工作(随机化方案、编盲、SAP等)、项目实施统计服务(统计分析、解读和报告)以及协助与监管机构的统计沟通。团队基于生物统计科学、依据监管机构(NMPA和USFDA等)法律法规以及生物统计相关指导原则,结合在药企和CRO多年经验积累,为医药企业提供高品质和专业的生物统计解决方案,加速新药研发进度和产品上市。有临来雅统计分析与编程团队致力于为客户提供卓越的一站式符合CDISC标准的统计编程服务,更好地支持临床试验注册和上市申请。



王素丽 撰写 / 章飞燕、张子豹 审核