有效性和安全性是药物上市的基础。尤其是对于抗肿瘤药物,有效性是批准药物上市的基本条件和必要条件。评价药物临床疗效两个最关键的因素,一是需要进行充分的良好对照的临床试验,另一个是选择能够直接反映或者预测患者临床收益的临床疗效终点指标。
选择恰当的疗效指标是疗效评价中重要的一环。疗效指标,即有效性指标,包含两部分,一部分是临床疗效观测指标,包括疾病临床终点、重要临床事件、社会参与能力、生存能力(既残疾残障状态)、临床症状或体征、心理状态、生理生化影像学化验数据等。这些指标在统计学中称为变量。另一部分是临床疗效评价指标,它实际上是对疗效观测指标的直接记录或转换而来的。
肿瘤领域常见的疗效评价指标包括ORR PFS DFS 等等。在不同的临床试验中将采用不同的指标作为临床试验终点。
首先我们对这些疗效评价指标做一个定义上的区分,包括生存的疗效评价指标和基于肿瘤测量的疗效评价指标。总生存期OS指从随机化开始至因任何原因引起死亡的时间(对于失访患者为最后一次随访时间;研究结束时仍然存活患者,为随访结束日)。无病生存期DFS指从随机分组开始至出现肿瘤复发或由任何原因引起的死亡之间的时间。无进展生存期PFS指从随机分组开始至肿瘤出现客观进展或死亡的时间。疾病进展时间TTP定义为随机分组开始到肿瘤出现客观进展的时间。客观缓解率ORR指肿瘤体积缩小达到预先规定值并能维持最低时限要求的患者比例,包含 (CR)和(PR)。缓解持续时间DOR指肿瘤第一次评估为CR或PR开始到第一次评估为PD或任何原因死亡之间的时间。治疗失败的时间TTF是一个复合的指标,指从随机化开始到任何原因导致治疗终止之间的时间(包括疾病进展、治疗毒性和死亡)。通常TTF不作为支持药物审批的终点,因此不做详细的展开了。疾病控制时间DDC同样也不常作为支持药物审批的终点。它是指肿瘤第一次评估为CR、PR或SD开始到第一次评估为PD(Progressive Disease)或任何原因死亡的时间。
按照临床上事件发生的时间轴进行排列,将对不同的终点指标有一个更加清晰的概念。可以进行纵向的对比。
在不同的试验阶段,通常会选择不同的疗效指标作为试验终点。比如I期试验是为了探索药物的的安全性和初步的疗效,遵照国际通用的实体瘤疗效评价标准选择指标,比如ORR,通过肿瘤标志物检测合理预测其疗效。II期时,通常采用ORR观察疗效。虽然ORR是反映药物活性的良好指标,但不一定能代表生存方面的获益。因此也要观察生存期、生活质量和临床症状等方面的疗效评价质指标。但是II期的目的是初步考察药物的生物活性,并非一定要获得生存方面的数据才能进入III期。根据药物的特点,生存方面的观察可以和III期临床试验同时进行。III期临床作为确证性研究,通过大样本、随机、对照研究设计,确证药物在特定人群中的疗效和安全性。通常抗肿瘤药物III期临床会选择总生存期作为首选终点。要明确药物能否给患者带来确切的临床获益, 要观察的除了是否提高患者总生存期,还有能否延长肿瘤复发时间,能否延缓肿瘤进展时间,能否有效的缩小肿瘤体积,能否改善临床症状,能否提高生活质量等。
总生存期OS是精确可测的,有死亡日期提供依据,因此在终点评估时不会出现偏倚。生存期是评价肿瘤药物最可靠的临床试验终点。当研究能充分评价生存期时,OS通常作为首选终点。但OS应在随机对照研究中评价。因为时间依赖性终点的历史研究数据相对不可信。除了药物治疗的不同,病例的选择、影像技术的进步和支持治疗的改善也会影响结果。III期时,OS的显著改善视为有临床意义,可支持新药上市。
无病生存期DFS常用于根治术或放疗后的辅助治疗的研究。如果某些疾病(例如血液肿瘤)在大部分患者化疗后达到完全缓解时,DFS也可以作为一个重要终点。尽管在大多数辅助治疗的情况下,总生存期仍然是一个传统的终点指标,但是当生存期延长而使得选择生存期为临床试验终点不现实的时候,DFS可以作为一个重要的终点指标。DFS作为临床获益的替代终点或者可以为临床获益提供直接证据。这取决于药物疗效大小、风险-效益关系以及疾病情况。目前DFS已经成为乳腺癌辅助性激素治疗、结肠癌辅助治疗、以及乳腺癌的辅助性细胞毒治疗的主要审批基础。
与TTP相比,PFS是更常用的替代终点。因为PFS包括死亡,更好的反映了受试药物的毒副作用,与总生存期相关性更好。当大多数死亡与癌症不相关的情况下,TTP也可以是一个合适的终点指标。PFS反映了肿瘤生长,但是对于预定的样本量,PFS收到的影响可能大于OS受到的影响,通常缺乏足够的数据对OS和PFS的相关性进行评价,因此正式确认PFS作为OS的替代终点是比较困难的。PFS的延长是否可以直接代表临床获益或仅是临床获益的替代终点,取决于试验疗法的疗效大小以及与现有治疗相比的风险效益比。
客观缓解率ORR常作为I期/II期的试验终点。ORR是直接衡量药物抗肿瘤活性的指标,可在单臂试验中进行评价。评价时需要采用标准化的指标确定疗效,比如RECISIT标准。
除了上述的指标还有基于症状评估的临床试验终点。症状和体征的改善通常被认为是临床受益,如体重的增加、疼痛的减轻或止痛药用量减少等。主要可用于盲法、多数患者有症状、无有效治疗药物和较少做影像评估的试验的疗效评价。在非盲法试验中则容易受到主观因素的影响,导致结果偏倚。当以症状和体征的改善作为支持抗肿瘤药物审批的主要终点时,应当能够区分是肿瘤相关症状的改善还是药物毒性的减小或缺失。
下面我们可以通过几个不同类型药物的临床试验,来了解实际临床中,疗效指标的选择。BYL719是诺华公司的一款PI3K抑制剂,在不同的瘤种中开展了多项临床试验。就HR阳性的乳腺癌来讨论,I期时没有将疗效评价作为主要终点,Ib/II期时,选择CR和ORR作为主要终点,III期时选择PFS和ORR作为主要终点。ISIS 3521是一款反义核酸药物,II期时,选择了ORR和DOR作为主要终点,III期时同样选择ORR。
长春新碱过去从未用于治疗急性淋巴细胞白血病。长春新碱脂质体作为一种改良型新药,几十年来临床使用长春新碱的可预期的毒性特征促使该药物基于相对样本量较小的II期临床试验的结果,获得该适应症的批准。可以看到关键II期的病例数并不多,只有65例,但疗效ORR达到了35%。前面说过OS是通常作为首选终点,但是实际上根据药物作用和疾病的特点,临床上会选择不同的疗效评价指标作为试验的主要终点。
以上举例的只是常出现在试验终点的疗效评价指标,关于临床疗效评价的更多展开可以参考下面这些指导原则或文献。
参考文献:
1. CDE《抗肿瘤药物临床试验终点技术指导原则》
2. CDE《药物临床试验的一般考虑指导原则》
3. CDE《抗肿瘤药物临床试验技术指导原则》
4. 刘炳林.药物临床试验中有效性指标的分类[J].中国新药杂志,2016,25(10):1103-1107.
5. 刘炳林.药物临床试验中疗效评价指标及常见评价方法[J].中国新药杂志,2016,25(18):2074-2077.
6. 刘炳林.药物临床试验中疗效指标的选择[J].中国新药杂志,2017,26(18):2113-2120.
7. 刘炳林,薛斐然.临床试验中疗效指标观察与测量相关问题的考虑[J].中国新药杂志,2019,28(24):2939-2947.