会议推荐
2026第三届中国医药企业项目管理大会
2026第二届中国AI项目管理大会
2026第十五届中国PMO大会
2026第五届中国项目经理大会
本
文
目
录
1、国际多中心临床试验简介及有启发性的案例
2、开展多中心临床试验的十大要点
3、多中心临床试验如何开展?《临床试验基本原理(第五版)》新书抢先看
4、国际多中心临床试验(MRCT)与桥接试验
5、多中心临床试验应考虑哪些因素?
一、国际多中心临床试验简介及有启发性的案例
(原创 王燕生 有理就听你的)
我们提到MRCT是药品在美国上市最佳路径,这篇就来更详细地介绍一下MRCT。当然MRCT的权威参考文献是ICH E17,如果想全面了解MRCT的建议要求,读一下这个指导原则是很有必要的。不过E17涵盖的范围很广,我们没法做到面面俱到,在这里简单介绍一下MRCT的机遇和挑战,用一些案例说明内因和外因如何影响试验结果的一致性,以及如何应对这类挑战。
MRCT的机遇和挑战
我们提到1998年ICH E5讨论接受外国临床数据的种族因素,并依据种族因素确定是否需要额外的桥接研究。同时,我们也提到桥接研究的缺点之一是依赖于批准地区的原临床试验完成,这样会引起重要药物上市的延迟。
对药物时滞的关注促使日本药品制造商协会(JPMA)发起一场讨论,希望从序贯的桥接研究开发模式转变为全球同步开发模式。该讨论的内容收载入2006年ICH E5 Q&A中,特别是其中第11条涉及在全球多个区域设计、分析和评估临床试验时需要考虑的要点。与此同时,日本厚生省也发布指导原则[1],鼓励企业参与国际多中心研究。在越来越强烈的国际多中心临床试验需求推动下,ICH于2017年发布E17对MRCT进行指导。
从企业角度看,国际多中心临床试验最大的优势就是同步全球开发,潜在可以在参与区域同步提交上市申请,以减少药物时滞,如同下面E17的图里描述的。
另外国际多中心研究还有其他优势,比如再生元的C5抗体Pozelimab第一个获批的适应症是Chaple disease,这是一种超级罕见的消化道疾病,全世界确诊人数不超过100人。为此再生元在美国,土耳其和泰国进行了一项国际多中心临床试验,患者总数为10人。可以想象即使是如此少的患者,如果仅靠单一美国招募的话,由于过于罕见,不知道什么时候才能招募完成。另外国际多中心研究的优势是可以探索对不同区域或种族治疗效果差异的原因,潜在可能挽救失败的临床试验,这点我们会用后面AZ的吉非替尼案例进行说明。
当然,机遇和挑战永远是并存的,MRCT也会遇到各种挑战。比如,临床运营更加困难,不但药物运输(特别是冷链运输)到各个国家复杂得多,因各参与国语言方面的差异对临床方案的理解可能会有偏差,如何培训临床试验相关人员也会更棘手,另外就是临床试验的质量控制也比单一国家的临床试验困难。其他的比如因为国际多中心的人群异质性更强,变异度更大,因此也需要更大的样本量,当然还有永恒的话题,样本量分配问题;对照药不见得在所有参与国都批准,如何处理对照药不可及的问题;各国监管机构可能有不同的要求,比如主要终点(用ORIENT-11举例,在中国一线NSCLC可以用PFS单终点获批,而FDA必须要求OS)。在这里我们会主要关心区域差异引起的疗效一致性问题。
E17用下图说明了不同区域疾病严重程度或种族如何影响治疗效果。在MRCT的规划阶段就应仔细考虑由内因和外因引起的区域差异,以及它们可能影响研究结果的问题。
如何识别潜在影响治疗效果的种族内外因以及规避可能遇到挑战的区域之间疗效巨大差异?可以分三步走:
第一步是收集有关可能影响治疗效果的内因和外因信息。ICH E5附件A列举了种族敏感性的内在和外在因素。内因为基因和生理病理层面的因素,如影响药物代谢的P450酶或转运体,年龄,体重,肝肾功能等。外因是不同国家的生活环境引起的,如环境污染,医疗实践和文化差异。通常外因是比内因更难确定的因素,比如在一篇新英格兰医学杂志的报道[2]中,研究者进行了一项VOICE研究对撒哈拉以南地区非洲妇女HIV暴露前进行药物预防。有近90%的女性表示她们没有漏服一剂药物,也没有退回空药瓶或凝胶涂抹器,但PK数据显示只有30%的血浆样本含有可检测水平的研究药物。不同的经济文化因素可能会导致临床试验依从性很低,以至于得到不可靠的研究结果。
第二步是根据收集到的有关药物的信息以及研究文献、数据库,和当地医学研究者的咨询,来检验内在和外在因素的影响。在必要的时候,也可以通过小型试验,比如PK-PD研究,收集更多信息来检验这些因素是否会潜在影响治疗效果。
第三步是将前面学到的知识充分反映在MRCT的临床设计中,据此定义明确具体的入排标准,确定分层因素以及如何合并区域和如何分析亚组人群。
当然,即使我们做了细致的调查研究,依然可能会有未知的因素或即使是已知的因素但我们并不知道其影响的情况。因此,在做完MRCT后,我们会在区域间检验治疗效果是否有一致性。更重要的是如果出现了不一致性,我们如何分析并解释这种不一致性。下面两个案例都来自阿斯利康,它们分别显示了未知的内因和外因如何导致区域间治疗效果的不一致性。由于美国患者和其他区域患者的治疗效果有巨大差异,对这两个案例FDA都召开了Advisory Committee会议,一部分信息是从会议资料中得到的。
外在因素的影响—PLATO试验
氯吡格雷是原来赛诺菲重磅心血管药物,AZ的替格瑞洛是当时新一代可逆的口服P2Y12拮抗剂。为了和赛诺菲竞争,AZ做了一项以大哲学家PLATO命名的国际多中心、随机、双盲,头对头的临床试验,旨在确定替格瑞洛在预防急性冠脉综合征患者的心血管事件和死亡方面是否优于氯吡格雷。
试验设计和结果
临床试验设计如下图所示,因为心电图ST段抬高型急性心肌梗死是冠心病的严重类型,该研究纳入伴有ST段抬高或者虽然没有ST段抬高,但有中高风险的因急性冠脉综合征住院患者。近两万名患者1:1比例分配到替格瑞洛组或氯吡格雷组。主要有效性终点是首次因心血管原因死亡、心肌梗塞或中风的时间,主要安全性终点是首次大出血的时间。另外,很重要的一点是合并用药阿司匹林,其中阿司匹林的维持剂量为每天75-100 mg,如果是经过心脏支架置换术的患者,阿司匹林的维持剂量可升至每天325 mg。
在ITT人群中,总体治疗效果如下图[3]所示,左侧的有效性数据显示对比氯吡格雷,替格瑞洛可以降低16%的心梗,中风和心血管死亡的风险,并且HR的95%置信区间整体小于1,p < 0.001;右侧的安全性数据显示HR为1.04,但95%置信区间跨1,没有统计学意义。
按理说这个主要分析结果证明了替格瑞洛优于氯吡格雷。AZ做了31个预设的亚组分析来评估一致性,其中按区域分组的结果出现了截然相反的不一致性。下面的森林图[4]显示北美人群的HR为1.25,替格瑞洛反而增加了25%的心血管事件风险,与总体疗效正好相反。而且北美的结果是由美国人群驱动的(美国人群的HR为1.27)。如果合并北美以外地区的人群,北美和非北美之间疗效-区域相互关系检测的结果为p值0.01,具有显著性差异。
不一致性的分析和解释
那么应该如何解释该差异?三个可能的答案是:1.在美国临床试验中心的实施有系统性问题,临床试验质量差;2.纯粹属于偶然因素,AZ这次运气不好;3.在美国和非美国人群间有重要的基线特征或临床管理方面的差异。
对于第一种解答,AZ表明仔细核对了药品批号,随机化编码等,并对PK样本进行了检验,证明没有错服漏服现象;并对美国临床中心进行审计,试验相关人员进行访谈,没有发现质量方面问题。因此,第一种可能性基本可以排除。
对于该现象纯属概率问题,FDA做了漏斗图[4]显示美国属于离群值,疗效-美国相互关系p值为0.0095。如果真实HR=0.84,美国观察到HR≥1.27的概率小于0.006。但AZ解释说疗效-区域分析没有进行多重性矫正,仅需少量观察的事件变化,就有可能将统计显著变为非显著,因此该观察结果仍有可能是由于偶然性导致的。
对于第三种可能性,AZ做了细致的各种基线和预后因素分析[4],最终认为美国和非美国受试者使用的阿司匹林维持剂量是引起疗效截然相反的原因。在美国,54%的患者接受了超过300 mg的阿司匹林维持剂量;但在美国以外的患者接受这些大剂量阿司匹林的比例仅为2%。
AZ继而对不同阿司匹林维持剂量对疗效的影响进行了分析,下图[4]可以看到从不同地区阿司匹林维持剂量的影响来看,美国和非美国的情况是相似的,所有低于100 mg的合并用药维持剂量,替格瑞洛都比氯吡格雷有效,相反对高于300 mg的合并用药维持剂量,氯吡格雷显得更加有效。
尾声
FDA对咨询委员会提出的主要投票问题为是否应该批准替格瑞洛?委员会以7:1的投票支持批准,并表示应在上市后研究中前瞻性回答区域差异和阿司匹林维持剂量的影响问题。
最终,FDA遵从会议投票结果批准了替格瑞洛,但是在替格瑞洛的说明书上加入黑框警告说明建议使用低剂量阿司匹林。并且由于阿司匹林剂量的原因是事后分析做出的,没有足够的说服力,FDA让AZ在上市后进行一项大型临床研究,以证明合并使用低剂量阿司匹林确实可以使替格瑞洛获益。于是AZ做了一项名为PEGASUS的临床试验,结果[5]显示在1-3年既往有心肌梗死的患者中,替格瑞洛联合低剂量阿司匹林(每天75-150 mg)可显著降低心血管死亡、心肌梗死或中风的风险。
小结
我们看看可以从这个案例中学到什么。首先从临床设计方面,AZ在设计PLATO的时候合并43个国家预设了4个地理区域,并且样本量在各地区之间是相对平衡的,这些为探索一致性提供了保障。但不幸的是阿司匹林维持剂量的作用在开展PLATO前尚不清楚。如果设计试验时已知不同区域使用不同阿司匹林剂量这个医疗实践差异是一个潜在的外因,则可以考虑按阿司匹林剂量对试验进行分层或限定使用低剂量阿司匹林。其次,从试验结果分析方面,AZ使用多种方法详尽地评估了跨地区的一致性,包括描述性总结、森林图和地区-治疗相互关系检验。这些细致的探索性分析揭示了关于阿司匹林用量的意外发现,最终说服FDA批准了替格瑞洛的上市。最后,事后分析比预设分析得到的证据强度差很多,并且AZ也没有找到生物学合理性的解释。虽然上市前FDA没要求AZ再调查阿司匹林剂量问题,其代价是迫使AZ上市后补做了一项大型临床试验。
内在因素的影响—吉非替尼的开发
吉非替尼是第一个EGFR酪氨酸激酶抑制剂,目标适应症是非小细胞肺癌。在吉非替尼开发的时候,精准治疗概念还没有真正建立,当时唯一使用生物标志物细分人群的获批药物是基因泰克的赫赛汀。因此,当时AZ的开发人员并不知道在非小细胞肺癌中什么是对EGFR TKI有效的预测生物标志物。随着认知和证据的不断积累,吉非替尼从一开始得到FDA批准到撤市,又重新上市,其上市过程一波三折。
首先,我们先看一下支持FDA和EMA批准的临床试验汇总表,我们会重点介绍那些黑体的研究,它们提供了相对更重要的证据。
IDEAL研究
首先是两项2期IDEAL研究[6],人群都是二线或更后线的非小细胞肺癌患者,由于还属于早期剂量探索阶段,队列分别为吉非替尼250 mg和500 mg,主要终点为ORR。其中IDEAL I研究主要是在欧洲和日本开展,只招募了少量澳大利亚和南非的患者,其中日本患者占49%;而IDEAL II研究只在美国进行,93%的患者为高加索人或拉丁裔。两个研究的缓解率如下图所示:
显然IDEAL I的缓解率比IDEAL II高接近一倍。另外对IDEAL I的亚组分析显示日本患者的缓解率比非日本患者的缓解率高很多,为27.5%对10.4%。可以看出IDEAL I的相对较高的缓解率是由日本患者驱动的,而IDEAL I其他地区患者缓解率与IDEAL II总体相当。那么什么是引起区域人群疗效差异的原因?一个直接的想法是因为日本人相对高加索人体重更轻,是不是因为PK暴露量更高导致的高缓解率?为此AZ利用群体药代动力学研究了日本和非日本患者的暴露量,结果显示没有区别。
ISEL研究
接着AZ开展了一项3期ISEL研究,以2:1的比例分配到吉非替尼250 mg或安慰剂,都附加上最佳支持治疗。其中75%的患者为高加索人,20%的患者为亚洲人。主要终点为全人群(包括腺癌,鳞癌等)和腺癌患者的OS。由于IDEAL I研究的提示,ISEL对亚洲和非亚洲人群进行了预设的亚组分析。ITT人群的OS数据如下图[7]所示,吉非替尼没有显著延长总人群的生存率,HR为0.89(95% CI 0.77-1.02,p = 0.0871)。
亚组分析数据[8]显示生存获益因区域而异,吉非替尼仅对亚洲人有效。因此,在2期IDEAL I和IDEAL II研究中观察到的缓解差异在3期ISEL研究中得到证实,吉非替尼在亚洲人中具有显着的治疗效果,但在非亚洲人中相对无效。
INTEREST研究
那么究竟是什么原因使吉非替尼仅对亚洲人有效?AZ在研究中推测可能与EGFR状态有关,但EGFR状态还可以分为EGFR基因拷贝数,EGFR表达以及EGFR突变的不同状态。因此,AZ又进行了一项INTEREST研究来研究EGFR相关生物标志物和临床结局的关系。INTEREST是在后线晚期NSCLC患者中吉非替尼对比多西他赛的3期研究,该研究涵盖欧洲,亚洲和美洲。虽然招募患者不区分EGFR状态,不过EGFR的不同状态会进行亚组分析。亚组分析结果如下所示[9]:
该分析显示,如果无视EGFR状态,亚洲和非亚洲人之间疗效没有显著区别(p=0.96),EGFR拷贝数和表达的阳性并不能提高疗效,EGFR突变阳性患者数值上生存更优。另外,基于组织样本分析,亚洲人EGFR突变率比高加索人高很多,为36.4%对10%。因此,很有可能是亚洲和非亚洲人群的EGFR突变率的差异导致不同的临床结局。
IPASS研究
IPASS研究进一步在东亚人群中调查EGFR状态和吉非替尼临床结局的关系,用以佐证是生物标志物而非种族是引起疗效差异的原因。入选的患者不限EGFR状态,然而会对EGFR突变进行亚组分析,主要终点为PFS。结果[6]显示在EGFR突变阳性肿瘤患者亚组中,吉非替尼的无进展生存期(PFS)显著优于卡铂+紫杉醇(HR=0.48,95% CI 0.36-0.64,P<0.0001;mPFS,9.5个月对6.3个月)。相反,卡铂-紫杉醇在EGFR突变阴性亚组中显著优于吉非替尼(HR=2.85,95% CI 2.05-3.98,P<0.0001;mPFS,5.5个月对1.5个月)。因此,吉非替尼并不是对所有亚洲非小细胞肺癌患者都有效,它只对EGFR突变阳性的亚洲患者有效。
IFUM研究
前面的证据都是亚组分析得出的结果,并不是主分析,并且也没有回答吉非替尼究竟在高加索患者中的效果如何。因此,AZ开展了一项2期IFUM研究,它只纳入EGFR突变阳性的高加索患者,主要终点是研究者和盲态独立中心评估的ORR。数据[10]见下表,结果显示吉非替尼对EGFR突变阳性的高加索人有效。
小结
经过数年时间和许多大型研究,吉非替尼治疗晚期NSCLC的目标人群才变得清晰。在临床开发过程中对靶点的生物学理解的进步使得AZ最终能够找到生物标志物,以确定最有可能从吉非替尼中受益的患者。如果临床试验最初仅在高加索人中进行,那么EGFR TKI这类非常有效的药物可能不会进一步开发,或者会推迟很久才开发成功。因为那样研究者不会看到高加索人和亚洲人的治疗效果不同,而且有可能因为吉非替尼在高加索人治疗效果不佳而终止开发,也不会探索出治疗效果是由EGFR突变状态驱动的。进行全球MRCT可能有助于理解区域差异,并提供有关重要内在因素(如这里的EGFR突变状态)的新知识。
总结
经济全球化和互联网信息技术的进步促使MRCT成为可能,但在早期的研究中也得到很多教训。另一个可以提及的案例是MERIT-HF研究,和PLATO类似,这个研究也显示了美国亚组和整体人群截然相反的治疗效果。在2007年研讨会上,FDA和工业界共同讨论了MERIT-HF作为MRCT的一些挑战性问题,如缺乏预设的区域分析方法,因此难以解释区域差异,以及美国外区域结果驱动因素等。正是由于多方经验的逐渐积累,最终总结进ICH E17中。
临床试验可以分为设计,实施,分析和解释阶段。由于人群更加异质,相比单个国家的临床试验MRCT在这几个阶段都更具挑战性。在设计阶段,虽然MRCT主要目的是评估在全人群中的治疗效果,但由于本地监管机构对一致性的要求,区域差异需要在设计阶段就进行周详考虑。试验质量始终是任何临床试验的首要目标,在MRCT中更是如此。如果出现试验结果不一致的情况,只有良好的试验实施才能挖掘出真正的原因。在分析调查一致性和正确解释试验结果时,重要的是要平衡证据的数据强度、既往的科学证据和假设以及任何相关的内部或外部一致性。
最后,由于篇幅有限,我们在此只涉及了MRCT的区域一致性问题。如果想了解更多关于MRCT的潜在问题和建议,最好的方式还是去仔细阅读一下E17。
参考文献
Basic Principles on Global Clinical Trials
N Engl J Med 2015;372:564–566
N Engl J Med 2009;361:1045-57
Cardiovascular and Renal Drugs Advisory Committee, July 28, 2010
N Engl J Med 2015. 372(19):1791-1800
EMEA/CHMP/563746/2008
Lancet 2005;366:1527–1537
J Thorac Oncol. 2006;1: 847–855
Lancet 2008;372:1809-1818
206995Orig1s000MedR
二、开展多中心临床试验的十大要点
(珠江ClinResearch)
开展多中心临床试验的十大要点
——TEN POINTS ——
随机对照临床试验(RCT)是最高等级的证据来源,多中心临床试验是大型RCT最常用的形式。多中心临床试验能在较短的时间内获得足够数量的参与者,并提高了研究结果的普适性。
临床研究本身极其复杂,而进行多中心临床试验时,其复杂性则呈指数级增加。这包括研究真实性、多学科人才的持续投入与协作等挑战。本文探讨多中心临床试验需要考虑的十个要点:
1
要点1:从预试验开始
多中心临床试验应先开展预试验-即小样本研究。预试验目的是测试重要的研究假设,估算样本量,摸索病例可及性、应答率、退出率、方案依从性、测试随机化、干预、数据收集、CRF表填写、统计分析等试验全流程,这些可以为更大规模临床试验的设计和实施提供宝贵信息,确保大样本的顺利实施。同时,预试验还有助于细化研究预算,早期发现项目缺陷和实施变更措施。
2
要点2:组建团队
任何多中心临床试验的成功都有赖于一个高效团队的共同努力。团队成员包括主要研究者(PI)、数据协调中心(DCC团队)、研究协调员和顾问。分中心的研究者团队应拥有至少一名具有临床试验经验的成员,并能及时反应研究过程中出现的问题。此外,研究者团队应雇用熟练的研究协调员,负责监督和执行研究项目的日常任务。多中心临床试验还需要独立的DCC团队,以保证数据的独立性。DCC团队必须具备生物统计学、GCP、计算机编程和数据管理等方面的专业知识。DCC团队的职责包括临床试验设计和管理、CRF的开发、操作手册(MOP)和随机化方案以及与临床中心的所有日常沟通的工作。此外,DCC团队还负责收集、监督、清理和分析从所有协作中心接收到的数据并监测协议执行和数据管理的质量,并在规定时间内完成数据的分析计划。PI可能需要几个顾问来指导临床研究,他们可以帮助PI解决临床研究中出现的大量复杂的问题,提供智力和学术支撑,并激励PI完成研究工作。
3
要点3:沟通结构和决策过程
多中心临床试验的挑战之一通常源于PI和分中心研究者之间沟通不充分或不清晰。建立可靠的沟通和决策机制有助于临床试验的顺利执行。当PI对试验的设计和实施负起主体责任时,指导和运行委员会(steering and operations committees)也会分担责任。指导委员会由PI和来自每个试验点的主要研究者共同组成,是负责监测临床试验进展的决策机构。运行委员会由PI、DCC成员和来自每个试验点的研究协调员组成,负责试验的日常管理工作。数据安全与监督委员会(DSMB)是由不参与试验的专家组成的独立委员会,负责监督试验参与者安全性和数据质量以及整体研究进度。
4
要点4:遵循研究方案
多中心临床试验旨在回答临床问题,伦理考量是研究临床问题的前提。比如,不确定新的治疗或干预的疗效是否优于现有的治疗方法甚至根本不使用任何治疗时,将参与者随机分配到较差的干预措施组是有违伦理风险的。所有分中心研究者及其同事必须愿意随机分配参与者,并同意遵循操作手册(MOP)明确描述的研究方案,否则会损害研究的内部有效性。PI团队负责制定研究方案的初稿,然后,初稿将分发给分中心共同研究者,并在各个临床中心研究者中进行讨论,以不断改进,直到其可行性完善。各分中心的研究者在会议上对修订的方案进行审查。所有研究者必须就方案达成共识,因为他们将无偏离地执行该方案。最后,指导委员会在终稿方案上签字,数据安全和监测委员会(DSMB)批准方案定稿。
5
要点5:确保数据质量
清晰而简洁的数据收集指引可以在试验过程中增强数据的完整性,而受过训练和监督的研究助理能够大大提高数据的可靠性。首先,操作手册(MOP)包含了商定好的方案和研究活动的所有方面,包括筛选潜在参与者的程序、随机抽样的指导方针、数据收集和CRF的使用、识别和报告不良事件的规范,以及重要人员的联系方式。在MOP中详细描述的研究程序应明确定义,重点突出,可行性佳。其次,标准化的、设计良好的CRF应该只包含对研究问题至关重要的项目。CRF的填写应将错误降至最低,并消除遗漏的数据问题。在启动研究项目之前,需确定CRF数据管理和向DCC转移的具体程序。此外,可靠的、可复制的培训研究人员的方法,特别是研究助理,对于确保多中心研究的数据质量也是必不可少的。培训应当在开始招募参与者和实际数据收集之前,并且在线下完成。根据研究方案的复杂程度,每4到6个月还需要对研究助理的可信度进行重新测试。
6
要点6:分中心监测
在临床试验的整个过程中,分中心的表现都需要受到监测。分中心监测的目标是提高效能和最大化其对项目成功的贡献。指导委员会通过使用每日筛选日志来监测分中心的参与者招募情况。指导委员会还负责识别和监测对研究结论的有效性产生影响的重要因素。包括每月和/或每季度的分中心执行报告,报告内容涉及招募工作、研究方案的遵守情况、研究流程的完成情况、方案违背的审查以及数据收集和抄写的任何错误的审查。由DCC生成的执行报告帮助早期发现质量问题,提供纠正的机会,并且是指导委员会和DSBM会议的一个常设议程。此外,外聘监察员进行分中心的现场访问以确保数据质量。监察员评估所有原始文档,如知情同意书和随机化日志,并抽查至少10%的CRF。监察员与分中心人员一起确保参与者安全和研究的一致性。监察报告随后由指导委员会和DSMB生成和审查。
7
要点7:监测资金流向
多中心临床试验的实施成本很高,为项目提供资金是PI的责任。研究者应当对每个分中心的直接和间接成本进行评估,并将其考虑到预算编制中。PI负责全面的预算管理,分中心PI负责分配给分中心的资金管理。通信、差旅、计算机访问和数据管理的成本是预算管理和研究财务监控中的一部分。多中心研究的高成本项目包括人员工资、研究专用设备、数据管理和实验室服务。每个分中心的预算根据机构类型及其地理位置的不同而有所不同,资金的分配应该秉持合理公平原则。高效的数据收集和有限的实验室测试项目将有助于控制预算。
8
要点8:遵循数据分析计划
多中心临床试验的数据分析必须按照研究方案中的设计框架进行。DCC是数据分析和实施分析计划的主要场所。DCC由一位精通基本描述性统计、变量测量、多元分析等统计方法的统计学家管理。数据一般根据意向性分析原则进行分析。具体来说,来自每个参与者的数据根据其最初被分配或随机化的组中进行分析。随机化分组是一种确保组间具有相同混杂因素从而提高可比性的技术。一旦分组,参与者的数据必须包括在最终的数据分析集中,即使他们从未接受治疗,没有遵守治疗,或没有遵循方案。
9
要点9:警惕不良事件
每个分中心必须及时向PI报告所有不良事件。MOP应包含严格的指导方针,用于报告这些不良事件。即使不良事件不太可能与干预措施或试验参与有关,也必须报告参与者随机化后发生的所有意外事件。如果对报告的不良事件有任何疑问,最好随时监查。然后,PI需负责向DSMB、所有分中心的机构审查委员会和申办者报告不良事件。如有必要,指导委员会和DSMB要共同修改研究方案,以保证患者安全。
10
要点10:培养凝聚力
为了在整个临床试验过程中保持所有研究人员的凝聚力,团队必须有积极的研究体验。创造一种积极的研究体验将有助于加强合作,这是促进研究并完成项目的必要条件。在合作中培养积极精神的关键是认识到每个人对研究团队的重要性和价值。在研究早期即将研究贡献和产出进行分配、寻找分中心可以开展的子研究、公平的分享论文成果均有助于培养合作精神。团队成员参与多中心临床试验的动机各不相同,但是都与团队凝聚力有关。团建活动中认可个人和分中心的价值、庆祝研究进展都有助于建立集体荣誉感并达成团队共同目标。
结
论
多中心研究试验需要注意细节、全面规划和多学科协作。虽然具有挑战性,但多中心临床试验推动着循证临床科学的发展。我们在进行多中心研究时,应积极考虑上述10个要点,减少复杂性,提高成功率。
三、多中心临床试验如何开展?《临床试验基本原理(第五版)》新书抢先看
(原创 AME AME科研时间)
编者按:它是Springer经典图书,从第一版面世至今已有42年历史;它是美国研究生课程的经典参考书目,被誉为“全面了解临床试验并迅速上手”的第一选择;它由5位NIH一线研究者著就,46位中国优秀科研工作者翻译;全书22章500+页内容,覆盖从确定科学问题到结果报告的方方面面;穿插60多个经典研究范例,以实践为媒将临床试验的原理娓娓道来。这就是AME即将推出的大部头译著——《临床试验基本原理(第五版)》。现AME科研时间将精选部分图书内容进行连载,以便令读者进一步了解本书。今天我们分享多中心临床试验。
第二十一章 多中心临床试验
多中心试验是一项协作性的工作,涉及多家独立的中心对研究受试者进行登记和随访。多中心随机临床试验的历史悠久而丰富,Fleiss[1]和Greenberg[2]曾对试验方法进行过一般性讨论。
在过去的40年里,多中心和多国试验数量大幅增加。多中心研究比单中心研究开展起来难度更大,成本更高,而且由于需要在众多研究者中共享荣誉,所以个人的专业“回报”就显得更少。然而,多中心试验还是必要的,主要是因为单中心试验不能招募足够的受试者来评估临床上重要的疗效[3]。1974年,Levin等[4]就“开展设计良好的合作以获得最高质量临床研究的重要性和必要性”提供了许多案例。
现如今,因为越来越多的药物在全球范围内得到应用,更需要开展多中心试验。由行业赞助的大型后期试验通常要包括广泛的地域代表性。可能涉及几百个地点,每个地点的受试者从几个到几十个不等。虽然这种分散的地点给人员培训和数据质量控制带来了研究保障方面的挑战,但快速招募受试者的益处通常多于这些挑战。多中心试验的另一个潜在优势是研究人员在多个地点采用标准化的方案,不太容易产生影响试验开展甚至准确性的偏倚,尤其在开放性试验中更是如此。单中心注册研究的受试者,都在一位研究者的监督下,假设其受到学术影响,则可能产生更大的偏倚。
多中心试验开展、组织和实施的许多基础工作是在多年前的CDP试验[5]和ISIS试验[6-7]中奠定的。本章将讨论开展这些研究的原因,并简要回顾这些研究在计划、设计和实施中的关键步骤。
一、基本要点
多中心试验需要在可能有不同实践操作的医疗机构中招募足够数量的受试者。负责组织和进行多中心研究的研究者应充分了解研究的复杂性,以及其需要哪些相应的系统来保证每家中心都遵循共同方案。
二、进行多中心试验的原因
(一)多中心试验的基本原理是在合理的时间内招募足够数量的受试者
许多临床试验在未预估足以验证主要假设所要求的受试者人数之前就已经开展,这一问题现在依然如此。但是,如果主要反应变量相对少见,或组间差异很小,样本量需求就会很大(见第八章)。
需要数百人参与的研究通常不能在单中心完成,虽然也有一些例外,比如德国心脏中心注册已超5万人的一系列单中心试验[8]。此外,该中心还成功参与了多中心试验[9]。
一些多中心试验规模庞大。GUSTO试验共纳入了15个国家、1 081家医院的41 021例急性心肌梗死患者,每家中心的注册人数从1名到200多名[10]。该试验分为四个治疗组,采用组织型纤溶酶原激活物(t-PA)治疗(与链激酶组相比),患者30天死亡率的相对风险降低了14%(绝对风险降低1%),这是一个可以改变临床实践的结果。该结果要求用大样本量来证明其显著性令人信服(P=0.001)。WHI试验[11]是一个为期15年的重要项目,其于1991年由美国国会批准并由NIH赞助。WHI的试验人群包括在美国40家中心登记的161 000名绝经后妇女。其一系列临床试验采用部分析因设计,纳入68 132名女性受试者,致力于饮食调整,钙和维生素D的补充或激素替代疗法等问题。WHI为改变实践提供了重要成果。该项目是很好的投资,事实上,成本为2.6亿美元的绝经后治疗试验的预估总净经济收益为371亿美元[12-13]。这主要是由于改变实践后绝经后妇女不再受到荷尔蒙替代疗法的有害影响。HPS2-SHRIVE试验的研究者采用不同的方法选择中心[14]。他们选出了245家高效中心,这些中心有足够数量的患者可以用来招募。这些研究者从进入临床试验入组阶段的42 424名患者中抽取了25 673名合并到3年以上血管疾病的患者里,并将其随机分入烟酸联合laropiprant组与安慰剂组。其患者分布于英国(89家中心)、斯堪的纳维亚半岛(84家中心)和中国(72家中心)。这些试验需要招募大量的受试者来测试合适的治疗效果(相对风险减少15%),研究者就多中心的重要性及所选中心做出说明。美国国家癌症研究所合作小组(现为国家临床试验网络)[15]和人免疫缺陷病毒/艾滋病临床试验网络[16]提供了历史悠久的多中心临床试验的其他案例。
(二)一项多中心研究可以使研究人群更具普遍性
虽然没有一项试验是具有完全代表性的,但如果受试者是由多中心注册的,那么其地理、种族、社会经济地位和生活方式可能更类似于一般人群。这些因素对概括试验结果可能很重要。有人担心,出于诸如提高研究招募入组速度等实用目的而选择中心,可能会对研究结果的普遍性产生负面影响[17]。
在GUSTO试验中,23 000名受试者在美国注册,其中大多数注册时间超过了一年[10]。1992年,估计全国近10%采用纤溶治疗的急性心肌梗死患者注册进入临床试验。在这项“务实”的试验中,几乎没有排除标准,受试者较好地代表了高危人群,例如老年人(12%的受试者年龄至少为75岁,年龄最大者110岁)[18]。
受试者构成可能会影响试验结论普遍性的另一个例子是种族分布。例如,众所周知,高血压及其治疗反应性可能因种族而异。来自黑人社区或白人社区的研究结果可能不一定适用于更加多样化的人口。鉴于此,在ALLHAT试验中特意入组黑人受试者。最终,35%的受试者是黑人,[19]这就体现了对干预效果种族异质性的研究。
(三)多中心研究使具有相似兴趣和能力的研究者能够携手解决常见问题
像其他许多学科一样,科学和医学是互相竞争的。然而,目前临床医学的大多数重要研究的成功需要团队协作。一项多中心试验还会为那些能力强、偏重临床却又无法参与研究活动者提供机会来投身科学研究。早期的多中心临床试验通常仅包含大型学术中心。现在,社区医疗机构也成功参与了试验,在许多试验中,有组织的社区医院或诊所是常见的报名机构。
三、多中心试验的实施
早期的多中心临床试验之一是CDP试验[5]。这项研究为目前使用的许多技术都提供了一个初步模型。在所有的活跃学科中,概念经常发生变化,一些技术在随后的试验中得到了改进。作为从一些研究中总结出的经验,以下一系列步骤是计划和实施中心试验的合理途径。
第一,应该建立一个计划委员会来负责组织并监督研究的各个阶段(计划、受试者招募、受试者随访、逐步淘汰、数据分析、论文写作)及其各个中心和委员会。委员会通常由来自赞助组织的代表构成(例如政府机构、私人研究机构、教育机构、私营企业),由适当的顾问提供意见,鼓励采纳在研究领域、生物统计学和多中心临床试验管理等方面的专家。为保证试验运行的高效和研究的有效,规划委员会必须具有权威性。
第二,要确定一项研究的可行性,计划委员会应该对文献和其他资料进行彻底的查阅。应该计算所需的样本量。要根据对照组事件发生率、预期干预效果和受试者对治疗的依从性进行合理预估。规划委员会还必须评估关键问题,比如受试者的可及性、称职的合作研究者、研究的及时性、可能的竞争性试验、监管要求和总成本。通过这样的评估来判断试验是否值得进行?是否有足够的初步迹象表明研究中的干预措施确实有效?另一方面,判断是否有足够多的提示性证据(尽管没有定论)支持新干预的措施,以至于从伦理上可能很难将受试者分配到对照组?这样的提示性证据会严重阻碍受试者招募吗?此外,由于研究的设计可能需要一年或更长时间,需要不断地重新评估其可行性,甚至直到实际开始招募受试者之时。新的或即将出现的证据可能在任意时候导致试验推迟、需要重新设计甚至被取消。在某些情况下,预试验或可行性研究有利于回答那些对设计和实施全面试验有重要意义的特定问题。
第三,多中心研究不仅需要临床中心招募受试者,还需要一家或两家协调中心来帮助设计和管理试验,然后从所有其他中心收集数据并进行数据分析。可能有区域性中心、学术中心愿意成为学术研究机构,或者成为现场访问和从临床中心收集数据的合同研究机构。多中心研究通常需要额外的中心来进行专门的研究活动,如开展关键性的实验室检查、影像检查以及分发研究药物。而专业中心可能开展多种服务,通常不建议由一家临床中心来完成这些服务。如果专业中心和临床中心对应同一家机构,则其每个部门都必须有独立的工作团队来防止破盲乃至偏倚,这一点很重要。即使避免了破盲或偏倚,研究也可能因为会产生偏倚而受到批评,并令外界对整个临床试验产生不必要的质疑。
如Croke[20]所述,研究者选择临床中心的主要考虑因素在于是否有合适的受试者。尽管这份报告现在看来有些过时,但依然有价值。试验必须在受试者所在的地方进行。显然,临床试验的经验和科学专业知识对研究者来说是理想特征,但这些对最终成功并不是至关重要的。全身心投入一项研究的著名科学家在合作项目中未必能成功。其中的主要原因往往是他们不能在试验中投入足够的时间。在一项有心肌梗死病史的入组患者相关因素分析的综合研究中,Shea等[21]发现疗效与患者在医疗机构由团队而不是由私人主治医师治疗有关,同时也与存在尽职的护理协调员呈正相关。虽然许多因素都与成功入组有关,但没有哪一项比在合作试验中的既往表现更能说明问题了。
协调中心的选择至关重要。其通常是单个实体,但有时协调中心的功能会划分为两个或更多单元,如临床协调中心、数据协调中心、(通常是)独立的数据分析中心。此处描述的职责适用于任何模式,但很明显,当存在多个单元时,沟通交流就成了更大的问题。
协调中心或者说联合中心除了帮助设计试验外,还负责实施随机化方案,开展日常试验活动以及收集、监测、编辑和分析数据。协调中心,或者说当有两个或多个单元时的临床协调中心/数据管理中心需要与所有其他中心保持密切交流。工作人员必须具备生物统计学、计算机技术、流行病学、监管政策、医学和管理等领域的专业知识,以便迅速应对试验中出现的日常问题。这些问题的范围可能从如何在调查表中编码特定项,到监测临床试验现场的操作。单一协调中心或独立的数据分析中心,有准备数据监控指南,进行数据分析,开发或修改统计数据方法等职责。这些中心的工作人员必须经验丰富、能力强、反应迅速,并致力于及时处理他们的工作。即使有一两家临床中心表现不佳,试验还是可以成功的,但临床协调中心或数据管理中心的失职会对多中心试验的成功产生极大影响。在极端情况下,试验中途可能会更换协调中心。这会造成严重的延误和后勤保障问题。因此,协调中心的合理选择显得尤为重要。
协调中心或分析中心的关键因素并不是形式上的完整,而应该表现为一个整体。任何利益冲突之嫌都会破坏试验。这就是资助试验的制药公司有时利用第三方机构作为组织或协调中心的原因之一。因为中心的人员控制着数据和分析,他们应该和试验结果没有重大利益相关。Meinert等[22]详细介绍了协调中心的职能。另见Fisher等对于独立数据分析中心的操作说明[23]。
如前所述,多中心试验的某些职能最好由选定的特别中心执行。集中进行实验室检测、X线检查及阅片、评估病理学标本或读心电图的优势包括,无偏倚评估、标准化、减少变异、易于质量控制和获取高质量的结果。集中化判定的劣势包括,运输所需的成本、时间消耗及有丢失研究资料的风险。即便使用电子传输数据,也可能发生故障。显然,被选择开展专业活动的中心需要相关领域的专业知识。同样重要的是,中心必须具备用科研级标准来处理多中心试验大量工作的能力。尽管这些中心的选择会非常谨慎,但工作积压仍然是试验进程受阻的常见原因。
第四,规划委员会最好尽早提供研究人员对研究设计关键要素的详尽概述。这样可以更有效地启动试验,每个研究员可以更好地计划人员配置和成本安排。我们建议全体人员或选择代表先进行讨论,必要时修改试验设计,而不是直接向研究者提交最终方案。这个过程使每个成员都能够表达自己的想法,都有机会参与试验的设计,强化其责任,并让其熟悉研究的各个方面。该过程还可以改进设计。研究者需要一个自己及当地机构的同事都能接受的方案。这种“买进”将改善受试者招募、数据收集及试验结果的最终验收。考虑到试验的复杂性,在开始招募受试者之前也许需要召开几次这样的计划会议。
如果有多位研究者和多种方案,可以在规划阶段让研究者将这些问题分配给几个特定的工作小组。工作小组可以专注于各自的问题并面向全体研究者准备报告。当然,如果最初的大纲经过深思熟虑并已经完善,则没有必要做重大修改。任何更改过的方案都需要仔细检查,以确保研究的基本目标和可行性不受影响。这条警告尤其适用于受试者入组标准的修改。研究者担心他们能否招募到足够数量的受试者,这一点可以理解。为了使招募更加简单,他们可能倾向于不那么严格的入组标准。任何这样的决定都需要经过审查,以确保它们不会对试验目标和样本数量产生负面影响。简化招募的获益可能会被更大样本量的需求所掩盖。准备会议也有助于使所有研究者意识到意见分歧所在。不同话题的分歧无疑会在符合科学的基础上达成一致,而一些研究者可能不会对试验的所有方面完全满意。然而,所有人通常都支持最终方案,合作试验的所有研究者必须同意遵循共同的研究协议。
虽然一个好的协议可以为所有主要问题提供指导,研究者在开始一项试验时总会遇到一些需要系统解决的问题。这些信息应该以简报、问答或协议修正案的形式(必要时)与所有研究者共享。多中心试验中更广泛的主题是有效沟通的重要性。协调中心的责任是保持与所有注册中心经常联系(通过电话、电子邮件、短信、访问的形式)。信息丰富、互动性强的网站常有很大帮助。研究负责人还需要与各中心和委员会保持联系,密切监督试验的进行。
第五,试验中应该建立权责明确、沟通顺畅的组织架构。经过众人努力[24–26],下面的框架已被时间证明有效。
指导委员会——该委员会在操作层面为研究提供科学指导。其成员可能是由部分或所有规划委员会成员(包括赞助商代表),加上参加试验的部分研究者构成。在国际试验中通常每个主要国家至少有一名“协调员”代表这些研究者并解决各自国家相关的问题。根据研究的跨度,一些研究者可能参与部分试验。此外,指导委员会通常会成立分委员会来处理研究范围内的特定问题,例如质量控制、反应变量的分类、出版政策和审查,然后向指导委员会报告。
授权一个小组在指导委员会会议期间来作出行政决策也很重要。这些小组有时被称为执行委员会或运营委员会。大多数“内务”任务和日常决策用这种方式可以更容易地完成。例如,一个大型委员会不能每天监督试验进程,撰写备忘录或准备议程。因为委员会的会议几乎不能随时召开,需要快速决策的问题必须由执行小组解决。当然,主要问题要和研究者讨论,这也很重要。
分委员会——指导委员会通常会成立分委员会。例如,经常需要一个对事件进行集中评估的系统,这可以由事件分类分委员会来完成。在受试者身份和干预组别设盲的情况下,判定事件的性质有助于确保报告事件的无偏倚分类,并确保将某些标准一致应用到特定事件中。其他分委员会可能会想方设法增加受试者数量或提高其依从性。但是在一些试验中,分委员会构成过于复杂,效率低下。而少中心试验构成简单且运作高效。如果委员会、分委员会和特别工作组成倍增加,处理日常问题的过程会变得复杂。涉及多个学科的研究尤其需要一个经过深思熟虑而构成的组织结构。来自不同领域的研究者倾向于从不同的角度来看待问题。虽然这种变化是有益的,但在某些情况下会妨碍试验的有序进行。研究者可能会设法增加其职责,并在这个过程中改变研究的范围。开始是一个中等复杂程度的试验,最终可能会变成一个几乎难以处理的项目。
数据监查委员会——这个科学机构有多个名称(见第十六章),其应独立于研究成员和试验赞助商。其主要作用是尽可能地确保受试者的安全和研究的完整。为此,要负责审查和批准方案,定期监测基线、有害影响和反应变量数据以及评估中心成效[27]。考虑到临床试验的完整性[28-30],保持该委员会的独立性尤其重要。其通常向研究赞助商、计划委员会主席或指导委员会主席汇报。协调中心或数据分析中心应提供表格和图形数据,还要向数据监查委员会提供适当的分析资料以供审查。在发生不可预见的危害,超预期获益,或大概率发生无关结局的情况下,委员会有责任建议提前终止试验(见第十六章)。这个委员会的成员应该在所开展研究的临床试验方法和生物统计学等领域具备丰富知识。伦理学家和/或受试者的律师也可能参与其中。应明确监查委员会对受试者以及试验完整性的责任,并有责任告知受试者。在双盲研究中,由于个别研究者不清楚分组及哪组与各种不良事件相关,所以这些责任对保证受试者的安全尤其重要。
遗憾的是,由行业进行的许多试验的组织结构不包括在试验设计、实施和分析中有重要参与价值的独立专家。现在需要的是学术性的试验者,包括那些供职于NIH一类机构的专家,其要能与公众和医护人员一起推动那些能解决卫生保健领域优先问题的临床试验的进行,保证试验质量[31]。
第六,尽管存在特殊问题,多中心试验应尽量维持那些与单中心精心实施并无区别的质量标准(见第十一章)。要把培训和标准化纳入工作重点,从而使协议以预期的方式在中心和区域得以执行。显然,所有中心的工作人员都必须了解协议规定及如何完成表单和测试。各中心之间及单中心内个体之间的工作差异不可避免。然而,通过适当的培训、认证、重新测试,或必要时对员工进行再培训,可以减少这种差异。一个有吸引力的、实用的、培训材料和其他资源不断更新的互动式网站是大型试验中的重要工具。美国国立心肺血液研究所(NHLBI)赞助的ISCHEMIA试验的网站就是一个典型例子[32]。这些工作需要在试验开始前完成(关于质量控制的讨论见第十一章)。在需要特殊培训和专业知识的试验中,每家临床中心应该证明其有能力履行必要的流程后才被允许开始招募受试者。研究者会议通常对成功开展试验非常重要,因为他们有机会讨论常见问题,并对收集数据和填写研究表格的方法是否恰当进行审查。
第七,需要密切监督所有中心的工作情况。应持续评估受试者招募,数据收集和处理的质量,实验室流程的质量,受试者对方案的遵守情况及失访情况。研究者的监管要求在第二十二章中有概述。框21-1列出了注册中心主要研究者(principal investigator,PI)的部分主要职责。
只要标准化的报表能够有效地捕捉和显示信息,电子追踪工具就能够使这项工作有效而系统地进行。追踪整体工作情况及各中心的工作情况都很重要。
许多行业赞助的多中心试验雇用合同研究机构进行广泛的审计和质量保证。这样做花费巨大而且能获益多少还受到质疑[33]。对这个话题的深入讨论详见第十一章。
在大多数临床试验中,招募受试者是困难的。然而,在协作性临床试验中,一些临床中心有机会通过超额完成其预定的招募目标来弥补其他中心的不足。临床中心应该明白,虽然友好的竞争让每个人都有事可做,但真正的目标是总体上的成功,对于这一点,一些中心做得到,一些中心做不到。因此,鼓励优秀的中心尽可能多地招募受试者非常重要。但是,如果中心、地区或国家(在国际性试验中)开始主导招募受试者,此时可能存在制约。在某些时候,如果这项研究被视为真正的多中心研究,单个中心的招募数量可能需要设上限。
第八,出版、展示和作者身份政策应提前达成一致。当存在多位研究者时,作者身份成为一个关键问题,因为他们的学术生涯都依赖于出版物。目前没有完全令人满意的方式来确认每位研究者的贡献。一种常见的折中办法是将研究名称直接放在论文标题下,在脚注、标题下或研究名称旁致谢论文作者,然后在文末列出所有的关键研究者。该原则也可能因文章类型(主或次)而有所不同。多中心试验稿件的集体署名受到一些医学杂志的质疑,另一些杂志则为之辩解[34-36]。这种做法仍然很常见,但通常由经认定的写作委员会负责(见第二十章)。
将主要试验赞助商的代表作为主要论文的作者会引起争议,尤其是如果其是一家能够从试验结果的有利表述中获益的商业公司。虽然将赞助商成员列入提供了重要知识贡献的研究团队是合适的,但大多数赞助商还是遵守不干涉原则,放手让研究人员撰写科学论文。通常情况下,行业赞助商有1个月的时间来预览手稿主要结果,以便有时间处理专利或监管问题。这项审查不能在不必要的情况下拖延主要试验结果的出版公布。令人遗憾的是,还是有一些由干涉学术自由引发冲突的案例。这些原则应该在赞助商与研究人员之间的合同中作出明确规定。
在一项包含4家中心的试验中,其中一家中心的研究人员在整个团队之前报道了其发现[37-38]。这样的行为与合作原则是格格不入的。这会阻碍多中心试验目标的实现,即利用足够多的受试者来回答现实问题,更重要的是,破坏了研究人员之间的信任关系。学术机构坚决反对这种合作原则,坚决捍卫每位研究人员的学术自由。然而,我们认为那些不愿意遵守共同作者规则的人不应该参与合作研究。
事先制定出版章程,并让各方同意遵守,这为避免误解提供了重要的保护措施。然而,公平地承认初级职员总是困难的[39]。研究领导者往往会因其工作得到荣誉和认可,而这些工作大多是由那些在科学界知名度很小的人所完成的。解决这一问题的办法之一是尽可能多地任命有能力的初级职员担任分委员会委员。还应鼓励这些职员开展主要试验的辅助研究。这种方法将令他们在使用试验的基本结构来获得受试者和支持数据的同时,还能够获得自己工作的署名权。此类辅助研究可仅在受试者的一个亚组内进行,可能与试验整体没有必然关系。但必须注意确保它们不会导致揭盲、伤害受试者或受试者离开试验进而干扰主要工作。Sackett等[40]讨论了在主要试验完成之前允许发表辅助研究结果这一争议话题的支持或反对意见。
四、国际多中心临床试验(MRCT)与桥接试验
(齐潇 李皛 药物研发XIAO观察)国际多中心临床试验
申办者要根据早期研究数据、种族敏感性分析和不同监管机构的要求,确定在全球不同区域间应采用的临床试验方式。如果多个区域的多个中心按照同一临床试验方案同时开展临床试验,则该临床试验为多区域临床试验或国际多中心临床试验(MRCT)。出于科学和安全性等方面的考量,申办者也可以在某区域内不同国家的多个中心按照同一临床试验方案同时开展区域性临床试验。上述两种形式的临床试验均属于国际多中心药物临床试验。
MRCT需要回答两个问题:
该药物在所有地域的总治疗效应是否存在?
在总疗效存在的条件下,总体疗效存在的结论是否能够推广到某个特定的地区?或各地域间的疗效是否具有相似性?
样本量考虑:
总体样本量的考虑:MRCT的总样本量是通过综合所有地区的整体疗效确定的。ICH E9用于确定临床试验样本量的一般原则同样适用于MRCT。以下2个因素尤为重要:
① 试验中所有区域具有临床相关性的疗效大小(clinically meaningful difference)
② 各区域主要结果变量数据合并的预期变异(Including individuals and regions)。
这2个影响因素可能会导致MRCT相对于单地区临床试验的样本量增加。
地区样本量的分配:地区样本量的分配应基于科学可行性,其结果应可用于一致性的评价,并为监管机构提供所需的信息,体现地区人群的代表性。样本量的分配应考虑各地区的疾病流行病学模式、地区规模大小/预期入组率、预期疾病发生/累计率、已知(或假设)影响疗效的内在和外在因素等。
目前尚无统一可接受或最佳的MRCT地区样本量分配方法。当前使用方法包括:
按比例分配。根据地区规模或疾病患病率,各地区按比例分配受试者。
优点:通过将受试者分配至疾病负担重的地区,可最大限度地缩短受试者招募时间
缺点:部分地区受试者数量可能极少或者缺失,而其他地区则可能主导试验结果
平均分配。各地区分配相同数量的受试者。
优点:根据既定总样本量目标进行,有助于提高检验地区间疗效差异的能力
缺点:会造成招募时间过长,尤其是在疾病患病率或招募难易程度在MRCT各地区间差异较大的时候
维持疗效。按照保持整体疗效的特定比例分配受试者至各地区。
地区显著性。分配足量受试者以达到各地区内的显著结果。
固定最小样本量。各地区分配一个固定的最小数量的受试者。
建议在方法①和②之间取得平衡,确保MRCT招募工作切实可行,并且能够及时完成,同时也能够提供足够的信息评估试验药物在不同地区内的情况。
若多个地区的监管机构均有要求,则需同时兼顾临床和统计方面可接受性的基础上考虑方法③和④,但可能会使总样本量增加,且会导致MRCT试验的合理性受到质疑。
如果方法⑤未提供科学论证就不推荐使用。
实际上,样本量地区分配反映的是科学性和实际可行性实施方面的综合考虑。例如,最初的样本量可首先基于疾病流行病学和地区规模进行分配,这样的初次分配首先考虑的是能够招募足够的受试者。之后,对各地区样本量进行修正,如地区间样本量存在较大的不平衡时,也可基于科学合理的最小地区样本量进行修正。初次分配时也可首先采用方法②,再根据流行病学数据和地区规模修正。无论采用哪种策略,都应谨慎避免单个地区在受试者招募乃至试验结果中占主导作用。
统计角度重点探问题:
如何合理地定义跨地区疗效的一致性。
等级1: 区域治疗效应与总体治疗效应有同样的趋势
等级2: 区域治疗效应保有一定比例的总体治疗效应
等级3: 区域上的治疗效应也具有临床意义和统计学意义
如何量化种族因素对疗效一致性评估的潜在影响。
一致性评价并不仅是假设检验,描述性总结、图表展示、基于模型的分析包括协变量分析、交互效应检验等是可以考虑使用的手段。
亚组分析, QQ plot, 或Galbraith plot 可以用来帮助评价一致性和解释结
如何合理地设计试验和规划样本量才能满足不同的一致性评估要求。
按比例分配。根据地区规模或疾病患病率,各地区按比例分配受试者。
平均分配。各地区分配相同数量的受试者。
总体样本量的考虑:MRCT的总样本量是通过综合所有地区的整体疗效确定的。
分析过程中,应该考虑试验中发现的地区间药物治疗效果的差异,是真的存在的种族差异呢,还是随机概率事件,或是由于临床试验操作不规范、数据质量参差不齐导致。
MRCT的挑战:
在实施MRCT中,各区域或国家、地区可能有其独特的挑战和难处(比如招募时间有限和本地样本量有特殊要求)。比如以中国为主要入组主体的MRCT,中国样本量对整体而言可能太大,其他国家入组可能会延误MRCT整体的完成时间(即最后病人入组时间)。为了解决挑战,已提出了扩展(Extension)和 SGDDP等创新设计。
前瞻性的分配国家参加试验与扩展试验的机会,包括他们的各自的最小患者入组人数。
按竞争入组运行试验。
锁库和按原计划采用主要队列的数据用于全球递交(中国的第一例病人入组需要在主要队列最后一例病人入组之前)。
"扩展"入组是针对那些在主要队列中不符合最低要求,需持续入组直到在扩展队列中达成最低要求 (注︰ 使用一种试验方案,使用相同研究设计,比如相同的随机比率和入排标准等)。
在全球申报中采用来自主要队列(包括在主要队列中中国的数据)的数据
在中国申报中采用包括从主队列和扩展队列入组的所有中国人。
比较来自中国的结果和主要队列的结果,评价一致性。
但无论采用哪种策略,都应该与监管机构有及时的沟通并取得指导。
“桥接”试验
所谓“桥接”试验,就是一个在新地区(国家)完成的,以允许国外临床数据外推至该地区人群的药效动力学或有关有效性、安全性、剂量和给药方案的临床研究。由此可见桥接试验不是一种新的试验方法,而是药物临床试验和审批中一种策略。“桥接”的目的在于,利用外国数据,外推有效性和安全性数据,以缩短开发周期、降低开发成本、促进全球化,从而使新药在新地区迅速获得批准。
“桥接”试验是一种特殊情况下的试验,无论是研究设计、样本量或者是桥接成功的标准,都建议与监管机构进行case by case的讨论。如果可以的话,还是建议开展MRCTs。
桥接”研究数据是否可以外推,通常有以下判断标准:
如果结果表明在新地区人群的剂量-反应、安全性及有效性与原研究地相似,则可作为合适的国外临床数据的“桥接”研究;
如果应用一个不同的剂量在新地区人群中产生的安全性和有效性特征与原地区无实质性不同,可通过充分的PK/PD数据来证明作合适的剂量调整后,可以将国外数据外推至该地区;
如果“桥接”试验的规模大小不足以充分确认将不良事件外推到该地区人群,则需要补充安全性数据;
如果“桥接”试验未能确认该药的安全性与有效性,则须递交补充确认性临床研究数据。
有效性“桥接”试验对种族因素不敏感药物,其“桥接”试验类型通常取决于使用该药物的经验,及外源性种族因素影响其安全性、有效性和剂量-反应的可能性。
对种族因素敏感的药物,如果两个地区的人群有差异,则通常需要进行“桥接”试验。
如果药物对种族因素不敏感,且两地的用药经验及开展临床试验的经验与要求大致相似;或药物对种族因素敏感,但两个地区在种族上相似,而且有足够的药理学及临床经验表明,相关药物在两地病人中的有效性、安全性、剂量及给药方案十分相似,则不需“桥接”研究。
在对于所选择的剂量有疑问、对国外所进行的对照试验缺乏经验及给药方法、合并用药或实施临床试验的设计不同、对于该类药物不熟悉的情况下,有必要进行对照性临床“桥接”试验。
具体来说,药效动力学显示有地区差异,有必要进行采用临床终点的对照试验;药物代谢类型的实质性不同,要求进行对照临床试验;
药代动力学差异在某些情况下可仅做些剂量调整,而不需要新的临床试验。
安全性“桥接”临床试验安全性考虑应包括常见不良反应发生率和对于严重不良反应事件的监测。评价有效性的“桥接”研究可用于检出常见不良反应事件的发生率,也可鉴别在新地区比较普通的严重不良反应事件。
如果不需要做药物有效性的“桥接”试验,或者试验期限太短,例数太少,则需要进行单独的安全性研究,尤其是在国外临床试验中有严重不良反应事件的案例,新地区有效性“桥接”试验只能得出有限的安全性数据时,须进行安全性“桥接”临床试验,而不能将一般不良反应事件及严重不良反应事件的发生率外推。
桥接试验与传统的临床试验不同,只需证明药物在新地区安全性和有效性和原地区具有相似性,而不一定达到差异有统计学意义。
在不同地区或亚组人群间药物治疗效果“无具有临床意义的差别”,才是“一致性”的本质。一致性评价并不仅是假设检验,描述性总结、图表展示、基于模型的分析包括协变量分析、交互效应检验等是可以考虑使用的手段。
五、多中心临床试验应考虑哪些因素?
(广贤医药)
什么是多中心临床试验?
临床试验的发起方一般为2种,由医药企业发起,以产品注册上市为目的开展的临床试验称为制药企业申办的研究(industry sponsored clinical trial,IST)。由研究者(含医生或科研人员)发起,以科学研究为目的开展的临床试验被称为研究者发起的临床试验(investigator initiate trial,IIT)。
多中心临床试验是由多位研究者按同一试验方案在不同地点和单位同时进行的临床试验,一般由一位主要研究者总负责,并作为临床试验各中心间的协调研究者。
开展多中心临床试验的优势?
在较短的时间内收集较多的受试者。临床试验要有一定数量的受试者参加以满足临床试验的科学要求,而一所所能收集到的受试者的数量总有一定限制,但临床试验规定有一定的完成期限,希望尽早完成。试验规模大、受试者人数多、试验期限紧的试验必然采取多中心的形式。
多中心试验可以有较多的受试者人群参与,涵盖的面较广,可以避免单一研究可能存在的局限性,因而所得结论可有较广泛的意义,可信度较大。
多中心试验有较多研究者的参与,相互合作,能集思广益,提高临床试验设计、执行和解释结果的水平。从科学性出发,要求临床试验的均一性,减少内部的差异,多中心试验增加了发生这一方面问题的机会。因为研究者人数越多,各研究者对试验的认识、经验和技术水平的差别很容易存在;研究越多,各机构的设备条件、工作常规也可能有差别,不同研究所收治的病人的背景,如民族、文化水平、生活方式会有偏向和差别,众多的差别都能影响临床试验的均一性,增加了试验的复杂性。要进行多中心试验,就必须尽量设法减少各种差别,或减少差别所产生的影响。
多中心临床试验应考虑哪些?
研究方案及其附件必须考虑到多中心的特殊性,按其要求进行设计。
研究方案及其附件要由各参加的主要研究者共同讨论以后确定,然后以书面方式予以确认。
研究方案及其附件要由委员会讨论通过并做出书面同意后方能执行。多中心试验涉及一个以上研究,因而涉及各研究的委员会。原则上研究方案及其附件要由委员会讨论通过并做出书面同意。在实际中可能会遇到两种情况。一是各个研究的委员会对事物的认识和考虑会有不同,可能多数研究的委员会同意研究方案及其附件,而个别研究的委员会持不同意见或不给予赞同意见,此种情况下研究者可以多做解释,争取理解。但如仍得不到同意,则该研究只能不参加该有关临床试验。另一种情况是可能个别研究机构尚未建立委员会,此时以该临床试验的主要负责单位的委员会的同意意见和批件作为覆盖性的措施,也是一种变通办法。
临床试验要在各研究机构同步进行,因此应规定各个研究中第一名受试者入组时间和最后一名受试者入组和完成时间。这可以使临床试验在一定时间内完成,也使各研究不至于因为时间相差大而影响其相互的一致性。
统一随机化,病人经筛选后将其资料传至随机中心,由随机中心派定随机号。这种做法在有条件选用治疗的随机分配时更为重要,但需要有较好的联系条件如传真、电话。如是对照试验,则每一位病例应保持按对照的要求进行随机分配。
多中心试验必然在多个研究中有较多研究者参加,除每一研究的主要研究者外,更多的是协助主要研究者进行临床试验的研究者。为使众多的协助研究者对研究的临床试验有一个共同的认识,在执行临床试验中有统一的行动,除了各研究机构的主要研究者在制定研究方案时统一认识外,还要求按照研究方案对协助研究者进行培训,使他们按同一标准来执行研究方案中的每一个具体细节。在培训中要特别强调严格遵循方案,减除任何随意的行为。
多中心试验中采用的评价安全性和疗效的方法必须统一。这里所说的方法包括实验室检查和临床检查方法,范围很广泛,从常规的血、尿检查,生化指标,肝肾功能,X线,心电图到特殊的形态和功能检查。所有检查都有方法、试剂、材料、正常值范围等方面的问题。不同的实验室采用不同的方法和材料做同一个检查项目,其结果就很难汇合,也很难比较。为了解决这一问题,在临床检验方面,当前主张采用中心实验室的办法。所谓"中心实验室"是指专门为多中心试验的特殊需要而建立的一种实验室,其各个检查项目均采用国际上公认的方法,所用的试剂质量可靠,检查有明确的标准操作规程和质控,并经过有权威机构的定期的质量稽查和确认。此外,还建立了一套标本的收集、输、接受、储藏体系,将各中心的标本集中到中心实验室进行检验,最后发出检验结果的报告。中心实验室可以有效地避免不同实验室存在的差异,提高临床试验的质量,但也会增加临床试验的经费,样本在传送的过程中有时也可能发生一些问题,如标本的损坏(包括机械的、理化环境的)、延误等。参加该临床试验的各研究中选择一处条件较好,尤其有良好质量控制,经有关的权威部门定期鉴定确认的实验室担任中心实验室的功能,至少将评价疗效和安全性的主要项目集中检验。
多中心试验中各中心在试验时产生大量数据,这些数据应该传送到一个数据处理中心进行统一管理,包括查询、核对、储存,最后进行分析。
在多中心试验中,监查员的作用更为重要,监查员要统一培训,定期汇报和交流;目的是保证各中心严格按方案执行,对严重违背方案者及时上报。
end
本公众号声明:
1、如您转载本公众号原创内容必须注明出处。
2、本公众号转载的内容是出于传递更多信息之目的,若有来源标注错误或侵犯了您的合法权益,请作者或发布单位与我们联系,我们将及时进行修改或删除处理。
3、本公众号文中部分图片来源于网络,版权归原作者所有,如果侵犯到您的权益,请联系我们删除。
4、本公众号发布的所有内容,并不意味着本公众号赞同其观点或证实其描述。其原创性以及文中陈述文字和内容未经本公众号证实,对本文全部或者部分内容的真实性、完整性、及时性我们不作任何保证或承诺,请浏览者仅作参考,并请自行核实。