罕见病防治面临的挑战之一是如何在受试者数量有限的情况下开展有效的临床试验来评价新药或新技术的安全性和有效性[1]。为实现这一目的,需要在给定的置信水平和检验效能水平下估算样本量。传统的样本量估算方法多使用检验效能分析法。该方法基于频率统计学原理,需设定目标治疗效果取值,证明“最小临床显著性差异”的合理性,并规定期望的检验效能。但有学者提出[2],当两种药物的安全性、价格和给药时间等方面相同时,即使是很小的效果差异也很重要,从而质疑最小临床显著性差异的合理性。另外,检验效能分析还存在两个问题:①对参数的未知真值进行点估计,但真正的疗效可能存在相当大的不确定性,因此检验效能并不能很好地说明试验将显示出积极结果的概率[3]。②在计算样本量的过程中,未考虑试验结果所适用的患者规模[4],对于罕见病临床试验,检验效能分析得出的样本量往往过高,在实际招募中无法达成。
因此,检验效能分析得到的大样本量在罕见病临床研究中仍存在局限性[4],需采用特殊的分析方法。本文将介绍一种基于贝叶斯决策理论的方法,将样本量估算问题转化为一个最优化问题:即在给定的资源约束下,寻找能够最大化期望收益的样本量,估算过程中考虑了疾病所对应的患者规模。同时,贝叶斯决策理论也为我们提供了一种结合先验信息的方法,研究者可将已有证据与新数据结合[5],充分利用先验信息,更准确地估算样本含量。
方 法
1.原理
基于贝叶斯决策理论的样本量估算方法希望得到一个治疗建议,使整个人群的预期“收益”最大化,并通过权衡相互冲突的要求来确定试验的样本量[6]。在过去几十年,许多作者讨论了基于贝叶斯决策理论的样本量估算方法[6-10]。该方法基于概率和收益的决策分析框架,可以在不确定风险下做出最优选择。具体包括以下步骤:
(1)定义一个决策问题,包括决策空间、状态空间、先验分布、收益函数。
(2)根据先验分布和观察到的数据,计算后验分布。
(3)根据后验分布和收益函数,计算期望收益。
(4)根据期望收益或期望损失,选择最优决策。
在罕见病临床试验中,决策问题是如何确定样本量。决策空间是可能的样本量集合,状态空间是新药是否有效的两种结果。先验分布是根据历史数据或专家意见得到的新药疗效的概率分布。收益函数根据不同目标和偏好定义,例如最大化新药上市的收益、最小化试验成本、最小化安全风险等[6]。
2.参数设定
使用决策理论方法估算样本量需要合理指定所需的参数。涉及的参数主要包括以下几种:
(1)患者规模
决策理论模型明确考虑到了患病人口的利益,包括临床试验中的患者和将从试验结果中受益的患者,这个患者的数量N被称为“患者规模”[4]。在决策理论方法中,假设患者规模是固定已知的,通过计算预期人口规模患者的最大收益,可以将患者规模N纳入估算过程。
(2)先验和后验信息
为降低参数的不确定性,对新疗法和对照疗法现有信息的更好总结并非点估计,而是一个数值范围内的分布[11]。决策理论模型假定新疗法和对照疗法的当前信息是以先验分布的形式描述的,再将其与收集到的数据(通过似然)相结合,形成这些参数的后验分布,然后使用后验分布进行推断和决策。
(3)收益/成本
决策理论方法对“收益”的解释非常宽泛[12],可从患者、制药公司、监管部门或公共卫生角度来定义。例如对每个病人来说,收益函数取决于其接受了何种治疗,是在试验中还是在试验外接受治疗,病人的治疗花费以及治疗结果等。另外,收益既代表了治疗带来的好处,也因成本而减少,例如试验招募的货币成本、不良反应的安全成本等。
3.三方平衡收益函数
为做出理性决策,决策理论需要定义一个收益函数,以便提供量化形式并权衡不确定性。药物研发中,尽可能有效治疗更多病人是基本目标,但基于此目标仍存在不同的决策层次。对制药公司而言,收益取决于其为股东创造利润的能力,对患者而言治疗成本和疗效决定收益大小,但如果试验目的是为了支持监管机构的药物许可,那么监管方在审查中并不考虑货币成本[6]。因此本文认为,在最大化期望收益过程中,兼顾不同决策者的决策结构较为合理。药物研发中主要决策者为患者、制药公司和监管方,因此本文建立了“三方平衡收益函数(tripartite balanced benefit function, TBBF)”模型。总体收益函数为:
其中,U1、U2、U3分别为患者、制药公司和监管方的收益函数,W1、W2、W3为权重,其允许在实际应用中,对不同决策层次的重要性进行排序。其取值为多方共同讨论的结果,旨在最大限度权衡多方获益。可使用德尔菲法(Delphi method)确定权重,如设计问卷邀请患者代表、制药公司高管、监管机构人员及临床研究专家,要求专家独立为各方分配权重,汇总首轮结果并匿名反馈,专家根据群体意见调整权重,迭代至共识(如标准差<0.1)。各方权重的敏感性分析表明,样本量随W1的增加而增大(需要多数据支持患者获益);随W2的上升而降低(节省试验成本);随W3的上升而增大(需要满足更严格的安全性要求)。但基线结果在合理范围内具有稳健性。
为简化说明,考虑使用基于连续终点的非劣效性假设比较试验疗法和阳性对照。其中δ1和δ2为试验疗法和阳性对照两个平行组研究终点的平均值,n1和n2为两组样本量大小。I(·)为示性函数,满足括号内条件时为1否则为0,表示试验结束后推荐何种治疗,若推荐使用新疗法称为事件A,推荐对照疗法称为事件B。hT和hC分别是一名患者在试验中接受新治疗或对照治疗时的预期收益(试验内收益),gT和gC为相应的试验外收益。需要注意的是,不同决策者的试验内、试验外收益不同。患者、制药公司和监管方的试验内、试验外收益分别用h1、h2、h3和g1、g2、g3表示。
需要长期治疗的疾病,收益不会立即可见,因此模型将区分急性疾病和慢性疾病[6]。急性疾病多为患者在试验内或试验外接受一次性治疗(图1),收益立即实现。因此,急性疾病各决策者的收益函数为:
慢性疾病需要长期治疗,因此存在治疗时长的概念。假定一个感兴趣的观察期间为H,S为试验结束时间,试验结果可导致一个治疗策略,即从时间S开始推荐优势治疗法,那么H-S就是试验外治疗的时间,每个患者在试验内治疗时长设为d。时间S取决于试验结束时间,它是招募速度和试验样本量n1+n2的函数,记为S=S(n1+n2)。函数S线性依赖于试验的样本量,记S=t0+t1(n1+n2),其中t0代表常数,t1代表招募速度(每个病人招募的时间)。试验结束后提出治疗建议,在根据该建议进行治疗之前,患者将接受对照组治疗(如果他们不在试验中)。图2以图形方式显示了慢性疾病的基本假设(为简便起见,所有N个病人在时间S同时开始推荐疗法),假设患者的收益与接受治疗的时长成正比。因此慢性疾病各决策者的收益函数为:
应 用
下面通过一种慢性罕见病临床试验的案例分析,说明TBBF模型在罕见病临床试验中的应用情况。B型血友病是一种凝血功能异常的出血性疾病,为罕见的慢性疾病[13]。根据中国全国血友病登记系统信息及相关研究[14],截至2021年中国大陆中重度和重度B型血友病患病人数约为2500人。
2022年末FDA批准了世界首款治疗中重度和重度B型血友病的基因疗法药物Hemgenix(EDZ),获批的临床试验使用了前后对照[14]。根据先前研究的信息,将EDZ作为研究性治疗,静脉注射IX因子作为对照治疗(以rIX-FP为例),将研究性治疗与对照治疗的患者1∶1随机分配,预期的主要结果是年化出血率(annualized bleeding rate, ABR),估算即将进行的试验的样本量。先前研究报告[14]显示,治疗后所有出血事件的年化出血率都有所下降,通过间接治疗比较法[15]可得,试验组年化出血率平均变化为3.72(n=51),根据研究中试验组年化出血率的置信区间,可假定标准差为1.12;对照组年化出血率平均变化为1.43(n=18.2),根据研究中对照组年化出血率的置信区间,可假定标准差为3.31。因此,对于决策理论方法,假设试验组年化出血率变化的先验分布为N(3.72,0.402),对照组的先验分布为N(1.43,0.882),例如试验组先验方差计算过程为
假设I型错误为α=5%(双侧),检验效能为80%(β=20%),传统检验效能分析所得样本量为26。图3为试验组与对照组年化出血率变化的先验分布图,此时EDZ优于对照的先验概率为99.11%。当先验分布与似然函数共轭时,后验分布可直接解析推导。当模型复杂或无共轭先验时,可采取数值法,如马尔可夫链蒙特卡洛(MCMC)算法。年化出血率变化符合正态分布,可使用解析法计算后验分布,但本文主要展示利用参数的分布来估算样本量的过程,对如何将先验分布转换为后验分布的过程不做过多说明。
B型血友病虽为慢性疾病,但试验组EDZ为一次性注射治疗[14],而对照组需长期注射,需结合公式(2)~(4)和公式(5)~(7)给出收益函数。设观察时间跨度H是10年,试验组为一次性治疗,对照组治疗时长为6个月,即d=0.5年。假设治疗建议在时间S=S(n1+n2)=t0+t1(n1+n2)开始,t0=2(试验周期为0.5年,假设从试验结束到推荐治疗的平均开始时间为1.5年),招募速度为t1=1/15年/人(预期每招募15个病人需要1年)。让未知的年化出血率变化量在EDZ治疗后为δ1,对照治疗后为δ2。
为指定收益函数,需要将临床结果转化为经济价值,ABR降低与节省成本之间的联系主要是由于减少了管理出血事件及相关医疗干预的治疗需求[16]。在本案例中,整个H年时间里,当使用默认治疗政策(对照疗法)治疗N个病人中的每一个时,可将预期收益设为0,意味着hC=gC=0。此时我们对另一种治疗政策的收益变化感兴趣。根据Christina等人的研究[16],当年化出血率降低3.6时,平均每人每年的总医疗费用减少112881美元,意味着年化出血率每降低1个单位,平均每人每年的总医疗费用减少31355美元,即C0=31355美元/人年。CP为纳入一个病人所花费的试验内费用,粗略估算得CP=5000美元;CT为一次性使用新药物EDZ的治疗价格,费用为CT=350万美元;P为一次性使用新药物EDZ的药品利润,假设P=200万美元;CS为药物的安全性成本,由先前研究可知,尚未出现与药物相关的不良反应,所以得CS=0。试验各参数规格见表1。
结合公式(2)~(4)和公式(5)~(7)中介绍的函数h和g,可以写出:
(1)当决策者为患者时(U1),因患者在试验内通常不必支付治疗费用,可得hT1=δ1C0,hC1=0;因患者在试验外支付的治疗费为一次性费用,可知gT1分为两部分(δ1C0和-CT),gC1=0。
(2)当决策者为制药公司时(U2),试验内收益全部为负收益,可知hT2分为两部分(-CP和-CT),hC2=-CP;试验外收益为药品销售利润,gT2=P,gC2=0。
(3)当决策者为监管方时(U3),因药物有效性获利已在前面公式中有所体现,此时试验内和试验外收益主要来自安全成本,可得hT3=0,gT3=0。
此时我们设定各决策方的权重为W1=60%,W2=40%,因尚未出现与药物相关的不良反应,故W3=0,对于n1=n2=n,可得收益函数为:
对以上计算公式进行最大化,我们得到决策理论的最佳样本量为n*=3,即决策理论方法建议采用对未来具有较高预期收益的治疗方法,在这种情况下建议试验组和对照组的样本量分别为3,相较传统方法所得的26,TBBF模型有效降低了样本量要求。
讨 论
基于贝叶斯决策理论的TBBF模型在罕见病临床试验样本量估算中具有明显优势。TBBF模型使研究者可充分利用先验信息,且将患者规模纳入了估算过程;同时,其兼顾不同决策者的决策结构可反映不同利益相关者的偏好和价值观,使得决策过程更具有科学性和可解释性,可为未来罕见病进一步的临床研究提供信息参考。
但该类方法的应用也需要注意以下问题。首先,治疗效果先验分布所需的先验信息来源广泛,但即使是可信度较高的早期研究结果也存在偏倚风险,例如早期试验为非盲法或非随机研究;另外,为该方法指定所需参数需要专业的知识和经验,可能存在主观性和不确定性,需要进行敏感性分析和稳健性检验[17];最后,因与传统频率学派的理念不同,该类方法的应用可能遭到一些审稿人和监管机构的质疑和拒绝,因此对其科学性和合理性要求更高。尽管存在上述局限性,但本研究认为,考虑到有限的资源和条件,样本量计算需要在成本收益和检验效能之间进行权衡,适当的妥协是合理的。
参考文献
[1] Huang Z,Chow SC.Probability monitoring procedures for sample size determination[J].Journal of Biopharmaceutical Statistics,2019,29(5):887-896.
[2] Burman CF,Carlberg A.Future challenges in the design and ethics of clinical trials.In:Gad SC,ed.Clinical Trials Handbook.Wiley,2009:1173-1200.
[3] Du H,Wang L.A Bayesian power analysis procedure considering uncertainty in effect size estimates from a meta-analysis[J].Multivariate Behavioral Research,2016,51(5):589-605.
[4] Stallard N,Miller F,Day S,et al.Determination of the optimal sample size for a clinical trial accounting for the population size[J].Biometrical Journal,2017,59(4):609-625.
[5] Goligher EC,Heath A,Harhay MO.Bayesian statistics for clinical research[J].The Lancet,2024,404(10457):1067-1076.
[6] Miller F,Zohar S,Stallard N,et al.Approaches to sample size calculation for clinical trials in rare diseases[J].Pharmaceutical statistics,2018,17(3):214-230.
[7] Berry DA,Wolff MC,Sack D.Decision making during a phase Ⅲ randomized controlled trial[J].Controlled Clinical Trials,1994,15(5):360-378.
[8] Cheng Y,Su F,Berry DA.Choosing sample size for a clinical trial using decision analysis[J].Biometrika,2003,90(4):923-936.
[9] Kikuchi T,Gittins J.A behavioral Bayes method to determine the sample size of a clinical trial considering efficacy and safety[J].Statistics in Medicine,2009,28(18):2293-2306.
[10] Pezeshk H,Nematollahi N,Maroufy V,et al.Bayesian sample size calculation for estimation of the difference between two binomial proportions[J].Statistical Methods in Medical Research,2013,22(6):598-611.
[11] Fang F,Tamura RN,Braun TM,et al.Bayesian Sample Size Calculation in Small n,Sequential Multiple Assignment Randomized Trials(snSMART)[J].Pharmaceutical Statistics,2025,24(1):e2465.
[12] Hee SW,Hamborg T,Day S,et al.Decision-theoretic designs for small trials and pilot studies:a review[J].Statistical Methods in Medical Research,2016,25(3):1022-1038.
[13] Keeling D,Tait C,Makris M.Guideline on the selection and use of therapeutic products to treat haemophilia and other hereditary bleeding disorders:a united kingdom haemophilia center doctors′organisation (ukhcdo)guideline approved by the british committee for standards in haematology[J].Haemophilia,2008,14(4):671-684.
[14] Pipe SW,Leebeek FWG,Recht M,et al.Gene therapy with etranacogene dezaparvovec for hemophilia B[J].New England Journal of Medicine,2023,388(8):706-718.
[15] Klamroth R,Bonner A,Gomez K,et al.Indirect treatment comparisons of the gene therapy etranacogene dezaparvovec versus extended half-life factor IX therapies for severe or moderately severe haemophilia B[J].Haemophilia,2024,30(1):75-86.
[16] Christina X,Baker JR,Nichol MB.Economic burden of illness among persons with hemophilia B from HUGS Vb:examining the association of severity and treatment regimens with costs and annual bleed rates[J].Value in Health,2017,20(8):1074-1082.
[17] Calderazzo S,Wiesenfarth M,Kopp-Schneider A.A decision-theoretic approach to Bayesian clinical trial design and evaluation of robustness to prior-data conflict[J].Biostatistics,2022,23(1):328-344.
END
点击下列热门文章,即可直接进行阅读!!!
1.世界中医药学会联合会DMC第四届学术年会于南京成功举办!
2.借道区块链发展模块药理学揭示方证关联机制
3.多组学网络背景下方剂临床价值的考量
4.多组分多靶点中药药理作用机制研究中的问题和解决策略
5.胡大一:中国临床指南与共识存在三大问题
6.新药研发价值评估-决策树模型
7.中药、天然药物注册分类及申报资料要求(试行)(下)
8.中药、天然药物注册分类及申报资料要求(试行)(中)
9.中药、天然药物注册分类及申报资料要求(试行)(上)
10.证候研究与流行病学
11.祝贺!“氧感知通路”获2019年诺贝尔生理学或医学奖