The BMJ:不能仅通过平均差排除研究结果的临床意义【分析与评论】【2016年第8期】

2017年06月20日 英国医学杂志中文版



点击标题下「蓝色微信名」可快速关注


  • 李佶松   译

  • 谢学海   校

  • 杨尹默   校

  • 北京大学第一医院外科


摘要

Christopher Cates和Charlotta Karner提出临床治疗效果的评价应包括患者个体反应的信息。


Christopher Cates和Charlotta Karner提出临床治疗效果的评价应包括患者个体反应的信息。


医生和患者在面临治疗方案的选择时,都想知道随机试验的结果除了统计学意义之外,是否也具有临床重要意义。如果随机试验的结果是事件发生的概率小于1/20 (P值小于0.05),那么这个结果即具有统计学意义。然而,P值并不能度量治疗组与对照组的差异大小,所以不足以评价临床重要意义。第2个问题是:治疗结果的差异是否大到值得临床应用的程度?最小重要差异值(the minimum important difference, MID)是对接受治疗的患者量表测量的最小变化阈值,由患者本人评估。对于像生活质量这一类通过连续量表评分的结果,MID是由患者判定治疗有效的最小评分变化1。MID可用于评价治疗的临床意义,尽管还有其他不同的方法来评估2,3


本文探讨如何评价具有统计学意义的结果是否也具有临床意义。我们将说明当平均差有统计学显著差异时,结合平均差的大小和个体反应度的分布能更好地评价其临床重要意义。


不仅仅是平均差

英国国家健康与临床优选研究所(NICE)指南组(和其他指南组一样)目前应用GRADE(推荐分级的评估、制订与评价)方法来评价临床试验的连续结果变量。GRADE应用平均差和95%可信区间(confidence interval, CI)来评价治疗组与对照组之间是否具有统计学显著性差异4


在大规模临床试验和荟萃分析中, 95%可信区间可以很窄,因此较小的平均差也可能有统计学意义,但是否也具有临床意义呢?回答这个问题需要比较平均差和MID。当平均差的95%CI达不到MID阈值时,使用GRADE方法的指南撰写者可能将此种治疗方法定义为不值得临床推荐,即使结果具有统计学意义。平均数的95%CI是受试人群平均治疗效果95%可能所在的区间,并不能描述为预测每个受试个体治疗结果的范围区间。平均差的95%CI相当于平均数的标准误宽度的3.92倍。相对而言,患者个体结果的分布范围更宽,95%的患者结果所位于的区间宽度相当于标准差的3.92倍。因此,尽管平均差的95%CI可能比MID阈值要小,这并不意味着95%的患者个体不能达到MID的阈值。


我们需要关于个体反应度分布的更多信息来确定治疗的临床相关性。一个方法是观察治疗组和安慰剂组有多少患者的反应度能达到MID。这些个体被描述为"反应者" ,而这种方法称为"反应者分析" 。


实例

我们应用一个关于噻托溴铵与安慰剂治疗慢性阻塞性肺疾病(COPD)随机对照试验的Cochrane系统性综述中的数据,对比以上两种方法(合并均数的95%CI和反应者分析)5


这篇综述纳入9个临床研究,总计11 672名受试者,运用St George呼吸问卷来评测患者生活质量。问卷量表评分从0到100分,更高的分数代表更低的生存质量。MID为基线水平减去4个单位,这是预先由受试患者判定的治疗"稍微有效"评分变化的平均数,因而具有临床重要意义6


平均差

研究结果显示,噻托溴铵试验组的St George量表评分平均比安慰剂组低2.89个单位。大多数受试者评分位于平均数估测值的较窄95%CI内。文章作者写道:"与安慰剂组相比,噻托溴铵治疗组显著提高了平均生存质量(平均差为-2.89,95% CI为-3.35~-2.44)。"森林图显示全部临床研究的平均数估计值的95%CI(图中方块宽度所示)具有统计学意义(P<0.000 01),但并未达到降低4个单位的MID阈值(图中虚线所示)(图1)。


图1    噻托溴铵组比安慰剂组生活质量的森林图(St George呼吸问卷总分)SE=平均数标准误, IV=逆方差。虚线示最小重要差异值(MID)阈值


我们很可能得出治疗没有临床显著效果的结论6,7。为了评价这个结论正确与否,我们查看一下噻托溴铵组和安慰剂组的反应者(那些评分减少至少4个单位的患者)数目。


反应者分析

临床试验报告很少包含每例患者的结果8。但本文的一位作者(CK)从研究者手中获得了尚未发表的各组反应者数目信息。


噻托溴铵组反应者与安慰剂组反应者的危险比为1.25 (95%CI为1.20~ 1.31)(图2),这意味着使用噻托溴铵的患者成为反应者的可能性相较于使用安慰剂的患者高出20%~31%。我们不可能单纯用比值来解释疗效的临床意义。我们还需要知道具体多少患者对噻托溴铵或安慰剂有效,从而确定治疗效果的确切差别。



图2   噻托溴铵组比安慰剂组生活质量改善至少4个单位的人群的森林图(St George呼吸问卷总分)。M-H=Mantel-Haenszel


总体而言,安慰剂组共5 108例患者,1 988例(39%)为反应者,这在Cates图中显示为39张绿脸(图3)。我们应用所有研究的危险比以及该值的95%CI(对于安慰剂组的平均值)来显示治疗的预期收益。Cates图中10张黄脸表示每100个平均使用1年噻托溴铵的COPD患者中,比安慰剂组多10例患者(95%CI为8~ 12)对治疗有反应。51张红脸代表对安慰剂和噻托溴铵均无反应的患者。


图3   噻托溴铵组和安慰剂组的反应者(St George呼吸问卷评分改善4个单位)的Cates图(www. nntonline.net, Visual Rx绘制)


反应者分析显示噻托溴铵治疗组相较于安慰剂组约多出1/10的受试者有明显治疗获益。应用噻托溴胺治疗的患者,治疗有效者较安慰剂组多1例患者,则受试患者总数为11 (95% CI为9~ 13)。反应者分析可用于评价治疗的临床相关性,即使平均差未达到MID。


举另一例子,在一项关于高频振荡通气治疗小于29孕周出生的新生儿的临床试验中,反应者分析和平均差均被报道9。尽管肺功能平均差看似很小,反应者分析显示仍有临床显著差异——在远期肺功能结果小于第10百分位的儿童中,出生时高频振荡治疗的儿童所占比例(37%)相较于传统通气(47%)更低。


我们并非建议用反应者分析来替代平均差,因为这样会导致统计学效力明显降低。更确切地说,我们认为临床重要意义不应仅仅由平均差的95% CI评价,而应结合反应者分析或其他能代表个体反应的方法,如散点图。


患者个体反应

在噻托溴铵试验中,每个受试者随机接受药物治疗或安慰剂,意味着我们不能直接比较同一患者对不同治疗方式的反应。噻托溴铵组和安慰剂组患者个体的平均差只可能在患者按随机顺序交替接受药物治疗和安慰剂的试验中计算得到;这样的试验称为单病例随机对照研究("n of 1"研究)10。正如Senn之前指出的,这将有利于我们评估COPD患者个体,噻托溴铵的持续疗效比安慰剂更好还是更差2,11, 12


因此,尽管我们发现应用噻托溴铵的患者中有更多的反应者,但我们无法知道哪些患者应用噻托溴胺比应用安慰剂获益更多。


指导临床实践

指南撰写者若要全面评估某种治疗方法的临床意义,需同时考虑平均差和临床研究中受试者的个体反应。连续结果变量的统计学意义可通过平均差来计算,但临床意义需要关于个体反应的更多信息。不能仅仅因为平均差的95%CI无法达到MID,而将某种治疗方式可能带来的临床获益忽略,并将其排除在指南或系统性综述之外。


对于临床研究的意义

临床研究报告应包括平均差以及个体受试者的结果分布。研究者应在临床研究报告中列出个体结果图和反应者分析。这样,指南撰写者、系统性综述作者和临床医师可利用平均差和这些信息来评估随机试验中疗效连续性结果的临床重要意义。



BMJ 2015;351:h5496 doi: 10.1136/bmj.h5496




收藏 已赞