The BMJ:错误指南的成因及发生情况【循证医学】【2017年第5期】

2017年11月23日 英国医学杂志中文版



点击标题下「蓝色微信名」可快速关注


  • 王琪 译 

  • 陈耀龙 校

  • 兰州大学循证医学中心


摘要

循证指南被认为是帮助医生、政策制定者和患者选择医疗方案的必备工具,也被视为无偏倚的卫生保健标准。然而,根据对其可靠性的评估,多达50%的指南被认为不值得信赖。这对患者安全、资源利用和卫生经济负担造成了严重的后果。虽然利益冲突、指南专家组构成和方法学缺陷通常被认为是影响指南可靠性的主要原因,但腐败与生物医学研究的浪费在其中发挥的作用也不容小觑。本文将对上述问题进行讨论,以期帮助读者对指南的局限性有更广泛的认识。

前言

循证指南由知名专家组成的小组依据规范的过程和准则制订,被认为是无偏倚和真实有效的,其结论与通常的科学研究方法得出的结论有着相同的可信度1。然而,尽管为制订高质量的指南采取了各种努力,近年来仍出现了一些关于其可靠性的忧虑2。虽然此现象的实际影响程度仍不清楚,但对采用了有缺陷的指南而导致的预期之外、有危害的临床结局的程度和影响进行评估至关重要,此外,也需要探究资源显著浪费的影响,以及对循证的"质量标杆"所产生的危害。了解指南错误发生的原因及情况将鼓励指南使用者谨慎对待临床指南的推荐意见,也将促进应用不同策略以成功应对该挑战。

何时临床指南是错误的?

指南的有效性一般无法直接判断,因为制订指南的过程异常复杂,涉及到专业技能(如有效检索主要的证据)、价值判断(评价证据)和社会层面(组织讨论并依靠指南专家组达成共识)3。总体而言,任何未能提供正确建议的指南都应该被认为是错误的,相反,正确的指南应该是"在其他条件相同的情况下,如果指南得以实施则会产生预期的健康与成本结局"4。然而,一般不太可能等到指南实施以后再去评判其有效性。更为常见的做法是,考察"预期的健康结局和所采取的各种干预措施的成本、证据与推荐意见的关联、所引用的科学研究证据的内容和质量、评价证据的方法"4有多可靠。即我们当前评价指南可靠性的方式——评价制订指南的方法(可靠的方法学)和(或)内容,即主要证据是否得到了正确的检索、评估、综合,并转化为特定的推荐意见(可靠的内容)。


错误指南的现状

不管如何定义指南的可靠性,我们应先了解错误指南的现状(参考本文在线的补充文件)。有趣的是,在指南问世之初,就有了方法学不可靠的说法。2000年,在Grilli等5评价的431种指南中,只有22种(5%)满足了3个基本的质量标准,而1个质量标准都没满足的指南多达221种(54%)。同样,1999年发表的另一项研究采用一份更详细的指南质量评价清单,评价了279种指南,结果发现平均总符合度仅为47%6。在接下来的20年里,指南的方法学质量鲜有或全无改善。一项研究结果证实,在2012年被评价的130种指南中,仅不到一半的指南符合美国医学科学院(IOM)50%以上的标准2。关于指南内容方面的可靠性评估尚未有类似水平的研究,但其不合格的情况也是屡见不鲜。


总的来说,保守估计当前50%的循证指南都存在问题,要么是方法学缺陷,在其参考的主要证据方面有令人质疑的内容,要么发现观测到的结局与所预期结局背道而驰。通常,相比由国家卫生机构支持的指南,医学专业学会资助的指南质量更低,而且这种情况还会继续。


循证指南为什么会发生错误?

早期以共识为基础的指南,在利用科学研究证据的方式上,存在不规范和不确定性,因而很容易存在导致发生错误的风险。而当前更多的循证指南则应该确保更客观可信的推荐意见(图1)。尽管20世纪90年代初期以来,新制订的指南有其可取之处7,但它们的质量仍在很大程度上不尽如人意,因为可能发生以下一个或多个影响指南制订过程的因素:(1)喜好新疗法和新干预措施的临床专家所占的比例过多,导致指南专家组的结构不合理和不平衡;8(2)许多专家对即将被评估的内容存在偏见9;(3)指南专家组缺乏规范的共识方法,决策方式不科学;(4)在进行证据分级和形成一致、清晰、可行的推荐意见时,方法过于简化、不透明、不一致;(5)未能考虑患者偏好和价值观差异、共病和慢病对指南的影响;(6)发表偏倚;(7)当前"最佳"证据和过期研究证据的时差;(8)利益竞争10;(9)缺乏生物医学期刊发表其他论文的同行评议机制、指南使用者对指南发布之前草案的验证(这一步至关重要),以及独立专家的外部评审。


图1 理想情况下和真实世界中循证指南在生物医学研究背景下的角色。方框里面是影响指南质量的内部因素:方框之外的右侧,是造成指南不被信赖的主要外部原因。同时还有健康结局的其他决定因素。


指南制订过程中常被忽略和视作不相关的其他原因,也需要在评价指南可靠性时予以考虑。首先,对证据复杂本质的认识不足。一般将证据定义为"能够建立起一种事实的依据或为相信某事而给出的原因"11,实际上,"证据"对于研究者、临床医生或政策制定者有不同的含义。这些不同形式的证据将不会自动整合而产生出卫生系统当中的指南,综合和诠释它们需要审慎的过程12。实际上,有不少指南虽然评估了相同的证据体,但会得出不同甚至相互矛盾的"循证"推荐意见。


此外,证据的质量可能因为生物医学研究中"本可避免的浪费"而被降低,譬如研究通常关注低优先级的问题,忽略关注重要的结局,应用不恰当的设计和研究方法,对不满意的结果和研究存在的偏倚未充分报告,基于不完整和有误导的研究结果进行评估13。在没有充分了解当前已有证据现状的情况下,大多数新的研究得以开展和解读。不恰当的利益14、贩卖疾病、过度诊断和过度治疗15影响着试验系统背后的整个研究过程,试验系统也由于这些原因而遭到破坏16,进而严重导致循证医学运动本身17及其最为典型的产品——指南的腐化。


结论

循证指南被认为是帮助临床实践者检索临床问题答案的有效辅助工具。通过使用指南,临床医生将纵览当前最佳的信息总结,评估所遴选的推荐意见是否足以应对他们所面临的具体临床情况。然而,指南的可靠性很大程度上被高估,指南仍存在方法学缺陷、不合理的专家组成、利益冲突,使得其结论常常并不可信。即使宣称采用了循证的方法,但事实上并没有严格遵守其原则和步骤,"循证质量标杆"因为既得利益而被滥用18。药厂控制和资助了大部分的科学研究,如此规模的"委托偏倚"解释了为何大量存在缺陷的证据能够被产出和引入指南,从而为过度诊断和治疗推波助澜,而非制止和减缓19。"证据"这一充满魔力的词汇,对许多医师处方偏好产生了强烈的影响。所以,低质量的生物医学研究损害了可靠和值得信赖的指南的制订过程,无论最诚实和严谨的指南制订者达到了多高的精确性和方法学水平,在这种情况下也无力回天。错误指南的危机,是循证医学运动面临的众多问题之一——正如研究选题受到干涉、道德诚信受到损害、研究与患者相关性不高一样,而这些问题在循证医学证据的生产过程中显得尤为重要。


循证推荐意见的"公共市场"已被唤醒——它推动指南用户迈向评价最高和最可靠的推荐意见20。不幸的是,如此真实和客观存在的领域迄今仍处于萌芽发展阶段。此外,没有一个对已发表的指南进行权威、公信、可靠、独立和不存在利益竞争评价的机构。所以,指南使用者在评价指南的可靠性时仍然孤立无援。在下一篇论文里,我们将探讨读者如何更了解所关注指南的价值,以及面对有缺陷的推荐意见时的行动。


Evid Based Med 2017;22(1):1 doi:10.1136/ebmed-2016-110606




收藏 已赞