我们应该认为,当医学证据不同意?

要了解如果疾病的新疗法确实比旧疗法,医生更好,研究人员期待的最好证据。 卫生专业人员要在证据解决什么治疗的最佳模式是一个问题的“硬道理”。

但并非所有的医学证据都是平等的。 而且有明确的证据等级:有关个人事件的专家意见和病例报告处于最低级别,而且进行的良好的随机对照试验接近顶端。 在这个层次结构的顶端是元分析 - 这个研究结合了来自多个研究的结果,提出了同样的问题。 而且, 非常 这个层次结构的顶层是由一个叫做组织的组织进行的元分析 Cochrane协作网.

要成为Cochrane协作组织的成员,要求个体研究人员或研究小组遵守非常严格的指导方针,以便如何报告和执行meta分析。 这就是为什么Cochrane评价通常被认为是最好的荟萃分析。

然而,没有人曾经问过Cochrane协作网进行荟萃分析的结果是否与其他来源的荟萃分析不同。 理论上,如果您比较Cochrane和非Cocrhane荟萃分析,两者都在相似的时间框架内发表,您倾向于期望他们选择相同的研究进行分析,并且他们的结果和解释会更多或者更少匹配。

我们在波士顿大学公共卫生学院的团队决定找出答案。 而令人惊讶的是,事实并非如此 我们发现了什么.


内在自我订阅图形


什么是元分析,无论如何?

想象一下,你有五个小型的临床试验,所有这些试验都发现了一个普遍的积极的好处,比方说,服用阿司匹林来预防心脏病发作。 但是因为每项研究只有少数研究对象,所以没有人可以自信地说有益效果不仅仅是偶然的。 在统计学上,这样的研究将被视为“动力不足”。

增加这些研究的统计能力是一个很好的方法:将这五个较小的研究合并为一个。 这就是元分析所做的。 有时将几项较小的研究结合到一项分析中,并将这些研究的平均数结合起来,有时甚至可能达到一定程度,医学界可以放心地了解特定的干预是否有效。

荟萃分析是高效和便宜的,因为他们不需要运行新的试验。 相反,这是一个发现已经发表的所有相关研究的问题,而且这可能会非常困难。 研究人员必须坚持和有条不紊地进行搜索。 发现研究并决定它们是否足够信任,这种科学的艺术 - 错误 - 成为一个关键问题。

这实际上是Cochrane协作组织成立的主要原因。 卫生服务研究人员Archie Cochrane认识到荟萃分析的力量,同时也认识到做正确分析的重要性。 Cochrane协作网荟萃分析必须坚持非常高的透明度和方法严谨性和可重复性的标准。

遗憾的是,很少有人能提交的时间和精力投身Cochrane协作,这意味着绝大多数的Meta分析不是由协作进行,不一定要坚持自己的标准。 但是,这实际上很重要?

两个荟萃分析有什么不同?

为了找到答案,我们开始通过识别荟萃分析,一个来自科克伦和一个没有,这涵盖了相同的干预(如阿司匹林)和结果(如心脏发作),然后比较和对比他们的40对。

首先,我们发现几乎40百分比的Cochrane和非Cochrane荟萃分析在他们的底线统计答案上不一致。 这意味着,例如,典型的读者,医生或健康决策者会根据他们所阅读的meta分析,对干预措施是否有效做出根本不同的解释。

其次,这些差异似乎是系统性的。 非Cochrane系统评价,平均而言,倾向于认为他们测试干预措施更有效,更容易治愈的条件或避免一些医疗并发症比Cochrane评价建议。 同时,非Cochrane评价在他们的精度不够精确,这意味着有更高的机会,结果仅仅是由于偶然。

荟萃分析只不过是其成分研究的奇特加权平均值。 我们惊讶地发现,大约63百分比的纳入研究对于一组或另一组荟萃分析是独特的。 换句话说,尽管两组荟萃分析可能会使用类似的搜索标准,在相似的时间内和类似的数据库中查找相同的论文,但这两组的论文只有三分之一左右。包含的是相同的。

这些差异的大部分或全部可能归结于Cochrane坚持更严格的标准。 一项荟萃分析与其所包含的研究一样好,考虑到不良研究的平均水平可能会导致较差的结果。 俗话说“垃圾进,垃圾出来”。

有趣的是,报告高得​​多的影响大小的分析趋于得到高得多的速率比分析报告低效应大小在其他文件再次引用。 这是老新闻俗话说的统计实施方案“如果它流血,它会导致”大和大胆的效果得到比结果显示边缘或模棱两可的结果更多的关注。 在医学界,毕竟只是人类。

为什么这件事情?

从最基本的层面来看,这表明Archie Cochrane绝对正确。 方法的一致性,严谨性和透明度至关重要。 没有这一点,就有可能认为某些事情没有起作用,甚至只是过度的利益。

但在更高的层次上,这又向我们显示了对医学文献进行统一解读是非常困难的。 荟萃分析往往被用来作为一个给定主题的最后一个词,作为模棱两可的仲裁者。

显然,这个角色是由事实两个荟萃分析,表面上是同一主题,可以得出不同的结论提出质疑。 如果我们查看荟萃分析,在我们目前的时代的“金标准”,“循证医学”又是怎样的平均医生或决策者,甚至病人时两金标准是相互矛盾的反应? 买者自负。

关于作者谈话

Christopher J. Gill,全球卫生部副教授; 波士顿大学传染病专家。

这篇文章最初发表于 谈话。 阅读 原创文章.


相关图书:

at InnerSelf 市场和亚马逊