在学校听一位自然疗法医师的讲座时,我有机会问了这样一个问题:鉴于顺势疗法在科学上极度站不住脚,而且临床证据也普遍呈负面,您为什么还要继续开顺势疗法药物?她的回答,正如我的问题一样,揭示了科学医疗从业者和宗派医疗从业者之间的一个核心区别。她说:“因为我在我的实践中亲眼见证了它的疗效。”

就是这样。她和许多其他从事可疑疗法的从业者都受轶事经验的左右,而我则不然。

轶事是一种故事——在医学语境中,它通常与个人患病或出现症状的经历以及他们为治疗所做的努力有关。人们通常觉得轶事非常引人入胜,而科学家则对轶事抱有深深的怀疑。我们常说,轶事的复数形式是“轶事们”(anecdotes),而不是“数据”(data)。这是为什么呢?

 

人类是善于社交、喜欢讲述故事的动物——我们本能地从他人的经验中学习。我的朋友吃了那种结着鲜红色浆果的植物,然后病得很重——教训:别吃那种植物。这是一种启发式方法,一种人类进化而来的思维捷径,使我们能够快速且大多准确地判断周围环境。从进化的角度来看,与其进行盲法实验来验证是否真的是那种植物让你的朋友生病,不如直接避开那种结着红色浆果的植物,这在统计学上可能更有优势。

此外,最引人入胜的故事往往是我们自己的亲身经历。当我们确信自己亲身经历过某件事时,很难甚至不可能说服我们改变这种想法。这似乎是人类与生俱来的本能。

在人类进化史的早期阶段,通过故事来理解世界是一种有效的策略,但这种方法缺陷太多,无法应对我们今天所处的复杂世界。事实上,科学学科的出现正是为了超越我们进化而来的那些高效却有缺陷的技术。例如,你的朋友可能因为当天早些时候吃了生鸡蛋而生病,而与植物本身无关。进化压力促使人们倾向于用一种更为简单的视角看待自然,这种视角往往假定显而易见的模式就是真实存在的。

在当今现代社会,我们面临着令人眼花缭乱的各种表象模式,而仅仅依靠我们进化而来的简单经验法则来应对已远远不够。例如,某种疗法是否对症状或疾病有效就是一个很好的例子。症状往往会随时间变化,有些症状甚至会自发缓解,而且我们对症状的感知也容易受到诸多心理因素的影响。此外,还有许多生物学因素可能产生影响。如果我们想要对特定干预措施对症状和疾病的影响做出可靠的判断,就必须超越缺乏对照的观察或轶事证据。

轶事作为证据的主要缺陷在于其缺乏控制。这使得许多隐藏变量可能影响结果。因此,我们无法就究竟是哪个变量(例如某种特定疗法)导致了任何明显的改善做出可靠的假设。

以下是一些使得可靠解读轶事性医学证据变得困难甚至不可能的具体因素:

均值回归: 这是一种统计现象,指任何极端波动之后都可能出现较为平均的波动——这仅仅是偶然因素造成的。许多疾病的症状都会出现波动或变化——时好时坏,或者病情加重后又会相对缓解。如果患者在症状严重时寻求治疗,仅凭偶然因素,接下来很可能就会出现症状减轻的时期。

大多数疾病都具有自限性: 俗话说,感冒不治疗七天,治疗一周。大多数疾病都会自行好转或缓解,因此,即使治疗本身没有生物学效应,大多数治疗后症状也会消失。更广泛地说,所有疾病都有其自然病程,即它们随时间推移通常遵循的进程。为了了解某种治疗是否影响了这一进程,必须将其与未接受治疗或接受不同治疗的患者进行比较。

多种疗法: 人们常常会尝试多种疗法来治疗某种疾病或不适,这使得我们无法判断哪种疗法真正有效(如果有的话)。多种疗法可能同时进行,也可能先后进行。例如,一位患有长期疾病(但注定会有一段相对缓解期)的患者,尝试了疗法 A 无效,然后尝试了疗法 B 也无效,接着尝试了疗法 C,症状有所改善。之后,他将功劳归于疗法 C,并声称其他多种疗法都失败了。然而,由于患者在症状改善的任何时候都在尝试新的疗法,因此总有一种疗法可以归功于这种改善。

死人不会说话(报告偏差问题): 癌症幸存者群体中不包含因癌症去世的人。那些死于疾病的人无法讲述他们的经历。因此,报告偏差是固有的。此外,那些感觉治疗对他们有益的人比那些没有明显获益的人更倾向于炫耀。人们喜欢讲述他们找到并坚信的“奇迹疗法”的故事,尽管有人怀疑和反对——但他们的远见卓识得到了回报,因为这种疗法对他们有效。人们没有动力去讲述他们尝试无效的新疗法的经历。此外,感觉医生或治疗师对他们有帮助的患者更有可能复诊。而那些感觉治疗无效的患者可能根本不会回来报告治疗失败的情况。

确认偏差: 这是一种有据可查的心理现象,我们倾向于寻找并记住那些证实我们已经相信或想要相信的事情的信息,而回避、忘记或曲解反驳的证据。

模糊的结果指标: 良好的临床试验应采用客观的结果指标——例如二元结果(如死亡或存活)、定量结果(如血液指标)或基于特定体征的结果。主观症状并非理想的结果指标,因为它们需要人为判断,而这又会引入另一个变量。那么,轻微的打喷嚏是否应该算作感冒呢?如果您正在服用某种您认为有助于预防感冒的药物,您可能会忽略这些打喷嚏的症状,并报告(甚至记住)您在服用该药物期间没有感冒。

安慰剂效应: 安慰剂效应实际上是由多种因素共同作用的结果,这些因素会使人产生对无效治疗产生反应的错觉。这些因素包括我上面列出的许多因素,但也包括其他可能影响健康结果或症状的变量。 点击此处查看更详细的讨论。

人类记忆的不可靠性: 医学生很快就会发现,采集病史的最大挑战之一在于人们的记忆力很差,说得委婉点就是人类的记忆力很差。轶事很大程度上依赖于个人对自身疾病和治疗的记忆。这引入了许多新的变量。例如,人们倾向于将记忆中的不同事件混淆为单一事件,或者将不同事件的细节拼凑在一起。此外,随着时间的推移,细节也倾向于演变,以使故事更加清晰和深刻。因此,人们在记忆中可能会夸大治疗前症状的严重程度,夸大治疗效果,美化事件的时间线,使病情在治疗后不久(而不是治疗前或治疗后很久)就开始好转,忘记接受过的其他治疗,歪曲不同医护人员的告知等等。我曾无数次有机会将患者对自身疾病和治疗的记忆与记录在案的病历进行比较,结果发现两者之间的相关性从差到完全错误不等。

出于这些以及其他原因,科学家们已经学会了不轻信轶事报道——或者更确切地说,是对其可靠性进行务实的评估。因此,每当有人把轶事证据当作确凿的证据来呈现,甚至主张应该将轶事作为有效证据时,我都会觉得他们天真得令人难以置信。

我们也可以利用历史来判断轶事。西方医生数千年来一直依赖体液学说来解释健康和疾病。显然,数千年的轶事经验并没有让他们意识到他们的疗法毫无价值甚至有害。 艾布拉姆斯医生通过出售一种诊断和治疗疾病的机器而致富。他的设备被广泛使用,数百万人对其疗效深信不疑。这些机器对他们有效,他们的经验也坚定不移。艾布拉姆斯去世后,人们发现他那些(之前被严密保护起来不接受检查的)机器里装满了毫无用处的随机零件。世纪之交, 放射性补品风靡一时,直到一些著名的拥护者开始目睹辐射中毒的不良后果。

这些例子的意义在于,许多人仅仅基于轶事证据就得出这些干预措施有效的结论。它们之所以有用,是因为它们如今已不再被接受:体液学说被现代医学取代,艾布拉姆斯装置被彻底揭露,放射疗法也被证实具有直接危害性。但对于那些并非直接有害(至少危害不明显)或不存在“幕后黑手”的疗法,我们所拥有的只有轶事——而这些轶事显然并不可靠。

即使在主流医学界,我们也学会了对轶事证据保持怀疑,哪怕是我们自己的经验。医学史上充斥着许多看似有效但最终被科学证据否定而弃用的疗法。最经典的例子就是乳内动脉搭桥术治疗心绞痛——虽然坊间传闻似乎有效,但事实并非如此。

但轶事在医学证据中应该扮演什么角色呢?答案是肯定的,但作用非常有限且界限分明。轶事虽然存在种种缺陷,但却是真实的生活经验。某种疗法或许确实有效,而个人经验可能是其产生显著生物学效应的首要迹象。然而,以下两个因素限制了轶事在医学证据中的应用:

首先,轶事应尽可能详细地记录。这在科学医学中是一种常见的做法,轶事在医学上被称为病例报告(单独报告时)或病例系列(报告几个相关的轶事时)。病例报告之所以被称为轶事,是因为它们是回顾性的,而且没有对照。但是,如果能够详细记录所有相关信息,例如事件的时间线、所有治疗方案、检验结果、检查发现等等,那么复述一个病例就很有帮助。这至少可以确保信息的准确性,防止记忆造成进一步的偏差。此外,它还能尽可能多地记录各种混杂因素。

在科学医学中正确使用轶事的第二个标准是,它们应被视为初步的——仅为未来的研究指明方向。它们本身绝不应被视为最终的或具有说服力的结论。任何由轶事病例报告提出的发现或结论都需要通过后续的对照前瞻性临床研究进行验证。

理解轶事的性质和作用对于弥合科学医学支持者和信奉可疑或宗派医疗实践者(以及广大公众)之间的鸿沟至关重要。以我的经验来看,这往往是这两个阵营之间争论的最终焦点。

值得注意的是,科学界早已就轶事的局限性和作用达成共识。逻辑和历史经验都对此问题给出了明确的答案。然而,如今却有一些势力试图让科学进步倒退——他们想重新将轶事作为可靠的医学证据来源,本质上是要回到医学的科学前时代。在某些情况下,这种做法源于挫败感——受控的科学数据未能证实他们先前根深蒂固的观点。而在另一些情况下,这似乎是一种蓄意降低证据门槛的尝试,目的是让那些未经可靠科学证据验证的疗法得以被接受。无论出于何种原因,这都无益于公众健康。