正告中医黑:随机对照试验排除中药安慰剂效应?光说不练可不行

栏目:生活资讯  时间:2023-07-29
手机版

  继白菜之后的这一篇,我来谈一谈随机对照实验。

  随机对照试验(randomized controlled trial, RCT),其设计遵循三个基本原则,包括设置对照组,研究对象随机化分组以及盲法,经常简单俗称为双盲实验,常用于医学领域对于某种疗法或者药物的效果进行检测的手段,其实验设计的理念,会保证被试者和实验者双方都不知道哪些被试者接受了哪一处理,因此这种实验方法主要用于防止研究结果被安慰剂效应或者观察者偏爱的影响,被公认为评价干预措施的金标准。

  但是,它能解决评价药物有效性的一切问题吗?

  且让我们从头开始说起。

  (准确地说,“有效性”这个说法是不全面的,因为所谓有效是基于相对无效的安慰剂或者空白组,但是安慰剂组未必无效,但是为了表达方便,首先声明此处的有效性,指“优于安慰剂效应的药理学作用”,即所谓药物在药理学角度的有效。)

  一、随机盲法不是评价药物有效性的必须

  众所周知,如果要对两个变量进行因果推断,即A是不是导致了B,必须保证A变量在改变的时候,受试者的其他变量完全不变,即“控制单一变量”。如果严格做到了这一点的情况下,确实观察到A变量的变化导致了B变量的改变,其实什么大样本,盲法,都是不需要的,就可以直接得出“A能导致B”的结论,这是毋庸置疑的。

  例子很好举,比如用动物实验去验证药物的有效性,经常要求实验动物要是“近交系”,什么意思,近交系动物的群体基因高度纯合和稳定,个体之间的基因相似程度达到98%以上并且可以稳定遗传,换句话说,对于同一批次的近交系动物来说,它们几乎相当于是“复制粘贴”得到的,个体差异已经小到无以复加的程度,然后将这些几乎完全一样的动物随机分组,造模,给药。对于模型组和给药组来说,这两组之间唯一的变量就是给药,其余条件都完全相同。在这样的情况下,如果观察到给药组动物的相应指标优于模型组并且具有可量化的统计学差异,那么就直接可以得出“实验动物指标的改善”是由于“给药”这个单一变量引起的。这种通过控制单一变量法得出有效性的结论,是不需要通过随机盲法得出的。

  另外,想推出A导致了B,除了控制变量法之外,最直接的办法就是逻辑推导法,即完全搞清楚从A到B的路径,A和B虽然不是直接关系,但是我通过研究推导,发现A能直接导致C,C能直接导致D,而D又确实能直接导致B,那么就算体系中存在更多的变量EFGH等等,都不会干扰A-C-D-B的因果关系路径,都是不影响得出A导致B的结论的。

  换句话说,如果在理论上研究的无懈可击,也是不需要随机试验去证明其有效性的。如果人类研究人体就像研究汽车那样原理清楚,全都懂了,那就只需要哪里坏了修哪里就好了。就比如临床上运用的抗生素,抗生素就是可以直接杀灭病原菌,哪种抗生素对哪一类病原菌的杀灭作用强或者弱,都是已经研究明白的。所以给了对应的抗生素,病原体感染患者就能够治疗痊愈,这种清楚明白的药效,是无需用随机试验进行证明的。再比如很多手术比如针对肿瘤(特别是边界清楚的良性肿瘤),病灶长在那里,不切除就还在,切了就好了,此时无论那个患者的变量再多,是男是女,年龄如何,今天吃了什么,都不会影响“切除病灶所以疾病痊愈”的事实,这种明白而又有效的东西,盲不盲的,也就无所谓了。

  但是现实却是,这种“控制单一变量得出结论”的实验设计原则到了临床上评价药效时,却因为“无法对人进行有效控制”的现实而遇到了实际的问题。最理想的实验,在同一个时间点,是复制粘贴出两个完全一样的人,对其中一个人单独用药,然后观察疗效,与另一个人进行对比,这才是真正的对药效进行准确判断的方法,然而在临床上这种情况是做不到的,所以控制单一变量法就不适用了。另外一个方面,很多药物的机制,无论是中药还是西药,是单一化学物质还是混合物,它的机制都是不清不楚的,或者说只能搞明白其中的一小部分,并且还是容易受到我们控制不了的变量干扰的。这种机制的不清不楚,是医学科学技术的无能,是人类还没有完全揭开健康疾病奥秘的必然。

  为了应对这种迷茫,随机对照试验才应运而生,它比一般的临床试验,能够更大限度地排除实验设计,实施中出现的各种偏倚和混杂的因素,因而能够比一般的试验方法更准确地判断药物的有效性,是所谓的“金标准”。

  这一部分说了那么多只想明确一点,所谓“金标准”,并非判断药物有效性的必须,而实际上,它的诞生更像是一种出于无奈的选择。我们既搞不清楚机制,又还想知道疗效,那就做双盲吧,得出的结论要更靠谱一些。

  二、可操作性层面的问题

  由于我的专业并不是临床实验,在这里我只谈由实验原则引发的可以讨论的问题。

  随机对照双盲实验作为一个需要盲法的临床试验,盲法和临床这两个特征就导致了它不可回避的两个问题(针对实验对象,即患者),一是得做的了(符合伦理),二是得瞒得住(保证盲法)。

  根据伦理学的原则,参与临床试验的患者需要保证“有效的知情同意”。患者的知情权决定患者必须得知有关治疗的目的、方法,预计的风险和疗效的全面、精确的信息。而患者的同意权责保证患者在任何时候都有权退出临床试验(引自协和医学院翟晓梅教授《生命伦理学》授课内容)。

  在这里不难看出,伦理要求“有关治疗的目的、方法,预计的风险和疗效的全面、精确的信息”,和随机对照试验中的“盲法”,是很容易发生冲突的。所以,在随机对照试验的知情同意中,患者必须被告知自己可能接受的治疗手段的范围,而只是不知道具体自己被施以哪一种而已。

  在这种原则下,以下的情况就会出现:

  第一,如果设置安慰剂组,那么患者将必定得知自己参与的临床试验中存在安慰剂组,而自己是有可能接受安慰剂的治疗的。这所带来的可操作性问题,就在于对于很多必须急需获得疗效,否则就会极大危及健康或者进展迅速的疾病,是无法进行安慰剂组的设置的,因为设置安慰剂,就几乎必然导致此组内的患者承担可能耽误疾病治疗的风险。另外,如果一种现行的治疗手段能够有效治疗患者的疾病,也是不能设置安慰剂组的,因为患者是没有理由承担“本来疾病可以被治疗却有可能被用安慰剂”的风险的。所以,设置阴性对照安慰剂组的双盲实验是有很大局限的,仅能在不给受试者造成较大健康风险时,或者一种新药用于尚无已知有效药物可以治疗的疾病的情况,才可以直接设置安慰剂对照组进行疗效评价。

  第二,在无法使用安慰剂对照的情况下,阳性对照是经常选择的对照方式。简而言之,是通过与已知的有效药物进行对比,以比较受试药和对照药之间的差别(一般指受试药作用强于对照药,即优效性),或者证明受试药与对照药效果相当(即非劣效性或叫等效性)。但是阳性对照的选择也有一定的局限,它必须是相关领域内公认的,对研究的适应症疗效最为肯定并最安全的药物,并且原则上须与受试药的药理作用类似,剂型,给药途径等需尽量保持一致,这不仅是保证相互之间具有参考价值,也是为了保证盲法,因为患者事先的知情同意是需要明确知道自己将接受的治疗是哪几种(只是不知道自己具体接受哪种),如果对照药与受试药在剂型,给药途径上有很大差别,患者就可以通过自己接受的治疗方式得知自己被分在哪一组从而破坏盲法。所以,如果找不到合适的阳性对照,那么实验结果的科学性是必然会打折扣的。

  并且,单纯从逻辑上讲,阳性对照是无法直接排除安慰剂效应的,因为它的实验结果是与阳性组作对比,得出的直接结论是“受试药的药效优于/相似于/劣于阳性药”,而不是直接设置安慰剂对照时得出的结论“受试药的药效优于/相似于安慰剂”。这样就要求所选择的阳性药已经排除安慰剂效应,理论上才能间接表明受试药排除安慰剂效应。

  因此,由于随机对照试验必须要选择对照组,无论是阴性对照还是阳性对照,那么其应用的局限,就在于对照组的选择过程中。选什么做对照,如何对照,虽然原则上都写的很清楚,但是到了具体的环节,会遇到很多问题。特别是阳性对照,作为对比的参照,怎么选,选什么样的参照,是会直接影响结果的科学性的。借用 @庞博 的例子,多索茶碱扩张支气管的作用是氨茶碱的十倍,如果以氨茶碱为对照评价多索茶碱,那多索茶碱的效果都要好到天上去了,然而在临床上,多索茶碱只不过是个二线用药,应用范围远远不及氨茶碱。所以评价出来的优劣,与临床使用的上的优劣,可能根本就是两码事。

  三、陪“言必称双盲”的中医黑唠嗑:“金标准”到底适用不适用于评价中药

  中医黑在黑中医的时候,有时候喜欢质疑中药的疗效,并且经常拿双盲说事,讲“你中药的治疗效果都没排除安慰剂效应”。说实话,我看着就烦,不过说“没排除安慰剂效应”的,比讲“中药起效都是通过安慰剂效应”的,还是要可爱一些,手动狗头。

  但是中医黑们从来只管黑,却没几个想过具体问题具体分析的,现在我就来做这件事情,从必要性和可操作性的角度分析一下,中药和随机对照试验的关系,即到底要不要做,能不能做,以及怎么做。或者说,证明中药的不依赖安慰剂效应的疗效,是不是必须通过随机对照试验进行。

  先说明一下,由于中医黑直接质疑的是“中药”的效果,打击范围太广,所以此处还是分情况讨论吧。另外多说一句,所有“理论可行”的东西,其实是没意义的,因为涉及到可操作性层面的东西,就需要用具体的例子才能说明问题。你光跟我说“某指南上明确规定了怎么做”,或者说“用什么什么方法就能做”是没有用的,我需要讨论的,是具体是什么,需要用什么,到底怎么做。

  1、机制清楚效果显著的中药,无需做

  第一部分已经讲过,得出A导致B结论的方式并不一定需要随机对照试验。对于机制清楚疗效显著的中药,与西药采取同样方式,其疗效直接确认就可以,对于这种情况,是无需随机对照,也无需排除安慰剂效应的。

  举例:大承气汤的泻下作用。中医用大承气汤治疗阳明腑实证,最显著的效果就是泻下通便。对于便秘的患者,吃药之前不排便,吃完之后排便了就是排便了,效果确凿,显然不是安慰剂效应所能达到的,这不能睁着眼睛说瞎话讲看不见。另外,此方中的大黄,对肠蠕动的促进作用有现代药理学研究背书,芒硝作为西药也有片剂在售可用于便秘,其作用均与通便有关。因此,这种中药方剂的作用,根本不需要用双盲实验去排除什么安慰剂效应。

  2、中药成方制剂:可以做,但说明的问题有局限

  如果非要做随机对照试验的话,中药成方制剂应该算是最好操作的了。由于剂型和组方固定,想要设计安慰剂组与中药成方制剂进行实验,理论上是可行而且比较方便的。对于丸散颗粒剂来说,制作出外观类似的安慰剂并不十分困难,只需要选取合适的评价体系和指标,可操作性还是比较大的。

  但是如果选用阳性对照,反倒问题会更麻烦一些。首先,阳性对照选择的原则之前讲过,必须是对研究的适应症疗效最为肯定并最安全的药物,并且原则上须与受试药的药理作用类似,剂型,给药途径等需尽量保持一致,这一点上首先就很难保证,比如治疗哮喘,西医常用的可能都是气雾剂吸入给药的,中药里几乎没有治疗哮喘吸入给药的方剂,这样剂型和给药途径上就大不相同,那就只好妥协一下,暂且忽略这个问题。另外一个问题是,中医的“证”和西医里的“症状”并不是相同的概念,随机对照试验中,总要选取一定的指标予以评价,这样就涉及到评价体系不同所导致的问题,或者直接无法评价。简单的例子而言中医里讲“梅核气”,是咽喉的异物感如梅核阻塞,咳不出咽不下,但是现代医学的检查往往找不到什么器质性病变,或者仅仅见到类似于慢性咽炎的表征,如果直接按照慢性咽炎的评价标准去评价中医对梅核气的治疗,在评价指标的选择上,就有体系不适用的问题,因为有的患者可能治疗过后,咽炎症状还在,阻塞感消失,或者咽炎症状缓解,阻塞感还在,那么到底这种治疗算是有效,还是无效,再加上阻塞感又是个主观性很强难以量化的指标,也就使临床研究在数据收集和分析方面遭遇困难。

  3、临床最常用的中药汤剂:问题最多,经常做不了

  前几天匿名中医黑挂我说我批判随机对照试验,我说我没有批判这个试验,而是说它不是放之四海而皆准,有应用的局限,举的就是中药汤剂的例子。

  a)由于汤剂自身特点,破坏盲法,无法操作

  临床试验的知情同意规则要求参与临床试验的受试对象必须清楚地知道自己将要接受什么样的治疗。换句话说,针对中药汤剂的随机对照试验,作为一个参与者,其自身是清楚自己将要接受的治疗方式有可能是服用中药汤剂(另一种可能是在对照组,属于有限选项范围内的未知),并且根据原则,中药汤剂的组方,至少是基本组方(因为涉及到临证加减),也应该是告知患者的,这是前提。

  那么,如果要设计阴性对照,即安慰剂组,排除中药汤剂的安慰剂效应,那么安慰剂组的患者就将服下一个不是中药汤剂的没有药理作用的东西,而又得保证患者不知道自己服下的是安慰剂。

  对于中药汤剂来说,这真是个艰巨的任务,因为中药里很多药材,其特殊的气味,是难以被复制和掩盖的,比如薄荷,香气扑鼻,患者只要端起药碗,就知道自己喝的是薄荷。

  有人说,那就用香精和色素去模拟安慰剂组假药汤的性状。

  气味分子的特殊气味很难被模拟和复制,你想模拟薄荷的气味,不好意思,你得加薄荷醇之类的薄荷提取物,绿箭口香糖里的薄荷味就是薄荷提取物,要知道那可是薄荷的有效成分啊,安慰剂里怎么可以加入待测药物含有的有效成分。

  虽然理论上讲,如果待检测的药物效果与薄荷无关,安慰剂里就可以随便加薄荷醇之类的东西。但是,你怎么知道待检测的药物效果与薄荷无关,你们中医黑自己说的,中药机制不明,既然不明,那就是有可能,否则你先证明它一定无关。

  除了薄荷,藿香沉香当归川芎丁香细辛小茴香,这样有特殊气味的药材,要多少列出多少,而且很常用。

  那就用矫味剂,你以为你说出个矫味剂,就能解决实际问题了?真是书呆子之见。黄连水煎剂的苦味独步天下,你靠什么矫味剂能掩盖,而且服用完之后还会把舌头染成特殊的黄色,连漱口的水吐出来都是橙黄色。

  那就处理汤剂吧,浓缩了,装胶囊。

  不好意思,那叫改变剂型。

  逼急了,某匿名用户说,最极端的情况是使用封装容器和吸管,捏着鼻子喝药。

  且不说人家患者签知情同意的时候,同意不同意你每次都捏着鼻子喝稀里糊涂的东西,就算喝了,你不怕人家患者喝饱了打嗝反出一股薄荷味?你上顿吃了臭豆腐,放出的屁都能提醒你确实吃过。你觉得这点伎俩就能保证盲法,不知道自欺欺人的成分有多大。

  还有,讲捏鼻子就吃东西就淡然无味的,不知道你们听说过一种叫土鳖虫的中药没有,说实话那玩意煮出来的汤跟翔味没多大区别,你靠捏鼻子,能挡得住这酸爽?

  要不你直播捏鼻子吃翔?

  省省吧,我都不忍心。

  还有大黄,大黄组成的方剂也不少,在方剂里,大黄清阳明实热,功效就是泻下,说白了就是吃了就拉稀,这是它的药理作用,这个时候治疗疾病需要病人拉稀排出体内的毒物,这不是什么副作用。

  就算你模拟的了大黄的气味和口感,让病人不知道自己吃下去的汤剂里含有大黄,但是你挡不住治疗组病人吃了就跑厕所啊。

  病人喝了不明物质,虽然当时不知道自己吃的是什么,但是上厕所拉稀的频率增加了好几倍,还能明白不过味?

  这一切都是问题,从药的性状和药效,稍微懂点中药的人,就能轻易破坏盲法。

  当然,除了阴性对照,也可以选择阳性对照。没错,又陷入了评价体系不一的死胡同,你拿什么当阳性,选什么做评价指标。用西药?剂型和给药途径不一,评价标准难选,怎么选,选哪个,都是问题。选中药?不对啊,中医黑自己说中药都没验证过,怎么能做阳性药。

  某匿名用户此时说,凡直接作为药物效果的活性物质均作为计量指标作为被测定指标,所以可以拿薄荷醇做阳性。

  去你的吧,指南里以偏概全的选取指标方式有多少代表性和依据,在这儿倒被奉为经典了,试问,薄荷醇能代表薄荷?做梦吧,薄荷醇是能疏散风热,还是能清利头目,还是利咽,还是透疹,还是疏肝解郁,话说指南还规定做阳性的机制要清楚,这些机制请证明给我看。

  薄荷里有多少种化学物质,又有多少种具有药理学作用,人类都还没研究透彻吧。

  b)中医临床方剂组方多样,难以控制变量进行统计学分析

  临床上,中医师开方会根据病人的情况进行加减,无论是药味,还是用药的剂量,都会进行调整,一人一方,千人千方,实际上是难以进行统计学分析的,因为没有一个人的治疗手段是完全相同的。

  好了,有人说,复方经过加减之后,就不属于原方了吗,把变量纳入统计不就得了。

  暂且不提变量是怎么纳入统计的,说实话一个药物的加减,就涉及到一系列物质基础的改变。

  这些全都不管,还有阴性对照或者阳性对照怎么设置的问题。

  这些也全都不管,变量纳入统计,理论上好像是说得通的,实际上呢?

  我暂且不提中医在组方的过程中变量能够多到如何程度,这个变量的维度又能大到何种程度,就单说一个原方和加减的变量,比如咳喘,西医看来都是一样的,咳嗽,呼吸急促等等,但是中医认为,肺热可以咳喘,肺虚也可以咳喘,甚至肾虚也可以咳喘,别说复方加减了,基础方都可以完全不同,有的清热,有的补虚,有的祛邪,有的固本,同样是咳喘,别说在原方基础上的加减了,药味可以完全不同,怎么比较。

  有人又说,那就再细化,分门别类,一定要把原方一样只进行加减的,放到一起评价。

  好吧,还是暂且不提阴性对照或者阳性对照怎么设置,这里边有太多的问题。

  理论上确实又说得通,实际上呢,可操作性又有多大?

  来看看六味地黄丸的组方吧,肝肾阴虚的经典方剂。

  遇到阴虚火旺的,会加知母和黄柏,不好意思,知柏地黄丸诞生了。

  遇到肺肾阴虚的,会加麦冬五味子,不好意思,麦味地黄丸诞生了。

  遇到肝肾阴虚的,会加枸杞和菊花,不好意思,杞菊地黄丸诞生了。

  遇到肝肾两亏的,会加当归和白芍,不好意思,归芍地黄丸诞生了。

  遇到肾阳不足的,会加肉桂和附子,不好意思,桂附地黄丸诞生了。

  遇到目涩畏光的,会加一堆东西往目疾上走,不好意思,还有个东西叫明目地黄丸。

  每一种,都是一个成药,又是一个母方,原方的变种又是原方,小的原方的基础上又可以加减,按理说,都应该分门别类,分别评价。

  那就无限再细分?

  又是理论上可行,动动嘴皮子而已,让你去做你也不去,说实话,你做搞死你。

  那就往糙了整,都合在一起,评价出“地黄丸”这个东西有效或者没效,这个结论有统计学意义,但是在临床上有意义吗,人家临床管你那么多做什么,我该组方组方,该用药用药,还是分门别类的用,这种没意义的验证试验,做出来又有何用。

  那就往细了整,每一个都分门别类,变量何其多也,分门别类有所穷尽,而变量无穷尽也,变量越多越不严谨,如此不严谨的情况下,你评价出来没效就是没效?

  到最后的结果就是进退失据。

  试问,一个“金标准”,在其不适用的,有无数问题的领域内,还能称作金标准吗?

  中医黑们天天叫嚣没做双盲就是安慰剂,殊不知耍耍嘴皮子可以,操作性的层面上有那么多的问题,有的无需做,有的根本做不了,听说了个高端词汇就可以黑了,到处嚷嚷着,你们去做啊,双盲是金标准,你们不做就排除不了安慰剂效应,如同自己胜利了一般。

  在理论层面打打滚而已,理论理解不理解都不知道,从来都在云端飘着,从来都没有脚踏实地过。

  四、正确态度

  首先要明确,“未证明有效性”不代表“一定无效”,“未排除安慰剂效应”不代表“一定是安慰剂效应”。

  其次,你可以因其机制不明,而将其束之高阁,不去使用,没问题,尊重你的选择。

  再者,也可以不管他到底怎么起效,就算是通过安慰剂效应,只要有看得到的效果就去使用,趋利避害,这种选择也没有错。

  中医药的有效性怎么验证,在我看来,能做随机试验的,我支持,但是这个能做只停留在理论上,任何一个临床应用的方剂,几乎都能从可操作性上提出难以解决的问题。不能做,做不下去的情况很多,如果在可操作性都不具备的情况下强行做,那随机对照试验必定沦为统计学的游戏。

  那怎么办,我想那就做机制,看疗效,毕竟双盲不是证明有效性的唯一标准,效果有或者没有,实事求是,具体问题具体分析,不持绝对化的观点,趋利避害,取其精华去其糟粕。

  只是别拿着鸡毛当令箭,别拿着理论当实际,别用屁股决定脑袋,别中了“百无一用是书生”的魔咒,客观理性认识一切问题而已。

  相关回答戳这里:

  于猫:从机制不明的白菜说起

  于猫:我的中医相关系列回答-收藏夹

上一篇:经典整形对比照>>>腭裂修复前后对比图>>>成年人兔唇修复术后半年效果图片震惊小
下一篇:饲养的已婚妇女(2020)