这里我要反对一下仲达 @司马懿 。
这是对随机对照试验的滥用,不合理,不合时宜,不应该。
1、有违伦理。在疫情爆发的高峰期让多达三千人在公共场合暴露,对参与者不公平,也是将全社会置于危险中。首先你都不知道三千人里面已经有多少感染者,感染者需要戴口罩这点争议并不大。此外,设想一下,如果口罩确实有显著效果,那来这三千人中可能有额外的几百人都会被感染,他们不戴口罩活动至少一个月,会带来多少的再次传播,参加者中还会额外多出一些死亡人数,甚至这些多出来的传染者就成为疫情控制和失控的转折点。这个研究在中国申请伦理几乎肯定无法通过。
2、这个研究的假设存在问题。只考虑了口罩对本人是否有保护作用,不能测量口罩对公众的保护。最多只能跟踪到这6000人的结局,6000人一个月内接触的人可能总数超过几十万,不知道这里面会有多少人是被这些受试者传染的。这依然是对口罩作用的一种偏见。实际上我们当我们说口罩有用的时候,说的是双向保护。
3、不是所有的事情都需要随机对照试验才可以证明。例如如果一个干预措施的效应足够大,根本不需要随机对照试验来说明问题,青霉素用于伤口感染没有经过随机对照试验的验证,因为观察发现用了青霉素后死亡率降低了几十倍,立竿见影,这么巨大的效应根本不能用任何偏倚来解释,只能叫有效。
4、并不是你有随机对照试验你就牛,就管用。设计/执行得很垃圾的随机对照试验不仅没用,得出的错误结论还有害。好的随机对照试验要求明确入组时的基线情况,还要尽可能控制变量。几千人如何确定基线,每个都做核酸+抗体+CT?我估计他们也就筛查下症状。控制变量更无从谈起。还有例如霍桑效应,当一个人知道自己是不能戴口罩的对照组的时候,他的行为会产生怎样的变化?其出门的频率,社交距离,洗手习惯,会有怎样的影响?这些行为改变会不会抵消口罩的保护作用导致研究得不出阳性结论?这里面太多不能考察的因素。
5、好的观察性研究也可以具备很强的效力。上面已经说过效应量的影响,假如观察性研究证明了戴口罩能降低数倍的感染风险,那根本不需要随机对照试验。湖北之前3000多医护感染新冠,援湖北的4万多医护无一感染,这么大的差异还需要RCT来验证医护全身防护的有效性吗?另外,假如我们能收集到足够多的数据,证明戴口罩的比例越高的人群,其感染率越低,呈现明显的剂量-效应关系,而且不能用其他的相关性来解释,这就是很强的证据。
6、我们并不需要1个月的观察期,其实只需要观察记录到感染者与被感染者接触的那个场景即可。流行病学调查的个案追踪,配合信息技术,就能做到。比如此前一个案例,一位患者乘大巴车,同车7人随后几天发病。车上戴口罩的乘客感染人数,不带口罩乘客的感染人数,是很关键的数据,可以配合车内摄像头来回顾。输入病例就是很好的观察对象,发现一名外来感染者后,通过大数据回溯他的接触者,配合摄像头等还原其接触场景是否戴了口罩,谁被感染谁没被感染。涵盖的人群足够多的时候,也可以提供很好的说服力。
7、证据质量只是告诉你我们对结论有多大信心,更关键的问题是利弊权衡。哪个选择的代价更大?哪怕获益不多?
丹麦这个口罩临床研究也不具备很高的优先级。人就那么多,参加一项临床试验往往就不能参加其他的,以免引入混杂因素。研究资源也不是闲的。目前疫苗试验不紧迫吗?药物试验不紧迫吗?不用搞流行病学调查吗?这件事情只能说明丹麦还处于疫情早期,资源尚丰富,还没体会到什么是真正的痛。
实验流程不严谨。
既然你要测试戴口罩能不能防治新冠病毒,前提是要有新冠病毒。
所以,建议在实验开始的同时,从医院里随机放出几十个新冠患者。然后让他们随机混进这群人里,最后再测一测统计数据,这样才更有说服力。
当然,统计人员在公布数字的时候,最好是找个地堡,再带把枪……
这个实验还是非常有意义的。如果坚信口罩有用,有用到不需要实验证明,本文中的重点都用黑字标出来了,请忽略第一行黑字,看第二行黑字就可以了。
口罩被认为的作用有两个:1.防止别人的飞沫被自己呼吸到;2.防止自己的飞沫被别人呼吸到。然而自从新冠爆发以来,我读了很多医学期刊上关于「非专业人群普遍戴口罩是否能够有效防止呼吸道疾病的病毒传播」的文章,关于这两点的研究就非常少,而有效的证据几乎没有。而少的原因,相当大的一部分恰恰就是在于没有机构去做这样的实验。
首先,观察性的数据,是不能提供口罩是否有效的有力证据的。比如说,我们观察一部分经常戴口罩的人,和一部分经常不戴口罩的人之间的感染率的差异,发现不戴口罩的人感染的多,这其实不能代表什么。因为「主动戴口罩」的人和「不主动戴口罩」的人可能对自己健康的关注本来就不一样,从而两类人会采取不同的行为模式,所以我们观察到的感染率的结果,可能是两类人行为模式差异造成的,而非口罩造成的。
再比如两个政府,一个强烈推荐民众要求戴口罩,一个不推荐,那么强烈推荐这个动作本身可能就会改变人们心目中疫病的严重程度,从而改变人们的行为模式[1],从而导致更少的感染。依然很难把口罩的作用从这些心理的、行为的模式中分离出来。
在呼吸道疾病爆发期间,民众被要求戴上口罩前后疫病的控制情况,同样也不能作为证据。因为极少有政府单独采用「口罩」控制,同时会有很多的措施出台。所以口罩是否有作用,在时间的先后顺序的比较也不能作为有效的证据。
有两篇文章是随机控制实验,来比较的医护人员用外科口罩和N95口罩之间的区别,因为医护人员都受到过专业训练,这个倒是消除了样本偏差,结果当然是N95的参数在各方面显著占优[2][3],不过在低强度的接触下和外科口罩的保护作用相比无显著不同。N95的参数占优确实倒也不意外,在心理不抵触,并且能够正确使用口罩的前提下,N95和外科口罩之间的差异,还是显示了市场是有效的——毕竟贵那么多呢。读了这些口罩的文献,我的感觉就是:贵还是有道理的,在低强度的测试下,外科口罩和N95可以认为是差不多有效;但是在高强度的测试下,N95一枝独秀[4]。所以在主观上愿意并且有条件的情况下,可以优先选择N95。
在一般民众的角度来看,也就是缺乏专业知识,也没有净室条件的情况下,大规模戴口罩到底有什么作用,目前没有任何高质量的证据。在2013年有一篇文章,用agent-based 模型模拟了各种非医学防疫手段——洗手+口罩对疫病传播的影响[5],结论是单独的口罩效果不显著,但是加上洗手组合起来就有效了——这个可以作为一个有趣的方向,但是因为根本都不是实验,而是通过社交网络来进行的数据模拟,所以其实只能说提供了一种可能,甚至于都谈不上是证据。
补充两篇口罩对流感预防的文章[6][7],这方面的RCT的结论一般是,单独口罩不确定,但是加上洗手效果就显著了。给定这样的实验结果,口罩在大众层面上是更多的起到一个对心理和行为模式的干预,加强了其他措施的效果(封城、隔离等等),还是说真的实质性防护,其实很难说。
要证明因果性,还是要精心设计的随机控制实验(well-designed RCT)是王道。这也会给全世界的疾病控制中心提供优秀的证据,不仅仅针对新冠,也是针对未来的疫病。
就丹麦这个实验,设计起来还是有点难度的。如果就是随机的分发口罩,让志愿者戴上,那依然不算是「高质量证据」,因为尽管随机分发排除了个体自选择的影响,但是人们戴上口罩之后可能会产生一些虚假的安全感,从而改变了行为模式(让本来有效的口罩变得无效了),也可能戴上口罩之后引起周围人的警觉,自觉的和他们保持距离(本来无效的口罩变得有效了),所以可能需要设计一些「假」的口罩,也就是看上去是口罩,志愿者和周围的人都会认为是口罩,但是基本不过滤任何的微粒,没有任何实质性的防护。通过这个外生而随机的「口罩防护水平」的工具变量,来减轻行为模式的影响。还可以设计一些单向的口罩,看看口罩如果有效的话,到底是1的作用更大,还是2的作用更大。
从伦理上说,我觉得这个实验还是有可能通过伦理审查的。如上所述,目前没有高质量的证据表明大规模的普通人群戴口罩是有效的——或者说甚至于口罩在疫病流行的不同阶段可能具有不同的效果是什么也不知道——在初期,密度很低的时候无所谓,但是在密度较高的时候有效等等。所以在这种情况下,口罩是可以被看做一个无害的对照组「harmless treatment」——也就是说不戴口罩并不会被认定为对志愿者有损害——毕竟考虑到欧洲大部分国家的情况,如果不做这个实验的话,基本上他们也不会戴。
我们当年上循证医学的时候,老师就问,是不是所有临床上的手段都需要循证医学依据?
答案当然不是。
当时举的例子就是危重病人的吸氧,这就没什么循证依据。
因为吸氧的危害几乎为零,操作方便,而很多疾病都可以从中获益,代价小收益大,去做临床研究纯属无聊。
反之,如果危重病人连吸氧都没有,那么意味着医疗条件极其匮乏,需要做的事情是尽快转运到医疗条件比较好的地方,而不是搞什么随机双盲试验。
口罩对呼吸道疾病的原理一样。代价极小、肯定有防护作用、多数人都能获益。如果口罩这种基础物品都缺乏,那意味着医疗物资已经极其匮乏,需要做的是尽快补充物资,而不是搞什么随机双盲。
而且,就临床实验的角度,对照组应该戴无效的口罩。有效的口罩和无效口罩外观一样,随机发放。而不是不戴口罩....
哎,真是活久见。
为了推卸责任,已经不要脸了....
====补充====
白天空闲时候吐槽了几句,没想到这么多关注....
然而我还是太年轻,没想到他们的下限有多低...
3000对3000的实验设计,看起来是大样本了.......
回家算了一下才发现我被忽悠了.......
目前丹麦感染率分之一左右(事实上这已经是很高的感染率了)。
我们假设人群感染率为1/1000,而口罩的作用可以降低1/3的感染率(能降低1/3是很强的作用了,我感觉口罩是达不到这个水平的)。
那么实验终点,非口罩组和口罩组预期感染人数分别是3例和2例,根本就不可能有差异....
即使预期的感染率扩大5倍,也就是感染率达到5/1000(基本相当于武汉的感染率了),那么非口罩组预期感染人数15例,口罩组为10例,算了一下,p=0.42...根本没有显著差异....
感染率达到2%的水平,那么非口罩组为60例,口罩组为40例感染......这时候勉强接近统计学显著水平...
2%感染率什么概念......也就是丹麦这个500多万人国家要有10万例以上的感染....这才有可能看到统计学差异...这还是建立在口罩能够减少1/3感染患者的前提下....(当然,他们一个月内增加到2%的总感染率也不是不可能....真到那一步口罩也不重要了,如何处理尸体比较重要)
我不相信他们设计这个试验没算过样本容量...
他们可能就是想要一个“大样本临床试验”证明戴口罩与不戴口罩 “无显著性差异”。
还是他们自己人了解自己:
世界上有三种谎言:谎言、该死的谎言、统计数字(There are three kinds of lies: lies,damned lies,and statistics)
====2020年底更新====
突然发现他们的文章居然发表了,而且不幸被我言中了.....
我觉得2%感染率太夸张....然而他们真的实现了(600万不到的人口,15万感染....)
当然,如我所估计,口罩对传染的减少作用达不到30%以上。所以他们的结果是42例对53例感染,不出意外没达到统计学的显著水平......
这个研究原本可以被某些人拿去说戴口罩没用了......
如果疫情真的在夏天结束了,肯定各种阴阳人会引用这个研究吧...
然而,他们设计实验时,恐怕也没想到疫情会这么惨烈吧.....
所以这个研究的结果,已经没什么人关注了。
毕竟,在惨烈的现实面前,统计数字也不能忽悠人了。
当然,既然不能甩锅给中国,就甩锅给水貂呗....这时候就不谈什么绿色环保、动物保护主义了..
关键杀完之后居然直接掩埋....我也是服...
如何处理尸体,确实是个重要问题....
=======
其余是给丹麦人民一个台阶下,当你的街上碰到一个戴口罩的白人。 还没等你开口,他就会说我是测试志愿者,在测试有不有效。
这他X叫人体实验!另外一半感染了,死亡了!甚至传染给其他人!如何处理?新冠本身严防死守都控制不住。在这其中搞非控制!无治愈能力实验!脑瘫么?
731当年也不敢这么干!
这比群体免疫更丧心病狂!
现在突然觉得白左,女权,各种保护邪会都很可爱。
果然是个比烂的世界。
你写个在某一疾病并没有治愈能力时候,而且具备大规模传染能力,让六千人做实验对照组,去证明某个手段能消除感染几率多少的剧本。信不信投资人能把你踢出去?
原来我认为中国崛起是一段荆棘之路,有各种各样的困难,现在看我们能躺赢!
卖火柴的小女孩死在丹麦确实不是没有原因的。
真金不怕火炼。随便试。
东亚怪物房两个月前已经肉测过了,你们不信罢了。
非得撞了南墙头破血流还要赞一声,我的骨头真硬,我的态度真科学。
我能怎么看
没有疼痛,就没有清醒。
西方一直以为自己牛逼哄哄,但现实是,没有装备代差的情况下,把你们放到东亚都是战五渣。
“我们现在要搞一个研究,试图证明人完全没有性生活,也能很快乐。”
“哦,你这研究对我而言没啥意义,只是对你才有意义。”
“为什么对你没意义,对我却有意义?”
“因为我有规律的性生活,而你就算想有,也并没有。”
“哎你这不科学啊...你要想,说不定性生活还有坏处呢,你看,可能的坏处有blabla...嗯?人呢?”
(吸溜吸溜...扑哧扑哧...咕叽咕叽...)
挺好。
牺牲自己造福人类,伟大。
doge.jpg