百科问答小站 logo
百科问答小站 font logo



「过不了双盲实验就一定是骗人的」这种说法对不对? 第1页

  

user avatar   dai-yu-xiao-72 网友的相关建议: 
      

首先,我们还是要理解一下到底什么是双盲测试,以及双盲测试的意义。

双盲中的一个“盲”指的是不让参与实验的受试者知道被评估样品的身份/型号。

双盲中的另一个“盲”是指不让控制实验的研究人员知道被评估样品的身份/型号。

盲听仅仅是让你不知道你正在听的是什么,并没有改变你听声音本身的事实。目的是排除一切非听觉因素的潜在干扰。例如价格、外观、品牌信仰、营销故事、坊间传说等等,以及这些因素进而可能导致的安慰剂效应、买家的懊悔、认知偏差。

更合理的做法是在测试小组中引入未知随机产品。因为有时如果事先知道被测产品包括哪些,那么即便过程是盲听,也可能会试图猜测正在听的产品型号。随机插入未知产品和加入随机分组会避免这种情况的发生。

除了常见的ABX双盲听、AB盲听,还有多产品交叉对比盲听以及AA测试等等。

所谓AA测试,是指前后给听音者一模一样的的声源,如果他还能听出一耳朵区别,说明可能所谓的区别不是听出来的而是想象出来的。


盲听到底有多翻车?

我进行过一些真正意义上的音箱盲评,产品中加杂着未知型号。全程由程序控制随机切换。对于其中的一次实验,印象比较深刻。4个音箱中有两款音箱在盲听中打成了平手。然而其中是一个行业内公认的最顶级品牌的产品,另一个则是行业内评价一般的二线品牌产品。评估的还是像线阵列这样绝对专业领域的音箱。所以即便是专业领域,有时所谓的“口碑”和“公认”也未必是事实。

我也进行过一些耳机的盲听测试,采用虚拟耳机,以防止耳罩触感导致听音者识别出正在听的耳机型号。

我可以保证我所参与的盲听测试都是真正意义上的盲听。然而,据我所知,有些公司有些部门按照公司高层的要求需要产品上市前进行盲听,并在盲听中新产品要击败市面上的竞争对手。但是在实际操作时,摆放音箱且负责播放音乐的人,会预先计好顺序并通过短信发送给参加盲听测试的人。这就不是盲听,这就是作弊。

因为该音箱的设计师以及部门主管没有把握在盲听中胜出竞品,实际上迫于成本压力,他们的产品就是不如某个竞争对手的。而如果盲听测试不过,意味着项目进度受影响,甚至可能影响年终绩效考核和年终奖发放。所以舞弊。

专业音频领域和国际大公司尚且如此。更不要说所谓的音响耳机销售、kol测评媒体、发烧大湿以及一些所谓的“资深发烧玩家”。

正如组织和进行过数十年盲听测试的Floyd Toole博士所言:“多年来,在几家知名音频杂志和网络杂志上,我一直在关注主观评价的内容,我惊讶的发现,人们对任何在理性的主观(盲听)或客观测试中都会被归类为严重缺陷的产品,给予了如此多的赞扬。

例如发烧圈经常所谓的“一分钱一分货”。然而在盲听中,耳机的价格与音质仅有微弱关系,一些高价耳机可能还不如一些几百元或者千元的耳机。

音箱也有类似的实验。一些售价十万左右的静电音箱,盲听表现不如一些几千块的落地音箱。

进而是关于类似于功放、耳放、线材、播放器、DAC等电子相关设备的盲听。

ABX双盲听也很容易证实例如发烧线材、高解析度、天价CD机、部分发烧功放、耳放、播放器等音频产品到底有没有所谓的“一耳朵区别”。

我过去做过许多相关内容,也做过主观评价概念讲解、听力测试和听力训练的示范。

然而,大湿们总说数据没用理论没用,要听。可是一到盲听时,到听力测试时,大湿们又是支支吾吾,顾左右而言他,转移话题。甚至干脆造谣人身攻击破口大骂。

盲听的威力是巨大的,因为它不讲情面,它能让假大湿原形毕露,能让一些误入歧途的人认清自己所追求的一些东西是无意义的。但盲听也是真正公平的,能够让真正做出好产品对行业有贡献的人得到尊重。

可以说双盲的人只能代表他自己,代表不了全世界所有人。但如果有些人自己连双盲都不做,却一直声称他天赋异禀能够听出某些玄学器材的区别,那多半确实就是个骗子。


user avatar   yan-ling-66 网友的相关建议: 
      

又看到一群XX民科出来了。

这个词汇源自医学领域,通常,它还要与‘对照’,‘随机’搭配使用,以排除被试个体差异,更为忠实地展现被测事物的自然属性。

作为RCT的辅助原则,它已成为循证医学在效果鉴定方面的基本要素。

它就是现代医学临床试验设计中的‘盲法’原则之一,另有单盲,三盲,都是RCT的辅助手段。

因为盲法原则的基本要点是盲在了病人不知自己接受的是真药,还是安慰剂上。一个标准的现代医学临床试验设计,一定可以做到单盲、双盲、三盲的某种程度。

而建立‘有效’的立论,可以有多种方式,但要真的‘成立’,就必须有通用性:即可以在多种考查方案里得到同样‘有效’的结果。

如果某个‘有效’,不能在盲法原则里复现,那么这个立论,必然不成立。

回到题主所说,只要有双盲方案存在,即试验人和被试都处于‘盲’的状态,那么要想立论成立,就必须能闯过,否则,就是扯淡。

任何声称可被人类感知其物理、化学等自然属性差异的事物,在盲法原则前敢有一丝怯场的,都可一刀砍成玄学,绝不冤枉。

**************************

某一事物的自然特征若存在,必不因人的主观意志而转移——这是一切自然科学试验的基本原理。

如果某个理论对某一事物的‘自然特征立存在之结论,那么就能换一种描述方式:


这种‘自然特征’的存在,是不会因人的主观意志而转移的。


也就是说,双盲验证法本质上是原命题的变种描述,这也是现代医学以它作为鉴定效果,作真伪判定的理论依据。


一些在自然科学方面毫无基本素养的▇▇,自信心满满地对科学验证试验的基本原理指点江山,张口,就要覆复自然科学的理论验证体系。


跨行充胖子:






***************************

又来一个▇▇的:

循证医学给证据可信度分级的基本点就是可重复性,效果的通用性。

在盲法比如双盲可行的情况下,如果某个声称有效果的立论,过不了双盲,就必须做出立论不成立的结论。

如果某理论在双盲可行下过不了双盲,唯一‘有用’的地方在于:这是个伪论,大家不必再信了。

连现代医学里基本的效果鉴定方式都搞不懂的:


这种人一张,你就能知道他是什么来路:




有人这样谈药效,你给他纠正之后,他分分钟给你造新词儿:

他说他说的有效,不是你说的有效,也不是国际药检通认的有效,而是他自己的有效。


他说对照组有问题,你问他对照组该怎样设计,他说你去查相关国家规定。




甚至,连对基本药检原理,国际通行药检程序都一无所知的文科生博士,也出来指点江山了:


user avatar   li-xiang-1-48 网友的相关建议: 
      

医学统计方法假设人和人有共性,但是很多情况下这种假设是无效的,必须考虑个体差异。统计可以告诉你人跑百米跑不到十秒以内,因为样本里出现一个苏炳添的概率很小嘛。统计也可以告诉你一种实际有效的药是无效的,例如假如某种药可以让一类人病情改善另一类人病情加重,而数据分析者没有挖掘到这种信息只是算了一个平均数。当然,这种情况下,换一种数据处理方式就可以得到正确的结论。但是,有时正确的数据处理方式无法从数据上明显看出来。对任何情况都成立的数据处理方式并不存在。

结论:一种药过不了双盲测试,除了可能无效以外,还可能是实验设计不当,个体差异过大,数据处理方式不当等等。




  

相关话题

  能否在不破坏物体表面的前提下把物体中心掏一个洞? 
  既然已经足够自信,还有没有必要寻求他人的认同? 
  儿子问我说:“如果我解决了湍流问题,学校会给我颁发青少年科学进步奖吗?”,我该怎么回答? 
  传染病是人类的宿命吗?有没有开挂的科技,帮我们避免下一次的新冠? 
  为什么月亮又圆又大的晚上,星星特别少? 
  计算机世界里有哪些经典谣言? 
  异地恋最重要是什么? 
  给人类历史上最伟大的科学家排名,排序将会如何? 
  有没有一些有意思的悖论,没意思也行,但要是悖论? 
  为什么人拎着很重的东西站着不动还会觉得很累?事实上几乎没有做任何功? 

前一个讨论
为什么有的hifi烧友满口科学,abx测试,自己没有所谓测量优秀的产品却说拥有这些产品的烧友是老烧?
下一个讨论
玩摩托车可能要花多少钱?





© 2024-11-21 - tinynew.org. All Rights Reserved.
© 2024-11-21 - tinynew.org. 保留所有权利