关键字: 假设检验, 双盲实验, 单盲实验, 空白对照, 盲听大赛,莎士比亚,猴子,聪明汉斯,观察者期望效应,受试者期望效应,心理暗示,猴子和打字机
盲听大赛不是发现了金耳朵么?--麦文学哭笑不得系列
昨天还一耳朵听出线材区别, 戴了眼罩以后突然特异功能丧失, 能不号啕大哭, 肝肠寸断么?
无限猴子定理的表述如下:让一只猴子在打字机上随机地按键,当按键时间达到无穷时,几乎必然能够打出任何给定的文字,比如莎士比亚的全套著作。
在这里,几乎必然是一个有特定含义的数学术语,“猴子”也不是一只真正意义上的猴子,它被用来比喻成一个可以产生无限随机字母序列的抽象设备。这个理论说明把一个很大但有限的数看成无限的推论是错误的。猴子精确地通过键盘敲打出一部完整的作品比如说莎士比亚的哈姆雷特,在宇宙的生命周期中发生的概率也是极其低的,但并不是零。
"从严格的专业角度来要求,参与评测的人员应进行听力检查,在125--8000HZ的频率范围内,听阀级应低于20dBHL(参见国标GB4854--1984)。听评人员双耳听力应该基本一致,具有准确判断声像位置的能力,参与人员应该有高保真及临场听音的经验,对音乐要有一定的理解,要熟悉各种声音的特性,人数以7人到11人单数为好,男女基本各半,年龄控制在18-60岁之间。"
摘自:
问:
那些盲听大赛不是发现了金耳朵么?
答:
把实验数据里面不符合自己预期的剔除, 只采用自己喜欢的数据, 说得通俗一些叫摘樱桃 (Cherry Picking), 说的文雅一点就是掩耳盗铃。这种低水平的学术造假只要小学程度的教育水平都能看穿。
问:
那些被发现的金耳朵真的那么神?
答:
让一只猴子在打字机上随机地按键,当按键次数达到无穷时,几乎必然能够打出任何给定的文字,比如莎士比亚的全套著作。
你觉得猴子突然进化了么。 正如彩票都有人中一样, 中彩票的人也都是肉身俗体。这是概率论的解释。
另外还有一个是实验方法的解释。 历史上有名的聪明汉斯是一匹懂得算术和做出各式各样惊奇技能的马,而事实上聪明汉斯不是真的懂得算术,而是靠训练员和观察者无意识下给予的暗示(例如:表情、姿势)得出正确答案。
同样,被发现的金耳朵和汉斯可能处于同样的情况。 至于被发现的金耳朵有无与主办方串通那其实不重要, 因为目前看到的实验方法是漏洞百出而且没有统计学意义。
问:
照你这么说,那些盲听大赛是在造假么?
答:
没有空白对照没有统计学意义的盲听大赛只能认为是群众娱乐,
虽然不能直斥为造假, 但你可以联想一下耍魔术。
问:
难道那些盲听大赛没有意义?
答:
实际上您可以认为这是我国发烧友重新发现了聪明汉斯。
发现金耳朵类似于我国近代史上的亩产万斤。
问:
那些盲听大赛把测试者的眼睛蒙起来还不够么?
答:
观察者期望效应是认知偏见的一种。在科学实验中,由于观察者预期某些测试结果,于是无意识地以某种形式操纵了实验步骤,或错误解释实验结果以达至他们希望得到的结论。观察者期望效应能严重歪曲实验结果,因此需利用双盲方式进行实验来消除这效应。很多实验经常是受观察者期望效应影响而出现奇怪结果,尤其在以人类为对象的实验。观察者期望效应最常出现于超自然现象研究。聪明汉斯(Clever Hans)是著名的观察者期望效应例子。聪明汉斯是一匹懂得算术和做出各式各样惊奇技能的马,而事实上聪明汉斯不是真的懂得算术,而是靠训练员和观察者无意识下给予的暗示(例如:表情、姿势)得出正确答案。
在另一实验,实验人员事先告诉一群小孩他们培养了两个实验老鼠品种:一种聪明,一种呆笨,然后安排小孩观察老鼠逃离迷宫。小孩报告聪明品种老鼠比呆笨品种老鼠更快逃离迷宫,而事实上所有实验老鼠只是随机挑选出来而已。
双盲是科学方法的一种,目的是避免研究结果受安慰剂效应或观察者偏向所影响。在各种科学研究领域中,从医学、食品、心理到社会科学及法证都有使用双盲方法进行实验。
单盲(en:Single Blinding)是一种简单实验方法,通过对试验对象保密,避免有意或无意在实验中造成偏颇。例如,在口味测试中,如果消费者事先知道测试的产品,他们通常都会称常用的知名品牌较佳。在单盲测试中,如果产品品牌被蒙住,消费者便可能选择另一产品。
单盲试验中,由于试验对象会与研究人员接触,因而受其影响。例如在心理及社会科学实验中,观察者的主观期望,经常有意或无意影响实验对象的行为。
双盲试验通常在试验对象为人类时使用,目的是避免试验的对象或进行试验的人员的主观偏向影响实验的结果,通常双盲试验得出的结果会更为严谨。
在双盲试验中,受试验的对象及研究人员并不知道哪些对象属于对照组,哪些属于实验组。只有在所有资料都收集及分析过之后,研究人员才会知道实验对象所属组别,即解盲(unblind)。
在药物测试中经常使用双盲测试。病人被随机编入对照组及实验组。对照组被给予安慰剂,而实验组给予真正药物。无论是病人或观察病人的实验人员都不知道谁得到真正的药物,直至研究结束为止。不过部分的试验会较难做成双盲,例如:如果治疗效果非常显著,或治疗的副作用非常明显,实验人员便可能猜想到哪组是对照。
由于警察可能会对证人作出有意或无意的影响,不少在法证中,警察局内的认人手续基本上是一个对证人记忆的单盲测试。由于执法机构现在倾向在认人过程中使用双盲测试,负责认人过程的警员事先不能知道被认的人当中谁是嫌疑犯,以免影响证人。
如果收集资料、分析解释研究结果的统计学家同样不知道哪组资料属于对照组,哪组属于测试组,这种测试被称为三盲测试。
所以说, 为了避免造假,避免研究结果受安慰剂效应或观察者偏向所影响, 至少要双盲实验。
上世纪90年代, 吃太阳神的孩子很多, 而且大部分人也觉得太阳神有奇效。
后来, 还有中华鳖精、脑白金以及冬虫夏草等等被点名的奇药。
当然它们后面也有无数背书的“医学专家”。
原国家食药监总局两次发文: 将冬虫夏草踢出保健品圈子
至于其他的实验, 俺已经写了散文, 大家不妨阅读:
当然还有外部的网站, 帮助您确认更换线材是否会带来一耳朵的改善,
或者立竿见影如胸口碎大石一样的效果:
1. 让我们首先假设实验对象宣称的都是真的;
2. 让我们通过对照实验检验实验对象说的和他实际能做到的有多大的差距。
3. 分析实验结果。
让我们开始下面的实验吧:电源线/信号线/USB线/耳机线.
准备两条同样的实验对象认可的, 高价线材, 线材A1/A2 。
两条被所有人认可的(原厂)平价合格线材 B1/B2。
按照以下的组合乱序抽签测试并记录, 当然要第三方来记录和抽签, 当然要遮挡:
A1-A2,A1-B1, A1-B2, A2-B1, A2-B2,B1-B2, A1-A2,A1-B1, A1-B2, A2-B1, A2-B2, B1-B2,
只要求实验对象决定是否有区别, 就这么简单,只要求实验对象决定是否有区别,不需要评价优劣。
** 为什么只要求决定是否有区别呢? 有的同学要发问了。
** 因为这已经是最低最基本的要求了, 不是么?
一般都同意,在双盲临床试验中,安慰剂对照群组对排除几种试验中可能出现的偏见是重要的。
在这里, 把天价线材按照某种新药 A 来对待, 而 B 则是对照 (机线或者平价线)。
A1 和 A2 形成自身对照,
** 为什么要求自身对照呢? 有的同学要发问了。
** 因为这可以帮助分析结果的时候确定答案的有效性。
B1 和 B2 也形成形成自身对照,
** 为什么要求自身对照呢? 有的同学要发问了。
** 因为这可以帮助分析结果的时候确定答案的有效性。
如果 A 有显效, 那么经过统计学分析必然能体现出来。
当然, 大家也可以加入空白对照 C, 比如 两对铁丝(或者AKG铁头梁): C1, C2.
A1-A2, A1-C1, A1-C2, A2-C1, A2-C2, C1-C2, A1-A2,A1-C1, A1-C2, A2-C1, A2-C2, C1-C2,
** 为什么加入空白对照呢? 有的同学要发问了。
** 因为两对铁丝(或者AKG铁头梁)被认为是100%能被实验对象识别的对象, 如果实验对象连铁丝(或者AKG铁头梁)都识别不了的话。
实验的结果就会更容易解读了。这也可以帮助分析结果的时候确定答案的有效性。
俺读书少, 俺相信只要是文化程度比俺高的同学都会觉得实验才是破解一切谎言的利器。
让金耳朵大师们扬名立万的第一关应该是什么呢?
那就是盲听铁丝和铜丝。
大师们口口声声的区别, 不管一耳朵的区别也好, 一棵树的区别也好, 一条街的区别也好, 一片森林的区别也好, 还是一个地球的区别也好, 让我们相信他。相信他。
好, 咱相信大师你能 100 % 听出铁丝和铜丝。
那么, 盲听的第一关就是 100 次随机盲听铁丝和铜丝,
如果不能达到 99.9% 正确率的, 请直接撞地板一次,咱会帮您拨打 120 。
性子急的读者可能会问, 那第二关呢?
第二关在这里:
老烧见了就躲的耳朵听力测试
https://zhuanlan.zhihu.com/p/3380718
_铁_铜_铁_铁_铁_铁_铜_铜_铜_铜_铜_铁_铜_铜_铁_铁_铁_铁_铁_铜_铜_铜_铁_铜_铁_铜_铜_铜_铁_铜_铜_铜_铜_铁_铜_铜_铜_铁_铁_铁_铜_铁_铁_铁_铜_铁_铁_铜_铜_铜_铜_铜_铁_铁_铜_铜_铁_铁_铁_铁_铁_铁_铜_铁_铁_铁_铜_铁_铜_铜_铁_铁_铁_铁_铜_铁_铁_铁_铁_铜_铜_铜_铁_铁_铜_铜_铜_铁_铜_铜_铜_铁_铜_铁_铜_铜_铁_铜_铜_铜
_铜_铜_铁_铜_铜_铜_铜_铜_铜_铜_铜_铁_铜_铜_铁_铜_铁_铜_铁_铜_铁_铜_铜_铁_铜_铁_铜_铜_铁_铜_铁_铜_铁_铜_铜_铜_铁_铜_铁_铁_铜_铁_铁_铜_铜_铜_铁_铁_铜_铁_铜_铁_铁_铜_铜_铁_铁_铁_铜_铜_铁_铜_铁_铁_铜_铜_铜_铁_铁_铁_铁_铜_铜_铜_铜_铁_铁_铁_铜_铜_铁_铜_铜_铁_铁_铁_铁_铜_铜_铁_铁_铜_铁_铁_铜_铜_铁_铜_铜_铁
_铁_铁_铁_铜_铁_铁_铁_铁_铁_铁_铜_铜_铁_铁_铁_铜_铁_铁_铁_铜_铁_铁_铁_铁_铜_铁_铁_铜_铜_铁_铁_铁_铁_铜_铁_铜_铁_铜_铜_铜_铁_铜_铁_铁_铁_铜_铁_铁_铁_铁_铁_铜_铜_铁_铁_铁_铜_铁_铜_铁_铁_铜_铁_铁_铜_铁_铜_铁_铜_铜_铁_铜_铜_铁_铁_铜_铁_铜_铁_铜_铁_铁_铁_铁_铜_铜_铁_铁_铁_铜_铜_铁_铁_铜_铁_铁_铜_铜_铁_铜
_铁_铁_铁_铁_铁_铁_铁_铜_铁_铜_铁_铁_铁_铜_铜_铁_铁_铜_铁_铜_铜_铁_铜_铜_铜_铁_铁_铁_铁_铁_铁_铜_铜_铜_铜_铜_铁_铁_铜_铁_铁_铁_铁_铜_铜_铁_铜_铜_铁_铁_铜_铜_铁_铁_铜_铁_铁_铜_铁_铜_铜_铜_铁_铁_铁_铁_铁_铜_铜_铁_铜_铁_铁_铜_铜_铜_铜_铜_铁_铁_铁_铁_铁_铜_铜_铁_铜_铁_铜_铜_铁_铜_铁_铜_铜_铜_铜_铜_铜_铜
_铁_铁_铁_铜_铜_铜_铜_铁_铁_铜_铜_铁_铁_铁_铁_铁_铁_铁_铁_铜_铜_铁_铜_铜_铁_铜_铜_铁_铜_铁_铜_铜_铁_铁_铁_铜_铁_铜_铁_铁_铁_铁_铜_铁_铜_铁_铁_铁_铁_铁_铁_铜_铜_铜_铜_铜_铜_铁_铜_铜_铜_铜_铁_铁_铁_铜_铜_铜_铁_铁_铁_铜_铜_铁_铁_铜_铁_铜_铁_铁_铜_铜_铁_铜_铁_铜_铜_铁_铜_铁_铜_铁_铜_铁_铁_铁_铁_铜_铜_铁
有人会说, 哎
我没有那么多时间做100次。
那么 10 次好不好?
铁电源线, 铁USB线, 铁网线, 铁信号线, 这些产品都能买得到。
这些产品绝大部分发烧友的第一印象, 注意是 “印象” , 应该是 “渣”、“衰声”、“垃圾”、 “一耳朵区别”、 “绝对能分辩”、 “100条街的区别” 。。。。。。
好么?
您不妨从几百几千人民币的系统开始做盲听, 小范围, 杀伤力小, 后果轻微的小团体开始测试。然后呢, 撇开你们的 “印象” , 看看 “事实”, 也就是 “实验数据”。
到底多少大师能达到 “一耳朵区别”、 “绝对能分辩”、 “100条街的区别” 。。。。。。
就象一鼻子分辨狗屎和肉夹馍,
智力正常的成年中国男性都能 100 %, “绝对能分辩”、 “100条街的区别”,
一鼻子分辨狗屎和肉夹馍
这样解释您觉得能理解吧。
那么 10 次好不好?
_铜_铁_铁_铁_铜_铜_铁_铜_铜_铁
铜次数5
铁次数5
_铁_铁_铜_铜_铁_铁_铁_铜_铜_铜
铜次数5
铁次数5
_铁_铜_铁_铜_铁_铜_铜_铁_铁_铜
铜次数5
铁次数5
_铜_铜_铁_铁_铁_铜_铁_铁_铜_铜
铜次数5
铁次数5
_铜_铜_铜_铁_铁_铁_铁_铁_铜_铜
铜次数5
铁次数5
_铁_铁_铜_铁_铜_铁_铜_铜_铜_铁
铜次数5
铁次数5
_铁_铁_铜_铁_铁_铁_铜_铜_铜_铜
铜次数5
铁次数5
_铁_铜_铁_铜_铜_铜_铁_铁_铜_铁
铜次数5
铁次数5
_铜_铁_铜_铁_铜_铜_铁_铜_铁_铁
铜次数5
铁次数5
_铜_铁_铁_铁_铜_铁_铜_铁_铜_铜
铜次数5
铁次数5
从这里开始吧。
打印出来, 抓阄。
找张白纸记录。 当然, 找第三方帮你切换。不然没有任何意义。
抓阄嘛, 很公平的哦。
*** 常见问题, 大师每逢盲听必然突发急症, 小到内急小便失禁, 大到血糖低脸色发白或者血压高或者特发性的失聪, 不一而足。
组织这类大赛或者活动必须要事先测定参加者的听力曲线。 可以用 "煲透了" 的耳机例如 HD800S 来做这个事情, 因为每个 HD800S 都有证书, 带曲线的。
软件呢, 这里也有
免费的耳朵测听软件 耳朵“频响“测试软件 the Free Hearing Test App is here
32bit 小巧的粉红噪音发生器软件 KOF PINK NOISE GENERATOR
连医院都不用上了, 打印存档。
名词解释: 特发性的失聪
特发性的失聪: 蒙上眼睛或者视线被阻隔就突然发作的听力障碍。 这种听力障碍在移除眼罩或者阻挡物之后能瞬间康复。 特发性的失聪在音响发烧界的大师身上有极高的发病率。直接诱因就是盲听试验。
通关以后的读者可能会问, 那证书呢? 俺可以很负责任地说, 如果您能够靠耳朵分辨电阻值一样的铜和铁线,您想要什么证书都不是问题, 整个21世纪中华之崛起就包在您身上了。
国务院特殊津贴您觉得咋样?
有的同志对国务院特殊津贴不感冒, 更加愿意拿百万美元的悬赏。
只要您能证明您可以用耳朵分辨出直流阻值相同的两条耳机线 100 次 100% 全对,
比如这样的:
_铁_铁_铁_铜_铜_铜_铜_铁_铁_铜_铜_铁_铁_铁_铁_铁_铁_铁_铁_铜_铜_铁_铜_铜_铁_铜_铜_铁_铜_铁_铜_铜_铁_铁_铁_铜_铁_铜_铁_铁_铁_铁_铜_铁_铜_铁_铁_铁_铁_铁_铁_铜_铜_铜_铜_铜_铜_铁_铜_铜_铜_铜_铁_铁_铁_铜_铜_铜_铁_铁_铁_铜_铜_铁_铁_铜_铁_铜_铁_铁_铜_铜_铁_铜_铁_铜_铜_铁_铜_铁_铜_铁_铜_铁_铁_铁_铁_铜_铜_铁
、
版权声明: 本文内容 COPYLEFT, 不保留版权, 欢迎转载, 不必支付稿酬。转载时请用大家熟悉的“佚名”或者自己的任何网名替换作者名字。
网友转发提问:
"为啥人类对听觉的记忆真的很差。。AB几次以后区别就消失了呢?"
老麦已经在 2018 把观点都重复几百遍了, 因为区别就是“音量”而已。
特别是那些叶公好龙买椟还珠本末倒置隔靴挠痒的实例, 也就是换电源线换信号线换插座换保险丝换SATA线换操作系统以及CDKEY来“调音”的用户。 他们在退货退款期限过去以后惊恐地发现AB几次以后区别就消失了。 血汗钱就这样打了水漂。当然这些钱是可以用来孝敬父母孝敬老婆孝敬孩子甚至捐给失学儿童, 例如老麦,的。
这个问题, Peter Aczel老先生总结得无比精辟了, 俺转贴一下以免/防大家又问。
大湿的逻辑是很奇怪的, 最好笑的是不能自洽。
比如盲听前,“一耳朵区别、一条街的区别、昌平和通州那么大的区别。。”
盲听开始后, “肚子疼、尿急、便秘、太远、天气不好、社交恐惧、忙、血压高等等等等不一而足。。”
盲听一结束, 所有的症状奇迹般地一扫而空,痊愈了!!
网友仍然会追问: “写枪文的那些作者为什么记忆力能有几天甚至几年几十年那么长?”
老麦的总结就是, 他们都和土行孙一样有个特长, 土遁术或者尿遁术。
对于那些要把盲听弄得象魔术表演的主办方。 方法也是有的。那就是里应外合。
俺可以给做庄的朋友透个底, 只要盲听条件定在10盲听 (100%)一次不能错, 您就能稳赚不赔(输的几率不到 1%)。当然这也是有前提的, 参与的各方都不能出千。 香港的赌神赌圣赌侠赌魔片子大家都看多了, 只要出老千那就不会符合小学数学了。
当然对于“盲”, 不需要象某些坛子那样对“盲”望文生义, 蒙住挑战者的眼睛。
对于蒙住挑战者的眼睛这个做法, 其实它很可能只是个障眼法, 因为演员可以通过各种方式接收场外的声光理化暗示(咳嗽、暗号、振动、触碰身体不同部位)来作弊。 就象历史上的聪明汉斯那样。 暗号包括很多您意想不到的编码方式, 比如发令员性别的切换、 语调的切换、 方言的切换甚至语句结构的切换等等。 甚至某种气味的远近变化都能用来实现暗号。这个东西恐怕高考监考过的人员体会更深刻。
当然, 会有些读者为历年“盲听大赛”获奖的幸运者鸣不平。 俺有啥好说的呢? Power Ball 都有人中啊, 兄弟, CCTV春晚还有魔术表演大变活人捏。。
** 中文网上流传的版本, 吞了Peter Aczel 的原文很多文字。
Peter Aczel 老先生已经过世几年, 为了完整的传达这位歪果仁(很不巧俺也是歪果仁)的思想, 俺勉为其难用尽蛮荒之力靠初中文化重新翻译了最关键的地方。
大家请多批评。
原文:
Peter Aczel 文章第四节 “(在家自测)听音 ABX 盲测”
译文:本刊(☞的是Audio Critic杂志)的常客都知道如何驳斥拜物的老烧反对双盲ABX测试所提出的各种谎言。以下就是一个简要的纵览:
ABX盲测法要求A和B设备的电平匹配到0.1dB范围内,之后参测人可随意听A和B,多久都行。如果认为它们有不同,可以要求去鉴别X, 其中X可以随机是A或者B(由系统随机打乱)。允许参测人随时对A/X、B/X进行比较。多少次都可以。最后决定X=A还是X=B。因为完全瞎猜,命中率会在50%左右(一半一半)。为了统计的正确性至少要测试12次(降低蒙中的几率到 1/2^12)。(16次抑或20次更好)。没有比这个更科学的方法来测试你是在听不同的东西还是在听同一个东西的了。
然而烧糊的老烧会说双盲测试完全不对:每个人都知道奇力比先锋好声,但如果他们在双盲测试中无法分辨奇力和先锋的话,就会耍赖说ABX盲测是行不通的。这就是他们的逻辑:(在生活中)如果每个人都知道Joe比Mike高,如果他们测出身高都正好都是5英尺11又1/4英寸的话,那尺子肯定有问题,对吧?
糊烧标准的反驳意见
之一就是ABX压力太大(换句话说你不能问:让我们来看看你能听力有多好吧?);
之二就是时间不够(因为要测16次所以一耳朵区别就消失了);
之三就是多只香炉多只鬼等等(诸如:继电器、开关和衰减器等);
还有其他能引用的主观听觉神论。
林林总总的目的就是东拉西扯躲避对照试验。
真相其实是这样的:
您可以自己独自完成 ABX 盲测, 也不需要受到旁人的干扰;
您爱折腾多久都可以(16个星期测16次不行吗?);
而且您也可以用直通来验证控制开关的通透性。
综上所述,那些反对的意见本质就是扯蛋和装逼。
教您一个法子来揪出一个狡猾的滥竽充数的反ABX测试的装逼犯:
问他相信其他AB对比测试吗,他可能会说信。
然后你问他到底靠什么办法分辨呢:
1.故意弄出不同的音量;
2.还是偷看厂标。
然后就等着他们如何撒泼吧。
以上就是第四节的译文。
Peter Aczel 文章的第四节是 “(在家自测)听音 ABX 盲测”, 然而网上流传的中文版本没有把最关键的段落翻译出来, 俺凭着初中文化勉强翻了出来给感兴趣的各位。
有些同学认为俺抄袭了中文网上的翻译。
大家请亲自过目, 对照一下以前的翻译吞掉了啥东西。
这段话摘自 《华尔街日报》 专栏作家 Lee Gomes 的文章。
来源:《华尔街日报》中文网
http:// chinese.wsj.com/gb/2008 0122/ptl174600.asp?source=mostpopular1
If You're Not Insane About Sound, Maybe You Can Just Go Crazy
By Lee Gomes
《华尔街日报》 英文网
https://www. wsj.com/articles/SB1200 44692027492991
Updated Jan. 16, 2008 11:59 p.m. ET
If you had to choose between two sets of speaker cables, one costing a few dollars and sounding fine, the other a few thousand dollars but perhaps sounding slightly better, and you chose the second pair, then you would have had a great time last week in Las Vegas.
The city's many goings-on included The Home Entertainment Show, an audiophile trade show held in two small motels off the Strip. Audiophiles, as you probably know, are the hi-fi zealots who think nothing of spending $50,000 on a turntable. I've learned over the...
盲听相关的散文:
为啥一搞盲听, 大湿的记忆就疲劳了呢?
因为大湿把牛皮撑破了啊。