百科问答小站 logo
百科问答小站 font logo



正常语速的情况下,各类语言的平均输出信息量都差不多吗? 第1页

  

user avatar   sichagao 网友的相关建议: 
      

这个问题特别好,涉及人类口语产出的语音学、心理学、语言学等等要素。在知乎上已经有过好几个类似的提问了,我整理了一下,也邀请了几个我认为可以在这个问题下提供洞见的答主。

和这个问题类似的提问有很多,题目和下面的答者大多关注:单位时间内的语言产出量(语速,多邻国Duolingo:如何衡量不同语言语速的快慢?)和产出同等信息量的语速情况(比如,比特,用汉语说话的信息密度高还是用英语说话的信息密度高?目前来说,通过读音交流,信息密度最高的语言是什么?)。“用汉语说话的信息密度高还是xx”这个问题下的高赞 @黄鼠狼精Morrica 提供的研究给出了一个语速和信息量(比特)的对比方式,得出下面这样的结论。

语速快的是因为单个音节包含的信息少,语速慢的是因为单个音节的信息多。

也就是说,各种语言的信息传递能力没有高下。日语有哪些缺陷? - Minamoto的回答 - 知乎 zhihu.com/question/3815 这个回答里提到一篇研究

它把世界上主要的七种语言,英,汉,法,德,日,西,进行对比,分析效率。
为了公平起见,原文用越南语写成,全部交给七门语言的母语者翻译,取最短的一篇包含越南语全部意思的文献,然后比较这七种文献的音节数量,和越南语比较计算信息密度。

我就做个二道贩子再解读一下这个研究,这个研究将相同信息量作为控制变量(通过翻译的方法),考察语速的快慢,而汉语的“语速”最慢,但是由于汉语一个音节的信息密度最大,因此,虽然语速慢,但是“表达意思的速度(也就是单位时间的言语信息量)”和其他几种语言差不多,但是日语“表达意思的速度”和其他几种语言相比是最慢的。

总而言之,这个研究也和 @多邻国Duolingo 提供的研究有相似之处:日语的语速较快,汉语语速慢。和黄鼠狼提的这个研究也有相同的结论:单个音节的信息量少,那么语速就快,为了实现表达相同的信息量。反之,语速就慢。但是这篇研究和多领国对于哪个语言最低效的判断是不一样的,多邻国说的是越南语,该研究说的是日语。

以上,都是知乎上关于这个题目的讨论,我来再补充讨论一下这个题目。

讨论这种语速、信息量的话题,首先,要控制变量。要么控制语速,要么控制信息量。多邻国提到的研究控制的是单位时间,考察语速和信息量,即对比了语速,也对比了信息量,但是没有把二者的关系阐释清楚;黄鼠狼精提到的研究控制的是信息量,考察单位时间的音节量(语速),同时提到:不同的语言,单个音节提供的信息量不同

这里涉及“信息量”这个变量怎么去考察,怎么定义,怎么量化。有的人提出,类似“井底之蛙”虽然是4个字,但是内涵太丰富了,或者如果大家爆梗,这个信息密度该如何计算?———这种涉及语义、语用的问题我们暂时先不考虑,只考虑最浅层的语言信息的传递问题,我们也尽量避免句法和语音的交界影响,只考察来自语音的证据——which is很勉强,但是我们试着去考察一下。 @黄鼠狼精Morrica 所引的研究用了比特这个概念,

我补充的内容是从听话人对节奏的感知的视角来的。不讨论信息量传递的多少,只讨论说两种语言的人,都是各自语言背景里正常语速的发音人,是不是一种语言听起来比较快

我们听一段话的时候,从两方面的感知了这段话。一是从内容上,也就是对元音辅音等音段信息的获取——这也是言语信息的来源,元音辅音的组合传递了语言信息,体现在音素的组合上,也就是前面所提到研究的音节的感知、判断等;另一方面是对时间长短、音高变化等超音段信息的感受,比如F0,比如单位时间里的发音时长(分母不包括停顿),单位时间里的说话时长(分母包括了停顿),单位时间内的音节数。二者显然是相互影响的,因为如果一个人说话磕磕巴巴,我们也不太容易get到他的内容,如果一个人音节乱拼,元音辅音发错,他说得再慢,我们也不知道他的意思。

Pfitzinger(2000)[1]基于上面这两面的感知特点建了一个预测模型,这个模型的被预测变量就是人耳所感知的语速(perceived local speech rate,PLSR):

sr:syllable rate,单位时间内所产出的音节数。sr前面的s是系数。

pr:phone rate,单位时间内所产出的元音、辅音数。pr前面的p是系数。

c:常量。回归方程里经常有的一个预测误差值。

Pfitzinger的这个回归方程是根据德国人说德语的数据构建的,F0也是他考虑的变量之一,但是数据分析结果显示F0的预测作用并不大。在德国人的数据里,系数s是7.38,系数p是4.06,c是-1.41. ——也就是说,音节数和人的听感所感知的语速相关系数更高一些,音素数的系数也有4.06,比7.38小了近一倍。这个模型被其他研究证实了其预测可靠性(在德语的数据范畴内)。

那么,这个方程与其背后的理念和我们的题目有什么关系呢?这个方程其实是肯定了单位时间内元音、辅音的数量对听感所感知的语速的作用。我们听感上所感受的语速,不光包括单位时间内说话人发出来的响(音节数),也包括元音、辅音的数量——也就是一个音节的复杂程度。

banana,有3个音节,6个音素;stretchmarks,有2个音节,10个音素。

香蕉,有2个音节,8个音素;妊娠纹,3个音节,9个音素。汉语中的双音节词居多,三音节词较少,而音素最多的双音节词的音素也就是10来个左右,而英语、俄语这样的重音语言音节复杂,音节可以很多,音素也可以很多很长。

或者抛开音节语言、重音语言这种不时尚的说法:一种语言的音节的复杂性,也会带来听感上的语速比较快的感觉。

纯属开脑洞,欢迎讨论。

参考

  1. ^ [1] Pfitzinger, H. R. . (2000). Local Speech Rate Perception In German Speech.

user avatar   he-xi-46-30 网友的相关建议: 
      

首先,题主你的感觉是正确的,大部分语言的传输效率应该是基本接近的。不然译制片的配音会成为一件无法完成的事情。

这个问题实际上知乎里面都提出过好几次了,因为经常会有一些朋友讨论语言优劣,所以就会有人提问语言传输效率问题,自然也一直有朋友在回答。

比如:


这几个回答都提到了里昂大学的一个研究成果。

这个研究最早是研究了七门语言,七门使用人数非常多的语言。包括印欧语系的英语、德语、法语、意大利语和西班牙语,然后日本-琉球语系的日语和汉藏语系的汉语普通话。后来又拓展到17种使用人数较多的语言,最后得出结论是,以上语言在正常语速下,输出效率都差不多,都在39bit/s的样子,标准差在5个bit/s左右。

这个研究还多关注了一个平时被忽略的点,它不仅仅考虑了语言本身的信息密度,还考虑了语言的实际使用。语言本身确实因为语法繁杂程度和音节的原因,信息密度有一些差距,但是信息密度越高的语言,语速就越慢,信息密度越低的语言,语速就越快。信息密度和语速相乘,最后都在39bit/s左右。

正常语速下传输速率稳定在39bit/s左右,这可能和大脑的信息处理能力有关,39bit/s可能就是大脑处理语言信号的带宽。人类在环境的压力下不断进化,信息处理带宽最终就进化到了现在这种状态,刚好让处理能力物尽其用。

语言的产生,是人类进化的一件大事。这是人类能拥有智慧的基本前提,可以说,它最终甚至可以决定了人类文明最终的高度。假如远古有个民族,他的语言说得特别慢,语言密度也特别低。那么这个民族的信息交流水平就位相对其他民族低很多,在和其他民族交流的时候,他们很快就会在竞争中处于劣势。这个民族要么走向衰亡,要么为了生存就会被迫提高语言传输速率。经过一段时间之后,最后各民族正常语速下的传输速率自然就趋向于一致。


user avatar   kong-chao-89 网友的相关建议: 
      

在我看来,特斯拉想石锤掉张女士太容易了好吗?

现在事情这么大了,都惊动到特粉的精神领袖马斯克了。

行车记录不是特斯拉后台都有吗?

不是只有特斯拉能读取(破解)吗?

直接倒出来事发前后10分钟的记录公布大众不就直接锤死了吗?

还轮的上张女士跳脚吗?

至于隐私啥的,涉及面这么广已经不存在隐私问题了,反正特斯拉也不尊重车主,就直接公布呗?

多少数据啊,拘留5天都整理不出来,都不如我们新招的实习生呢。


那么问题来了,为啥不锤呢,人道主义吗?


还有人在那说,车主不给车就鉴定不了。

行,我认为你说的是对的,

那特斯拉给一份精选的数据是咋回事?

不用怕网友看不懂,我看不懂,我后面有千千万万网友会翻译成我能看懂的Excel。

你倒是公布啊。


user avatar   maigo 网友的相关建议: 
      

从场景来看,地方指挥官从远处看到的是这样:

实际上如果你是前排敌方骑军你看到的是这样:

如果你是步兵,你冲锋的时候看到的是这样:

你开心的跟伍长说你已经窥破了敌军弱点,所以选择了

这样和

这样。

军需官瞪了你一眼:我们是亚洲战场,哪儿他么有双手剑和塔盾这种玩意?然后把你武装成了这样:

你很开心的拨开了几个超长枪的杆子,贴近对方到了大概一米的地方,然后看到了这样:

一个竖劈,你架住了,你觉得自己帅爆了,然后你看到了这样:

你这次没那么走运了,只有用自己的头骨去尝试格挡对方的长戟,很遗憾,失败了。

下一个倒霉蛋看到了这样:

灵机一动,觉得对面的护甲等级是这样:


于是自信的把自己武装成了这样:

然后发射了箭矢,这才发现对面的防御等级是这样:

给个特写的话是这样:

你的武器对面感觉如同这样:


哦不好意思图错了

你很自信,蚁多咬死象。但是突然发现对面的投射火力是这样:

这样:

甚至是这样:

第三个倒霉蛋,也是最后一个,出来了,说,老大,俺寻思俺们可以这样:

它发射的是这样:

你觉得下令装填的时候自己是这样:

于是对面发现了你的炮兵阵地,他们是这样:

发射的是这样:

然后你变成了这样:

但是,鞑子败了,我们才得了个机会,不用再经历这样:

哦对了,别忘了黄石部队的抚恤金是这样:


对方的抚恤金是这样:




  

相关话题

  有的中国人靠飙英语装13,那以英语为母语的外国人一般靠飙什么装13? 
  人有可能进化成昼伏夜出的生物吗? 
  假设存在如下印欧语元辅音对照,能否证明两者属于不同语族? 
  哪门语言的单词拼写看起来和日语罗马音最像? 
  有哪些你误以为是方言的普通话用语? 
  请问“挽狂澜于既倒,扶大厦之将倾”中的“既”表示已经还是不久?现代汉语中既表示已经,古汉语有不久。? 
  有哪些汉字的本字就是它去掉偏旁的形式? 
  日本的国字如何用汉语发音? 
  为什么现在很多文章都会刻意用「打工人」「不讲武德」「耗子尾汁」这些词汇? 
  在进化论被提出之前,难道没有人觉得猴子和猩猩长得像人类吗?他们是如何解释的? 

前一个讨论
中国刑警如何进行枪械管理?
下一个讨论
为什么猫在我面前露出肚子让我摸了一会儿咕噜几声之后突然抓我(露爪的那种)?





© 2024-12-18 - tinynew.org. All Rights Reserved.
© 2024-12-18 - tinynew.org. 保留所有权利