5.7.2019 更新:评论提出了一些对这篇研究的质疑,我觉得都非常有道理。主要的两个问题一个是音节表达意思的效率和题主所说的信息摄取速度并不是一回事儿,另外正如原答案中提到,论文中的不同语言段落并不能完美体现这种语言最原生态的表达方式。而众所周知,文科学科的量化研究总是很难的,有点数学内容的研究总是比凭空胡诌靠谱一点点。文章比较有趣的结论其实在于即便统计误差不小,各种语言的信息效率却没有很大的差别,大概表现了人类语言进化中的某种相似性。
这个11年的文章引用在200左右,虽然我不是很清楚一个语言学的文章引用大概是什么水平,也不清楚这个Language杂志风评如何。但至少表明这结论在学术界还是有点专业人士信的。大家能批判的看待就好。
——————————————————
原文:
简单来说,我们能看中文一目十行是因为我们对中文足够熟悉。如果你问问周围的外国人会发现他们对于非专业性的英文文章一样是一目十行。(然而读大家都不熟悉的东西的时候,比如新的论文,该读不懂的句子给谁都读不懂)反过来说,我读曾谨言的量子力学也无法看一眼就知道怎么回事。
从语言的角度来看,一些研究认为英语的语言效率高于世上大多部分语言。以下数据来自:Pellegrino, François, Christophe Coupé, and Egidio Marsico. "Across-language perspective on speech information rate."Language87.3 (2011): 539-558.
简单地说,就是研究人员把几段意思相同的话翻译成不同的语言,首先数这段话在不同语言环境下的音节数,再用这段话能传达的意思除以这段话的音节数来比较不同语言的阅读效率。比如说syllable(原答案拼错,已改正……)有三个音节,“音节”则有两个音节,他们的效率就分别是1/3和1/2. 除了书写,这篇文章还研究了交流效率。就是考虑了说不同语言时候的速度,通过这种语言每秒钟能传达的信息来判定这种语言的交流效率。
结论大概是这样的:(出于某种奇怪的原因,越南语被当做了1个标准单位)
表格中,左边的imformation density信息密度是每个音节能传达多少意思,表达书写效率。syllabic rate音节速率是说这种语言的时候每秒钟能传达多少个音节,information rate信息速率是对应每秒钟能传达多少“个”意思。
可以看到除开作为标准的越南语不谈,在书写效率上,汉语普通话和英语不相上下是稳定的第一梯队,日语则显著低于其他语言。如果我们认为说话的速度几乎等同于阅读速度的话,日语和西班牙语则显然快过其他语言(这也很合理,日语是一种好学不好用的语言,不少人会觉得日本人说话快的惊人)。最终的结论中,交流中的信息速率除了日语和德语以外,其他语言几乎没什么区别。所以语言学上中文并没有显著的高信息传递效率,甚至在速度单一因素上还算是比较慢的。
就最后的结论来看,英语好像是略微不显著的强了一点,不过这可能来自研究本身的偏差。文中给出的样本信息大概是这个样子:
就看中文和英文,可以明显感觉到中文有翻译体的感觉,不够自然,也可以有更简洁的表达方式。