一般来说,我不相信类似的研究,权当茶余饭后的谈资吧:有的研究认为,音素的多少跟人口有关。
不少语言学家或者非语言学家都有过语言特点跟自然、社会环境有着神秘联系的奇思妙想。比如萨丕尔早在上个世纪初就已经想过了,他甚至认为语法结构都可以与自然环境有关系,当然他和他的学生沃尔夫还发展了语言决定论/相对论的假说。我不在这里展开讲了。
自然、社会环境对语言的最直接影响可能还是词汇,在该地区没有的东西,就应该不会有相对应的名称。不过,如果说连音系都受影响,就有点匪夷所思了。但还是有人想过:Hay and Bauer (2007)[1]在Language上发表了一篇短文,题目是Phoneme inventory size and population size。音系的大小和人口的多寡。
他们俩使用了Bauer (2007)[2]编纂的手册,这本手册包含了一些语言的使用人数以及类型学信息,当然也包括了音素的数量。在Hay and Bauer (2007)中,他们主要专注于元音的数量。
他们选择了像英语、印地语、官话这样的“大”语言,同时也选择了巴士克、迪亚里、希卡利亚纳语等“小”而出名的语言。不过主要还是印欧语和大洋洲的语言。
在元音区分上,作者区分了“基本单元音”(basic monophthongs),这些单元音仅仅区别于音质(quality);又区分了“额外单元音”(extra monophthongs),加入了音长、鼻化等发声态的考虑。他们也把双元音纳入了研究范围,但是双元音必须小心处理,因为有些双元音可能可以被分析为滑音加单元音,有一些可能被分析为两个单元音音素。
实验结果如下。横坐标表示人口(对数人口,log population),纵坐标表示元音的数量。每个小圆圈代表一个语言。左图是基本单元音的情况,右图是额外单元音的情况。
如果我们假设,人口越多,音素就越多,我们会期待这些小圆圈从左下角到右上角呈直线排列,这时人口和音素的数量就是正相关。在这两张图中,并没有这样的状况。不过,我们得到的rho值分别是0.36和0.23,说明人口和音素数量是呈弱正相关(假设rho=0,就是没有关系),p值非常小,表示这种弱正相关很可能不是出于偶然。
另外,作者还是探究了辅音音素数量和人口的关系。结果如下。左上是阻音(obstruents),右上是响音(sonorants),左下是所有辅音,右下是所有音素。
我们可以看到,响音数量和人口的相关性是最弱的,rho值只有0.17,但再怎么说也是正相关。当我们把辅音和元音合起来研究(右下),我们发现rho值提升到了0.37,相关性反而增加了。
近期,Moran et al (2012)[3]重新对音素数量和人口的相关性做了一个审视。他们使用了PHOIBLE的961个语言的数据,以及Ethnologue的人口数据,进行了研究。他们的研究发现, 这两者的关系非常非常地弱,几乎可以忽略不计:
统计学上,音素数量和人口的关系可能有一点点的显著性,但是实际上这点显著性也许不能给我们带来有意思的信息。同时,不同的语系也有不同的结果,总之都不是特别显著,有的甚至呈负相关:
Moran et al (2012)问道:为啥我们非要假设人口跟音系的大小有关系呢?人口可以瞬间增长或者减小,而且几乎没有改变音系大小的机制可以想象。那么究竟什么跟音系的大小有关呢,他们没有正面回答,只是给出了几个可能:
这个问题实际上并不是大部分语言学家会关心的问题,就想我在开头所说的,属于茶余饭后的谈资——话说回来,哪一项研究不是茶余饭后的谈资呢?圈子不同罢了。