世界上现存的文字系统主要可分为五类
但要注意的是,它们相互间的界限并不严格,很多文字兼具不同系统的特征。
典型文字:阿拉伯字母、希伯来字母、塔纳字母、叙利亚字母
基本特征:
以最常被引用的阿拉伯语“书写”一词为例,这个单词由三个字母构成,所代表的辅音音位分别可以被转写为k t b,其中没有表示元音的字母。
但阿拉伯语并非完全没有表记元音的字母。转写为a, w, y的三个字母被用在长元音和复元音的表记形式中。例如外来词“巧克力”,阿拉伯语用辅音字母w表记长元音u。
下图第一行的阿拉伯文可以转写为shuukuula,单从这个词来看,它的音节书写方式其实和我们熟悉的拉丁字母文字有类似处,前两个同样的元音都体现了出来。
Abjads原本是密切贴合闪语特点而产生的书写系统,就文字属性本身而言并不太适合用来记录印欧语言、突厥语言等。乌尔都文、维吾尔文等以此为基础创制的文字,都对书写系统进行了较大的改造,添加了纯元音字母,虽然在不了解的人看来“像”阿拉伯文,沿袭着从右到左的连写特征,但实际上已经不属于Abjads,而是Phonemic alphabets了。
典型文字:拉丁字母、希腊字母、西里尔字母、亚美尼亚字母、格鲁吉亚字母等
基本特征:
仍以“巧克力”一词为例,西班牙语拼写为chocolate(没错,和英语拼写完全一样)
它直接代表了四个音节cho/co/la/te,也即四个辅音音位和四个元音音位的两两相拼。
这里我们注意到一个在拉丁字母中经常出现的情况:作为一种趋于定型的文字体系,使用拉丁字母的多数语言(除去越南语和部分东欧语言等),相比于改造新字母(例如西语的ñ),更多采用组合原有字母的形式来表示不同的音位。
而英语的chocolate[ˈtʃɔːklət],四个元音字母中只有第一个o原封不动地发音,非重读的a弱化为ə,而第二个o和最后的e全部静音。最终成为了两个音节:重读的tʃɔːk和非重读的lət合在一起。
法语的chocolat,t后面没有e,更是连t这个辅音也不发了(口型也不用做)
综上,音位拼写系统虽然基于音位,但很多语言实际书写中不一定每个字母都代表一个音位,也存在多个字母表示一个音位,一个字母表示多个音位,或者某个字母不表示任何音位的情况。
典型文字:天城文、孟加拉文、藏文、缅甸文、泰米尔文、高棉文、泰文、老挝文等
此外,韩文、阿姆哈拉文也具有部分音节拼写的特征。韩文一般被认为是介于Syllabic alphabets和Phonemic alphabets之间的独立文字系统,而阿姆哈拉文一般被认为是介于Syllabic alphabets和Syllabaries之间的独立文字系统。
基本特征:
上图所列只是最简单的音节形式,实际遇见的很多音节可能是这样的
对比phonemic alphabets和syllabic alphabets的差别
Phonemic alphabets只需要根据语流中出现的顺序,将表示各个音位的组件线性排列就可以了,变更组件顺序即可变为不同的音节,不附带任何其它形态上的变化;而Syllabic alphabets对于每个组件允许放置的方位,在特定方位的形态、搭配方式都有极严格的要求
典型文字:日文平假名、日文片假名、凉山规范彝文、切诺基文等
基本特征:
以凉山规范彝文为例,左边it, ot, at这三个含有t的音节书写,并不含有任何共同的组件;右边ke, ne, le这三个含有e的音节书写,也不含有任何共同的组件
阿姆哈拉语虽然也常被称为“音节文字”,但对比下便可发现,它还是更接近前面所讲的abugidas,而不属于syllabaries,音位和书写之间的关系太“规范”了
不过,syllabaries和syllabic alphabets之间,也会有交界处。例如日文假名虽然笼统来讲是一字一音节,没有拼合,不体现音位,但实际上拗音的写法却是拼合起来的,第一个假名表记开头的辅音和中间的介音,第二个缩小的假名表记主元音(此时它代表音位而不是音节了)。在表记外来词时,更有多种用片假名充当音位符号的情况。
典型文字:汉字、喃字、方块壮字、方块白文、西夏文、传统彝文等
基本特征:
某些表音文字中也会出现同个音节对应不同拼写形式(例如英语hear和here)以及同音同形对应不同语素的情况(例如荷兰语haar可以对应英语her也可以对应英语hair),但与语素文字相比,同音形态的数量级相差悬殊
意音文字和音节文字之间,有时界限也不是特别分明。有多达数万字符的中文汉字无疑是意音文字,只有百余字符的日文假名无疑是音节文字。然而有2500多字符的云南彝文和819字符的四川凉山彝文,在一般人看来就不那么容易归类了。实际上,在被认为是音节文字的体系中,同样存在一个音节字符只对应一个语素的情况;而在被认为是意音文字的体系中,一个单字对应很多不同语素的情况也不鲜见。在音译词中更有多个单字连起来表示一个语素的情况,例如上文提到的“巧克力”,此处这三个字已经基本去除了原有的语素含义,如同构成新语素的三个音节字符了。
相关阅读