百科问答小站 logo
百科问答小站 font logo



如何快速分辨一串西里尔字母是哪种语言? 第1页

  

user avatar   hakunetsudenkyuu 网友的相关建议: 
      

@蒋澈 的答案给出了辨别独联体国家用西里尔字母书写的语言的方法。

我的答案想试图给出辨认俄罗斯境内非斯拉夫少数民族的一些语言的方法。


能辨别出特殊字母是最好的方法,特别是当某个字母只在一种语言出现的场合。

1、当发现字母Ӕ,可以立即断定这是印欧语系伊朗语族的奥赛梯语

2、当发现字母上方有短音符号:Ӑ、Ӗ,可以立即断定这是突厥语族的楚瓦什语

3、当发现上方有两点的字母Ӝ,可以立即断定这是乌拉尔语系的乌德穆尔特语

4、当你发现了有Ӛ、Ӫ中的任何一个字母,可以立即断定这是乌拉尔语系的汉特语

等等。


当你发现某个语言中字母出奇的多,甚至奇怪字母的数量差不多达到了十个,你可能遇到了高加索语系西北高加索语支的阿布哈兹语。判定的方法是:有带尾巴的Ҭ、带横线的Ҵ和Ҟ、在国际音标中见到过的Ӡ、奇形怪状的Ҽ和Ҩ等字母,你可以确认这是阿布哈兹语。这些是阿布哈兹语的特征字母。


有些特殊字母可能同时出现在多种语言中,这时,需要判断是否观察到另外的特殊字母,根据规则判断语言。

例如:

1、当你发现Ҥ这个字母,这是东马里语(乌拉尔语系)、阿尔泰语(突厥语族)、萨哈(雅库特)语(突厥语族)用来拼写后鼻音的字母。辨认这三种语言的方法是:在存在Ҥ的场合下,如果发现字母Ј,则是阿尔泰语;如果发现字母Ҕ,则是萨哈(雅库特)语。如果文章足够长,又没有发现以上两种字母,则是东马里语的可能性比较大。

2、当你发现Ӌ这个字母,则可能是突厥语族的哈卡斯语或是印欧语系伊朗语族的塔吉克语中的一种。区别方法:若你找到Қ,则可辨认出是塔吉克语。

3、一些突厥语言中经常出现Ә这个字母来拼写/æ/这个音。 @蒋澈 的答案中已经给出了区别哈萨克语、鞑靼语、巴什基尔语的方法。通过看是否有字母Җ可做出一步区分,但我在这里给出的是同时有Ә和Җ的四种语言的方法:土库曼语、鞑靼语、维吾尔语和蒙古语族的卡尔梅克语。

(1)如果你找遍整篇文章都看不到Һ这个字母,它是土库曼语

(2)当你确认Җ存在时,又有幸发现了Ғ这个字母,你遇到的是维吾尔语

(3)鞑靼语相比之下并没有什么明显的特征,我的方法是,当你找到Һ后,发现它的单词中有很多音节是“一个元音夹在两个辅音中间”,你可以考虑是鞑靼语。

(4)卡尔梅克语的特征明显:结尾多由三四个一串辅音组成,如:Таңһчд、үвлд、һоллгч、балһсн。这是因为卡尔梅克语在非词头的短元音被省略掉了,因此留下了一大串辅音字母,而真实的发音要通过元音和谐律判断。此外,当你看见了ӘӘ这样的双写,是卡尔梅克语的几率也很大。


四、高加索语系(不含有独创字母的格鲁吉亚语)

世界语言中的奇葩。喷音多、辅音多、元音极少(车臣语除外),但除了阿布哈兹语之外,基本上并没有用到很多俄语以外的西里尔字母,而是通过字母与硬音符号、软音符号、棒子符号(俄语palochka意为小棍,外形与拉丁字母I一样,无法区分大小写,经常在电脑上打不出来且无法显示,所以经常用大写、小写L或阿拉伯数字1替代。当你找到了这个棒子符号,你就可以认定它属于高加索语言)的组合,实现众多辅音的书写。高加索山区面积不大,却有五六十个民族,是世界上文化多样性最丰富的地方之一。由于高加索民族的多数类别居住在俄罗斯的达吉斯坦共和国中,各民族之间只能以俄语进行交流,因此很多至多数千人的小民族的语言几乎找不到运用的价值。由于阿布哈兹语已在之前提到过,这里另提几个西里尔字母拼写的高加索语言中具有一些存在感的语言。

1、车臣语印古什语:特点是找得到形如Кх的组合。区别方法是,车臣语的元音远比印古什语丰富,因此你还能找得到在元音字母后加上软音符号的组合:Аь、Оь、Юь、Яь等,这是车臣语用来表示/æ/、/ø/等音的方法,运用得很巧妙。注:拉克语也运用了以上书写元音的方法,但拉克语没有Кх。

2、切尔克斯语:分为阿迪格语卡巴尔达语,特点是常用辅音后接у来表示/w/,最直接的是ӏу这个组合,这在车臣语和印古什语中看不到。区别两种切尔克斯语的方法是:卡巴尔达语有阿迪格语里没有的四字母组合Кхъу,而阿迪格语有卡巴尔达语里没有的三字母组合Жъу。

3、找到了Жв,认定它可能是塔巴萨兰语

4、碰到了辅音双写:сс、ЦӀцӏ、хх等(真奇葩!),认定它可能就是阿瓦尔-安第克语支里最有存在感的阿瓦尔语

5、如果你看得眼睛都花了也没发现什么特殊的标志,那么就当它是另外两个稍有存在感的高加索语言:列兹金语或者达尔金语吧,其中有Уь的就是列兹金语。

6、其他更微小的语言实在懒得区分了,而且意义不大,大家都说俄语,他们的母语大多已是濒危语言。


user avatar   jiangche 网友的相关建议: 
      

主要是看一些特殊字母及高频词。基本上所有用西里尔文字的语言,都有自己的一些独特字母或正字特点。

我记得很久以前,有位朋友发来一个“俄文”文档,让帮忙翻译,结果打开一看,除了个把词之外,什么都不懂,而且有很多没见过的西里尔字母。后来接触了一些突厥语,结合其他一些信息回想了一下才明白,那应该是鞑靼语。

用西里尔字母的语言,林林总总,三十多种是有的。但是很多语言很小,比如俄联邦境内的少数民族等等,国内基本接触不到。使用人口比较多的那些语言,还是比较好区分的——

一、斯拉夫语

如果你懂俄语,读某段文字发现有不少动词、形容词、介词、连词似曾相识(靠名词判断不太靠谱),那么这99%是斯拉夫语族的语言。

练习一:判断下面两段话,哪段是斯拉夫语

Мандатар Александар Вучић поручио је, представљајући кандидате за министре у новој влади, да верује да је изабрао тим који ће бити спреман да оствари све зацртане циљеве и победе.

Москва хотод оршин суугаа Монгол улсын гавьяат жүжигчин, Оросын “Ардын жүжигчин” уралдааны ялагч, оросын “Премьер-министр” хамтлагийн гоцлол дуучин Борхүүгийн Амаархүүг та бүхэнд тусгайлан танилцуулах нь илүүц биз ээ.
                # 答案:第一段是。поручио、верује、изабрао 这些动词和俄语很像,另有 новој 等很基础的形容词和俄语类似。这是塞尔维亚语。第二段为蒙古语。            

1. 俄语。略。

2. 乌克兰语。字母і、є和ґ是特征。不过ґ在苏联时代的出版物里没有。

3. 白俄罗斯语。同样有字母і,不过有一个戴帽子的у是其特征:ў。只要是有ў的斯拉夫语,一定是白俄罗斯语。

练习二:判断哪段是白俄罗斯语,哪段是乌克兰语。

"МЗС має організувати телефонні розмови з керівництвом Німеччини та Франції у трьохсторонньому Нормандському форматі, запросити розмови з віце-президентом США, президентом Європейської Ради Дональдом Туском та ініціювати розмову з президентом РФ Путіним", - сказано в повідомленні.

Учора заснавальнік Незалежнага інстытуту сацыяльна-эканамічных і палітычных дасьледаваньняў (НІСЭПД) Алег Манаеў заявіў, што НІСЭПД згортвае сваю працу ў Беларусі з-за ціску ўладаў.
                # 答案:送分题,略。            

4. 塞尔维亚语。有字母џ、ћ、ђ、њ、љ、ј。黑山语新正字法也有这些字母,不过国内应该很少能碰到西里尔文黑山语的东西(很多黑山人也不用这个蛋疼的东东)。黑山语的西里尔字母比塞尔维亚的多一些特殊字母,不过这里就不细说了,因为这俩实际上是一种语言的不同变体而已。

5. 马其顿语。和塞尔维亚语也有џ、њ、љ、ј,但没有ћ、ђ,比塞尔维亚语多了头上长角的ѓ、ќ、ѕ。此外,如果你看到和俄语类似的名词/形容词,但是单词结尾多了个-от、-та、-то、-те之类的带个т的音节,那么这是马其顿语或保加利亚语的后置定冠词,是在斯拉夫语中很奇葩的存在,可以帮助判断。

6. 保加利亚语。没有љ这样的特殊字母,字母都在俄语字母表里,俄语字母表之外的字母一律没有。此外,保加利亚语用ъ比较多,因为在保加利亚语里ъ不是硬音符而是个元音字母,比如保加利亚的国名就是България。

练习三:下面三段文字中,一段是塞尔维亚语,一段是马其顿语,一段是保加利亚语,请判断。

Летни олимписки игри (ЛОИ) — меѓународен повеќеспортски настан првпат одржан во 1896 година, кој се приредува на секои четири години од страна на Меѓународниот олимписки комитет.

Летње олимпијске игре међународни су мултиспортски догађај који се одржава сваке четири године, у организацији Међународног олимпијског комитета.

Летните олимпийски игри са най-голямото международно спортно събитие, в което спортисти от цял свят се състезават в различни спортове. Провеждат се на всеки 4 години.
                # 答案:依次是马其顿、塞尔维亚、保加利亚。състезават、събитие 中的ъ就是保加利亚语的那个特殊元音。Меѓународниот олимписки комитет 中的 -от 就是马其顿语和保加利亚语的那个后置定冠词。            

二、非斯拉夫语

在国内能接触到的用西里尔字母的非斯拉夫语主要是中亚那些斯坦的国语以及西里尔蒙古语。偶尔可能见到老阿塞拜疆文和现在俄联邦用的鞑靼文、巴什基尔文。我就不按语言说了,只说几条判断标准。

标准1:有没有元音字母ӣ、ӯ和小尾巴的辅音字母ҷ,如果有,则是印欧语系伊朗语族的塔吉克语。

标准2:观察有没有元音字母ө、ү,如果有,那么恭喜,欢迎来到阿尔泰语系的地盘。有这两个字母的语言有蒙古语族的蒙古语和突厥语族的哈萨克语、吉尔吉斯语、巴什基尔语、鞑靼语、土库曼语(苏联时代老文字)、阿塞拜疆语(老文字)。乌兹别克语老文字是个例外,没有ө和ү,但有一个标志性的字母ў,非常好认。

练习四:区分塔吉克语和阿尔泰语系的语言。

(1) Бөтендөнья татар яшьләренең VII форумнының пленар утырышында туган телне өйрәнү, аның куллану мөхитен киңәүйтү турында күренекле мәгърифәт белгече Рашат Якупов чыгыш ясап, тел мәсьәләсенең катлаулы һәм актуаль якларын тасвирлады.

(2) Забони тоҷикӣ диққати бисёр олимон ва нависандагони оламро ба худ ҷалб кардааст. Ба омӯзиши забони порсӣ-тоҷикӣ яке аз асосгузорони коммунизми илмӣ Фридрих Энгелс низ мароқ зоҳир карда буд. Забони тоҷикӣ рӯз то рӯз рушд мекунад ва садҳо вожаҳои нав ба таркиби луғавии забони он ворид мешаванд.

(3) Амгы үеде салгалдар аразында харылзаа дыка-ла ырап, улуг улус-биле ажы-төлүнүң аразында харылзаазы дыка-ла чидип бар чыдар. Уруглары-биле кады бир-ле чүвени кылып, сеткилинден чугаалажыр үе көңгүс эвээжээн.

(4)Чорабинӣ бо ташаббуси ҳукумати Тоҷикистон дар якҷоягӣ бо СММ оид ба масъалаҳои иқтисодӣ ва иҷтимоӣ ташкил карда шудааст. Симпозиум бо дастгирии барномаҳои рушди СММ, САҲА, Бонки умумиҷаҳонӣ ва дигар ташкилотҳои байналмиллалӣ ва минтақавӣ баргузор гардид.
                # 答案:(1)(3)分别是阿尔泰语系突厥语族的鞑靼语和图瓦语(咦,这可能超纲了),(2)(4)是塔吉克语。            

具体怎么区分这些阿尔泰语言,可以补充看一些特征来判断——

标准2.1:如果字母қ这个带小尾巴的к。那么是哈萨克语或乌兹别克语老文字之一。塔吉克语也有这个字母,但判断是不是塔吉克语参考标准1就够了。这个字母在哈萨克语和乌兹别克语出现超级频繁。乌兹别克有带尾巴的ҳ和带帽子的ў,这是哈萨克语没有的。

标准2.2:如果有字母ұ或і,则是哈萨克语。

标准2.3:如果有字母ў,则是乌兹别克语。(也有可能是乌兹别克斯坦的卡拉卡尔帕克语,不过我认为通常碰不到,而且现在卡拉卡尔帕克语多用拉丁字母书写了。)

练习五:区分哈萨克语、塔吉克语、乌兹别克语

Мунтахаби Русия бо 728 хол чун пешин дар зинаи 38-ум боқӣ мондааст. Мунтахаби Исландия, ки дар чемпионати Аврупо-2016, дар Фаронса, ҳамаро дар ҳайрат гузошта буд бо 871 хол аз мақоми 22 ба ҷои 23 поён рафтааст.

Ол 200 метр қашықтықты брасс әдісімен жүзіп өтуде финалған шыққан еді. Баландин 2:07.46 уақыт нәтижесімен финалда сенсация жасап, Қазақстан тарихында жүзу спортынан тұңғыш рет Олимпиада чемпионы атанып отыр.

Бироқ милиция оператив маълумотларида жиноятчилик энг юқори даражада бўлган деб қайд этилган Тошкент туманлари биридаги манбаънинг айтишича, ўтган июл ойининг ўзида озиқ-овқат ёки дору-дармон ўғирлашни амалга оширмоқчи бўлган 12 фуқаро ушланилган.
                # 答案:分别是塔吉克、哈萨克和乌兹别克。            

标准2.4:有一个元音字母连写两遍,比如уу、өө、оо等,那么这是吉尔吉斯语或蒙古语的长元音。蒙古语的长元音比吉尔吉斯语要多,而且蒙古语的字母э出现频率也极高,另常常有小词юм、нь、ч、л,可以用来判断。

练习六:区分蒙古语和吉尔吉斯语

Америк-Австралийн эрдэмтэд Дэлхийн эрүүл мэндийн байгууллагаас таван өвчний эрсдэлийг бууруулдаг гэх биеийн ачааллыг заасан зөвлөмж нь худал болохыг батлав.

1930-жылдардын аягына, каардуу фракциялык күрөштөн кийин Сталиндин жактоочулары башкаруучу партиянын бүткүл түзүлүштөрүн өзүнө баш ийдиришет. Мамлекетте талаптуулук менен борборлоштурулган, тоталитаритардуу коомдук түзүм түзүлөт.
                # 答案:上面是蒙古,下面是吉尔吉斯。            

标准2.5:元音字母有ә,辅音字母有ң、һ,这些字母都齐全,那么这是哈萨克、鞑靼、巴什基尔这三种钦察语支的突厥语之一。这三种钦察语中,如果冒出了ҙ、ҫ、ҡ则是巴什基尔语,如果有元音і、ұ那么是哈萨克语,如果有җ则是鞑靼语。

练习七:区分三种钦察语

«Таж Өфөгә юлланды! Башҡортостан, беҙ иң яҡшылары! Фәйзи Ғәскәров исемендәге ансамблгә һәм «Арғымаҡ» этно-төркөмөнә ярҙамдары өсөн ҙур рәхмәт!», — тип яҙҙы Миләүшә.

Бу виноград, цитрус җиләк-җимешләре һәм помидорлар кебек авыл хуҗалыгы экспортының шактый үсешенә китерәчәк, диелә "Анадолу" мәгълүмат агентлыгы сайтында.

Яғни отбасын құрамын деп, ажал құшқан жігіттің туыстары науқас қызға жасалатын ота мен дәрі-дәрмектің шығынын мойындарына алған. Тіпті қыз аяғынан тұрғанша, қолдан келгеннің бәрін жасаймыз депті.
                # 答案:分别是巴什基尔、鞑靼、哈萨克。            

标准2.6:碰到字母ҝ、ҹ,不是屏幕脏了,而是阿塞拜疆语。此外,句子常常以-б结尾,这在其他突厥语不常见,因为突厥语的-p/b类副动词一般需要和其他动词连用或在剧中做中顿,不用来结束句子(当然这实际上是-p副动词后的第三人称词尾丢掉了,变成了∅,也就是维吾尔语里的okup-tu,bolup-tu在阿塞拜疆语里对应的是okub-∅,olub-∅)。比如:

Телман Сәди оғлу Ҹәфәров адлы азәрбајҹанлы минаја дүшәрәк һәлак олуб. Бу барәдә мәлуматы Украјна Азәрбајҹанлыларынын Бирләшмиш Диаспорунун сәдри Һикмәт Ҹавадов дејиб.

标准2.7:但看字母很难判断土库曼语老文字,因为和其他突厥语相比没有什么特殊字符,所幸的是土库曼斯坦的文字拉丁化很彻底,现在基本没有什么人再用西里尔土库曼文了。但如果你看到一种突厥语有连词ве(“和”,相当于俄语и),那么这应该就是土库曼语了。

----------------

终极测试:说出下面文字的语言

(1) Бүгін Астана уақытымен таңғы 7-де суда жүзуші Дмитрий Баландин Рио-де-Жанейродағы Олимпиада ойындарында алтын медаль жеңіп алып, спорттың бұл түріндегі тұңғыш қазақстандық чемпион атанды деп хабарлайды ҚазАқпарат.

(2) Маалыматка ылайык, бул айтыш "Тарых жана маданият” жылына, II Дүйнөлүк Көчмөндөр оюндарына, эгемендүүлүктүн 25 жылдыгына жана "Айтыш" коомдук фондусунун 15 жылдыгына арналат.

(3) Скульптура гродзенскага кашталяна можа з'явіцца на скрыжаваннях вуліц Замкавай і Гарадзенскага, Горкага і 17 верасня, а таксама на плошчы Савецкай (на месцы сонечнага гадзініка, які перанясуць у іншае месца). Як менавіта будзе выглядаць статуя, вырашыцца ў ходзе адкрытага конкурсу, які абвесцяць у хуткім часе пасля заканчэння галасавання.

(4) Фильм яздырылган кассета кулдан-кулга йөреп, берничә кеше карагач, мин аны Казандагы яшь тамашачылар театры җитәкчесе Фәрит Хәбибуллинга биргән идем. Милли хәрәкәттә катнашкан һәм әлеге программага да кертелгән Фәрит әфәнде, кызганычка, вафат булды. Шунлыктан кассетаны табу, кире кайтарып алу мөмкин булмады. Бары тик узган елда гына Германиядә яшәүче күренекле милләттәшебез, “Азатлык” радиосының элекке директоры Фәрит Иделле бу фильм яздырылган лазер тәлинкәсен Казанга җибәрде. Һәм хәзер, фильмны төшерүдән соң 25 ел үткәч, аны татар тамашасылары карый ала. Хәерле сәгатьтә!

(5) Чойбалсангийн намтар бол ХХ зууны эхний хагасын Монголын замнал, ялангуяа улс төрийн амьдралын тусгал юм. Энэ бол Монголын түүхэн дэх магадгүй хамгийн ээдрээт үе. Ээдрээтэй түүхийг бүтээлцсэн, басхүү хувь хувьсгалын намтар нь түүнийхээ үндэс нахиа, үр дагавар болсон хүний цадиг шастирыг улстөр-нийгмийн амьдралаас тусгайлан өгүүлэх аргагүй.

(6) Одлука Хашког трибунала да покојног Слободана Милошевића, бившег председника Србије и Југославије, ослободи свих оптужби за ратне злочине наводно почињене током рата у Босни, поново доказује да би све тврдње НАТО-а о такозваним „званичним непријатељима“ требало прихватати не с великом, већ с огромном резервом.

(7) Шайх Мӯсо Адманӣ – имоми Донишгоҳи Метрополитани Лондон, маркази Бритониё, дар як давраи омӯзишӣ ба рӯҳониёни тоҷик роҳҳои ҷилавгирӣ аз ифротгароиро маслиҳат дод. Адманӣ бо даъвати Созмони амнияту ҳамкорӣ дар Аврупо ба Душанбе омадааст ва дар сӯҳбати ӯ бо рӯҳониён намояндагони додситонӣ ва созмонҳои иҷтимоӣ низ ҳузур доштанд.

(8) Оценявам високо професионализма на колегите си от Българската народна банка, които осигуриха спокойно и адекватно провеждане на тази изключително сложна процедура в съответствие с установената европейска практика. Така българската държава изпълни стриктно препоръките на Европейската комисия. Уверен съм, че освен реализирането на партньорския ангажимент, с приключилата процедура правим поредна сериозна стъпка към укрепването на банковия надзор в България, осигуряване на прозрачност и поддържане стабилността на банковата система и защита интересите на вложителите.

(9) Ганс-Ґеорг Ґадамер — німецький філософ, один із найзначніших мислителів другої половини ХХ ст., відомий передусім як засновник «філософської герменевтики». Вивчав філософію, історію, теорію літератури, історію мистецтв та євангельську теологію у університетах Бреслау та Марбурга. У 1922 році захистив докторську дисертацію під керівництвом Пауля Наторпа.

(10) Биз хато йўқ¸ демаяпмиз. Хатолар бор¸ масалан¸ ташкилотнинг тўртта протоколи нотўғри тўлдирилган. Аммо бу аҳамиятсиз камчиликлар ва уларни ҳал этувчи деб атаб бўлмайди! Улар оддий ёзувдаги техник хатолар ва миллионлаб инсонлар ҳуқуқларини ҳимоя қилувчи ташкилотни йўқ қилиб ташлашга мутлақо асос бўла олмайди, деди ҳуқуқ фаоли.

                # 答案:(1)哈萨克;(2)吉尔吉斯;(3)白俄罗斯;(4)鞑靼;(5)蒙古;(6)塞尔维亚;(7)塔吉克;(8)保加利亚;(9)乌克兰;(10)乌兹别克。            

user avatar   nie-xuan-nan 网友的相关建议: 
      

先给大家看张图。

但是,我要强调,不要仰仗它,

它只是有趣,但不实用,看看就行。

(另外,原图中把阿布哈兹、南奥塞梯、德左、纳卡和科索沃单独划出来了,这是我们不承认的,特此声明)

真正要给大家的是一张Excel表。附原始出处链接:

zh.wikipedia.org/wiki/%

根据表格统计,

当下用于现代语言的“活”西里尔字母至少有104个,使用西里尔字母拼写的语言至少有38种(注:原表格所列语言仍有缺失,我只是暂且使用其统计数据):

印欧语系,斯拉夫语族,东斯拉夫语支:俄语、乌克兰语、白俄罗斯语、卢森尼亚语(4)

印欧语系,斯拉夫语族,南斯拉夫语支:塞尔维亚语、保加利亚语、马其顿语(3)

印欧语系,罗曼语族:摩尔多瓦语(1)

印欧语系,印度-伊朗语族:塔吉克语,奥赛梯语(2)

乌拉尔语系,芬兰-乌戈尔语族:基尔丁萨米语、东马里语、西马里语、乌德穆尔特语、汉特语(5)

乌拉尔语系,萨摩耶德语族:涅涅茨语(1)

高加索诸语言:阿布哈兹语、车臣语、卡巴尔达语(3)

突厥语族,葛逻禄语支:乌兹别克语、维吾尔语(中亚也有地方讲维语)(2)

突厥语族,钦察语支:哈萨克语、鞑靼语、巴什基尔语、卡拉恰伊-巴尔卡尔语(4)

突厥语族,乌古斯语支:阿塞拜疆语、土库曼语(2)

突厥语族,其他语言:吉尔吉斯语、阿尔泰语、图瓦语、哈卡斯语、雅库特语、楚瓦什语(6)

蒙古语族:蒙古语、布里亚特语、卡尔梅克卫拉特语(3)

通古斯语族:鄂温克语(1)

汉藏语系,汉语方言:东干语(1)


在所列出的104个字母中,只用于一种语言的、独一无二的字母有43个:

Ђ ђ 和 Ћ ћ 这两个字母只用于塞尔维亚语。

Ѓ ѓ Ѐ ѐ Ѕ ѕ Ќ ќ 这四个字母只用于马其顿语(按照注释,Ѐ ѐ其实不是单独的字母,但为了Excel统计方便,我暂且当它是)。

Ӂ ӂ 只用于摩尔多瓦语。

Ӕ ӕ 只用于奥赛梯语。

Ӣ ӣ 和 Ӯ ӯ 只用于塔吉克语。

Ҋ ҋ Ӆ ӆ Ӎ ӎ Ӊ ӊ Ҏ ҏ Ҍ ҍ Ӭ ӭ 这7个字母只用于基尔丁萨米语。注意:知乎页面下可能看不清,Ҋ Ӆ Ӎ Ӊ都是带一个折线形小撇的,而且Ӊ和Ң是两个不同的字母,小撇不太一样(后一个用于好几种突厥语族语言中)。Ҏ比普通的Р多一道短斜线。Ҍ和早期西里尔字母Ѣ也是两个不同的字母。

Ӹ ӹ 只用于西马里语。

Ӝ ӝ Ӟ ӟ Ӥ ӥ Ӵ ӵ 这四个字母只用于乌德穆尔特语。

Ӛ ӛ Ӄ ӄ Ӫ ӫ 这三个字母只用于汉特语。

Ӷ ӷ Ҽ ҽ Ҿ ҿ Ӡ ӡ Ҟ ҟ Ҩ ҩ Ҧ ҧ Ҭ ҭ Ҵ ҵ 这九个字母只用于阿布哈兹语。

Ҝ ҝ Ҹ ҹ 这两个字母只用于阿塞拜疆语。可能也看不清,中间有小竖线。

Ұ ұ 只用于哈萨克语。

Ҙ ҙ Ҡ ҡ 这两个字母只用于巴什基尔语。

Ӌ ӌ 只用于哈卡斯语。请留意它的小撇方向和另一个字母Ҷ不同。

Ӑ ӑ Ӗ ӗ Ӳ ӳ 这三个字母只用于楚瓦什语。Ӳ上是两撇,不是两点(懂点匈牙利语的朋友可能会会心一笑?)


只要在待分析文本中存在以上43个字母中的任意一个(而且,前提是分析人员没把字母搞错),基本上就能确定此文本的语言。我现在只能说“基本上”,因为我不能确定那些原表缺失的语言里是不是也有这些字母,会不会戳破它们目前的独一无二性。这是很可能的:

原表中有不少俄罗斯少数民族语言,这使得其他答主提供的部分判断技巧失效了,也是我说开头那张地图其实并不实用的原因。我举几个例子:

Ё ё 这个字母,除了俄语有,白俄罗斯语也有,卢森尼亚语也有,乌拉尔语系的语言都有,突厥语族的也基本都……足足29种语言里有它,用这个来象征俄罗斯怕是不行的。

Ў ў 白俄罗斯语有,乌兹别克语有,但卡拉恰伊-巴尔卡尔语和东干语里也用。

Ґ ґ 不仅存在于乌克兰语,还存在于卢森尼亚语。

Җ җ 作为了鞑靼语的标志,不过土库曼语、维吾尔语、卡尔梅克语和东干语里也有它。

Ҷ ҷ 似乎是塔吉克语独占吧,然而实际并不,阿布哈兹语里也有这个字母。

Џ џ 是塞尔维亚语和马其顿语的专属吗,不,阿布哈兹语里也存在。

Ҕ ҕ 这个字母主流语言里没有,但阿布哈兹语和雅库特语里都有……

这样写下去是没完没了的,而且其中那么多冷僻的俄罗斯少民语言,估计大多数人过完一辈子也不会和它们产生交集。文末我会给出Excel外链供大家下载。


答案主体部分我已经写完了,另外还有几句对苏联搞的西里尔化的吐槽想说:

有的时候,同一个字母在不同语言里发各自不同的音,然而更可能的情况是,本来是同一个语音,结果由于这样那样的原因,分别先后创造了好几个不同的字母来表示。例如,Ң ң Ӈ ӈ Ҥ ҥ 这仨完全都是/ŋ/,Ӂ ӂ Җ җ Ӝ ӝ Ҷ ҷ Ӌ ӌ Ӌ ӌ 几乎都是/dʒ/。Ә ә 这个字母虽然写成个 ə 样但在大多数语言中的发音是/æ/(当然话说回来,比起拉丁字母全球开花带来的混乱,西里尔字母这点事简直不值一提)


顺便一提,从这个表中还能发现一些别的信息,比如,在全部所列出语言中都有的“全勤”字母有22个:

А а Б б В в Г г Д д Е е Ж ж З з К к Л л М м Н н О о П п Р р С с Т т У у Ф ф Х х Ч ч Ш ш

看起来毫无悬念,唯一的意外是,白俄罗斯语不用И и。


Excel获取地址:wws.lanzous.com/itawCg8




  

相关话题

  如何判断某段拼音文字书写的是何种语言? 
  如何快速分辨一串西里尔字母是哪种语言? 
  如何快速分辨一串西里尔字母是哪种语言? 
  新加坡口语感叹词“Alamak”是怎么来的? 
  如何判断某段拼音文字书写的是何种语言? 
  天龙八部乔峰的父亲写在山崖上的字是蒙语吗?还是契丹语? 
  只看拉丁字母,如何快速从品牌名和商标上大致确定该品牌来自哪个国家和地区? 
  塔吉克斯坦将来会废除西里尔字母吗? 
  新加坡口语感叹词“Alamak”是怎么来的? 
  天龙八部乔峰的父亲写在山崖上的字是蒙语吗?还是契丹语? 

前一个讨论
在韩国政史题材影视剧中经常提到和出现的“西冰库”到底是一个怎样的地方?
下一个讨论
如何评价北一辉?





© 2024-11-24 - tinynew.org. All Rights Reserved.
© 2024-11-24 - tinynew.org. 保留所有权利