我觉得这种追根溯源很可能找不到答案
举几个例子
希腊人自古以来都是自称hellas,但基本上除了希腊、中国和越南以外的国家都用类似英语greece的词汇称呼他们,Greece源自某个到亚平宁半岛建立殖民地的人,也是最早与拉丁罗马人接触的希腊人,所以(当时没文化的)罗马人就用他的名字称呼全希腊,如果希腊人第一次听到这个词肯定会莫名其妙,根本联系不到自己身上,就像中国被叫成张三李四王二麻子国一样;
再比如埃及,古埃及人从来没称呼过自己埃及人,埃及一词就是(当时没文化的)古希腊人把埃及的一座神庙的名字Aígyptos误当成了埃及的国家名称,这个根本是非常乌龙的一件事,这就像中国被叫成少林武当妈祖国一样;
就说中国吧,在俄罗斯等国被称为“契丹”,Russia在中国莫名其妙多个“俄”字,也只是因为隔着蒙古人这个没文化的二道贩子
举这些例子就是想说,罗马、希腊、埃及这种距离这么近的共生文明对彼此的称呼也是牛头不对马嘴的,何况远隔千山万水的中国和拜占庭,中间隔着无数(没文化的)国家和部落,以讹传讹,追根溯源太困难了,上面提到的大汉拓跋唐家都有可能,但历史的真相说不定只是个让人啼笑皆非的乌龙罢了
本来我不想回答这种热门问题的,奈何目前(UTC+8 2018-04-12 20:15)排在前三位的回答…
某中亚史爱好者列举了不少东西,但逻辑不成立,我想这大概是因为他对汉语语音史不很了解,被小道消息带进沟里去了。
某人文领域专业人士的回答一如既往地言简意赅,可惜这次未免武断了一点。
剩下那位…不提也罢。
总之,前三位的回答都有问题。
「拓跋」说之所以成为主流并不是因为立场问题,而是因为从语音的角度来看它确实最像。
我们先不管罗马帝国的文献(毕竟不知被转手了多少次了),先看后突厥汗国的碑文。
后突厥汗国里「桃花石」这个词拼作(从右到左读):
直接转写:t¹b¹g¹č,一般转写:tabγač,语音:/tʰɑbʁɑtʃ/。
作为对比:
「禿髮」两晋南北朝音:/tʰouk.puɔt/;
「拓跋」两晋南北朝音:/tʰɑ(ɔ)k.bɑt/;
「大漢」东汉音:*dʶɑs.χɑn;
「大漢」两晋南北朝音 /dɑi.χɑn/;
「大魏」两晋南北朝音 /dɑi.ŋui/。
我们完全有理由猜测,这个词源于鲜卑语,最初的形态可能是 *tʰɑɡʷɑtʃ、*tʰɑʁbɑtʃ 或者 *tʰɑbʶɑtʃ 之类的东西,然后被汉语译作「禿髮」及「拓跋」,同时又被古突厥人借作 /tʰɑbʁɑtʃ/,被更西方的某些部族借作 *tauɡaʃ(t) 或者 *tavɣaʃ(t),然后变成希腊语 *tauɣas(t)(希腊语 γ 很早就擦化了)。
关于汉语中「禿髮」及「拓跋」的韵尾(分别是 /-k/ 与 /-t/),这其实都不成问题。/-k/ 韵尾就不用说了,/-t/ 韵尾用来对译 /tʃ/ 也是常规操作,在梵汉译音里 /-t/ 韵尾可以对译除了鼻音、软腭塞音、唇音之外的所有辅音,比如 /r/、/l/、/s/、/dʑ/,拿它来对鲜卑语的 /tʃ/ 根本就没什么奇怪的,也用不上什么「突厥语后缀」。/tʰɑbʁɑtʃ/ 就是「拓跋」,没有词缀。
至于说「大漢」的…两字的声母也就算了(都能用清浊交替解释),你给我解释一下「大」字的韵尾 *-s 或 /-i/ 是怎么变成 /ʁ/ 或者 /b/ 或者 /v/ 的?「漢」字的韵尾 /n/ 是怎么变成 /tʃ/ 的?
这不是立场问题,这是方法问题。你可以说「拓跋」牵强,但非要说「大漢」比「拓跋」可能性高…这就没有道理了。
至于公元七世纪以后的那堆乱七八糟的东西…大概确实有可能被「唐」之类的带跑了。
4月13日更新:中文维基百科里引用了一个论述,认为「拓跋」分别是“tog”(词义:土)与“be(i)g”(词义:后)的音译。
我觉得这个说法很有道理,但有一个细节需要指出:魏晋南北朝时期汉语既有 /k/ 韵尾也有 /t/ 韵尾。如果汉语所音译的就是“be(i)g”,那么理应使用「辟」等 /k/ 韵尾字,不可能去用「髮」「跋」这种 /t/ 韵尾字。
一个合理的猜测是,“tog-be(i)g”这个词在鲜卑语中发生了音变,变成了 *tʰoɡ-bedʒ,然后又过渡到 *tʰoɡ-bɑtʃ(可能有元音和谐律的因素),并于公元三世纪被汉人音译为「禿髮」/tʰouk.puɔt/。
后来这个词又变为 *tʰɑɡbɑtʃ,于公元四世纪被汉人音译为「拓跋」/tʰɑ(ɔ)k.bɑt/。
公元五世纪北魏名扬内亚,阿尔泰山附近的突厥人以 *tʰɑʁbɑtʃ 称呼北魏(受元音和谐律的制约,突厥在此只能以 *ʁ 对 *ɡ),不过随即跑偏成 /tʰɑbʁɑtʃ/,也就是公元七世纪突厥碑文所记载的那个“t¹b¹g¹č”。
之后的事情这里就不再重复了。
对于为什么中国被称为桃花石,有这么几种观点:
1、大魏(北魏),法国学者德经首倡,该说法目前无人问津已被遗弃
2、唐家(唐朝的自称),德国学者夏德、日本学者桑原鸷藏提倡。由于桃花石的最早记载应该早于唐朝,所以这个说法也被遗弃
3、拓跋(北魏皇族姓氏),法国伯希和、日本白鸟库吉提倡,目前为主流,但有一个很大的问题就是,拓跋的古汉语读音T’ak bwat如果要和“桃花石”吻合,就得套成“拓跋氏”才行。如果不加一个“氏”就没法吻合了。
这个问题的荒谬性在于,“拓跋”是鲜卑语(古蒙古语的一种),而“氏”是汉语。“拓跋氏”这个词语只有也只能在汉语语境中出现。汉族之外的其他民族如果要称呼“拓跋氏”,肯定不会这么称呼。
而且,桃花石的第一个“桃”的音,在各种有“桃花石”拼写的语言里,都更接近古汉语的“大”,而不是“拓”。
4、大汉(汉朝自称),中国张星烺、芮传明提倡。目前声音还很微弱。不过很有说服力。至于怎么有说服力呢。
首先,“大汉”一直是汉朝的自称。在文献里比比皆是,甚至连匈奴人刘渊建立的“第四汉朝”也如此自称。匈奴跟汉朝交往时,匈奴人撰写的汉文国书也将汉朝称呼为“大汉”。
古突厥碑文中的“桃花石”即“大汉”的对音,再加一个后缀“石”。而这个“石”即“c”,在古突厥碑文中,有例子,即《翁金碑》中,有一个“atac”,“ata”就是爸爸,但到底为什么加一个“c”。解读者最终解读为“尊敬的父亲”。而这个“桃花石”就是“尊敬的大汉”。
为什么会管汉朝叫“尊敬的大汉”呢,这根汉朝和匈奴的国势相比有关。匈奴只在汉初昌盛,汉武帝之后匈奴日渐衰落最终沦为汉朝附庸,所以就有了“尊敬的大汉”这种称呼。而这种称呼传到了草原各地和外国,就成了中国的另一个名字“桃花石”。
但问题是,这个“大汉”的解读,仅仅只能对应古突厥碑文里的“桃花石”,因为“桃花石”并没有标准的读音,在不同文字不同语言,有不同的称呼:
“桃花石”在不同文字里的拼写情况:
1、拜占庭帝国的希腊文(转拉丁文拼写):Taugast
现存文献中最初的“桃花石”,但肯定不是最早的,见于希腊语Taugast。是拜占庭时期对中国的一种称呼,那时候拜占庭不知道这个Taugast是不是就是古代传说中的赛里斯,也不知道是不是就是以后的契丹,所以只是一个稀里糊涂听来的陌生国度的名字。该记载源于七世纪初的席摩喀塔《陶格司国记》,陶格司,即桃花石的另一个音译。而希腊语中的Taugast,读音也是“陶格司”。
希腊语的这个读音,不但跟“大汉”相去甚远,跟“拓跋”离得更远了……这个读音,明显是“唐家”的对音。
而席摩喀塔活跃的年代,唐朝刚刚建立。当时连印度的戒日王都对唐僧说:“我知道你们那里有个秦王天子,很牛逼。”由于唐初的武功鼎盛,连印度人都听闻了,肯定也传到了拜占庭。同时代的拜占庭历史学家席摩喀塔撰写“中国记”时,肯定就会问中国是哪个国家,有见闻的商旅肯定会告诉席摩喀塔,说这个国家大家都叫“桃花石(大汉)”,但最新的消息传来,好像读“桃花石(大汉)”是读错了,应该读作“唐家”。
席摩喀塔听了旅人的说法后,想了想,他觉得应该用新的读法,但旧的读法也不能遗弃,于是就有了Taugast陶格司。
2、后突厥汗国的古突厥文(转拉丁文拼写):
见于《阙特勤碑》《毗伽可汗碑》《暾欲谷碑》
这个源于大汉,见上文。
3、阿拉伯帝国的阿拉伯文(转拉丁文拼写):Tamgama
读作“唐格马”,见于阿拉伯帝国历史学家马苏迪(公元十世纪)的《黄金草原》。来源不明,没人探源,我根本不懂阿拉伯语的一根毛,没法拉开胡扯。
3、喀喇汗王朝的阿拉伯文(转拉丁文拼写):Tavghaq
见于《突厥语大辞典》。
突厥语大辞典的作者马赫穆德·喀什噶里是一个读过很多阿拉伯书籍的大学者。而阿拉伯人称呼中国,有两个称呼,要么称为“隋尼(秦尼即支那在阿拉伯帝国时因为知道了隋朝后的音转)”,要么称为“唐格马”。马赫穆德·喀什噶里的历史概念基本全来源于阿拉伯文献,所以他可能会受到拜占庭拼写、阿拉伯拼写和古突厥读音的三重影响。
4、伽色尼帝国的塔吉克文或阿拉伯文(转拉丁文拼写):Tamghaq
这个源于比鲁尼(973-1048)的著作,具体是哪本书我实在记不得了。这个读音似乎依然是拜占庭拼写的影响。
5、叙利亚的阿拉伯文(转拉丁文拼写):Tughaj
读作“图格基”,见于十四世纪的叙利亚学者阿伯儿肥达的《地理书》。该书内容多摘取比鲁尼的著作。这个了解不深,仅仅列入。
6、帖木儿帝国时期的波斯文和察合台突厥文(转拉丁文拼写):Taugas
见于帖木儿帝国时期所有文献,此称呼带歧视,因为此时桃花石读音发生音变,和突厥语中的野猪(Tonguz即通古斯)谐音。所以帖木儿帝国在尊称中国时,称为“契丹(Khata)”;蔑称时,称为“陶格斯(Taugas)”。这个读音完全是拜占庭读音的影响,因为如果按照古突厥碑文的读音和《突厥语大辞典》的读音,无论如何也是和突厥语的“野猪”没法谐音的。
然后到了结论时候了。
我认为,每一个词汇,都是随着不同年代不同语言而发生微妙变化的。比如最简单的例子,就是汉语中的“维吾尔”,从“袁纥”“回纥”“回鹘”“畏兀儿”“维吾尔”甚至“尧熬儿(裕固)”“裕固”都是一个词,但即便用古汉语来解读,这些字眼依然读音无法吻合。幸好我们早就知道这是一个词而已。
再比如,中国的另一个称呼“契丹”,也有不同的拼写,读起来也都各有微妙的不同。
这都是不同年代不同语言拼写的变化。
所以我认为,桃花石这个词,在不同年代不同语言,会发生相应变化。
这个词最初的词源是“尊敬的大汉”,是匈奴人(大致是南匈奴)对汉朝的称呼。
到了北魏时期,由于北魏皇族是拓跋氏,所以这个读音会在北方民族中融入“拓跋”的一些微妙转变。
到了唐初,该读音发生流变。西域地区的人,目睹了中国朝代兴亡,所以依然用老的读音“桃花石”。而西域之外更遥远的地方的人,如拜占庭人,则因为听到了“唐家”,有意做了修改,出现了“陶格斯”的读音。
到了辽朝以后,原本把中国叫“桃花石”的人群(北亚人、西域人)都慢慢管中国叫“契丹”了,“桃花石”的读音虽然还存在但慢慢消逝。而“陶格斯”的读音慢慢抬头,最终影响了一部分“桃花石”读音的人群,所以就出现了同样是突厥语人群,后突厥汗国叫“桃花石”跟野猪的读音没关系,但帖木儿帝国却读“陶格斯”和野猪谐音。
因此,在帖木儿帝国,就有了谐音辱骂明成祖的一个新名词“契丹国的野猪皇帝”。其实说白了就是故意用谐音误读的“契丹国的桃花石皇帝”。
而“桃花石”的读音,其实是匈奴语的“尊敬的大汉”之后,不断补充不断微调的结果,是一个多源头的词汇。