补充强调一些信息:
原回答:
如果从现有的迹象来看,某种或某类与南岛-仡台(Austro-Tai,通译“澳泰”)相关的语言的可能性相对大一些。
首先需要注意的是,一个地区的遗传连续性(genetic continuity)未必是成立的。因此,在没有相关的古代样本的情况下,使用一个地区现代人群的遗传结构直接逆推出同一地区数千年前的遗传结构,是存在着一定风险的。
既然是考古文化与语言相关性的问题,那么有历史语言学和考古学的证据自然是最好的。同时,现代人基因组外加古DNA的模式,也可以重构古代人群的迁徙历史,而这一方法已经成功运用在了重建印欧语人群历史上。
下面是一些线索:
以上线索均指向了华东沿海可能一度广泛分布着南岛-仡台语或与之相关的语言,而良渚文化则包含在这一范围内,甚至有可能是语言-文化-人群传播的一个中心。而同一时期,汉藏语的中心使用者更有可能是西北地区以小米种植为主的农业群体(Zhang, Yan et al., 2019; Sagart et al., 2019)。同时,考虑到同一时期长江-水稻农业群体的二分格局,作为沿海中心的良渚文化使用某种形式的南岛-仡台语的可能性相对较高,但未必是后期已经分化的南岛语或仡台语。
当然,更直接的证据则需要良渚全基因组古DNA样本的发表与研究了。
然后是关于南岛-仡台假说的问题:
判断语言同源,亦即语言之间具有谱系关系(genetic/genealogical relationship)的通用标准是是否具有足够多的词汇(越基本越好)有系统的、非偶然的音位-语义对应关系(即comparative method)。这些音位或语义未必是相同的,但却是需要成对对应的,因为只有这样才能以较高的置信度排除掉偶然相似,亦或是非同源语言后期接触导致的相似。而与词汇相比,文化词、音系、语法等特征则更容易受后期语言接触的影响,这些特征的相似则更不容易分辨是起源上的同源还是接触所导致的相似。相应的语言集合可以称为语言联盟(Sprachbund),但却不是严格意义上的、具有谱系关系的语系。
在这样的标准下,只由汉语族和藏缅语族组成的、狭义的汉藏语系(Sino-Tibetan)/跨喜马拉雅语系(Trans-Himalayan)是一个公认的、具有谱系关系的语系。但是,不论是阿尔泰“语系”,还是“传统”意义上的、囊括了苗瑶语和仡台语的“汉藏语”,这些分类关系在早期被提出的时候糅杂了大量音系与文化词水平的近期借用导致的相似性作为论据,因此在谱系关系的意义下,目前并不被广泛地接受,这和“国内”还是“国外”无关,而和观点的新与旧有关。
南岛语与仡台语相互之间的同源关系的置信度虽然还没达到公认的谱系关系的程度,但是其同源关系的论证是遵循严格的comparative method的。尤其在受汉语影响较小的仡佬语(Kra)当中,可以更明显地看出和南岛语的系统对应关系。
最后,厘清同源关系可靠与否,绝非没有意义,反而对确定不同语言间是否存在共享的、可重构的早期历史(如是否起源于同一地区,早期的使用者是否是具有相似文化特征的、同质化的人群)来说,是至关重要的。
先上结论。从基因、驯化动植物类型来看,良渚先民所操语言大概率不属于“汉藏语系”,很可能与今天的“南岛语系”接近,但良渚先民的直系后裔基本全然融入吴方言为主的汉语族群。
1、基因
汉语族群Y染色体单倍群主要如下类别
O1a-M119:全世界只有两个高频分布地区,中国东南沿海,以及台湾原住民等南岛语系族群;
O2-M268: 汉族中5%以上;
O2a-M95:华南、南方少数民族、中南半岛及印度Munda人群分布较多
O2b-M176:最主要集中於朝鲜半岛、朝鲜族和日本弥生人,越南和汉族也有少量分布
O3-M122:中国最常见的单倍群,遍及整个东亚和东南亚,占汉族50 – 60%左右;其中子类型O3a3c1-M117是“汉藏语系”的特征类型,在语系内的汉语、藏语、缅甸语中均高频分布;O3a3b-M7是苗族的特征类型,汉族中也有5%以下的分布;
由目前公开资料可得,良渚先民Y染色体几乎全为O1a-M119,不存在汉语所在“汉藏语系”特征类型O3a3c1-M117。因此良渚先民使用汉语或其亲缘语言的概率几乎为零,而与南岛语系可能存在某种联系。因为现代南岛语系的直系先民大约于公元前3000年(几乎与良渚文明同期)登陆台湾,并在之后四千年里席卷大洋。
2、驯化作物类型
商周之际,中原的主要作物是“稷”,即“粢米”。“稷”是黄河流域独立驯化出来的农作物,作为“五谷”之长而备受推崇,也是三代诸夏的主食,后来被小麦、稻谷所取代。而良渚文明上承河姆渡,主要作物是“稻谷”,即“大米”。
黄河流域、长江流域几乎在同时,各自独立地演化出两套作物体系。
而良渚人的堂兄弟“南岛语系”先民,征服岛屿原住民的利器,是猪、鸡、狗等驯化动物,没有稻谷(南岛语系的祖源地是台湾,明郑之前的台湾原住民不会种植稻谷)。似乎暗示,早在河姆渡文明(约公元前5000年)之前,环太湖族群与南岛族群已经分离,两者不存在直接的继承关系,而并列存在。
而台湾是南岛语系祖源地的主要依据是,台湾原住民所操南岛诸语具有极高的多样性。
综上,良渚先民所操语言大概率不属于“汉藏语系”,但良渚先民的直系后裔基本全然融入吴方言为主的汉语族群。