东亚南洋语言历史文化圈假说(二)
李葆嘉
1990年,法国沙加尔论证了汉语南岛语同源说。
依据白保罗的台语单音节是音节脱落结果的观点,认为汉语的单音节词和南岛语的多音节词的末一音节对应。汉语的声调和南岛语的辅音韵尾对应:原始南岛语的-s韵尾和上古汉语去声-agh、-idh、-adh对应;原始南岛语的-p、-t、-k的和上古汉语入声-p、-t、-k对应。汉语辅音聚合关系和南岛语的对应:上古汉语的不送气清塞音、送气清塞音、浊塞音的对立,相当于原始南岛语的清塞音、鼻冠清塞音、浊塞音的对立。汉语介音与南岛语中缀的相近:上古汉语的介音-j-和-r-是具有构词作用的中缀,和原始南岛语中缀-in-、-ar-相近。已经发现的汉语和南岛语关系词有222个
,其中17个见于斯瓦迪斯词表。
谢飞(1955)曾提出:汉藏语和Athapqskan语配比的词根,与汉藏语和南亚语配比的词根完全不同,这是否表明汉藏语系是否实际上是两种更原始的语系:太平洋语系和南亚语系的某种混合物呢?伊万诺娃(1970)认为把汉藏语系、孟高棉语系和马来—玻里尼西亚语系联合成一个太平洋语系的理论,现在既没有可能创立但也不必拒绝。在汉语南岛同源论提出以后,邢公畹(1991)和郑张尚芳随即表示支持,提出包括汉语、藏缅语、侗台语、苗瑶语、南岛语和南亚语的华澳语系说。
(六)汉语—藏缅语—高加索语同源说
汉语—藏缅语—北高加索语同源说,也称之为汉—蒙语系说。1853年,霍奇森(B .H .Hodgson)在《论汉藏语和蒙古语的亲属关系》中,对汉藏语和高加索语亲属关系的论证做过尝试。1939年,波达(K . Bouda)的《苏美尔语与巴斯克语、西高加索语以及藏语的关系》一文继续探讨了这一问题,因此西方的一些学者认为存在一个“汉—蒙语系”。1995年,俄国学者斯大罗丝汀(S. Starostin)在《上古汉语词表:一次历史的透视》通过35个基本词汇的比较,得出汉语和藏缅语24个同源、和北高加索语13个同源、和南岛语4个同源的结果,推断汉语和藏缅语关系最密切,其次是与北高加索—叶尼塞语。斯大罗丝汀提出南岛语和台语的关系相当于汉藏语和北高加索语的关系,因此汉语南岛语同源说必须放弃。
(七)苗瑶语系属的歧异
苗瑶语系属大致有三种假说。1.孟高棉语族说。英国戴维斯(H.R.Dawies)在《云南:印度和扬子江的链环》(1909)提出此说。他还认为孟高棉语(不包括蒙达语的南亚语)、掸语、汉语和藏缅语有共同的起源。2.澳泰语系说。白保罗(1942)认为苗瑶语属于澳泰语系,但有所存疑。与之相似的是雅洪托夫(1964)认为苗瑶语与孟高棉语族关系密切,属于澳斯特利语系。3.汉藏语系说。王辅世《苗瑶语的系属问题初探》(1986)中,批评了戴维斯和白保罗的缺陷,从同源词和类型学的相似性确定苗瑶语属于汉藏语系,但对属于什么语族或是否独立为语族却未明确。
(八)白语系属的歧异
白语的系属大致有五种假说。1.孟高棉语族说。戴维斯在《云南:印度和扬子江的链环》中通过对一百个词的分析,得出汉语源42个、藏缅语源33个、孟高棉语源23个、掸语源2个。依据现代白语地区没有孟高棉语,推定这23个必定是白语的原词。2.混合语说。李澡在《大理县志稿.方言》(1916)中认为白语是固有蛮音从宋元以后与彝语混合,又受到明初吴越一带迁来的汉族居民语言影响的混合语。罗常培的《语言学在云南》也主张白语为“夷汉混合语”说。徐嘉瑞《民家语新诂》中认为白语是汉语和白蛮语的混合,当归入汉藏语系,别列语族。徐将“民家”考释为“名家”,其实“民”是汉藏人的自称。3.藏缅语族说。闻宥《民家语中同义词之研究》(1940)批评了戴维斯的白语孟高棉语族说,认为白语中最古的成分是藏缅语言,至于孟高棉语的成分简直没有。李方桂早年(1937)曾经认为白语属于彝语支,但晚年
——————————
L. Sagart: Chinese and Austronesian are Genetically Related, 23rd International Conference on Sino-Tibetan languages and Linguistics, 1990, U.S.A.
(1980)认为白语受到汉语的强烈影响,系属值得怀疑。周耀文的《略论白语的系属问题》(1978)认为属于藏缅语族的一个单一语支。赵衍荪在《白语的系属问题》(1982)中同意白语属于彝语支。4.上古汉语方言说。三十年代,白族学者赵韬父《白文考》认为白语中保留大量周秦汉语“雅言”词汇,属于在汉代以前就形成的汉语方言,后来受到与之杂处的其他民族语言的影响成为白语。张海秋认为白族的“言语声音,实能保存三代以来之古语古音”。5.汉白语族说。白保罗(1942)的汉藏语分类把白语归入汉语族。郑张尚芳在《汉语和亲属语同源词根词及附缀成分比较上的择对问题》(1995)中认为白语属于汉白语族,在《白语是汉白语族的一支独立语言》(1999)中论证了“汉白语族”假说。吴安其在《藏缅语的分类和白语的归属》(2000)中认为,白语在语音、语法和核心词的构成上与彝缅语比较接近,词汇上与汉语的相近是借用造成的,从语音和语序的历史看,白语应是彝缅语的一支。实行古氐羌人习俗火葬的白族这一藏缅支系到达滇西北可能是战国至汉,其习俗不同于分布在洱海的较早从四川进入云南的古藏缅“昆明人”和滇池一带的“滇人”。但是,既然白族远祖是古氐羌人的一支,那么与来源复杂且与藏语同源的汉语之间的同源关系就是存在的。问题是要使 “汉白语族”成立,就必须证明白语是什么时期从华夏语中分化出来的。
(九)阿尔泰假说和阿尔泰语系
阿尔泰假说问题可以说就是阿尔泰语系假说的问题。迄今为止,围绕阿尔泰假说问题仍然有许多争议。焦点就在于是否承认阿尔泰语系的存在,或者说阿尔泰语诸语言之间是亲属还是借贷关系。第一个注意到突厥、蒙古、通古斯语言之间存在相似性的是瑞典冯.斯特来林贝尔格(Von Stralingberg),在18世纪上半叶提出分为六个语群的“塔塔尔诸语言”假说。一个世纪以后,拉斯克重新命名为斯泰基诸语言,并将其中的语言做了调整。由于阿尔泰诸语言是粘着结构,因而这一特征一度成为判断是否与之相关的语言的主要原则。马克斯.缪勒将暹罗语、藏语、拉德维达语、马来语也扩大进来,称之为“都兰诸语言”。M.A.卡斯特林(M.A. Kastling)认为语言同源的本质是词素的一致性,只有乌戈尔—芬兰语、萨莫耶德语、突厥语、蒙古语、通古斯—满语才构成相关语群,现通常分为乌拉尔语群和阿尔泰语群。兰铁司(G.J. Ramstedt)在《阿尔泰语言学导论》中,确立了原始朝鲜语、原始突厥语、原始蒙古语、原始通古斯—满语的阿尔泰语系四种方言说,并建立了许多语音对应关系。
不接受阿尔泰假说的学者主要有两类:一类学者并不否认阿尔泰假说,但认为证据尚不充分;一类学者认为阿尔泰假说不能成立,把阿尔泰语中的这些共同成分解释为接触的结果。虽然阿尔泰假说的理论尚不完善,但迄今为止,反对者并没有提出使语言学家能够接受的、足以否定这一假说的充分证据。之所以有学者不接受阿尔泰假说,一方面,是因为谱系树模式或“语系”说的禁锢。以严格的印欧语系眼光来看世界语言,符合“语系”的除了印欧语系,可能就是闪含语系。狭隘的“语系”说禁锢了欧洲学者的眼界,认识不到——不同的生态环境和经济方式决定了语言的发展方式。在早期语网的基础上逐步分化,又随着游牧经济相互借贷词语的阿尔泰诸语言,确实不可能也无须具有印欧语系那么严格的词语对应规则和明显的分化层次。以游牧经济为基础的语言,结构类型的相似性应是衡量这类语言的亲缘关系的标准之一。依据元音和谐规则、粘着结构类型和部分基本词语对应,可以认为阿尔泰诸语言是以原始语网和相互借贷词语为基础的亲属语言。至于阿尔泰诸语言的内部关系,比如原始突厥语和原始蒙古语的关系、突厥人何时迁至西域、突厥人和西域土著的关系等,还值得深入探讨。一方面,西域地区的土著居民是雅利安人种,当地曾经存在过四种印欧语;另一方面,与蒙古人的草原文化有所不同,突厥人是西域地区的“绿洲文化”。
(十)东亚南洋语言文化圈假说
1990年,李葆嘉提出“华夏汉语混成发生论”。稍后,在《中国语的历史和历史的中国语》(1996)进一步提出“东亚南洋语言文化圈假说”,这一语言文化圈包括澳台语(日本语、朝鲜语、南岛语、侗台语)、南亚语(南亚语、越南语、苗瑶语)、汉语(南方汉语、北方汉语)、藏缅语(彝语、藏语、缅语、景颇语、羌语)和阿尔泰语(通古斯语、蒙古语、突厥语)。又在《语言关系类型学:对谱系树模式的超越》中提出涵盖谱系树模式的世界语言关系类型的四分法。
二、东亚南洋语言文化圈的史前渊源
根据近30年来的考古学成就,中国境内的旧石器遗存和新石器文化的中心并非仅在黄河流域,反之,多种考古文化的冲突交汇才形成了后来居上的中原文化。虽然考古学界最近宣布,1997年在河北南庄头出土的陶片、石器、角器以及谷物这些一万年前的新石器文化遗存,东亚制陶史的开端提前了3000年,但仍然没有证据说明这就是东亚新石器文化的原始母体,同期的考古文化就有江南的溧水神仙洞遗存。黄河流域汉藏南岛综合体或单一的新石器文化母体可能并不存在,东亚南洋新石器文化母体更有可能存在长江流域和黄河流域两个源头。在讨论了若干预设的基础上,才有可能探索东亚语言的史前渊源,以建构东亚南洋语言文化圈假说。
(一)东亚南洋语言文化圈假说的若干预设
1.夏娃理论和蒙古人种的形成
依据生物分子学的研究和考古文化的印证,现代人或新人起源于距今15—12万年之际的东非大草原。欧洲科学家依据线粒体DNA特征研究的分组结果,推测现代欧洲人的99%是由大约在4.5万年之际先后来到欧洲的七位女性祖先繁衍而来,并提出欧罗巴人种的“白化”在距今3万年之际。由此可以旁推,蒙古利亚人种也应形成于距今3万年前,东亚大陆的原始居民应是在这之前即距今4万年之际从中东地区迁来的。
2.采集狩猎经济型的连锁语网
俄国民族学家托尔斯托夫曾经提出“原始语言连锁扩散性假说”,澳大利亚的土著语之间很难找出明确界限,因而形成了扩散网络,可以推定新旧石器时代之交“原始语网”说。由于人类新石器革命进程的不平衡和生态环境所导致的自然经济方式的不同,致使世界语言呈现游牧型语系、农耕型语区、采集狩猎语网和渔猎型语珠等四种语言关系类型。在东亚大陆南部、东南亚以及南岛这一广袤区域,直至公元以后,一些地区还处于新石器时代早期,甚至依然停留在旧石器,与印欧语的语系式分布状态不同,语网关系成为这一区域的语言分布特征。欧洲学者并非全然没有觉察到这一状况。本维尼斯特(E. Benveniste )认为:在远东“存在着从藏语到缅甸语,再到怒江语群诸语言,其后到孟高棉语,最后到大洋州诸语言的逐步过渡。这些语群中的每一语群都不可能界定得清晰,每一语群都有其特点。其中一些特点使它与前一语群衔接,而另一些特点则使它与后一个语群衔接……。植物学家很熟悉这种‘连锁血缘’,也许只有这种类型的分类法才是我们现在构拟的这一范围内的一些大语群的唯一合适的分类方法。”
面对东亚南部区域的语言复杂性,可以设想,在新石器时代早期,原始南方语仍然是以由若干个语链组成的原始语网。
3.语言亲缘关系的历史性质
正如安德罗诺夫所说:“从语言本质的自然主义理解,留下的所谓一个语系内部诸语言的亲属关系不可能永久性的和最初性的,而是带有历史性的——它是逐渐形成的,同样也能逐渐衰弱以致消失。”
语言亲属关系的历史性观点揭示了语言关系的动态性,从而指明了语言亲属关系的认定只能以某一时期内的存在为依据。从理论上说,可以把这一上限确定为新石器时代的开端但实难统一,因为各地部落文化进入新石器时代的先后不同,借助推测早期语言同源或接触的新石器时代文化遗存的分布不平衡。依据东亚大陆的考古文化系统,一般只能追溯到距今7000年左右。
——————————————
转引自伊万诺娃《论台语及其在发生学分类法中的地位》。
马伯乐认为:“古代汉族文化与泰族、彝族、苗族文化之间有那么多的共同之点和显著的相似现象,以致令人不由自主地产生了所有这些民族在史前时期就存在共同文化的想法。有过这样的文化共同是确定无疑的,它可以用汉、藏、彝、暹罗等语言中的大量亲缘关系词得到证实,比方说在所有这些语言中都有共同的数词。虽然不能根据这些相似形式就遽然断言,这些语言一定是亲属语言,但是这些词语可以表明:这些民族的语言和文化在史前时期就已经彼此发生了深刻的影响。也许它们不存在语言的亲属关系,可是明显地具有文化的亲属关系。”
既然这些民族的语言文化在史前时期就彼此发生了深刻影响,因此如果限定在某一个阶段,它们之间就具有某种程度的亲缘关系。亲缘关系的长河中,存在可追溯的“同源亲缘”,也存在本非同源的“接触亲缘”;反之,存在本非亲缘的“真性异源”,也难免亲缘泯灭的“假性异源”。
4.语言亲缘标准的综合性质
对于东亚地区语言结构的相似性,一些欧洲学者强调不是起源的共同性,而是接触渗透的趋同性。奥德里古尔(1961)认为:“在结构中的相似性足以论证语言在发生学上的亲属关系时,认为有可能把东南亚语言地图的复杂性简化为二分法,使汉藏诸语言与南亚诸语言相对立……吴克德曾经试图使这些语言的关系互相靠拢。现在既然强调语言邻接的意义及其最终的表现——双重语言制,就不那么倾向于否定结构借用的可能性了,用二分法或单一性简化语言地图是不能令人信服的……。按照这一假设
,除明显的现象以外,东南亚各种不同的语言区域在发生学上彼此间没有联系。”
此外,张琨(1969)、马提索夫(1973)和白保罗(1976)等,也同样认为类型学标准,特别是声调不足以证明同源关系。
也许,因为汉语的声调也可能是后起的,因此声调和词音单音节性确实不能作为同源的证据。尽管受汉语的影响,侗台语和苗瑶语等语言的结构类型发生了转换,但是仍然不能以语言接触中的“结构借用可能性”否认发生学上的“语言结构相似性”。如果史前语言的亲缘关系和结构类型不具有一致性,那么就无法讨论语言的同源。这一亲缘关系和结构类型的一致性,至今在许多关系语言之间还可以看到。所谓语言的同源,包括根词同源和结构同源两个方面。依据本维尼斯特“在史前时期就已经按照类型相似组成语言集团的话,那么从历史的观点来看,我们觉得类型的相似性似乎是发生学上的亲属关系的一个证据”
的观点,那么与他另提出的 “语言结构类似不能成为语言同源证据”不免互相矛盾,也就是说后者不具备历史语言学理论的普遍意义。
无论像中国学者为维护“汉藏语系四分说”所坚持的语言结构的稳定性(同构标准),还是像外国学者坚持把基本词汇的对应作为唯一标准(同源标准),其实都是无的放矢。在语言接触过程中,语言的任何要素从来不存在绝对的稳定性,问题在于接触的方式和深度。虽然结构类型的相似性可能出于长期影响,但基本词汇也并非不可能大量借用。依据语言的无界接触观,语言中的任何成分都可以渗透和借贷,不但结构类型和音系格局可以借贷,就是核心词汇可也以借贷。西方历史比较语言学所标榜的“语音对应规则”,除了可以作为语言同源的证据,也可能是语言趋同的结果。语言接触中最活跃的要素词语,其语音结构特征会对接触语言的个别音位乃至音系格局发生影响,其语义结构方式会对接触语言的语法范畴乃至结构类型发生影响。随着语言接触的深入,语言的任何要素都可能发生变化即丧失其稳定性。因此语言亲缘关系的认定标准,应当是音系格局、结构类型、基本词汇以及文化特征、历史追溯的综合标准。
——————————————
转引自伊万诺娃《论台语及其在发生学分类法中的地位》。
根据上下文是指“区域接触性借用假说”。
5.同源词和借源词的历时相对性
词语的相似性有同源和借用两种可能。所谓“同源”,应当包括新石器时期以来的语系分化和旧石器时代的语网延展两种情况下的同源。虽然连锁型语网关系是东亚南洋某些语言地区域至今仍然可见的基本特征,但是不可否认新石器时代强势文明的形成促使某些地区的连锁型语网向同化型语区方向的演变趋势。随着强势文明的形成发展,其语言文化因子必然会向周边扩散,从而促使接触语言的或少或多的同化进程。由于东亚地区语网关系和文化扩散的交叉性,致使同源词和借贷词的区别变得非常复杂,最后不得不以“关系词”来指代“语词的相似性”。但是前代的借用可能成为后代的同源,二者只是不同历史层次上的关系词,因此相互之间没有绝对的界限。由于年代久远的早期借用和可能同源之间的界限趋于泯灭。当语言成分借贷到达一定程度,借贷双方也就成为亲属语言。最全面的借用也就是语言的换用。较长历史时期的持续借用和较短历史时期的迅速换用,只是过程长短不同而实质无别。因此无论是借用和换用,还是渗透和混合,都没有截然的界限。
6.语言混合是深刻接触的自然结果
以往的中国语言学界,谈到语言融合也只是所谓同化,或斯大林主张的胜利者的 “吃掉”,而根本没有想到通过混合会产生一种新的语言。在人类历史上,语言的混合是若干语言长期接触的必然结果。语言接触必然导致语言要素的渗透以致混合,而对于混合过程中的语言来说根本不存在什么最稳定的要素。在渗透较弱和层次清楚的两种语言接触的情况下,可以根据其主流特征确定其归属关系;在混合深刻和层次复杂的多种语言接触的情况下,唯一明智的选择就是确定为混合语,揭示其“基础源语”和“混入源语”。对于这种混合语,到底是新语种的产生还是原语言的演变,这不是一个语言学问题而是一个民族学或文化学的问题。语种的质的规定性,绝不等于语言的差异度,而是取决于语主的文化心理的认同度。两种差别迥然的语言,由于文化心理的一致认同可以确定为一种语言;而两种差别微殊的语言,由于文化心理的拒绝认同则必须确定为不同语言。
语言的历史是语主的历史,语言的演变是语主的演变。从来不存在脱离语主的语言系统内部自身的自发演变,封闭社会的语言的变化几乎停滞说明了这一现象,而语主的变化可以说是一个耗散结构。一方面,由移民引起的语言历史分化,可以使方言演变成为亲属语言。另一方面,由移民引起的语主局部嬗变,也可以通过语言换用使所换用语言发生重大变化而成为一种方言。因此,语言演变是移民交融和语言接触的历史投影。
语言系统是人类文化系统中与其他子系统密切相关的的一个子系统。史前语言学既为“史前”,就不可能像现代语言学那样具有丰富的语料。以已有的各类语料为基础,采取语言学、考古学、历史学、遗传学、民族学、社会学和相关学科的综合性研究方法,是探索语言史前状态的唯一途径。
(二)东亚南洋语言文化圈假说的史前构想
根据人类学和考古学的研究,人类在距今5—4万年发生巨大突变,从体质上的现代人逐步转变成为心智上的现代人。可以选择这一关键点,作为建构东亚—南洋语言文化圈史前语言史的起点。距近4—5万年前,作为起源于新人的原始居民从中东出发,经过伊朗高原分别从南北两个方向进入东亚大陆。这些进入东亚大陆的新人,身材矮小且皮肤黝黑,和现代蒙古利亚人种不完全相同。北支从帕米尔高原向东进入黄河流域与大漠南北,然后继续向北,乃至经过白令海峡陆桥进入北美,逐步演化为东亚种群和北亚种群的新蒙古利亚人种,以及北极种群和印地安种群。其中东亚种群成为黄河流域居民的祖先,北亚种群成为大漠南北居民的祖先。
南支从印度次大陆
,经由东南亚再进入南中国沿海和长江流域的成为蒙古利亚人南亚种群,继续向东南进入大洋州的成为澳大利亚人种。其中南亚种群的北支 ——江淮类型成为长江流域居民的祖先,南亚种群的南支成为岭南—湄公河—恒河地区居民的祖先。如果汉藏语和印欧语确实存在发生学关系或一些远古同源词,除了可能源于最初欧亚人种的分化,就是分化后的文化扩散的借词。蒲立本认为印欧语和汉藏语的分化在6000年前的说法之所以不能苟同,其理由就是人种体质类型在距今3万年形成,虽然不排除东亚现代人并非一次性迁徙,可能是一波波迁徙而来,但是没有遗传学证据表明白种人从欧洲来到东亚后再转变为黄种人。
越过白令海峡进入北美的印地安种群,成为说印地安语言的祖先。滞留在北极圈沿海附近的“海上游牧民族”的北极种群,成为说北亚细亚语的祖先,北亚原始语链的破裂而形成离散性语珠。东亚北部原始居民所说语言即原始北方语言。留居中国北方和蒙古、南西伯利亚一带的北亚先民,进入新石器时代以后,所说的语言逐步形成分布在大漠草原的原始阿尔泰语群,后来陆续向北方、西北、东北方向远徙。在黄河中上游的东亚人种所说的语言成为原始藏缅语群,后来分为三支:留在黄河中上游的北支成为氐羌语;进入缅甸的南支成为缅甸语;由川康进入西藏高原的西南支成为喜马拉雅语。东亚大陆南部原始居民所说的语言即原始南方语。进入新石器时期以后,不晚于距今7000年前,存在着北支江淮(南岛)语群和南支南亚(孟高棉)语群。南支南亚语群分布于恒河流域、湄公河流域、马六甲-尼科巴- 苏门答腊以及云贵高原,后分化为蒙达语群、孟高棉语群和苗瑶语群。北支江淮语群,一部分沿江越淮迁到山东—辽东—朝鲜半岛,渡海到达日本列岛,在这一范围内形成东夷语群。一部分留居在长江以南的鄱阳湖—太湖流域,演变为百越语群(侗台语群)。一部分迁往南洋群岛甚至以远,演变为南岛语群(印尼语群)。
虽然中国原居民都是蒙古利亚人种,但是根据GM单倍型频率却可以分为南北两大类型,北方人群中GMag单倍型频率较高,在0.29-0.54之间,南方人群仅在0.03-0.25之间;与之相反,北方人群中GMafb单倍型频率较低,仅在0.08-0.39之间,南方人群却高达0.46-0.81。南北两大类型的地理分界线在北纬30度即长江一带
。与之一致,东亚大陆南北两支语言文化的显著区别是:作为基本词汇,北部叫水流为“河”,而南部叫水流为 “江”;作为句法结构,北部语言为OV、AN的逆行结构,南部语言为VO、NA的顺行结构,但粘着结构却是其共同的原始特征。借助考古文化系统研究的成果,以中国境内三大考古文化系统的形成为座标,可以为东亚新石器时代的远古语言概貌的考察找到了一个相对支点。在三大考古文化系统的形成之前,南方是原始采集—狩猎演变而来的迁移型原始农耕经济,而后在一些地区又形成定居型发达农耕经济;北方是原始采集—狩猎演变而来的半农半牧型混合经济,而后在一些地区又形成专门的游牧经济。依据澳大利亚土著语言关系的性质可以推定,在东亚大陆早期农牧社会出现之前或原始采集—狩猎经济方式下的语言状况为连锁性原始语网,而农牧化引起的迁徙则是促使连锁性语网逐步分裂或重组的历史条件。南亚语、南岛语、藏缅语和阿尔泰语的部分底层相似性,也许正源于此种连锁性原始语网。
公元前5000年左右,三大考古文化系统的形成标志着青莲岗、仰韶、北方三大太古语区的形成,三大语区的共同特征是语言结构都是原始粘着型。由于中原地区得天独厚,多种语言文化的冲突交融促使原始华夏语的混成发生,因此包容着不同历史层次的孑遗。斯大罗丝丁之所以认为汉语和藏缅语关系最密切,其次是与北高加索—叶尼塞语,而和南岛语关系较远,就是因为依据的是氐羌化的周秦语料。沙加尔之所以认为汉语和南岛语同源,是因为利用的是搜集了许多南方词语的《集韵》,而《集韵》中搜集的用汉字书写的百越语或汉语东南方言词,正与南岛语的词具有对应关系。
白保罗认为台语与汉语词汇近似而与印尼语相差甚远,是上古汉语向澳泰语借词而后又贷词给澳泰语的结果,其前提——澳泰人的文化技术比北方华夏人发达——没有考古学证据。罗美珍的大陆台语先民换用原始汉藏语而残留着原始马来语底层的假说和倪大白的台语“马来—支那语”假说,都隐含着台语是历史混合语的潜台词,而问题在于:台语先民是什么时间换用原始汉藏语?是什么条件引发了百越先民的语言换用或接受渗透?雅洪托夫提出,4世纪以后中原居民的大量南迁促使侗台语先民的语言转型或语言混合。作为中介将台语和印尼语联系起来的加岱语群,其中拉嘉语等在越南境内,黎语处于台语和南岛语之间,正好填补了台语和南岛语推移的中间环节。同样,关于苗瑶语是属于南亚语还是藏缅语的分歧,正好表明苗瑶语处于南亚语和藏缅语的中间性质。加岱语和苗瑶语的过渡性正是语言接触渗透的产物。雅洪托夫依据台语、加岱语与印尼语一致的词语在斯瓦迪斯表中只有15个,推定其亲属关系比台语和加岱语之间,甚至比汉语和藏缅语族之间的关系都要远得多,以证明加岱语支并不存在。这一结论的不周之处是,既没有考虑语言渗透所引起的词衰减变量,更没有设想语原始网状态下的语言歧异因素。以单纯的语言分化论和封闭的语言年代学方法,也只能够得出这样的不尽符合语言历史的结论。
——————————————
据研究,印度次大陆的土著是被从北方来的达罗毗荼人赶入偏僻丛林的说南亚蒙达等语言的原始居民,后来达罗毗荼人又被从伊朗高原来的雅利安人向南方驱赶。
张余善编著《中国人口地理》,商务印书馆1997年。