Paternal Genetic Affinity between Western Austronesians and Daic Populations
Li Hui, Wen Bo, Chen Shu-Juo, Su Bing, Pramoonjago Patcharin, Liu Yangfan, Pan Shangling, Qin Zhendong, Liu Wenhong, Cheng Xu, Yang Ningning, Li Xin, Tran Dinhbinh, Lu Daru, Hsu Mutsu, Deka Ranjan, Marzuki Sangkot, Tan Chia-Chen, Jin Li (2008)
英文原作下载:http://li-hui.net/Documents/A41.pdf ,以下是我的节选翻译。
南岛西部人群和壮侗人群父系的紧密遗传关系
摘要
背景:南岛语是在东南亚、大洋州和印度洋地区扩展最广的语系。以他们语言的相似性为基础,这个语系包括了马来-波利尼西亚和台湾土著语。语言上的相似性还导致了有争议的台湾是南岛语原乡的假说,在民族学家、语言学家、考古学家和遗传学家中都有争论。普遍公认东部南岛语人(密克罗尼西亚人和波利尼西亚人)源自西部南岛语人(东南亚岛屿和台湾原住民),而且大陆上的壮侗族群则被假定为所有南岛语人的源头。
结果:在报告中,我们研究了30个中国壮侗族群,23个印度尼西亚和越南的马来-波利尼西亚族群,共1509个Y染色体的非重组区的20个SNP位点和7个STR位点。这三个群体在父系遗传谱系方面显示出许多共同之处,混合分析证实了壮侗族群在遗传方面几乎未受中国汉族影响,而且构成了印尼人的遗传的主体。O1a*在大部分族群的样本中高发,而在其他语系族群中十分少见。,O1a*单倍群的网络图解释了印尼人的世系并非如语言学研究结果的那样源自台湾原住民,而是来自壮侗族群。
结论:我们发现,与台湾原乡假说相反,东南亚岛屿族群在父系遗传谱系上并非台湾起源。另外,我们的还发现台湾原住民和印尼人在父系上很可能都源自壮侗族群。这两支人群似乎都经历了独立发展的过程,我们的研究结果显示遗传上支持一个包括台湾原住民、壮侗族群和马来--波利尼西亚族群在内的大族群。
结果
为确定壮侗人群和南岛西部人群的遗传关系,我,我们测定了23个东南亚岛屿族群和11个台湾原住族群(群体所在地见图1,族群信息见表1),1509个Y染色体的非重组区的20个单核苷酸多态性位点和7个短串重复序列位点。本次研究囊括了几乎全部中国壮侗族群和台湾原住族群的样本。
另外,现已完成了对包括所有东亚和东南亚语言集团在内的134个东亚族群SNP位点定义单倍群的主成分(PC)分析。结果显示语其他东亚和东南亚群体相比,壮侗人群最为接近西部南岛族群(图2),表明壮侗人群和西部南岛族群有很近的遗传关系。壮侗-东南亚-台湾集团从其他种群中的分异与主成分2有高度相关性(详见附件1)。此外,O1a-M119是台湾原住民的优势单倍群(平均77%),检测值从54%至100%不等(见表2,O1a*和O1a2之和),但其他东亚族群中则不然(<5%)。因此,预计O1a-M119能为勾画壮侗族群和西部南岛人群的关系提供丰富的信息。
图2中的主成分图显示一些壮侗族群接近汉藏族群的簇。可能是因为壮侗族群和汉藏族群有共同的祖先,可能导致他们在遗传上有相似之处。然而,对此也可以有另一种解释,就是东亚大陆上的壮侗族群在遗传上可能受到过中国汉族的影响,因为他们从2500年前就开始比邻而居。混合分析可以评估假定现代壮侗人群的壮侗或汉族祖先的比例,而一些被隔离的壮侗族群可以作为混合分析中的父系族群。海南的原住族群(黎族、加茂人和仡隆人)和台湾原住岛民可以假定为相对孤立的,因为他们的文化很少受到大陆上的外来文化的影响。所以,在遗传结构上这些原住岛民可能很类似于壮侗祖先。
为评估假定的大陆壮侗族群中的汉族遗传影响,我们将大陆壮侗族群、海南原住民、台湾原住民和中国汉族的Y-SNP数据应用于混合分析中。为了分析,我们将后3个群体合起来视为大陆壮侗族群的父系群体。结果显示海南原住民的遗传贡献非高(2.145±0.927),然而中国汉族(-0.314±0.422) 和台湾原住民(-0.831±0.662)的贡献几乎没有。这里的ADMIX程序算出的遗传贡献负值暗示对现代壮侗族群没有贡献的可能。这个结果显示壮侗族群的父系遗传谱系是相当清晰的,壮侗人群与西部南岛人群之间的遗传关系几乎未受族群混杂的影响。
东南亚岛屿族群可能也是混合的。在我们的研究中,假设东南亚岛民在父系遗传上是是三个群体的混合:壮侗人群、台湾原住民,以及很接近巴布亚人的巽他群岛土著居民。我们完成了印度尼西亚人的混合分析,并在分析中加入了从文献中得到的巴布亚人数据作为父系族群结构之一。我们的分析显示如下的混合比例:壮侗群体(0.713±0.124),台湾(0.143±0.125)和巴布亚人 (0.144±0.050),表明壮侗祖先对印尼人的父系遗传贡献是最强势的。在这些数据中存在一些不确定性,因为我们关于东南亚岛民是混血的假设是无法得到检验的。
正如O1a*是壮侗和西部南岛人群最具特色的单倍群,我们使用O1a*个体的7个STR位点评估了壮侗人群、印尼人和台湾原住民之间的遗传距离,(遗传距离见图3,STR原始数据见附件2)。我们的研究显示台湾和印尼族群之间遗传距离是最大的,几乎差不多是壮侗群体和台湾原住民遗传距离的3倍。壮侗群体和印尼人之间的遗传距离很接近壮侗人群和台湾原住民的距离。这些发现表明印尼人和台湾原住民在遗传上都与壮侗族群的更接近,超过了这两个西部南岛群体之间的距离。此外,在O1a*个体的7个STR位点上的多态性在壮侗语人中比在印尼人和原住民中更高发(图3)。多态性最高的族群未必总是最古老的,也可能是与周边族群混血的结果。但是,壮侗语人O1a*单倍群较高的多态性应该是族群年代最古老造成的,因为这种单倍群在周边人群中几乎不存在,所以不是混血导致了更高的多态性。我们所取得多态性和分歧时间结果显示,壮侗人群很可能是印尼人和台湾原住民父系遗传世系上的祖先群体。其他的Y单倍群(如O3-M122、O2a-M95)也呈现与O1a*相似的图谱,显示壮侗人群与印尼人和台湾人的遗传距离比后两个族群之间的距离更接近(表3)。有趣的是O2a甚至可能进一步追溯到南亚语人群,正如近期研究所提出的观点。
我们用三个人群O1a*个体的7个STR突变位点构建了中接网络(图3)。假如东南亚岛民的台湾原乡假说(THH)是真的,也就是说东南亚岛屿个体来源于台湾原住民,那么网络中的东南亚世系和台湾世系就应该有共享节点和(或者)连线。在图3中,壮侗世系(绿色节点)构成了网络的中心。所有的东南亚世系(黄色节点)和台湾原住民世系(蓝色节点)直接或是间接地共享或连接着壮侗世系。相反地,没有台湾世系(除了一个)分享或者连接到东南亚世系的节点。这些发现表明东南亚岛民并非直接源自台湾原住民,而应该是东南亚岛民和台湾原住民各自独立地起源于壮侗群体。
我们进一步注意网络中那些与东南亚世系相连的壮侗族群世系。有趣的是,大部分与东南亚相连的壮侗单倍型不是来自海南,就是来自海南西北面的广西(图3中带深绿外圈的绿色节点)。这些海南和广西族群均位于北部湾周边区域(即东京湾,Gulf of Tonkin)。特别是越南南部的属于马来-波利尼西亚族群的占人(cham),以及海南的回辉(Tsat),可以看到他们在网络中联系着壮侗人群和印尼人。所以我们假设东南亚岛屿族群起源于北部湾周边地区,他们穿过印支半岛到马来半岛向南迁徙,而后再扩散到太平洋和印度洋的大部分岛屿。
我们估算了网络中O1a*单倍群的年代。总体年代是33765±5221年,与末次冰期相吻合。网络中所有壮侗系样本的年代是33193±5577年,与O1a*的总体年代很接近。由于台湾与壮侗的单倍型大范围交叠,很难估计台湾簇的真实年代。有些交叠表明发生过从壮侗族群到台湾原住族群的多次移民。我们估计网络中左侧那个台湾簇的有14659±3110年。所有台湾样本的总体年代估值为21268±3148年。有趣的是,后面这个年代值很接近台湾已发现的最早的人类遗存,即左镇人。由此我们推断O1a*个体从大陆向台湾岛的移民出现在旧石器时代。
由于在网络中可以观察到两个清晰明确的东南亚岛屿单倍型的簇,我们计算了两者的年代。左边的东南亚簇的年代是9895±2393年,可是右边的簇却达25880±7137年。语言学上对马来—波利尼西亚语的起源年代的估计比我们的估值要年轻得多,大约5000-6000年前。此外还可发现在网络中到壮侗单倍型和东南亚岛屿单倍型有一些交叠,说明在东南亚人脱离壮侗祖先群体向外移民过程中可能发生过瓶颈效应。地理学上的瓶颈效应可能来自狭窄越南海岸。所以O1a*单倍群很可能在马来—波利尼西亚语7500年产生之前由此向东南亚岛屿扩散。但是晚近时期O1a个体向东南亚岛屿移民的可能性是不能忽视的,因为遗传学时间估计的精度不足以排除这种可能性。
应当注意的是,在“特别快车”假说中存在两种不同的角度:(1)移民的起源,也就是台湾原乡说,以及(2)移民模式,也就是从印尼开始的快速扩散。在研究中,为验证台湾原乡说,我们检测了先前研究中很少涉及的包括壮侗语人和东南亚岛民在内的西部南岛人群。我们发现台湾不象是东南亚印尼人的原乡,至少不是其父系主体世系的故乡。尽管台湾原住民和印尼人都源自壮侗人群,但两者父系主体世系并非单一起源表明其分化是相互独立的事件。
有意思的是,我们的研究表明家猪在东南亚群岛和太平洋地区的分布与西部南岛族群分布基本一致。台湾及远到密克罗尼西亚的家猪都直接来源于东亚大陆,而那些东南亚群岛和波利尼西亚的家猪是来自印支半岛。假设家猪是被人类群体在早期迁徙中引入的,那就意味着人类同样可以顺着这两条的路线抵达东南亚和太平洋岛屿。
事实上我们的检测结果与澳泰语群单一起源理论相一致,澳泰语群由壮侗语、马来—波利尼西亚语和台湾土著语组成。我们的检测结果表明,在这次研究加入壮侗人群和东南亚岛屿人群对研究南岛人群的起源是绝对必要的。如果不加入这些群体,波利尼西亚和台湾原住民会显得相互十分接近,从而导出所有南岛人都是起源于台湾的结论。
我们的结果表明北部湾极有可能是东南亚岛屿族群的原乡。鉴于人类群体从印尼东部向太平洋岛屿移民过程的复杂性,以及西部和东部南岛人群在遗传方面的显著区别,我们在研究中没有选择波利尼西亚的数据。作为替代,我们只分析了西部南岛群体。波利尼西亚族群缺少O1a-M119的事实是令人好奇的,而且不能简单地以瓶颈效应来给出波利尼西亚人Y染色体单倍型表现出高多态性的原因。
与我们对父系遗传谱系的发现相一致,对马来半岛群体的线粒体DNA研究也表明,大约在末次冰期(Last Glacial Maximum)时原始马来人的祖先居住在印支半岛。后来这支祖先群体经由马来半岛扩散到东南亚岛屿。对东南亚岛屿人群的mtDNA研究也表明,即使发生过一次南岛语人从台湾的移民,在人口统计学上也是一个次要的事件。
我们的大部分结论都是基于对O1a*的分析,一个在这些族群Y染色体谱系中只占少部分的单倍群。O1a*谱系的频率在台湾族群中显著高发,不过在马来—波利尼西亚人和壮侗人群中并不特别多。一些族群事件可能还涉及到其他的Y染色体谱系。有其他次要的、不同来源的父系谱系也很正常,比如说南岛群体到来之前的印尼土著族群,还有更晚近来自南亚的移民。东亚和东南亚人之间遗传关系的复杂程度超出了我们的预料。
结论
我们的结果显示,在父系遗传谱系上壮侗人群比其他东亚民族群体更接近西部南岛族群。O1a-M119是壮侗族群和西部南岛族群中主要的Y染色体单倍群,其STR多态性表明西部南岛的两个群体——台湾原住民和东南亚岛屿土著,各自独立地起源于壮侗群体。因此,东南亚岛屿族群很可能起源于北部湾地区——壮侗民族的原乡,然后经越南走廊迁徙至印度尼西亚。与此相反,台湾原住民族是从中国大陆直接移民。我们的研究结果表明从遗传上可以推断出一个包括台湾原住人群、壮侗族群和马来—波利尼西亚人在内的大群体。