设为首页收藏本站

僚人家园

 找回密码
 注册

QQ登录

只需一步,快速开始

点击进入授权页面

只需一步,快速开始

扫一扫,访问微社区

搜索
查看: 2859|回复: 3
打印 上一主题 下一主题

[分享][转帖]世界民族的语言

[复制链接]

32

主题

1

听众

4706

积分

铜鼓精灵

Rank: 11Rank: 11Rank: 11Rank: 11Rank: 11Rank: 11Rank: 11Rank: 11Rank: 11Rank: 11Rank: 11

最后登录
2013-6-24
注册时间
2006-2-2
跳转到指定楼层
楼主
发表于 2006-5-26 23:02:00 |只看该作者 |倒序浏览

世界民族的语言

来源:湘里妹子学术论坛-www.xlmz.net-2003
  作者:centralplain
  

世界上主要的大语系中:印欧语系占世界人口的比例为48%;汉藏语系占25%;尼日尔-刚果语系占6%;亚非语系占5%;马来亚-玻利尼西亚语系占5%;德拉维达语系(达罗毗荼语系)占3%;阿尔泰语系(含日语-朝鲜语)占5%。还包括几种“人造语言”,如世界语Esperanto(属于印欧语系)。
  单是汉语就占了20%的人口,加上英语、西班牙语、印地语、俄语就达到了45%;再加上阿拉伯语、日语、孟加拉语、葡萄牙语、德语、意大利语、法语能达到60%;再加十来种语言就增加到75%……可以想象,最后5%的人口一定讲着上千种语言:美洲的印地安人中有一千多种语言、非洲有近一千种语言、巴布亚新几内亚这一个岛上就有七百多种、印度有一百五十多种、前苏联境内有一百三、中国境内有好几十……
  语言学和人类学、历史学紧密相联,互为影响借鉴;语言和文字有联系,但是相对独立,同种语言可用不同文字,反之亦然;汉语文字的表意特性保持了语言(乃至民族)的统一性;汉语形声字的引入使它走向拼音文字以外的另一条道路,这有利有弊;现代汉语已经不再增字而是增词表意,这是汉语向拼音文字转化的一个早期迹象;文字的简化有利于它的普及,从而促进文明的进步;拼音文字是最易于普及的文字,但其通行性受到读音的牵制;语言的发展趋势总是小语种让位于大语种,大语种的广泛分布又逐渐形成新的语种。
  
  
  
  第一部分 诸多小语系
  
  一、非洲
  
  撒哈拉以南的黑非洲语言分为尼日尔-刚果语系(Niger-Congo)、乍得-尼罗语系(Chari-Nile)、科依散(Khoisan)、其他两个小语系。
  其中最大的一个语系要数尼日尔-刚果语系,有二亿多人口,接近非洲人口的一半。尼日尔-刚果语系分为5个亚语系:大西洋亚语系、沃尔特亚语系、几内亚亚语系、豪萨亚语系和班图亚语系。 大西洋亚语系包括沃洛夫语(主要在塞内加尔)、富拉尼语(几内亚、塞内加尔、马里)、曼丁戈语(马里、几内亚)、桑海语(马里、尼日尔)。 沃尔特亚语系分布在黑沃尔特河流域,以莫西语为主。几内亚亚语系的分布从利比里亚开始,到尼日利亚的沿几内亚湾一带地区。 豪萨亚语系分布于尼日利亚的北部。
  班图亚语系的分布地区最大,沿赤道两边向南延伸。其主要语言有尼日利亚东部的蒂夫语、喀麦隆-加蓬的芳语、扎伊尔-刚果的芒戈语、巴特克语、巴鲁巴语、安哥拉的姆本达语、坦桑尼亚-肯尼亚的斯瓦希里语、赞比亚的本巴语、津巴布韦的绍纳语、莫桑比克的马夸语、南非的祖鲁语。 其中主要是东非的斯瓦希里语,原用阿拉伯字母,现采用拉丁字母,该语言早先是由阿拉伯奴隶贩子发展起来的。
  语言学研究的结果表明,持班图语言的民族最开始是发源于二千多年前的喀麦隆,也就是班图语言区的最西北角。可能是因为他们从近东地区学会了种植某种农作物后,由于这种作物的适应性,他们随之逐渐朝东,南迁移,最终布满了由此往南的整个非洲大陆。 班图语言中最重要的语种是斯瓦西里语(Swahili),它现在已成为东非最通行的语言,坦桑尼亚和肯尼亚更以它作为官方语言。
  科依散语系是黑非洲最古老的语言,曾经是非洲分布很广的语言,由于班图语的扩散,该语言退缩到现在的地方。 该语的特征是语音带有由啧舌形成的吸气音,属于该语系的有布什曼语与霍屯督语,使用人口各有10多万人。布什曼语分布于纳米比亚、博茨瓦纳、安哥拉交界处,卡拉哈里沙漠地带;霍屯督语分布在纳米比亚沿海纳米布沙漠地区。
  乍得-尼罗语系(尼罗-撒哈拉语系)的分布从苏丹南部、肯尼亚西部和乌干达北部向西沿中非和扎伊尔交界处,直到乍得南部、喀麦隆东北部与尼日利亚东北部。
  在南非共和国,白人讲的语言叫“阿非利肯斯语”(Afrikaans),这是十七世纪的荷兰殖民者带来的,由于好几个世纪的分离,它已经和荷兰语有了不小的差别;黑人讲的语言主要是祖鲁语(Zulu)和科萨语(Xhosa),科萨语受附近的一个小语系影响,有一种非常难发的“倒吸气”音。
  
  二、德拉维达(达罗毗图)语系
  
  北部语族包括库鲁克语(奥拉昂语)﹑布拉会语(布拉休依语)﹑马尔托语;中部语族包括泰卢固语﹑贡迪语(冈迪语);南部语族包括泰米尔语﹑坎纳达语(卡纳雷语)﹑马拉雅拉姆语﹑图卢语、库依语。
  
  三、亚-非语系Afro-Asiatic
  
  也叫闪米特-含米特语系Hamito-Semitic,简称闪含语系,这名字取自圣经中诺亚的两个儿子,一个叫shem,一个叫ham。亚非语系包括五个语族:①闪米特诸语言,内含阿拉伯语、希伯来语、马耳他语、古叙利亚语﹑阿姆哈拉语﹑提格雷语﹑提格里尼亚语﹑阿拉米语﹑古拉格语﹑哈拉里语﹑吉兹语、埃塞俄比亚北部的安哈拉语;②柏柏尔诸语言,含摩洛哥、阿尔及利亚等国家讲的同族语言;③库施特诸语言主要通行于埃塞俄比亚和索马里;④埃及语族最初系指古埃及语,但是现在以科普特语为代表;⑤图阿雷格语分布在阿尔及
  利亚、马里、尼日尔三国交界处。 乍得的豪萨语有人说属于尼日尔-刚果语系。 亚非语系分布区不仅是世界上最古老文明的发源地,起源于那里的拼音文字,更是当今世界上大多数主要文字的鼻祖。
  阿拉伯语是将近二十个国家的国语,另外全世界的穆斯林都多少懂几句阿拉伯语,这使它在1974年成了联合国的第六种工作语言。它的字母系统更是被许多其它语系的语言所采用。它的文字保留了几个古代拼音文字的特点:从右到左的书写,以及只有辅音字母没有元音字母。还有一个现象是一个字母在词中的位置不同,写法也不一样。如果你在用X窗口的电脑,可以试试看把编辑器的字体设置成阿拉伯文的字母,再看看把同一个字母放在词中间与放在词尾,形状是否一样。你不需要懂得阿拉伯语就能看得出来。
  阿拉伯文共有二十八个字母,都表示辅音。由于它们都写成草体连书,所以看上去一串串的,好象看不出一个个独立的字母。那元音呢?你可能还注意到在这些弯弯曲曲的连续曲线的上下还有不少小点点和短线条什么的,那就是元音! 不幸的是,他们阿拉伯人在书写一般文字时,是省略掉这些元音的,只有在小学课本和给外国人看的读物上才注上元音。
  举个例子,要写“solid”这个词,他们大概会写作“dls”(别忘了是从右往左写),那你就很难猜这是个什么词了……
  阿拉伯文的古老特点是与近、中东文字的起源演变相联系的。古埃及和“两河流域”是世界上最先出现文字的地方,也是拼音字母的发源地。 大约在五千五百年以前,埃及就出现了文字和书写的纸草。约公元前3100年上下埃及统一,统一后的埃及开始有文字记录可考(这比我国开始有文字记载早了1700年)。最早的文字是图形文字,后来有些文字逐渐变成音节符号和指意符号,其后又有了一音一符的字母,共二十四个。所有字母都只标辅音不标元音。各种符号组成词组,共有六百多个词组。经历这些发展的古埃及文字,是用字母、音符、词组组成的一种复合文字。到第八王朝(公元前2200)时期出现了一种草书体,到中王朝(公元前2000-1700年)时草书体已广泛流行,只有正式文体和铭刻才用象形体。
  所谓纸草是下埃及产的一种植物,将其茎干剖为长条后,彼此排齐连成片,然后压平晒干成纸。这种纸草后来成为古代地中海地区一种通用的纸,希腊人、罗马人以及往后的阿拉伯人都曾用它书写。(这不能算是“正式的纸”,“正式的纸”必须等到三千年后由中国发明)
  早在5500年前差不多与埃及人同时,生活在幼发拉底河与底格里斯河的苏美尔人sumerian也有了自己的文字。他们最早的文字也是图形符号,一符一义。以后发展为表音符号和指意符号,一起组成词组。自从有了表音和指义符号,字符孳乳增繁的倾向减少,到了4300年前,字符减少到了六百以下,其中约有一百个是表示音节的符号,但是没有单独表示辅音的符号。这种文字用削尖的芦杆、骨棒等刻写在泥版上,晒干或烘干后成为可以长期保存的文书,有一些保存到了现在,并被释读成功。芦杆刻成的笔划,起划粗而深,收划细而浅,形如楔形,因而得名“楔形文字”。
  楔形文字后来成为近东各国外交的通用文字,一直到先进的腓尼基拼音文字的“传人”阿拉美文aramaic流行以后才逐渐弃而不用。阿拉美文在近东各国的通行到了公元七世纪阿拉伯的伊斯兰文化兴盛时,又让位于阿拉伯文,直到今日。
  腓尼基拼音文字是怎样发明的?腓尼基人在公元前1500年时居住在现在的以色列-黎巴嫩一带。当时埃及和两河流域的文字早就有一部分发展为音节符号,埃及文字还由此出现标示辅音的二十四个字母。但是两种文字中都有好几百个字符,埃及文字还保持象形体,结构复杂,使用不便。地处使用这两种文字的人之间的腓尼基人受到它们的共同影响,取埃及文的辅音符号而摈弃其象形体,发明出了二十二个辅音字母。从此文字不再为祭司所垄断,从而避免了玛雅文化那样的命运。
  与此同时的希腊人,正彷徨于早期从埃及学来的象形-表音混合文字中,到了公元前一千年时,腓尼基文字传入希腊,他们马上放弃了原有的文字,并且又在此基础上进一步发明了元音字母,世界上第一套完整的拼音文字终于诞生了。
  腓尼基人的字母系统,是对人类文明的重大贡献。 拼音文字的优点在于它的普及性。一般来讲,学会二三十个字母,就能见字读音。文字越复杂,掌握的人就越少,这对于社会文明的进步非常不利。就文字的复杂程度而言,以象形文字为最,其次为表意文字,形声字又次之,拼音文字最简单。到了现在信息时代,拼音文字因其一维的表达方式又有了一个新的优势(至少目前如此,以后的变化未可知也)。
  但同时,拼音文字也有一个大问题,就是许多拼音文字,由于千百年来口语的不断变化,它的书面文字与读音往往相去甚远。拿法语来说,它的书面语言表达的还是四、五百年以前的发音,不发音的元音彼彼皆是,象hommes读为um、aiment读为em。
  
  四、伊比利亚-高加索语系(高加索语系)
  
  高加索语系分以下几类:南语族的格鲁吉亚语言(包括格鲁吉亚语、明格列尔语、斯万语、拉兹语[土耳其境内]);西语族的卡巴尔达语[库班和上德列克盆地]、塞卡西亚语、阿迪格语、阿布哈兹语、阿巴齐尼亚语; 东语族的维纳喀语言(包括车臣语、印古什语、巴茨语);达吉斯坦语族的阿瓦尔语、莱兹金语、达尔金语、拉克语、塔巴萨兰语。
  在印欧语传入到欧洲以前,欧洲流行的语言在今天仍被保存下来的只有巴斯克语。它现在只分布在西班牙北部与法国西南相连的比利牛斯山地区,使用的人有100多万。山区的闭塞环境使这种语言得以保存。 巴斯克语勉强能分到伊比利亚-高加索语系里面,但有人把它勉强划为印欧语系。
  有人说伊比利亚-高加索语系与乌拉尔-阿尔泰语系有亲缘关系,待考。
  
  五、澳洲语系
  
  所谓澳大利亚语言,当然是指土著居民的语言,白种人自然是讲英语。今天的澳大利亚土著只剩下数万人,可是他们仍在讲数百种语言!澳大利亚本地的哺乳动物都是非常原始的有袋类,离进化到人类还差十万八千里。当地土著是新石器时代某个时候从马来亚--印度尼西亚渡海而来,可这还没有找到足够的语言学方面的证据支持。今天,许多当地的语言都面临绝灭,可怜它们作为历史的遗迹只在英语中留下了象kangaroo、koala等少数几个词汇。
  巴布亚新几内亚的三百多万人说着五、六百种语言,这给独立后的政府提出了很大的难题:不可能找到一种当地语言作为官方语言来发号施令。所幸的是,在几百年的殖民统治以后,当地土著居民发明了一种叫“洋泾浜英语”的交流工具,它取得了官方语言的地位。
  “洋泾浜”是俗称,正式的称呼是皮钦英语(Pidgin English)。“洋泾浜”一词来自上海原来的一条河,就是现在的延安路。当时在上海英租界也有自己的“洋泾浜英语”,“假洋鬼子”们常说“let me see see”(让我看看)或“not can do”(不能做)这样不伦不类的话。所谓皮钦语言就是指一种外来语言被当地人大大地简化了语法和词汇以后用作交流工具,这种现象在不少殖民地都有。巴布亚新几内亚的皮钦英语约有1500个词和非常简单的语法,这使它很容易学会。而且许多词汇还是由一些更基本的词汇组成的复合词,如ho
  use cook意为“厨房”,house sick意为“医院”,house paper意为“办公室”等等。另外belong变成了一个常用词,仅表示of的意思,如“glass belong look-look”意为“镜子”,smoke belong ground意为“灰尘”,“light belong cloud意为“闪电”,“man belong long-way place意为“外国人”……。但是,你可不要以为凭自己的英语可以去那儿独闯天下----他们不会听懂你的英语,你也读不懂他们的“英语”,因为毕竟语法和词汇都有许多变化。
  
  
  第二部分 印欧语系
  
  一、简述
  
  印欧语系是世界上最大的语系,覆盖了欧洲、美洲、亚洲-澳洲的很大一部分。它包括两种伟大的古典语言:古希腊语和拉丁语;包括象法语、意大利语、西班牙语一类的罗曼语族;包括象英语、德语、荷兰语(在比利时也叫佛兰芒语Flemish)、瑞典语一类的日耳曼语族;包括象俄语、波兰语、捷克语、塞尔维亚-克罗地亚语一类的斯拉夫语族;包括象威尔士语和盖尔语(Gaelic,在苏格兰和爱尔兰)这样的塞尔特Celtic语族[高卢人是凯尔特人,但是被罗马入侵后逐渐改说拉丁语,日尔曼异族征服法国后继续使用拉丁语];包括巴尔的Baltic诸语言;包括波斯语、印地语、孟加拉语一类的印地语言。
  接下来我们可能会问:原始的印欧人生活在什么年代?是从何处“发迹”的?现在找不到原始印欧人留下的任何“书面材料”,因为人类使用语言的历史远比使用文字的历史久远。所以,最好的办法就是分析他们的语言。我们可以假定如果一个词在大多数印欧语言中都很相似,那就是一个他们已有的概念;反之就可以认为那是一个后来才知道的概念:这就是语言学重现“化石语言”所用的方法。
  最原始的印欧人是库尔干人(Kwrgan),居住在里海北部靠近伏尔加河的草原地区。他们饲养的家畜有马、牛、羊、狗,他们知道的野生动物有狼和熊,他们知道的金属可能只有铜。许多人认为马和战车使他们在征战中能取得很大优势从而扩展到后来的辽阔地域。
  一般认为原始印欧文明起自于公元前3000年的东欧某地(里海北岸),大约在公元前2500年它分裂了,人们离开故乡分好几路向四面八方迁移。其中一路到了希腊,另一路到了意大利(这两路分别是古希腊和古罗马文化的起源)。另一路穿过中欧一直到达不列颠诸岛(他们是高卢人、苏格兰人、威尔士人、爱尔兰人的祖先)。还有一路北上到了俄国,同时又有一路跨过伊朗、阿富汗最终到了印度。他们每到一处,就征服或同化当地的土著,把自己的语言传播到那里。应该说他们是一个出色的民族。
  
  印欧语言之间究竟有多象?印欧语言与非印欧语言的差别有多大?看看几个“基本词汇” 之间的比较:
  威尔士语 mis mam newydd nos tri
  德语 Monat Mutter neu Nase drei
  瑞典语 ma^nad moder ny na"sa tre
  英语 month mother new nose three
  法语 mois me`re nouveau nez trois
  西班牙语 mes madre nuevo nariz tres
  意大利语 mese madre nuovo notte tre
  俄语 mesyats mat' novy nos tri
  希腊语 men meter neos rhis treis
  波斯语 mah madar nau bini se
  梵语 mas matar nava nas trayas
  芬兰语 kuukausi a"iti uusi nena" kolme
  匈牙利语 ho'nap anya u'j orr ha'rom
  土耳其语 ay anne yeni burun u"c,
  
  
  二、印欧语系日尔曼语组(Germanic)
  
  此语组包括英语、西日尔曼语、北日尔曼语和东日尔曼语4部分。
  
  1)西日尔曼语
  虽然此分支在起源上属于同一语组,但后来已演化成2个分支,即高地日尔曼语和低地日尔曼语。高地指德国南部的山地,低地指北部的低地。英语也是低地日尔曼人所说的语言,后来由于他们迁往英格兰,经演化而成英语。低地日尔曼语包括旧萨克逊语(Old Saxon)、旧弗兰科语(Old Low Franconia)、阿非利堪斯语、旧弗里西亚语(Old Prisian)、依地语﹑卢森堡语等。旧萨克逊语是那些没有迁往英国而留在原处的萨克逊人说的语言,它是今天低地德语的主要成分,是现代德国北部人说的现代德语方言。旧弗兰科语是现代荷兰语和比利时北部弗兰芒语的基础,阿非利肯斯语是南非白人说的荷兰语,而弗里西亚语只是荷兰东北部少数人所说的语言。依地语和卢森堡语都是在德语基础上发展起来的。高地德语成为现在标准德语的基础。
  
  2)北日尔曼语
  北日尔曼语是斯堪的纳维亚人所说的语言,其中包括瑞典语、丹麦语、挪威语、冰岛语。原来,这些语言是相同的,起源于古代斯堪的纳维亚语(Old Norse)。在10世纪以后,由于人口的迁移和政治形成了不同的国家而带来了语言上的分化。冰岛语与其他3种语言在地理位置上相距较远,所以比起其他日尔曼语来,变化较小。
  
  3)东日尔曼语
  这种语言在历史上存在过,但现在已经灭绝。这种语言是公元3世纪时,住在欧洲东部和北部的哥德(哥特)人用的语言。到16世纪时,说这种语言的哥德人住在俄国的克里米亚。由于受到政治控制的影响,哥德人的后代使用其他语言,而这种语言就消失了。可见,一种语言的空间分布是衡量一个文化集团命运的尺子。如果该文化集团兴旺发达,则其使用的语言就会在地理范围上不断扩大,反之,则会缩小,甚至终于灭绝。
  
  4)英语
  是当今世界事实上的国际社交语言。从使用人口来说,以英语为母语的人数仅次于汉语而居世界第二位,有四亿多人。然而以英语作为第二语言,或者在一定程度上使用英语的人数,要远比这多得多,说分布在世界的各个角落、各个民族,在这一点上汉语是望尘莫及的。它是怎样发展起来的?
  公元前3000年,伊比利亚人(Iberi-ans)从地中海地区抵达大不列颠岛定居,带去新石器文化,征服了原地的旧石器人。 英伦三岛的第一批印欧居民是塞尔特人。塞尔特人是古印欧人的一支,公元前2500年离开他们在东欧的故乡向西迁移,在公元前1000年时,他们成了德国南部,阿尔卑斯山北麓的一个强大民族。在公元前500年左右,他们开始向西迁移,后来到了英伦诸岛。这就是印欧人的第一次“入侵”。塞尔特(Celt)中的c可以读如s或k,所以也叫“凯尔特”,美国人中有许多来自苏格兰和爱尔兰,所谓的“美国腔”可能是凯尔特口音。波士顿有个著名的球队叫“凯尔特人队”。 在现今英语中,只在一些地名和河流名称方面还保留着凯尔特语的词汇成分。例如the Tha-mes、the Cam、the Dee、the Avon等均为凯尔特人命名的河流。在Dumcombe、Winchcombe、Cumberland等地名中,也可以看到凯尔特语Cumb(深谷)一词成分。Kent、Dover等地名也为凯尔特语成分。
  印欧人的第二次入侵是在公元450年,当时生活在现在的德国和丹麦交界处有两个部落,一个是石勒苏益格(Schleswig)的盎格鲁(Angles),另一个是霍尔施坦因(Holstein)的萨克森(Saxon)。石勒苏益格/霍尔施坦因现在是德国最北面的两个州,是第一次世界大战时德国从丹麦那里“取得”的。这两个部落从那里跨过北海,占据了英格兰,原来的塞尔特人很快地后退到爱尔兰、康瓦尔、威尔士、苏格兰高地。康瓦尔语早在17世纪时已经灭绝,爱尔兰语、威尔士语、苏格兰语仍然存在。
  盎格鲁、萨克森两个部落的方言随着社会的发展、逐渐融合,出现一种新的语言,即盎格鲁萨克逊语(Anglo-Saxon),这就是古英语。English一词就出自盎格鲁Angles,在古英语中Angle写作Engle,他们的语言叫做Englisc(在古英语中sc读如sh,如sceap读作sheep)。
  
  从8世纪末,日尔曼人的一支丹麦人(操斯堪的纳维亚语)开始侵袭英国,后来整族的人迁往,侵吞土地,并在英国东北部建立丹麦区,这种活动延续将近300年。因此,今天英国东北部地区大约有1400多个村镇的名称来自斯堪的纳维亚语。如Wood thorp(斯堪的纳维亚语中的thorp,相当于英语中的village)Althorp、Linthorp、Applethwaite、Braithwaite、
  Cowperthwaite(斯堪的纳维亚语thwaite等于英语an isolated piece of land)。此外,在英语的名词(如 bank、knife、scales)、形容词(happy、low、wrong)、动词(call、gasp)等基本词汇中留有斯堪的纳维亚语的成分。英语中的斯堪的那维亚词汇还有egg、cake、skin、leg、window、husband、sky、fellow、skill、anger、flat、ugly、odd、get、give、take、raise、die、they、their、them等。
  公元1066年,法国的诺曼蒂公爵侵入英国,并加冕为英国国王。诺曼蒂王朝一直延续到公元1154年。在此期间,英国实际上存在着3种语言:法语、拉丁语、英语。法语是官方、贵族及其他上层社会人士语言,学校、法庭也用法语。社会下层人士,即普通劳动者讲话用英语。拉丁语是教堂与宗教界人士使用的语言。
  由于罗马统治和法国统治,拉丁语在英国有过特殊的地位,拉丁语词汇大量进入英语。如angel、candle、cup、cheese、kitchen、kettle、mass、monk、pope、street、wine。在15与16世纪,欧洲进入文艺复兴,人文主义的兴起促进人们研究古代希腊、罗马文化,拉丁语词汇又开始涌进英语,如item、simile、memorandum等。
  虽然诺曼蒂王朝不到100年,可是法语在英国主导地位延续了约300年,这为英语带来了大量的法语词汇,这使得现代英语中存现大量的同义/近义词:shut/close、answer/reply、smell/odor、yearly/annual、ask/demand、room/chamber、wish/desire、might/power(英语词/法语词)。有一个有趣的现象是产肉的动物多是英语词,如ox(cow)、calf、sheep、swine、deer,而它们的肉则是法语词,如beef、veal、mutton、pork(bacon)、venison。 大概持法语的多为贵族统治者,只注意他们餐桌上的肉,并不在意牲畜们叫什么。
  这些外来语使英语成为一个表达力丰富的语言。尽管溶入了如此众多的“外来语”,古英语仍然构成了它的核心----不到5000的古英语单词一直保持到了今天。在此期间英语逐渐向高层发展,1399年继承王位的亨利四世是第一个以英语为母语的英国国王。在十四世纪快要结束的时候,乔叟(Chaucer)完成了《坎特伯雷的传说》(Canterbury Tale),以伦敦方言为代表的现代英语终于开始出现。
  
  5) 美国英语
  虽然美国与英国之间隔着辽阔的大西洋,影响两国人员的往来和语言的交流,于是两国英语差异逐渐增加。表现在三个方面,包括语音、拼法、词汇。
  词汇方面的差异主要是由于在美国的居民碰到许多在英国所没有的事物和现象引起的,这就需赋予以新的名词,如:moose(麋)、raccon(浣熊)、chipmunk(花栗鼠),这些都是来自印第安人的命名。又如canoe(独木舟)和sg-uash(南瓜)也来自印第安语。
  由于美国具有强烈的独立国家意识与感情,逐使拼法上产生分异。例如,在英语中honour和colour两个词中英国拼法u消除掉,变成honor和color,又如defence英语中的c用s来代替,而变成defense。
  在英国和美国在口语的语音上差异是十分明显的。从殖民者到达北美时候起,他们的对单词的读音上就开始与英国的不同。因为两地居民之间的直接联系仅限于文字和其他印刷品,而直接的对话比较少。
  美英二国英语之间的重要差别之一是对字母a和r的发音不同。例如,fast、path、half,这些词在英国英语中发音如father中的a,而不是man中的a。在英国英语中,除去在元音前,字母r是不发音的。因而,在英国英语中,lord发音为land。还有,在美国英语中,对弱音节的发音要清楚。例如,secretary和neces-sary在美国英语中有4个音节,而在英国英语中,则只有3个音节。 这种发音上的差别的形成还有历史上的原因。在早期殖民者于17世纪离开英国时,在英国字母a和r的发音与现在美国英语一样。可是在18世纪晚期,作为英国标准英语的南部方言出现了,而美国英语并没有像英国英语那样变化,致使两国英语的发音不同。
  在美国,英语的扩散过程中,由于历史的原因出现差异,终于形成不同的方言。在东部,原先的聚落沿大西洋岸延伸,形成13块殖民地。这些殖民地可以分成3组:即新英格兰、沿大西洋岸中部和南方。 历史上的移民来源不同,对今天东部方言起着决定性的作用。北部与中部方言分界线通过新泽西州中部与宾夕法尼亚州北部,南部与中部方言的界线是弗吉尼亚西部的山地。
  新英格兰是以马萨诸塞州为中心的美国东北地区,该地区定居的都是英格兰人,其中2/3来自英国东南部东安格利亚的清教徒,少数来自英格兰北部。
  南方的核心地区是弗吉尼亚,最早来自英格兰人,其中大约一半来自英格兰的西南部。早期到宾夕法尼亚州的移民是英格兰北部公谊会会员,接着是大量的苏格兰人和爱尔兰人定居于宾夕法尼亚州、新泽西州和特拉华州,此外,还有很多德国人、荷兰人、瑞典人。因此,沿大西洋岸中部的人说的语言与南、北方都不相同。
  有些词汇在一个方言区普遍使用,可是,在另两个的方言区却很少听到。这种情况,在乡村地区比较明显。在城市中由于人员的流动性大,所以不明显。例如,pail(农村提水用的水桶)是北方方言中常用的词汇,可是在另两个方言区却用bucket。对耕地旁边堆积的长条状石堆,在北方方言中称stone wall,在中部方言中称stone fence,在南方方言中称rock fance。在北方方言中小河称为brook,在中部称为run,在南部称为branch。在英格兰北
  部与苏格兰也用run。
  在西部地区,由于受东部3个方言区的人向西部进行移民活动的影响,其语言上也存在着差异。但是,因为西部地区移民来源不像东部那样具有明显的差异,加上美国人流动性大,所以就西部内部语言上的差异,比东部各地区间要小,彼此一致性则较东部大。
  
  三、印欧语系罗曼语组(Romance)
  在印欧语系中与日尔曼语组相匹敌的是罗曼语组,也称为拉丁语组。这种语言是由于古罗马人说的拉丁语发展而来的。
  拉丁语的传播与罗马城地位的提高有关。在公元2世纪罗马最盛时期,罗马帝国的疆域西达西班牙、北到不列颠群岛,南至非洲北部,东面经中东抵黑海。随着罗马军队在帝国各省的进驻,拉丁语也被传播到各个角落。而各省当地人所说的语言由于受到征服者语言的抑制而大大地削弱,甚至被消灭。 在罗马帝国灭亡以后,虽然拉丁语仍在一些地方继续使用,但其范围已大大缩小。在其他地方有的已恢复使用原来的语言,有的则被东方或北方说日尔曼语和斯拉夫语的民族所征服。
  在罗马帝国时期,拉丁语在各省也有不同。帝国各省经历了几百年的殖民与统治,各省所用的拉丁语以占领时期罗马军队所说的口语为基础。同时,各省的拉丁口语中由于引入许多当地原语言中的词汇而有了变化。所以各省所用的拉丁语词汇已不是标准的书面形式,而是一种被称作通俗拉丁语(vulgate Latin)的口语。vulgar这个词的意思即是指平民。驻防在帝国各地军队用的是通俗拉丁语,它在词汇上与文学上用的拉丁语不同。例如,在拉丁语中,文学上用的拉丁语的马是equus,英语中由此词转化为equine(马)和equestrain(骑马者)。可是,平民所用的通俗拉丁语中,马这个词是caballus。现代意大利语中的马则由此词转化为cavallo,在西班牙语中为caballo,在葡萄牙语中为cavalo,在法语中为cheval,在罗马尼亚语中为cal。在5世纪以后,罗马帝国崩溃,使先前各省与它的往来和联系中断,结果导致拉丁口语在各地区的差异增加。到8世纪,这种彼此的孤立终于使彼此的
  语言发生根本性变化。今天,拉丁语已成为过去的语言,除在一些宗教活动中与某些科学文献中使用外,已没有人使用这种语言,更没有人说这种语言。
  
  现代罗曼语主要有西班牙语、葡萄牙语、法语、意大利语、罗马尼亚语5个语种。这些语种在欧洲的分布与这些国家的国界大体是一致的。从地图上可以看出,西班牙和法国之间有比利牛斯山相隔;在意大利和法国之间有阿尔卑斯山阻挡;在意大利和罗马尼亚之间有斯拉夫语区。自然的和人文的阻隔使得语言处于孤立状态。随着时间的推进,语言发生变化。各罗曼语种并不是突然出现的。开始作为各省的方言出现,后来,随着民族和国家的发展,才出现标准的民族语言,所以法语、西班牙语等都是近期才逐渐形成的。
  
  1)法语
  法语是由法国北部的方言演变而来的。因为首都巴黎就在该区范围内,所以把这里的方言称为标准法语。从18世纪以后,巴黎法语由于巴黎在政治、经济和社会方面的领导地位而加速向外传播,遂在法国取得优势地位。
  法国的方言分南北两部分,北部方言被称作langue d'oil,南部的方言被称作langue d'oc。这两个词汇是由于表达所谓“是”的方式不同而产生的。罗曼语的“是”为hoc illudest,意思是“就是这样”,在南方,这个词汇被简化成hoc或oc(因为h不发音);在北方这个词被简化成o-il或oil即把hoc illud est的 hoc illud内h音消掉,并简化而成o-il,如果将这两个音节快读,就变成oil,同时又把最后 est的音也取消就成为oil。现在南方方言又称为普罗旺斯语。
  法语在非洲有相当影响。由于许多地方过去是法国殖民地,所以,在独立后,这20个国家多仍用法语作为官方语言。
  
  2)葡萄牙语和西班牙语
  由于其过去具有大片的殖民地,所以成为世界性语言。使用这两种语言的人80%在欧洲以外,主要是在中美洲(含墨西哥)和南美洲。因此,中美洲和南美洲又称为拉丁美洲。在拉丁美洲,以西班牙语作官方语言的就有18个国家。
  说葡萄牙语的在拉丁美洲只有巴西,其人口约占南美洲总人口的一半,它约等于葡萄牙本国人口的11倍。葡萄牙语成为南美洲东部的官方语言,西班牙语成为其他拉丁美洲的官方语言,是由于1494年在教皇仲裁下,签订托尔德西里雅斯条约,双方同意以西经46°作为分界线(即历史上有名的教皇子午线),此线以东地区归葡萄牙、以西归西班牙所造成的。
  西半球各地所用的西班牙语和葡萄牙语与欧洲用的有些差别。所以巴西与葡萄牙有一联合语言委员会,目的在于使其共同语言标准化。
  
  3)意大利语
  在欧洲与其国界几乎完全一致。在非洲只有索马里以意大利语作为官方语言
  。
  
  4)罗曼什语、加泰隆语和撒丁语
  罗曼什语分布在瑞士东部,用此种语言的只有2万多人,被列为瑞士4种官方语言之一。加泰隆语,也可作为西班牙语的一种方言,使用的人有600多万,分布在以巴塞罗纳城市为中心的西班牙东部。同时,该语言也是位于西班牙和法国之间的比利牛斯山中间的安道尔的官方语言。 撒丁语分布在意大利的撒丁岛上,是意大利语、西班牙语与阿拉伯语的混合物,亦是该岛的通用语言。
  瑞士位于日尔曼语与罗曼语两语组之间的过渡地区,其官方语言有德语(占总人口的69%)、法语(占21%)、意大利语(占10%)、罗曼什语(占1%)。该国尽管语言复杂,但人民能和平相处,具有强大的向心力。
  
  四、印欧语系斯拉夫语组(Slavic)
  
  该语组亦称波罗的-斯拉夫语组,一般可划分为东、西、南3语种。斯拉夫语实际上在17世纪才被确认,并随斯拉夫各民族的分离而出现分化。
  
  1)东斯拉夫语
  这个语种使用的人数最多,分布最广。东斯拉夫语主要指俄语,是苏联的主要语言,使用该语言的人有2亿多。第二次世界大战后,俄语的重要性有所提高,成为联合国使用的5种正式语言之一,在东欧,俄语是各国的第二语言。在前苏联,除俄语外,属于东斯拉夫语的还有乌克兰语、白俄罗斯语,前者使用的人数有4000多万,后者有900多万。
  
  2)西斯拉夫语
  这种语言主要有波兰语、捷克语、斯洛伐克语。捷克语和斯洛伐克语的官
  方语言,有时也被合称一种语言。
  
  3)南斯拉夫语
  这种语言包括保加利亚语、塞尔维亚语、克罗地亚语、斯洛文尼亚语、马
  其顿语。除保加利亚语是保加利亚的官方用语外,其余4种都是前南斯拉夫的官方语言。塞尔维亚语和克罗地亚语虽然前者用古斯拉夫字母,后者用拉丁字母,但这二者仍然十分相近,所以亦被认为是一种语言。在斯拉夫语中,各种语言与其他印欧语系的语言相比,差异比较小,所以这几种语言相互可以理解的部分比较多。
  
  五、印欧语系印度-伊朗语组(Indo-Iranian)
  
  此语组在印欧语系中使用的人数最多,包括100多个语种,使用人数超过9亿,分为东部印度-伊朗语和西部印度-伊朗语。
  东部印度-伊朗语包括-印地语(梵语后裔)、乌尔都语、孟加拉语、旁遮普语、马拉蒂语、古吉拉特语、比哈尔语、拉贾斯坦语、奥里亚语、阿萨姆语、克什米尔语、尼泊尔语、信德语、僧伽罗语、比利语、吉普赛语、马尔代夫语。
  巴基斯坦人主要用乌尔都语;在印度有1/3的人用印地语(梵语后裔),大都分布在印度北部。这两种语言十分接近,不过乌尔都语用阿拉伯字母,而印地语用印度自己的字母。如果把这两种语言当作一种语言,则其使用的人数占世界第三位。在孟加拉和印度东部的人说孟加拉语,人数超过1.3亿。在印度属于印欧语系的还有近100种,其中使用人数比较多的是旁遮普语(6000多万人)、马拉蒂语(5000多万人)、古吉拉特语(3000多万人)。 吉卜赛人(Gypsy)从公元(后)1000年开始由印度向西迁移,途经的波斯、亚美尼亚、希腊都在他们的语言中留下了不同时期的痕迹。现在听到一些老美爱说pal(兄弟),这词就来自吉卜赛语phral。
  在印度,除属于印欧语系的语言外,还有很多语言分属于达罗毗荼语系、汉-藏语系、南亚语系。达罗毗荼语是单独的语系,是游牧雅利安人进入印度以前居住在印度的民族说的语言,以后受雅利安人影响而南迁,现住在南部德干高原。属于该语系的有坎纳拉语(在德干高原西北)、马拉雅兰语(在德干高原西南)、泰卢固语(在德干高原的东北)、泰米尔语(在德干高原东南)。使用汉-藏语的人分布在印度的西北、克什米尔东部、印度的东北部,与缅甸接壤的那加兰邦,使用那加兰语。 分散于印度东北与东部的卡西语(在阿萨姆邦)、蒙
  达语(在比哈尔邦和奥里萨邦)、桑塔尔语(比哈尔邦和西孟加拉邦)则属于南亚语系。 在印度会说英语的人数只占1%,但英语仍是各语种之间的交谈时经常采用的语言。
  在西部的印度-伊朗语组中,有波斯语、普什图语、库尔德语、俾路支语、塔吉克语、奥塞梯语。这些语言都采用阿拉伯字母书写。
  
  六、印欧语系其他语种
  
  在印欧语系中,还有一些小的分支,如阿尔巴尼亚语、希腊语、凯尔特语、波罗的海语、安纳托利亚语、吐火罗语,今天仍有少部分人在使用。
  阿尔巴尼亚语和希腊语基本上限于阿尔巴尼亚和希腊。 凯尔特语在公元前后使用范围很广,包括现今的英国、德国、法国、意大利北部;可是今天凯尔特语只剩下威尔士语、布列塔尼语(法国西北部)、盖尔语(包括爱尔兰语和苏格兰语)。波罗的海语包括立陶宛语、拉托维亚语(莱蒂语)、亚美尼亚语。安纳托利亚语包括赫梯语﹑卢维亚语。
  公元前2500年吐火罗人离开东欧故里(里海北岸),到达塔里木盆地南北部、河西走廊。此后吐火罗人除少数进入祁连山中之外,大部分又经过天山北麓西迁伊犁河、楚河流域,最后越过阿姆河,进占巴克特里亚。在此期间,各地吐火罗人之间相继失去联系,并进而分道扬镳,独立发展,逐渐在塔里木盆地南缘的尼雅至楼兰一线,北缘的焉耆、龟兹地区,河西走廊西部山谷地带及中亚巴克特里亚等地形成几个活动中心。吐火罗语属于印欧语系的西支,与后来迁移到中亚的雅利安人(印欧语系东支印度伊朗语组)不是同一个语组。
  
  
  
  第三部分 黄种人所操语系
  
  一、印地安人
  现在一般都认定印地安人来自亚洲。大约在二万五千年前有一些亚洲人就开始跨过冰封的白令海峡,逐渐向美洲内地迁移。这似乎不是有目的的移居,所以这过程缓慢得在一代人中间都看不出来。但是到了十六世纪西班牙人到达美洲时,他们已经布满了整个美洲大陆,从阿拉斯加到智利南端的合恩角。据估计那时的人口在一千四百万到四千万之间,操一千七百多种语言,所处的社会形态从狩猎和采集的石器时代到具有高度文明的阿兹台克(Aztec)、玛雅(Maya)、印加(Inca)国家都有。
  由于人们认定印地安人来自亚洲,所以自然地把他们的语言和各种亚洲语言作比较。比较的结果,不仅没有找到确定的联系,而且他们内部也不是完全彼此相象的。这说明,第一,二万多年的漫长时光对于语言的变化来说是太长了,我们现在已知的这些语言之间的联系都仅限于数千年的分离;第二,印地安不是在同一时刻一起来到美洲的,互相之间可能分属不同的民族。
  在印地安人中,玛雅人的文字系统是最发达的,玛雅人在公元最初的几个世纪中就发明了文字,符号与解释符号的图形并列,包括很多图形,也有音标和音节符号。这些图形文字看上去极其复杂,好象是一幅幅精致繁复的装饰图案。
  西班牙人征服玛雅后,大部分文字记录都被销毁,只有极少数保存到了今天。这给释读造成很大困难。不过释读研究已在近年取得进展,只可惜文字资料太少,我们对于当时社会情形不能了解很多了。
  在玛雅,只有祭司才识字(所以当他们被消灭干净以后就没人能懂玛雅文了!),因此祭司们拥有极大的权力,这导致了玛雅人登峰造极的拜神狂热:修建巨大的神殿和祭坛,频繁而繁缛的祭奠仪式,征用大量的人力物力,甚至把最健壮的人用作牺牲。结果,社会生产力遭到很大破坏,加上当时加勒比地区风暴频繁,到西班牙人来到时,各城市已经荒凉破败了。
  现在印第安人的语言有在北美洲有阿尔衮琴语(有30多万人使用,在美国分布较分散)阿塔帕斯卡语(在美国西部有20多万人使用);在中美洲的墨西哥以南地区的基切语(有100多万人使用);在南美洲西部的克丘亚语(有上千万人使用,在厄瓜多尔、秘鲁、玻利维亚)和艾马拉语(有100多万人使用,在玻利维亚与秘鲁)。
  爱斯基摩人分布在亚洲东北、北美洲北部,总人口约10万。其语言称爱斯基摩语,有数十种方言,阿留申语也属于爱斯基摩语。格陵兰及北美洲的爱斯塞摩语用拉丁字母拼写,亚洲东北部的爱斯基摩语则用斯拉夫字母拼写。
  古亚细亚语言(古西伯利亚语言)包括楚克奇语、科里亚克语、依特门语、尼夫克语、凯特语、尤卡吉语、勘察加语。
  
  二、乌拉尔-阿尔泰语系
  
  最早操乌拉尔语的人群于公元前5000年居住在距伏尔加河与卡马河汇合处很近的乌拉尔山区,即库尔干人家乡的北面。乌拉尔语系芬兰-乌戈尔语支后来分成三支向外扩散:向北的一支沿着伏尔加河上游进入北欧,演变为芬兰语、芬兰以北的拉普语、爱沙尼亚语、莫尔多维亚语、乌德穆尔特语、马里语;向西的一支演变为马扎尔人,后从中亚迁移进入匈牙利;向东一支,沿卡马河、越过乌拉尔山,进入西伯利亚,现有科米语、汉蒂语等。操乌拉尔语的现在都是白种人,以前是否黄种人还不清楚。萨莫耶德语支包括涅涅茨语﹑塞尔库普语,也属于乌拉尔语系,属于黄种人。
  阿尔泰语一直与乌拉尔语有联系,阿尔泰语的结构,特别是词的组合和词尾语法与乌拉尔语有共同之处。可是,在起源上,最近研究认为,它最先出现在阿尔泰山与中国的青海之间广大草原地区。可是还不知道,它是否像印欧语和乌拉尔语那样,是一种语言呢,还是几种语言在草原上通过接触与交流融合而成的。阿尔泰语系包括突厥、蒙古、通古斯三个语族。苏美尔语也被认为是阿尔泰语系。
  突厥语族细分为以下几类:西南(奥古兹)语支的土耳其语、阿塞拜疆语、土库曼语;西北(吉普查克)语支的哈萨克语、吉尔吉斯语、鞑靼语、巴什基尔语、卡拉—卡拉帕克语、卡拉恰依语、巴尔卡尔语、库梅克语、诺盖语;东南(查加泰)语支的乌兹别克语、维吾尔语、萨拉克语;东北语支的阿尔泰语、哈卡斯语、图瓦语;楚瓦什语;雅库特语。
  蒙古语族细分为蒙古语、布里亚特语、卡尔梅克语、达斡尔语-云南本人、东乡语、东部裕固语、土族语、保安语等。
  通古斯语族细分为:埃文基语(通古斯语)、埃文语(拉穆特语);满语、纳奈语(戈尔德语、赫哲语)、锡伯语、鄂温克语、鄂伦春语;朝鲜语和日语也被认为是通古斯语。
  说突厥语族语言的在中国有840 多万人,分布在新疆、青海、甘肃、黑龙江,包括维吾尔语、哈萨克语、柯尔克孜语、乌孜别克语、塔塔尔语、撒拉语、西部裕固语、图佤语。说蒙古语族语言的人口在中国有550 万,分布在内蒙古、新疆、黑龙江、辽宁、吉林、青海、甘肃。在中国说通古斯语族语言的人口有20万,分布在新疆、内蒙古、黑龙江省,现在满族通用汉语。
  朝鲜族用的朝鲜文是维一东方自己发明的“纯粹”拼音字母。说它是“纯粹”,因为它有表达元音和辅音的完整音素集合。音素(phone)是人能分辨的最小语音单位。与此相对的是日语的假名,虽然也是拼音文字,但是每个假名表达的是整个音节(syllable)而不是音素。朝鲜语在语法结构上最象日语,但是它们的词汇并不相似,所以它们的关系仍有待于进一步研究。另一方面,朝鲜语又从汉语借走好多词汇,但在语法结构上又非常不一样。有人认为朝鲜最早的居民是一万年以前从北方移入的通古斯人一部。朝鲜文字母发明于十五
  世纪中叶(相当我国明朝前期),共有二十五个字母——字母在哪儿?
  虽然它们看上去象一个个的“方块字”,但每个“方块字”其实是由一些更小的“小零件”组成,这每个“小零件”就是一个字母,它们的种类是有限的,对吗?他们的字母不象其它拼音文字那样排成一条线,而是上下左右错落有致地拼在一个方块内,非常别致。象“眼泪”这个词,它们读作nunmul(nun意为“眼睛”,mul意为“水”),写成从左到右两个“方块字”:
  n m
  u u
  n l
  
  三、马来亚-玻利尼西亚语系(南岛语系)
  
  现在南岛语系语言总人数有二亿多,他们的祖先是生活在中国大陆东南沿海地区,在公元前二千纪至一千纪之间汉族人开始南侵的同时,他们的航海技术也发展到了一定的水平,开始向海外移居,在其后的二千年间,遍布了太平洋和印度洋。 南岛语系分为以下几类:
  印度尼西亚语族---印度尼西亚语、马来语、爪哇语、他加禄语、占语、马达加斯加语、米沙鄢语、马都拉语、米南卡包语、阿钦尼语、巴塔克语、布金语、巴林语、依洛卡塔语、比科尔语、邦板牙语、帮阿西楠语、依戈罗语、马拉瑙语、爪雷语; 密克罗尼西亚语族---马绍尔语、吉尔伯特语、查莫罗语、波纳佩语、雅普语、帕拉乌语、特鲁克语、瑙鲁语; 美拉尼西亚语族的斐济语、莫图语、雅比姆语; 波里尼西亚语族的毛利语、乌维亚语、萨摩亚语、汤加语、钮埃语、拉罗通加语、塔西提语、土阿莫图语、马克萨斯语、夏威
  夷语。 中国台湾省的高山族使用排湾、阿眉斯、布嫩、鲁凯、赛设特、卑南、邵、泰耶尔、赛德、邹、沙阿鲁阿、卡那卡那布等语言,属于印度尼西亚语族。
  新几内亚,面积81万多公里2,其中新几内亚(亦称伊里安岛或巴布亚岛)的面积为78.5万公里2,居民多美拉尼西亚人和巴布亚人。东部居民讲美拉尼西亚语(莫图语)和皮钦英语,西部居民通用马来语。
  美拉尼西亚意为“黑人群岛”,位于澳大利亚东北、赤道同南回归线之间。陆地总面积15.5万公里2,居民是美拉尼西亚人,当地居民通用美拉尼西亚语,英语为官方语言。主要有俾斯麦群岛(属于巴布亚新几内亚)、所罗门群岛、圣克鲁斯群岛-新赫布里底群岛(属于瓦努阿图, 比斯拉马语)、新喀里多尼亚岛(属于法国)、斐济群岛。
  密克罗尼西亚意为“小岛群岛”,陆地总面积2584公里2,居民主要是密克罗尼西亚人,主要有马里亚纳群岛(属于美国,查莫罗语)、加罗林群岛(属于帕劳和密克罗尼西亚联邦, 特鲁克语--波纳佩语-雅普语-特鲁克语)、马绍尔群岛、瑙鲁岛、吉尔伯特群岛(属于基里巴斯)等。
  波利尼西亚意为“多岛群岛”,陆地总面积2万公里2,居民主要是波利尼西亚人,主要有威克岛-中途岛-夏威夷群岛-约翰斯顿岛(属于美国)、菲尼克斯群岛(属于基里巴斯)、图瓦卢群岛、托克劳群岛(属于新西兰)、瓦利斯群岛-富图纳群岛(属于法国)、萨摩亚群岛(西萨摩亚已经独立,东萨摩亚仍为美国占领)、纽埃岛(属于新西兰)、汤加群岛、库克群岛(属于新西兰, 拉罗通加语)、莱恩群岛(属于基里巴斯)、法属波利尼西亚、皮特凯恩群岛(属于英国)。 法属波利尼西亚包括社会群岛(塔西提语)、土布艾群岛、土阿莫土群岛、马克萨斯群岛、甘比尔群岛、马罗蒂里群岛(巴斯群岛)、拉帕岛等。
  
  南亚语系(澳斯特罗-亚细亚语系)包括孟-高棉语族、马六甲语族、尼科巴语族、印度的蒙达语族。 孟-高棉语族包括中国的佤族-德昂族-布朗族语言、缅甸的孟语、柬埔寨的高棉语。马六甲语族包括塞芒语﹑萨凯语﹑雅昆语。 尼科巴语族包括卡尔语﹑乔拉语﹑特雷萨语。蒙达语族包括桑塔利语、蒙达里语、霍语、萨瓦拉语、科尔库语,布鲁沙基斯语也勉强划入蒙达语族。 南岛语系与南亚语系合称大南亚语系。
  
  
  第四部分 汉藏语系
  
  一、简述
  
  汉藏语系包括汉、藏缅、苗瑶、壮侗四个语族。
  说藏缅语族语言的人口在中国有2200万,与汉语关系最近,分布在西藏、青海、甘肃、四川、云南、贵州、湖南、湖北、广西。 直系分支包括藏语支、巴语支、印度kuki-naga、独龙语、僜语、珞巴语、缅语支、土家语;旁系分支包括白语、卡伦语群。 藏语支包括藏语群、白马藏语、羌语群,其中藏语群包括藏语、门巴语,羌语群包括羌语、普米语。 缅语支包括罗罗语群、缅语群,其中罗罗语群包括彝语、傈僳语、纳西语、哈尼语、拉祜语、基诺语、怒语,缅语群包括景颇语(克钦语)、阿昌语、缅甸的国语缅甸语。
  说苗瑶语族语言的人口在中国有940 万,分布在贵州、湖南、云南、四川、广东、广西。包括苗语、布努语、勉(瑶)语、畲语。
  说壮侗语族语言(又称台语)的人口在中国有2300多万,跟汉语、藏语关系较远,跟大南亚语系反而有密切联系,分布在广西、云南、贵州、湖南、广东、海南。包括侗水语支、壮傣语支、黎语、仡佬语。侗水语支包括侗语﹑水语﹑么佬语﹑毛南语﹑拉珈语;壮傣语支包括壮语﹑布依语﹑泰语(傣语)﹑老挝语﹑掸语(在缅甸)﹑岱语侬语(在越南)、阿洪语(在印度阿萨姆)。 古代中国的百越是壮侗语族的祖先。越南语是一种汉化很深的壮侗语族语言。京族是以百越一支骆越为主体,同时也加入了南岛语系印度尼西亚族的占婆人、南亚语系孟高棉语族的高棉人、少量汉人而重新组合而成的新民族群体。
  
  二、汉语
  
  主流意见认为,汉语属于汉藏语系,但还有人认为汉语属于乌拉尔-阿尔泰语系的变种,更有人认为汉语属于印欧语系。
  汉语是论人口世界上最大的语言,有十多亿人以汉语为母语:这包括在台湾的2000万、马来西亚的500万、泰国的500万、香港的500万、新加坡的200万、印度尼西亚的100万、越南的100万等。汉语是联合国1945年成立时的五种工作语言之一(1974年又加上了阿拉伯语)。
  
  汉语的各个方言之间差别很大,是什么理由语言学仍把这些方言统统归为一种语言?除了长期以来的统一的中原强势文化和统一的国家政权这些因素以外,还有一个重要的原因是文字----汉字。
  从商朝的甲古文开始,汉字有三千多年的连续历史,三千多年来汉字的字形、字义的变化都是连续的。与大多数其它语言不同的是,汉字的发展经历了一条象形—表意—形声的途径。这条道路产生了两个主要效应:第一,随着文明的不断发展,语言所要表达的概念不断增加,使得汉字拥有了一个数量庞大的字符集(虽然现代汉语已经不用增加字符来表达新的概念,而是创造新词,这在一定程度上减少了使用的字数)。汉字的庞大的字符集使它显得非常复杂:难学、难记、难用; 第二,历史上的汉字作为表意文字(ideograph),文字与语音没有直接关系,无论用哪种语言或方言去读,意义没有变化。这是几千年来各种口语分化交熔变迁,而汉字一直作为一种统一的文字被所有人认同的原因。这一优势甚至体现在当它被别的语言借用的时候:哪怕不懂日语的人也能读懂一半意思吧。汉字使操不同口语的人互相交流成为可能,而隔膜是统一的主要障碍。后来,随着汉字的演变,汉字已不再是纯粹的表意文字,许慎《说文解字》中的9353字里面,“形声字”占了80%以上,“会意字”不到20%,而甲骨文中形声字仅占20%多。特别是近年来多音词的比例急剧上升,汉字已向表音文字方向发展。
  现代汉语的文字仍有几万字之多,但是使用频率极不平衡。据北京语言学院1985年的统计结果,最常出现的前十个字及其出现频率为:
  的   4.16%    
  一   1.84%
  了   1.71%
  是   1.52%
  不   1.37%
  我   1.28%
  在   1.08%
  有   0.98%
  人   0.97%
  这   0.93%
  累计 15.85%
  前100字的累计字频已达47.34%,500字到了79.76%,2000字覆盖了98.07%,如果你认识4000字,你读一万个字只有四个不认得。
  语言学院还统计了词:共计出31159个不同的词,其中单音节词(一个字的)占12.2%,双音节词73.6%,三音节词7.6%,四音节词6.4%,五以上的占0.2%,平均词长2.09。前100词的累计频率为41.7%,2000词为82.2%,9000词为95.85%。不同汉字的构词能力(与别的字组成新词的能力)也不一样,最多的是“子”字,构词668个。
  
  三、汉字
  
  汉字是怎样起源,怎样演变的?据汉代纬书《春秋元命苞》:“仓颉生而能书,及受河图录字,于是穷天地之变,仰视奎星圜曲之势,俯察鱼文鸟语,山川指掌,而创文字。”文字虽美,实无所据。传说仓颉为黄帝的史官,而黄帝的生存年代及其事迹都属传说史的范围,具体内容多不可究,“仓颉造字”实在太玄了。又《易经》云:“上古结绳而治,后世圣卜易之以书契。”,意思是说从前的人结绳记事,后来有“圣人”把这改造成了文字。绳结与文字差距甚大,不以为然也。
  后世的汉文字学家一般持两种看法:起源于原始氏族社会晚期的陶器符号,或起源于原始图画。得到考古支持的商代甲骨文最早出现在三千三百年前,这比古埃及的文字及两河流域的苏美尔文字都要晚近二千年,汉字学家因而不服,他们认为最早的甲骨文被发现时已有了一定程度的会意和形声成分,所以文字的出现应当比那时早得多,因而推断说例如山东龙山文化中的陶器符号可能是原始的文字(龙山文化据今四至五千年)。这些目前仍缺少考古证据和足够的研究。顺便提一句,至今共发现了五千个以上的甲骨文单字,其中可以认识的约有一千七百字。
  总之不管从哪儿来,来了多久,从“帝盘庚迁殷”(公元前1312年)时开始,汉字开始了它的长达三千多年的连续发展史,中华文明史也开始了连续至今的文字记载。可以想象,一开始的象形文字(hieroglyphs)工作得不错。可是随着汉语的不断丰富,有些语言不能用形象表达了,怎么办?
  古埃及人和苏美尔人开始创造一些仅代表发音的符号来记录这些语言;玛雅人(美洲印第安人)开始借用那些画得出来的同音字来表达它们(例如,借用画得出来的eye来表示画不出来的I,汉语中叫“通假字”);而中国人则想出了一种叫做“形声字”的“中庸之道”:用两部分拼成一个字,一半表示发音一半表示意思(属性),象“中-盅-忠-钟-种-肿,羊-洋-痒-样”之类。这真是一个好办法:既能表达大量的新概念又与旧的文字体系“兼容”,于是大喜,到秦篆时形声字大增,汉字总数已数万,每当出现一种新概念我就发明一个新字来对付你,一字一意,文章简短,节约用纸。汉字的表达能力大大增加,形成了一个完备的文字体系。春秋战国时期的文化大发展与此不无关系。
  
  原来我们从小学习表意文字,觉得从象形文字演变到现在的汉字非常自然,觉得从象形文字演变到拼音文字很不可思议:现在看来后者比前者好象更自然一点。拼音文字的演变我们在讨论中近东语言的时候已经提到。
  作为语言发展历史的一部分,会意字、表音字、通假字也不同程度地存在于汉语中。会意字如“日+月=明,女+子=好”,这类字是在原始象形文字基础上意义的扩展,但是因为表达能力仍受限制,所以它们占的比例也不太大。通假字在古汉语中出现得比现代汉语多得多(如“说-悦”),说明当时人们也想从这方面想办法,后来认识到这不现实。试想,如果所有的抽象概念都用同音异字表示,那文章读起来大概是太累了,而且多半读不懂。事实上没有一种文字能纯粹用这办法解决问题,最多是部分地采用这技术,多了就不灵了。汉字也有少量的表音字,如“阿”,没有任何意义,只表示一个音节。自春秋时期开始形声字得到了极大的发展,具有了很强的表达能力,这可能反而抑制了向表音文字的进一步发展----表音文字在汉语中至今仍处于初级阶段。
  
  四、中国境内各民族的文字概况
  
  汉、回、满三个民族通用汉文,蒙古、藏、维吾尔、哈萨克、柯尔克孜、朝鲜、彝、傣、拉祜、景颇、锡伯、俄罗斯12个民族各有自己的文字。这些文字多数都有较长的历史。其中蒙古族使用一种竖写的拼音文字,通用于蒙古族地区。居住在新疆的蒙古族还使用一种以通用的蒙古文为基础而适合卫拉特方言特点的拼音文字。云南傣族在不同地区使用4种傣文。上述15个民族共使用17种文字。此外,傈僳族中大部分信仰基督教的群众,使用一种用大写拉丁字母及其颠倒形式的字母拼写傈僳语的文字,还有少数人使用当地农民创制的傈僳音节文字“竹书”。云南省东北部一部分信仰基督教的群众使用一种把表示声、韵、调的符号拼成方块的苗文。云南佤族中信仰基督教的少数群众使用拉丁字母形式的佤文。壮族、白族和瑶族中还有一部分人使用在汉字影响下创制的方块壮字、方块白文和方块瑶字。在新中国建立前,已使用文字的民族有21个,文字种类有24种。中华人民共和国建立后,又有壮、布依、苗、侗、哈尼、傈僳、佤、黎、纳西、白、土、瑶共12个民族和景颇族中说载瓦语的人使用新创制的以拉丁字母为基础的拼音文字。其中苗族因方言差别大,分别给其黔东、湘西和川黔滇三个方言创制了文字,给滇东北次方言也设计了一种文字方案。因此,现在共有16种拉丁字母形式的新文字。还有一些在历史上使用过,后来停止使用的文字,即突厥文、回鹘文、察合台文、于阗文、焉耆- 龟兹文、窣利文、八思巴字、契丹大字、契丹小字、西夏文、女真文、东巴图画文字、沙巴图画文字、东巴象形文字、哥巴文、水书、满文等17种文字。这17种在历史上曾经使用过的文字,加上现在使用的40种文字,共有57种文字。
  
  文字类型:
  中国不但语言类型较多,文字类型也很丰富。从类型上看中国文字有非字母文字和字母文字两大类。属于非字母文字一类的:①图画文字。在中国发现的图画文字有两种。一种是云南省纳西族的东巴图画文字,另一种是四川省凉山彝族自治州尔苏人的尔苏沙巴图画文字。这两种文字共同的特点是:尚未形成固定的行款,有从左向右的,也有由右到左的,既有由上到下的,也有由下到上的;常常利用字组构成的形象来表达比较复杂的意思;读出来的经文中的词语,一般都比写出来的字多。这两种文字都还不是成熟的文字,只是文字的雏形。②象形文字。它既包括整体像某事物形体或状态的字和以象形字为基础构成的指事字,又包括由多个单体象形字结合构成的会意字和形声字。词根是单音节的汉藏语系语言使用这种象形文字,基本上都是一个字读一个音节。云南纳西族的象形文字和贵州水族的水书中的大部分字,都是一个字读一个音节。纳西族的象形文字有以下三个特点:一个字只能读一个音节;以单体象形字为主,也有形声字,会意字;就文字的作用说,已经由表意发展到表音。③楷书化汉字和在汉字影响下创制的几种文字。有两类情况:字形结构虽受汉字的影响,但有自己的特点,借用汉字不太多。属这一类的有契丹大字,西夏文和女真文;大量使用音读汉字和训读汉字的方法表达自己的语言,也用形声或其他方法创制表达本族语词的新字。方块壮字,方块白文和方块瑶字,都属于这一类。④音节文字。音节文字的共同特点是每个字表示一个音节,笔画比较简单。这一类文字,目前发现的有三种,即彝文,纳西族的哥巴文和云南迪庆藏族自治州维西县部分地区的傈僳族使用的“竹书”。字母文字也称拼音文字。中国民族的字母文字可按字母形式的来源和其他情况,分成以下七类:①藏文,八思巴字,傣文,于阗文,焉耆龟兹文。这些文字的字母都是直接或间接参考印度的某种字母创制的;②窣利文,回鹘文,蒙古文,满文,锡伯文。窣利文来源于波斯时代的阿拉米文草书。回鹘文字母是参考窣利字母创造的。以后蒙古文字母的制定又参考了回鹘字母,满文字母的制定则参考了蒙古文字母。锡伯文是满文的延续;③察合台文,维吾尔文,哈萨克文,柯尔克孜文。这四种文字都以阿拉伯字母为基础。同一字母的单写,在词头,词中,词尾,书写形式略有不同,④突厥文。根据突厥文献早期发现的地点,又称鄂尔浑叶尼塞文;⑤朝鲜文,契丹小字和方块苗文。这三种文字在汉字的影响下,都把属于一个音节的字母拼成一个方块;⑥俄文。新疆的伊犁,塔城等地有近3000俄罗斯族人,他们使用俄文;⑦拉丁字母形式的文字。拉祜族,景颇族和佤族的文字,都是拉丁字母形式,中华人民共和国建立前就使用。中国的少数民族中,还有一些有自己的语言而没有文字的,将根据他们的意愿,创制文字或者选用对他们适用的现有文字。

http://www.douban.com/group/topic/1007547/


分享到: QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0
帖子永久地址: 

僚人家园 - 论坛声明1、本主题所有言论和图片仅代表作者个人的立场,不代表本论坛管理方立场。
2、本站所有主题由该帖子作者发表,该帖子作者与僚人家园享有帖子相关版权
3、其他单位或个人使用或转载本论坛原创文章时须征得作者本人及僚人家园论坛管理员的同意
4、发帖者承担因本文发表而直接或间接导致的相关责任。僚人家园管理团队有事先不通知发帖者而删除或屏蔽本文的权利。

回复

使用道具 举报

319

主题

9

听众

5万

积分

花王

Rank: 18Rank: 18Rank: 18Rank: 18Rank: 18Rank: 18Rank: 18Rank: 18Rank: 18Rank: 18Rank: 18Rank: 18Rank: 18Rank: 18Rank: 18Rank: 18Rank: 18Rank: 18

最后登录
2020-5-28
注册时间
2005-9-17
沙发
发表于 2006-5-27 08:41:00 |只看该作者

哦。又学习到了新知识。


山歌不唱忧愁多,大路不走草成窝; 钢刀不磨生黄锈,胸膛不挺背要驼。
回复

使用道具 举报

259

主题

1

听众

3万

积分

超级版主

Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13

最后登录
2020-1-10
注册时间
2002-7-27
板凳
发表于 2006-5-27 11:20:00 |只看该作者
虽然很长,但是值得一看.

Mwngz ndei,Dieggagguenj Bouxcuengh Guengjsae(Gvangjsih Bouxcuengh Swcigih)!
回复

使用道具 举报

154

主题

1

听众

1万

积分

版主

Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12

最后登录
2019-1-23
注册时间
2003-4-24
地板
发表于 2006-5-27 15:08:00 |只看该作者

已经看了,不错,不错,补上了语言知识。韩语为乌拉尔-阿尔泰语系可以理解,日语为通古斯语就比较难接受。

PS:姐姐的头像真是太有个性了,晃得俺头晕。


人的一生有如负重致远,不可急躁。以不自由为常事,则不觉不足。心生欲望时,应回顾贫困之日。心怀宽恕,视怒如敌,则能无事长久。只知胜而不知败,必害其身。责人不如责己。不及胜于过之。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册  

允许回帖同步到新浪微博  

Archiver|手机版|壮族在线    

GMT+8, 2024-12-23 03:06 , Processed in 0.161452 second(s), 45 queries .

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

回顶部