[转帖] 世界的语言与中国的方言
文章阅读 北大未名站○ 历史 讨论区 <p>--------------------------------------------------------------------------------<br>发信人: centralplain (中原), 信区: History<br>标 题: 世界的语言与中国的方言(原创)<br>发信站: 北大未名站 (2003年01月21日16:49:16 星期二) , 站内信件<p><br>世界上主要的大语系有:印欧语系占世界人口的比例为48%;汉藏语系占24%;尼日尔-刚果语<br>系占6%;亚非语系占5%;马来亚-玻利尼西亚语系占5%;德拉维达语系(达罗毗荼语系)占3%;<br>阿尔泰语系占2%。 还有几种独立语言:日语(2%)、朝鲜语(1%)、越南语(1%)。 还包括几<br>种“人造语言”,如世界语Esperanto(属于印欧语系)。<br>单是汉语就占了20%的人口,加上英语、西班牙语、印地语、俄语就达到了45%;再加上阿拉<br>伯语、日语、孟加拉语、葡萄牙语、德语、意大利语、法语能达到60%;再加十来种语言就增<br>加到75%……可以想象,最后5%的人口一定讲着上千种语言:美洲的印地安人中有一千多种语<br>言,非洲有近一千种语言,巴布亚新几内亚这一个岛上就有七百多种,印度有一百五十多种<br>,(前)苏联境内有一百三,中国境内有好几十……<br>语言学和人类学、历史学紧密相联,互为影响借鉴;语言和文字有联系,但是相对独立,同<br>种语言可用不同文字,反之亦然;汉语文字的表意特性保持了语言(乃至民族)的统一性;汉<br>语形声字的引入使它走向拼音文字以外的另一条道路,这有利有弊;现代汉语已经不再增字<br>而是增词表意,这是汉语向拼音文字转化的一个早期迹象;文字的简化有利于它的普及,从<br>而促进文明的进步;拼音文字是最易于普及的文字,但其通行性受到读音的牵制;语言的发<br>展趋势总是小语种让位于大语种,大语种的广泛分布又逐渐形成新的语种。<p><br>第一部分 诸多小语系<p>一、非洲<br>撒哈拉以南的黑非洲语言分为尼日尔-刚果语系(Niger-Congo)、乍得-尼罗语系(Chari-Nile<br>)、科依散(Khoisan)、其他两个小语系。<br>其中最大的一个语系要数尼日尔-刚果语系,有二亿多人口,接近非洲人口的一半。尼日尔-<br>刚果语系分为5个亚语系:大西洋亚语系、沃尔特亚语系、几内亚亚语系、豪萨亚语系和班图<br>亚语系。 大西洋亚语系包括沃洛夫语(主要在塞内加尔)、富拉尼语(几内亚、塞内加尔、马<br>里)、曼丁戈语(马里、几内亚)、桑海语(马里、尼日尔)。 沃尔特亚语系分布在黑沃尔特河<br>流域,以莫西语为主。几内亚亚语系的分布从利比里亚开始,到尼日利亚的沿几内亚湾一带<br>地区。 豪萨亚语系分布于尼日利亚的北部。 <br>班图亚语系的分布地区最大,沿赤道两边向南延伸。其主要语言有尼日利亚东部的蒂夫语、<br>喀麦隆-加蓬的芳语、扎伊尔-刚果的芒戈语、巴特克语、巴鲁巴语、安哥拉的姆本达语、坦<br>桑尼亚-肯尼亚的斯瓦希里语、赞比亚的本巴语、津巴布韦的绍纳语、莫桑比克的马夸语、南<br>非的祖鲁语。 其中主要是东非的斯瓦希里语,原用阿拉伯字母,现采用拉丁字母,该语言早<br>先是由阿拉伯奴隶贩子发展起来的。<br>语言学研究的结果表明,持班图语言的民族最开始是发源于二千多年前的喀麦隆,也就是班<br>图语言区的最西北角。可能是因为他们从近东地区学会了种植某种农作物后,由于这种作物<br>的适应性,他们随之逐渐朝东,南迁移,最终布满了由此往南的整个非洲大陆。 班图语言<br>中最重要的语种是斯瓦西里语(Swahili),它现在已成为东非最通行的语言,坦桑尼亚和肯尼<br>亚更以它作为官方语言。<br>科依散语系是黑非洲最古老的语言,曾经是非洲分布很广的语言,由于班图语的扩散,该语<br>言退缩到现在的地方。 该语的特征是语音带有由啧舌形成的吸气音,属于该语系的有布什曼<br>语与霍屯督语,使用人口各有10多万人。布什曼语分布于纳米比亚、博茨瓦纳、安哥拉交界<br>处,卡拉哈里沙漠地带;霍屯督语分布在纳米比亚沿海纳米布沙漠地区。<br>乍得-尼罗语系(尼罗-撒哈拉语系)的分布从苏丹南部、肯尼亚西部和乌干达北部向西沿中非<br>和扎伊尔交界处,直到乍得南部、喀麦隆东北部与尼日利亚东北部。<br>在南非共和国,白人讲的语言叫“阿非利肯斯语”(Afrikaans),这是十七世纪的荷兰殖民者<br>带来的,由于好几个世纪的分离,它已经和荷兰语有了不小的差别;黑人讲的语言主要是祖<br>鲁语(Zulu)和科萨语(Xhosa),科萨语受附近的一个小语系影响,有一种非常难发的“倒吸气<br>”音。<p>二、德拉维达(达罗毗图)语系<br>北部语族包括库鲁克语(奥拉昂语)﹑布拉会语(布拉休依语)﹑马尔托语;中部语族包括泰卢<br>固语﹑贡迪语(冈迪语);南部语族包括泰米尔语﹑坎纳达语(卡纳雷语)﹑马拉雅拉姆语﹑图<br>卢语、库依语。<p>三、亚-非语系Afro-Asiatic<br>也叫闪米特-含米特语系Hamito-Semitic,简称闪含语系,这名字取自圣经中诺亚的两个儿<br>子,一个叫shem,一个叫ham。亚非语系包括五个语族:①闪米特诸语言,内含阿拉伯语、希<br>伯来语、马耳他语、古叙利亚语﹑阿姆哈拉语﹑提格雷语﹑提格里尼亚语﹑阿拉米语﹑古拉?裼铹p哈拉里语﹑吉兹语、埃塞俄比亚北部的安哈拉语;②柏柏尔诸语言,含摩洛哥、阿尔?袄堑裙医驳耐逵镅裕虎劭馐┨刂钣镅灾饕ㄐ杏诎H肀妊呛退髀砝铮虎馨<坝镒遄<br>畛跸抵腹虐<坝铮窍衷谝钥破仗赜镂恚虎萃及⒗赘裼锓植荚诎⒍袄恰⒙砝铩⒛<br>崛斩唤绱Α?乍得的豪萨语有人说属于尼日尔-刚果语系。 亚非语系分布区不仅是世?缟献罟爬衔拿鞯姆⒃吹兀鹪从谀抢锏钠匆粑淖郑堑苯袷澜缟洗蠖嗍饕淖值谋亲妗<br>? <br> 阿拉伯语是将近二十个国家的国语,另外全世界的穆斯林都多少懂几句阿拉伯语,这使<br>它在1974年成了联合国的第六种工作语言。它的字母系统更是被许多其它语系的语言所采用<br>。它的文字保留了几个古代拼音文字的特点:从右到左的书写,以及只有辅音字母没有元音<br>字母。还有一个现象是一个字母在词中的位置不同,写法也不一样。如果你在用X窗口的电<br>脑,可以试试看把编辑器的字体设置成阿拉伯文的字母,再看看把同一个字母放在词中间与<br>放在词尾,形状是否一样。你不需要懂得阿拉伯语就能看得出来。<br> 阿拉伯文共有二十八个字母,都表示辅音。由于它们都写成草体连书,所以看上去一串<br>串的,好象看不出一个个独立的字母。那元音呢?你可能还注意到在这些弯弯曲曲的连续曲<br>线的上下还有不少小点点和短线条什么的,那就是元音! 不幸的是,他们阿拉伯人在书写<br>一般文字时,是省略掉这些元音的,只有在小学课本和给外国人看的读物上才注上元音。举<br>个例子,要写“solid”这个词,他们大概会写作“dls”(别忘了是从右往左写),那你就很<br>难猜这是个什么词了……<br> 阿拉伯文的古老特点是与近、中东文字的起源演变相联系的。古埃及和“两河流域”是<br>世界上最先出现文字的地方,也是拼音字母的发源地。 大约在五千五百年以前,埃及就出<br>现了文字和书写的纸草。约公元前3100年上下埃及统一,统一后的埃及开始有文字记录可考<br>(这比我国开始有文字记载早了一千七百年)。最早的文字是图形文字,后来有些文字逐渐变<br>成音节符号和指意符号,其后又有了一音一符的字母,共二十四个。所有字母都只标辅音不<br>标元音。各种符号组成词组,共有六百多个词组。经历这些发展的古埃及文字,是用字母、<br>音符、词组组成的一种复合文字。到第八王朝(大约在公元前2200)时期出现了一种草书体,<br>到中王朝(公元前2000-1700年)时草书体已广泛流行,只有正式文体和铭刻才用象形体。<br> 所谓纸草是下埃及产的一种植物,将其茎干剖为长条后,彼此排齐连成片,然后压平晒<br>干成纸。这种纸草后来成为古代地中海地区一种通用的纸,希腊人、罗马人以及往后的阿拉<br>伯人都曾用它书写。(这不能算是“正式的纸”,“正式的纸”必须等到三千年后由中国发明<br>)<br>早在五千五百年前差不多与埃及人同时,生活在幼发拉底河与底格里斯河的苏美尔人sumeri<br>an也有了自己的文字。他们最早的文字也是图形符号,一符一义。以后发展为表音符号和指<br>意符号,一起组成词组。自从有了表音和指义符号,字符孳乳增繁的倾向减少,到了约四千<br>三百年前,字符减少到了六百以下,其中约有一百个是表示音节的符号,但是没有单独表示<br>辅音的符号。这种文字用削尖的芦杆,骨棒等刻写在泥版上,晒干或烘干后成为可以长期保<br>存的文书,有一些保存到了现在,并被释读成功。芦杆刻成的笔划,起划粗而深,收划细而<br>浅,形如楔形,因而得名“楔形文字”。 <br>楔形文字后来成为近东各国外交的通用文字,一直到先进的腓尼基拼音文字的“传人”阿拉<br>美文aramaic流行以后才逐渐弃而不用。阿拉美文在近东各国的通行到了公元七世纪阿拉伯的<br>伊斯兰文化兴盛时,又让位于阿拉伯文,直到今日。<br> 腓尼基拼音文字是怎样发明的?腓尼基人在公元前1500年时居住在现在的以色列,黎巴<br>嫩一带。当时埃及和两河流域的文字早就有一部分发展为音节符号,埃及文字还由此出现标<br>示辅音的二十四个字母。但是两种文字中都有好几百个字符,埃及文字还保持象形体,结构<br>复杂,使用不便。地处使用这两种文字的人之间的腓尼基人受到它们的共同影响,取埃及文<br>的辅音符号而摈弃其象形体,发明出了二十二个辅音字母。从此文字不再为祭司所垄断,从<br>而避免了玛雅文化那样的命运。<br> 与此同时的希腊人,正彷徨于早期从埃及学来的象形-表音混合文字中,到了公元前一<br>千年时,腓尼基文字传入希腊,他们马上放弃了原有的文字,并且又在此基础上进一步发明<br>了元音字母,世界上第一套完整的拼音文字终于诞生了。<br> 腓尼基人的字母系统,是对人类文明的重大贡献。 拼音文字的优点在于它的普及性。<br>一般来讲,学会二三十个字母,就能见字读音。文字越复杂,掌握的人就越少,这对于社会<br>文明的进步非常不利。就文字的复杂程度而言,以象形文字为最,其次为表意文字,形声字<br>又次之,拼音文字最简单。到了现在信息时代,拼音文字因其一维的表达方式又有了一个新<br>的优势(至少目前如此,以后的变化未可知也)。<br> 但同时,拼音文字也有一个大问题,就是许多拼音文字,由于千百年来口语的不断变化<br>,它的书面文字与读音往往相去甚远。拿法语来说,它的书面语言表达的还是四、五百年以<br>前的发音,不发音的元音彼彼皆是,象hommes读为um,aiment读为em。<p>四、伊比利亚-高加索语系(高加索语系)<br>高加索语系分以下几类:南语族的格鲁吉亚语言(包括格鲁吉亚语、明格列尔语、斯万语、拉<br>兹语[土耳其境内]); 西语族的卡巴尔达语[库班和上德列克盆地]、塞卡西亚语、阿迪格语<br>、阿布哈兹语、阿巴齐尼亚语; 东语族的维纳喀语言(包括车臣语、印古什语、巴茨语);达<br>吉斯坦语族的阿瓦尔语、莱兹金语、达尔金语、拉克语、塔巴萨兰语。<br>巴斯克语勉强能分到该语系里面,但有人把它勉强划为印欧语系。<p>五、澳洲语系<br> 所谓澳大利亚语言,当然是指土著居民的语言,白种人自然是讲英语。今天的澳大利亚<br>土著只剩下数万人,可是他们仍在讲数百种语言!澳大利亚本地的哺乳动物都是非常原始的<br>有袋类,离进化到人类还差十万八千里。当地土著是新石器时代某个时候从马来亚--印度尼<br>西亚渡海而来,可这还没有找到足够的语言学方面的证据支持。今天,许多当地的语言都面<br>临绝灭,可怜它们作为历史的遗迹只在英语中留下了象kangaroo,koala等少数几个词汇。<br> 巴布亚新几内亚的三百多万人说着五、六百种语言,这给独立后的政府提出了很大的难<br>题:不可能找到一种当地语言作为官方语言来发号施令。所幸的是,在几百年的殖民统治以<br>后,当地土著居民发明了一种叫“洋泾浜英语”的交流工具,它取得了官方语言的地位。<br> “洋泾浜”是俗称,正式的称呼是皮钦英语(Pidgin English)。“洋泾浜”一词来自上海<br>原来的一条河,就是现在的延安路。当时在上海英租界也有自己的“洋泾浜英语”,“假洋<br>鬼子”们常说“let me see see”(让我看看)或“not can do”(不能做)这样不伦不类的话<br>。所谓皮钦语言就是指一种外来语言被当地人大大地简化了语法和词汇以后用作交流工具,<br>这种现象在不少殖民地都有。巴布亚新几内亚的皮钦英语约有1500个词和非常简单的语法,<br>这使它很容易学会。而且许多词汇还是由一些更基本的词汇组成的复合词,如house cook意<br>为“厨房”,house sick意为“医院”,house paper意为“办公室”等等。另外belong变成<br>了一个常用词,仅表示of的意思,如“glass belong look-look”意为“镜子”,smoke be<br>long ground意为“灰尘”,“light belong cloud意为“闪电”,“man belong long-way<br> place意为“外国人”……。但是,你可不要以为凭自己的英语可以去那儿独闯天下----他<br>们不会听懂你的英语,你也读不懂他们的“英语”,因为毕竟语法和词汇都有许多变化。<p><p>第二部分 印欧语系<p>一、简述<br> 印欧语系是世界上最大的语系,覆盖了欧洲、美洲、亚洲-澳洲的很大一部分。它包括两<br>种伟大的古典语言:古希腊语和拉丁语;包括象法语、意大利语、西班牙语一类的罗曼语族<br>;包括象英语、德语、荷兰语(在比利时也叫佛兰芒语Flemish)、瑞典语一类的日耳曼语族;<br>包括象俄语、波兰语、捷克语、塞尔维亚-克罗地亚语一类的斯拉夫语族;包括象威尔士语和<br>盖尔语(Gaelic,在苏格兰和爱尔兰)这样的塞尔特Celtic语族[高卢人是凯尔特人,但是被罗马<br>入侵后逐渐改说拉丁语,日尔曼异族征服法国后继续使用拉丁语];包括巴尔的Baltic诸语言<br>;包括波斯语、印地语、孟加拉语一类的印地语言。<br> 接下来我们可能会问:原始的印欧人生活在什么年代?是从何处“发迹”的?现在找不<br>到原始印欧人留下的任何“书面材料”,因为人类使用语言的历史远比使用文字的历史久远<br>。所以,最好的办法就是分析他们的语言。我们可以假定如果一个词在大多数印欧语言中都<br>很相似,那就是一个他们已有的概念;反之就可以认为那是一个后来才知道的概念:这就是<br>语言学重现“化石语言”所用的方法。<br>最原始的印欧人是库尔干人(Kwrgan),居住在里海北部靠近伏尔加河的草原地区。他们饲养<br>的家畜有马、牛、羊、狗,他们知道的野生动物有狼和熊,他们知道的金属可能只有铜。许<br>多人认为马和战车使他们在征战中能取得很大优势从而扩展到后来的辽阔地域。<br> 一般认为原始印欧文明起自于公元前3000年的东欧某地(里海北岸),大约在公元前2500<br>年它分裂了,人们离开故乡分好几路向四面八方迁移。其中一路到了希腊,另一路到了意大<br>利(这两路分别是古希腊和古罗马文化的起源)。另一路穿过中欧一直到达不列颠诸岛(他们是<br>高卢人、苏格兰人、威尔士人、爱尔兰人的祖先)。还有一路北上到了俄国,同时又有一路跨<br>过伊朗、阿富汗最终到了印度。他们每到一处,就征服或同化当地的土著,把自己的语言传<br>播到那里。应该说他们是一个出色的民族。<br> 印欧语言之间究竟有多象?印欧语言与非印欧语言的差别有多大?看看几个“基本词汇<br>”之间的比较:<br>威尔士语 mis mam newydd nos tri<br>德语 Monat Mutter neu Nase drei<br>瑞典语 ma^nad moder ny na"sa tre<br>英语 month mother new nose three<br>法语 mois me`re nouveau nez trois<br>西班牙语 mes madre nuevo nariz tres<br>意大利语 mese madre nuovo notte tre<br>俄语 mesyats mat' novy nos tri<br>希腊语 men meter neos rhis treis <br>波斯语 mah madar nau bini se <br> <br>梵语 mas matar nava nas trayas<br>芬兰语 kuukausi a"iti uusi nena" kolme<br>匈牙利语 ho'nap anya u'j orr ha'rom<br>土耳其语 ay anne yeni burun u"c,<p><br>二、印欧语系日尔曼语组(Germanic)<br>此语组包括英语、西日尔曼语、北日尔曼语和东日尔曼语4部分。<br>1)西日尔曼语:虽然此分支在起源上属于同一语组,但后来已演化成2个分支,即高地日尔曼<br>语和低地日尔曼语。高地指德国南部的山地,低地指北部的低地。英语也是低地日尔曼人所<br>说的语言,后来由于他们迁往英格兰,经演化而成英语。<br>低地日尔曼语包括旧萨克逊语(Old Saxon)、旧弗兰科语(Old Low Franconia)、阿非利堪斯<br>语、旧弗里西亚语(Old Prisian)、依地语﹑卢森堡语等。旧萨克逊语是那些没有迁往英国?粼谠Φ娜搜啡怂档挠镅裕墙裉斓偷氐掠锏闹饕煞郑窍执鹿辈咳怂档南执<br>掠锓窖浴>筛ダ伎朴锸窍执衫加锖捅壤北辈扛ダ济⒂锏幕。⒎抢纤褂锸悄戏前<br>兹怂档暮衫加铮ダ镂餮怯镏皇呛衫级辈可偈怂档挠镅浴R赖赜锖吐び锒际窃<br>诘掠锘∩戏⒄蛊鹄吹摹8叩氐掠锍晌衷诒曜嫉掠锏幕 ?2)北日尔曼语:北日尔曼语是斯堪的纳维亚人所说的语言,其中包括瑞典语、丹麦语、挪威<br>语、冰岛语。原来,这些语言是相同的,起源于古代斯堪的纳维亚语(Old Norse)。在10世纪<br>以后,由于人口的迁移和政治形成了不同的国家而带来了语言上的分化。冰岛语与其他3种语<br>言在地理位置上相距较远,所以比起其他日尔曼语来,变化较小。<br>3)东日尔曼语:这种语言在历史上存在过,但现在已经灭绝。这种语言是公元3世纪时,住在<br>欧洲东部和北部的哥德(哥特)人用的语言。到16世纪时,说这种语言的哥德人住在俄国的克<br>里米亚。由于受到政治控制的影响,哥德人的后代使用其他语言,而这种语言就消失了。可<br>见,一种语言的空间分布是衡量一个文化集团命运的尺子。如果该文化集团兴旺发达,则其<br>使用的语言就会在地理范围上不断扩大,反之,则会缩小,甚至终于灭绝。<br>4)英语:是当今世界事实上的国际社交语言。从使用人口来说,以英语为母语的人数仅次于<br>汉语而居世界第二位,有四亿多人。然而以英语作为第二语言,或者在一定程度上使用英语<br>的人数,要远比这多得多,说分布在世界的各个角落、各个民族,在这一点上汉语是望尘莫<br>及的。它是怎样发展起来的?<br>公元前3000年,伊比利亚人(Iberi-ans)从地中海地区抵达大不列颠岛定居,带去新石器文化<br>,征服了原地的旧石器人。 英伦三岛的第一批印欧居民是塞尔特人。塞尔特人是古印欧人的<br>一支,公元前2500年离开他们在东欧的故乡向西迁移,在公元前1000年时,他们成了德国南<br>部,阿尔卑斯山北麓的一个强大民族。在公元前500年左右,他们开始向西迁移,后来到了英<br>伦诸岛。这就是印欧人的第一次“入侵”。塞尔特(Celt)中的c可以读如s或k,所以也叫<br>“凯尔特”,美国人中有许多来自苏格兰和爱尔兰,所谓的“美国腔”可能是凯尔特口音。<br>波士顿有个著名的球队叫“凯尔特人队”。 在现今英语中,只在一些地名和河流名称方面还<br>保留着凯尔特语的词汇成分。例如the Tha-mes、the Cam、the Dee、the Avon等均为凯尔特<br>人命名的河流。在Dumcombe、Winchcombe、Cumberland等地名中,也可以看到凯尔特语Cumb<br>(深谷)一词成分。Kent、Dover等地名也为凯尔特语成分。<br>印欧人的第二次入侵是在公元450年,当时生活在现在的德国和丹麦交界处有两个部落,一个<br>是石勒苏益格(Schleswig)的盎格鲁(Angles),另一个是霍尔施坦因(Holstein)的萨克森(Sa<br>xon)。石勒苏益格/霍尔施坦因现在是德国最北面的两个州,是第一次世界大战时德国从丹麦<br>那里“取得”的。这两个部落从那里跨过北海,占据了英格兰,原来的塞尔特人很快地后退<br>到爱尔兰、康瓦尔、威尔士、苏格兰高地。康瓦尔语早在17世纪时已经灭绝,爱尔兰语、威<br>尔士语、苏格兰语仍然存在。 <br>盎格鲁、萨克森两个部落的方言随着社会的发展、逐渐融合,出现一种新的语言,即盎格鲁<br>萨克逊语(Anglo-Saxon),这就是古英语。English一词就出自盎格鲁Angles,在古英语中An<br>gle写作Engle,他们的语言叫做Englisc(在古英语中sc读如sh,如sceap读作sheep)。<br>从8世纪末,日尔曼人的一支丹麦人(操斯堪的纳维亚语)开始侵袭英国,后来整族的人迁往,<br>侵吞土地,并在英国东北部建立丹麦区,这种活动延续将近300年。因此,今天英国东北部地<br>区大约有1400多个村镇的名称来自斯堪的纳维亚语。如Wood thorp(斯堪的纳维亚语中的tho<br>rp,相当于英语中的 village)Althorp、Linthorp、Applethwaite、Braithwaite、Cowpert<br>hwaite(斯堪的纳维亚语thwaite等于英语an isolated piece of land)。此外,在英语的名<br>词(如 bank、knife、scales)、形容词(happy、low、wrong)、动词(call、gasp)等基本词汇<br>中留有斯堪的纳维亚语的成分。英语中的斯堪的那维亚词汇还有egg、cake、skin、leg、wi<br>ndow、husband、sky、fellow、skill、anger、flat、ugly、odd、get、give、take、rais<br>e、die、they、their、them等。<br>公元1066年,法国的诺曼蒂公爵侵入英国,并加冕为英国国王。诺曼蒂王朝一直延续到公元<br>1154年。在此期间,英国实际上存在着3种语言:法语、拉丁语、英语。法语是官方、贵族及<br>其他上层社会人士语言,学校、法庭也用法语。社会下层人士,即普通劳动者讲话用英语。<br>拉丁语是教堂与宗教界人士使用的语言。<br> 由于罗马统治和法国统治,拉丁语在英国有过特殊的地位,拉丁语词汇大量进入英语。<br>如angel、candle、cup、cheese、kitchen、kettle、mass、monk、pope、street、wine。在<br>15与16世纪,欧洲进入文艺复兴,人文主义的兴起促进人们研究古代希腊、罗马文化,拉丁<br>语词汇又开始涌进英语,如item、simile、memorandum等。<br>虽然诺曼蒂王朝不到100年,可是法语在英国主导地位延续了约300年,这为英语带来了大量<br>的法语词汇,这使得现代英语中存现大量的同义/近义词:shut/close、answer/reply、sme<br>ll/odor、yearly/annual、ask/demand、room/chamber、wish/desire、might/power (英语<br>词/法语词)。有一个有趣的现象是产肉的动物多是英语词,如ox(cow)、calf、sheep、swin<br>e、deer,而它们的肉则是法语词,如beef、veal、mutton、pork(bacon)、venison。 大概<br>持法语的多为贵族统治者,只注意他们餐桌上的肉,并不在意牲畜们叫什么。<br>这些外来语使英语成为一个表达力丰富的语言。尽管溶入了如此众多的“外来语”,古英语<br>仍然构成了它的核心----不到5000的古英语单词一直保持到了今天。在此期间英语逐渐向高<br>层发展,1399年继承王位的亨利四世是第一个以英语为母语的英国国王。在十四世纪快要结<br>束的时候,乔叟(Chaucer)完成了《坎特伯雷的传说》(Canterbury Tale),以伦敦方言为代<br>表的现代英语终于开始出现。<br>5) 美国英语<br>虽然美国与英国之间隔着辽阔的大西洋,影响两国人员的往来和语言的交流,于是两国英语<br>差异逐渐增加。表现在三个方面,包括语音、拼法、词汇。<br>词汇方面的差异主要是由于在美国的居民碰到许多在英国所没有的事物和现象引起的,这就<br>需赋予以新的名词,如:moose(麋)、raccon(浣熊)、chipmunk(花栗鼠),这些都是来自印第<br>安人的命名。又如canoe(独木舟)和sg-uash(南瓜)也来自印第安语。<br>由于美国具有强烈的独立国家意识与感情,逐使拼法上产生分异。例如,在英语中honour和<br>colour两个词中英国拼法u消除掉,变成honor和color,又如defence英语中的c用s来代替,<br>而变成defense。<br>在英国和美国在口语的语音上差异是十分明显的。从殖民者到达北美时候起,他们的对单词<br>的读音上就开始与英国的不同。因为两地居民之间的直接联系仅限于文字和其他印刷品,而<br>直接的对话比较少。<br>美英二国英语之间的重要差别之一是对字母a和r的发音不同。例如,fast、path、half,这<br>些词在英国英语中发音如father中的a,而不是man中的a。在英国英语中,除去在元音前,字<br>母r是不发音的。因而,在英国英语中,lord发音为land。还有,在美国英语中,对弱音节的<br>发音要清楚。例如,secretary和neces-sary在美国英语中有4个音节,而在英国英语中,则<br>只有3个音节。 这种发音上的差别的形成还有历史上的原因。在早期殖民者于17世纪离开英<br>国时,在英国字母a和r的发音与现在美国英语一样。可是在18世纪晚期,作为英国标准英语<br>的南部方言出现了,而美国英语并没有像英国英语那样变化,致使两国英语的发音不同。<br>在美国,英语的扩散过程中,由于历史的原因出现差异,终于形成不同的方言。在东部,原<br>先的聚落沿大西洋岸延伸,形成13块殖民地。这些殖民地可以分成3组:即新英格兰、沿大西<br>洋岸中部和南方。 历史上的移民来源不同,对今天东部方言起着决定性的作用。北部与中部<br>方言分界线通过新泽西州中部与宾夕法尼亚州北部,南部与中部方言的界线是弗吉尼亚西部<br>的山地。<br>新英格兰是以马萨诸塞州为中心的美国东北地区,该地区定居的都是英格兰人,其中2/3来自<br>英国东南部东安格利亚的清教徒,少数来自英格兰北部。<br>南方的核心地区是弗吉尼亚,最早来自英格兰人,其中大约一半来自英格兰的西南部。早期<br>到宾夕法尼亚州的移民是英格兰北部公谊会会员,接着是大量的苏格兰人和爱尔兰人定居于<br>宾夕法尼亚州、新泽西州和特拉华州,此外,还有很多德国人、荷兰人、瑞典人。因此,沿<br>大西洋岸中部的人说的语言与南、北方都不相同。<br>有些词汇在一个方言区普遍使用,可是,在另两个的方言区却很少听到。这种情况,在乡村<br>地区比较明显。在城市中由于人员的流动性大,所以不明显。例如,pail(农村提水用的水桶<br>)是北方方言中常用的词汇,可是在另两个方言区却用bucket。对耕地旁边堆积的长条状石堆<br>,在北方方言中称stone wall,在中部方言中称stone fence,在南方方言中称rock fance。<br>在北方方言中小河称为brook,在中部称为run,在南部称为branch。在英格兰北部与苏格兰<br>也用run。<br>在西部地区,由于受东部3个方言区的人向西部进行移民活动的影响,其语言上也存在着差异<br>。但是,因为西部地区移民来源不像东部那样具有明显的差异,加上美国人流动性大,所以<br>就西部内部语言上的差异,比东部各地区间要小,彼此一致性则较东部大。<p>三、印欧语系罗曼语组(Romance)<br>在印欧语系中与日尔曼语组相匹敌的是罗曼语组,也称为拉丁语组。这种语言是由于古罗马<br>人说的拉丁语发展而来的。<br>拉丁语的传播与罗马城地位的提高有关。在公元2世纪罗马最盛时期,罗马帝国的疆域西达西<br>班牙、北到不列颠群岛,南至非洲北部,东面经中东抵黑海。随着罗马军队在帝国各省的进<br>驻,拉丁语也被传播到各个角落。而各省当地人所说的语言由于受到征服者语言的抑制而大<br>大地削弱,甚至被消灭。 在罗马帝国灭亡以后,虽然拉丁语仍在一些地方继续使用,但其范<br>围已大大缩小。在其他地方有的已恢复使用原来的语言,有的则被东方或北方说日尔曼语和<br>斯拉夫语的民族所征服。<br>在罗马帝国时期,拉丁语在各省也有不同。帝国各省经历了几百年的殖民与统治,各省所用<br>的拉丁语以占领时期罗马军队所说的口语为基础。同时,各省的拉丁口语中由于引入许多当<br>地原语言中的词汇而有了变化。所以各省所用的拉丁语词汇已不是标准的书面形式,而是一<br>种被称作通俗拉丁语(vulgate Latin)的口语。vulgar这个词的意思即是指平民。驻防在帝国<br>各地军队用的是通俗拉丁语,它在词汇上与文学上用的拉丁语不同。例如,在拉丁语中,文<br>学上用的拉丁语的马是equus,英语中由此词转化为equine(马)和equestrain(骑马者)。可是<br>,平民所用的通俗拉丁语中,马这个词是caballus。现代意大利语中的马则由此词转化为ca<br>vallo,在西班牙语中为caballo,在葡萄牙语中为cavalo,在法语中为cheval,在罗马尼亚<br>语中为cal。在5世纪以后,罗马帝国崩溃,使先前各省与它的往来和联系中断,结果导致拉<br>丁口语在各地区的差异增加。到8世纪,这种彼此的孤立终于使彼此的语言发生根本性变化。<br>今天,拉丁语已成为过去的语言,除在一些宗教活动中与某些科学文献中使用外,已没有人<br>使用这种语言,更没有人说这种语言。<br>现代罗曼语主要有西班牙语、葡萄牙语、法语、意大利语、罗马尼亚语5个语种。这些语种在<br>欧洲的分布与这些国家的国界大体是一致的。从地图上可以看出,西班牙和法国之间有比利<br>牛斯山相隔;在意大利和法国之间有阿尔卑斯山阻挡;在意大利和罗马尼亚之间有斯拉夫语<br>区。自然的和人文的阻隔使得语言处于孤立状态。随着时间的推进,语言发生变化。各罗曼<br>语种并不是突然出现的。开始作为各省的方言出现,后来,随着民族和国家的发展,才出现<br>标准的民族语言,所以法语、西班牙语等都是近期才逐渐形成的。<br>1)法语:法语是由法国北部的方言演变而来的。因为首都巴黎就在该区范围内,所以把这里<br>的方言称为标准法语。从18世纪以后,巴黎法语由于巴黎在政治、经济和社会方面的领导地<br>位而加速向外传播,遂在法国取得优势地位。<br>法国的方言分南北两部分,北部方言被称作langue d'oil,南部的方言被称作langue d'oc。<br>这两个词汇是由于表达所谓“是”的方式不同而产生的。罗曼语的“是”为hoc illud est,<br>意思是“就是这样”,在南方,这个词汇被简化成hoc或oc(因为h不发音);在北方这个词被<br>简化成o-il或oil即把hoc illud est的 hoc illud内h音消掉,并简化而成o-il,如果将这两<br>个音节快读,就变成oil,同时又把最后 est的音也取消就成为oil。现在南方方言又称为普<br>罗旺斯语。<br>法语在非洲有相当影响。由于许多地方过去是法国殖民地,所以,在独立后,这20个国家多<br>仍用法语作为官方语言。<br>2)葡萄牙语和西班牙语:由于其过去具有大片的殖民地,所以成为世界性语言。使用这两种<br>语言的人80%在欧洲以外,主要是在中美洲(含墨西哥)和南美洲。因此,中美洲和南美洲又称<br>为拉丁美洲。在拉丁美洲,以西班牙语作官方语言的就有18个国家。<br>说葡萄牙语的在拉丁美洲只有巴西,其人口约占南美洲总人口的一半,它约等于葡萄牙本国<br>人口的11倍。葡萄牙语成为南美洲东部的官方语言,西班牙语成为其他拉丁美洲的官方语言<br>,是由于1494年在教皇仲裁下,签订托尔德西里雅斯条约,双方同意以西经46°作为分界线<br>(即历史上有名的教皇子午线),此线以东地区归葡萄牙、以西归西班牙所造成的。<br>西半球各地所用的西班牙语和葡萄牙语与欧洲用的有些差别。所以巴西与葡萄牙有一联合语<br>言委员会,目的在于使其共同语言标准化。<br>3)意大利语:在欧洲与其国界几乎完全一致。在非洲只有索马里以意大利语作为官方语言。<br>4)罗曼什语、加泰隆语和撒丁语:罗曼什语分布在瑞士东部,用此种语言的只有2万多人,被<br>列为瑞士4种官方语言之一。加泰隆语,也可作为西班牙语的一种方言,使用的人有600多万<br>,分布在以巴塞罗纳城市为中心的西班牙东部。同时,该语言也是位于西班牙和法国之间的<br>比利牛斯山中间的安道尔的官方语言。 撒丁语分布在意大利的撒丁岛上,是意大利语、西班<br>牙语与阿拉伯语的混合物,亦是该岛的通用语言。<br>瑞士位于日尔曼语与罗曼语两语组之间的过渡地区,其官方语言有德语(占总人口的69%)、法<br>语(占21%)、意大利语(占10%)、罗曼什语(占1%)。该国尽管语言复杂,但人民能和平相处,<br>具有强大的向心力。<p>四、印欧语系斯拉夫语组(Slavic)<br>该语组亦称波罗的-斯拉夫语组,一般可划分为东、西、南3语种。斯拉夫语实际上在17世纪<br>才被确认,并随斯拉夫各民族的分离而出现分化。<br>1)东斯拉夫语:这个语种使用的人数最多,分布最广。东斯拉夫语主要指俄语,是苏联的主<br>要语言,使用该语言的人有2亿多。第二次世界大战后,俄语的重要性有所提高,成为联合国<br>使用的5种正式语言之一,在东欧,俄语是各国的第二语言。在前苏联,除俄语外,属于东斯<br>拉夫语的还有乌克兰语、白俄罗斯语,前者使用的人数有4000多万,后者有900多万。<br>2)西斯拉夫语:这种语言主要有波兰语、捷克语、斯洛伐克语。捷克语和斯洛伐克语的官方<br>语言,有时也被合称一种语言。<br>3)南斯拉夫语:这种语言包括保加利亚语、塞尔维亚语、克罗地亚语、斯洛文尼亚语、马其<br>顿语。除保加利亚语是保加利亚的官方用语外,其余4种都是前南斯拉夫的官方语言。塞尔维<br>亚语和克罗地亚语虽然前者用古斯拉夫字母,后者用拉丁字母,但这二者仍然十分相近,所<br>以亦被认为是一种语言。在斯拉夫语中,各种语言与其他印欧语系的语言相比,差异比较小<br>,所以这几种语言相互可以理解的部分比较多。<p>五、印欧语系印度-伊朗语组(Indo-Iranian)<br>此语组在印欧语系中使用的人数最多,包括100多个语种,使用人数超过9亿,分为东部印度<br>-伊朗语和西部印度-伊朗语。<br>东部印度-伊朗语包括-印地语(梵语后裔)、乌尔都语、孟加拉语、旁遮普语、马拉蒂语、古<br>吉拉特语、比哈尔语、拉贾斯坦语、奥里亚语、阿萨姆语、克什米尔语、尼泊尔语、信德语<br>、僧伽罗语、比利语、吉普赛语、马尔代夫语。<br>巴基斯坦人主要用乌尔都语;在印度有1/3的人用印地语(梵语后裔),大都分布在印度北部。<br>这两种语言十分接近,不过乌尔都语用阿拉伯字母,而印地语用印度自己的字母。如果把这<br>两种语言当作一种语言,则其使用的人数占世界第三位。在孟加拉和印度东部的人说孟加拉<br>语,人数超过1.3亿。在印度属于印欧语系的还有近100种,其中使用人数比较多的是旁遮普<br>语(6000多万人)、马拉蒂语(5000多万人)、古吉拉特语(3000多万人)。 吉卜赛人(Gypsy)从<br>公元(后)1000年开始由印度向西迁移,途经的波斯、亚美尼亚、希腊都在他们的语言中留下<br>了不同时期的痕迹。现在听到一些老美爱说pal(兄弟),这词就来自吉卜赛语phral。<br>在印度,除属于印欧语系的语言外,还有很多语言分属于达罗毗荼语系、汉-藏语系、南亚语<br>系。达罗毗荼语是单独的语系,是游牧雅利安人进入印度以前居住在印度的民族说的语言,<br>以后受雅利安人影响而南迁,现住在南部德干高原。属于该语系的有坎纳拉语(在德干高原西<br>北)、马拉雅兰语(在德干高原西南)、泰卢固语(在德干高原的东北)、泰米尔语(在德干高原<br>东南)。使用汉-藏语的人分布在印度的西北、克什米尔东部、印度的东北部,与缅甸接壤的<br>那加兰邦,使用那加兰语。 分散于印度东北与东部的卡西语(在阿萨姆邦)、蒙达语(在比哈<br>尔邦和奥里萨邦)、桑塔尔语(比哈尔邦和西孟加拉邦)则属于南亚语系。 在印度会说英语的<br>人数只占1%,但英语仍是各语种之间的交谈时经常采用的语言。<br>在西部的印度-伊朗语组中,有波斯语、普什图语、库尔德语、俾路支语、塔吉克语、奥塞梯<br>语。这些语言都采用阿拉伯字母书写。<p>六、印欧语系其他语种<br>在印欧语系中,还有一些小的分支,如阿尔巴尼亚语、希腊语、凯尔特语、波罗的海语、安<br>纳托利亚语、吐火罗语,今天仍有少部分人在使用。阿尔巴尼亚语和希腊语基本上限于阿尔<br>巴尼亚和希腊。 凯尔特语在公元前后使用范围很广,包括现今的英国、德国、法国、意大利<br>北部;可是今天凯尔特语只剩下威尔士语、布列塔尼语(法国西北部)、盖尔语(包括爱尔兰语<br>和苏格兰语)。波罗的海语包括立陶宛语、拉托维亚语(莱蒂语)、亚美尼亚语。安纳托利亚语<br>包括赫梯语﹑卢维亚语。<br>在印欧语传入到欧洲以前,欧洲流行的语言在今天仍被保存下来的只有巴斯克语。它现在只<br>分布在西班牙北部与法国西南相连的比利牛斯山地区,使用的人有100多万。山区的闭塞环境<br>使这种语言得以保存。<p><br>第三部分 黄种人所操语系<p>一、印地安人<br> 现在一般都认定印地安人来自亚洲。大约在二万五千年前有一些亚洲人就开始跨过冰封<br>的白令海峡,逐渐向美洲内地迁移。这似乎不是有目的的移居,所以这过程缓慢得在一代人<br>中间都看不出来。但是到了十六世纪西班牙人到达美洲时,他们已经布满了整个美洲大陆,<br>从阿拉斯加到智利南端的合恩角。据估计那时的人口在一千四百万到四千万之间,操一千七<br>百多种语言,所处的社会形态从狩猎和采集的石器时代到具有高度文明的阿兹台克(Aztec)、<br>玛雅(Maya)、印加(Inca)国家都有。<br> 由于人们认定印地安人来自亚洲,所以自然地把他们的语言和各种亚洲语言作比较。比<br>较的结果,不仅没有找到确定的联系,而且他们内部也不是完全彼此相象的。这说明,第一<br>,二万多年的漫长时光对于语言的变化来说是太长了,我们现在已知的这些语言之间的联系<br>都仅限于数千年的分离;第二,印地安不是在同一时刻一起来到美洲的,互相之间可能分属<br>不同的民族。<br> 在印地安人中,玛雅人的文字系统是最发达的,玛雅人在公元最初的几个世纪中就发明了<br>文字,符号与解释符号的图形并列,包括很多图形,也有音标和音节符号。这些图形文字看<br>上去极其复杂,好象是一幅幅精致繁复的装饰图案。<br> 西班牙人征服玛雅后,大部分文字记录都被销毁,只有极少数保存到了今天。这给释读<br>造成很大困难。不过释读研究已在近年取得进展,只可惜文字资料太少,我们对于当时社会<br>情形不能了解很多了。<br>在玛雅,只有祭司才识字(所以当他们被消灭干净以后就没人能懂玛雅文了!),因此祭司们<br>拥有极大的权力,这导致了玛雅人登峰造极的拜神狂热:修建巨大的神殿和祭坛,频繁而繁<br>缛的祭奠仪式,征用大量的人力物力,甚至把最健壮的人用作牺牲。结果,社会生产力遭到<br>很大破坏,加上当时加勒比地区风暴频繁,到西班牙人来到时,各城市已经荒凉破败了。<br>现在印第安人的语言有在北美洲有阿尔衮琴语(有30多万人使用,在美国分布较分散)阿塔帕<br>斯卡语(在美国西部有20多万人使用);在中美洲的墨西哥以南地区的基切语(有100多万人使<br>用);在南美洲西部的克丘亚语(有上千万人使用,在厄瓜多尔、秘鲁、玻利维亚)和艾马拉语<br>(有100多万人使用,在玻利维亚与秘鲁)。<br>爱斯基摩人分布在亚洲东北、北美洲北部,总人口约10万。其语言称爱斯基摩语,有数十种<br>方言,阿留申语也属于爱斯基摩语。格陵兰及北美洲的爱斯塞摩语用拉丁字母拼写,亚洲东<br>北部的爱斯基摩语则用斯拉夫字母拼写。<br>古亚细亚语言(古西伯利亚语言)包括楚克奇语、科里亚克语、依特门语、尼夫克语、凯特语<br>、尤卡吉语、勘察加语。<p>二、乌拉尔-阿尔泰语系<br>最早操乌拉尔语的人群于公元前5000年居住在距伏尔加河与卡马河汇合处很近的乌拉尔山区<br>,即库尔干人家乡的北面。乌拉尔语系芬兰-乌戈尔语支后来分成三支向外扩散:向北的一支<br>沿着伏尔加河上游进入北欧,演变为芬兰语、芬兰以北的拉普语、爱沙尼亚语、莫尔多维亚<br>语、乌德穆尔特语、马里语;向西的一支演变为马扎尔人,后从中亚迁移进入匈牙利;向东<br>一支,沿卡马河、越过乌拉尔山,进入西伯利亚,现有科米语、汉蒂语等。操乌拉尔语的现<br>在都是白种人,以前是否黄种人还不清楚。萨莫耶德语支包括涅涅茨语﹑塞尔库普语,也属?谖诶锵担粲诨浦秩恕?阿尔泰语一直与乌拉尔语有联系,阿尔泰语的结构,特别是词的组合和词尾语法与乌拉尔语<br>有共同之处。可是,在起源上,最近研究认为,它最先出现在阿尔泰山与中国的青海之间广<br>大草原地区。可是还不知道,它是否像印欧语和乌拉尔语那样,是一种语言呢,还是几种语<br>言在草原上通过接触与交流融合而成的。阿尔泰语系包括突厥、蒙古、通古斯三个语族。<br>突厥语族细分为以下几类:西南(奥古兹)语支的土耳其语、阿塞拜疆语、土库曼语;西北(吉<br>普查克)语支的哈萨克语、吉尔吉斯语、鞑靼语、巴什基尔语、卡拉—卡拉帕克语、卡拉恰依<br>语、巴尔卡尔语、库梅克语、诺盖语;东南(查加泰)语支的乌兹别克语、维吾尔语、萨拉克<br>语;东北语支的阿尔泰语、哈卡斯语、图瓦语;楚瓦什语;雅库特语。<br>蒙古语族细分为蒙古语、布里亚特语、卡尔梅克语、达斡尔语、东乡语、东部裕固语、土族<br>语、保安语等。<br>通古斯语族细分为:埃文基语(通古斯语)、埃文语(拉穆特语);满语、纳奈语(戈尔德语、赫<br>哲语)、锡伯语、鄂温克语、鄂伦春语;朝鲜语和日语也被认为是通古斯语。<br>说突厥语族语言的在中国有840 多万人,分布在新疆、青海、甘肃、黑龙江,包括维吾尔语<br>、哈萨克语、柯尔克孜语、乌孜别克语、塔塔尔语、撒拉语、西部裕固语、图佤语。说蒙古<br>语族语言的人口在中国有550 万,分布在内蒙古、新疆、黑龙江、辽宁、吉林、青海、甘肃<br>。在中国说通古斯语族语言的人口有20万,分布在新疆、内蒙古、黑龙江省,现在满族通用<br>汉语。<br>朝鲜族用的朝鲜文是维一东方自己发明的“纯粹”拼音字母。说它是“纯粹”,因为它有表<br>达元音和辅音的完整音素集合。音素(phone)是人能分辨的最小语音单位。与此相对的是日语<br>的假名,虽然也是拼音文字,但是每个假名表达的是整个音节(syllable)而不是音素。朝鲜<br>语在语法结构上最象日语,但是它们的词汇并不相似,所以它们的关系仍有待于进一步研究<br>。另一方面,朝鲜语又从汉语借走好多词汇,但在语法结构上又非常不一样。有人认为朝鲜<br>最早的居民是一万年以前从北方移入的通古斯人一部。朝鲜文字母发明于十五世纪中叶(相当<br>我国明朝前期),共有二十五个字母——字母在哪儿?<br> 虽然它们看上去象一个个的“方块字”,但每个“方块字”其实是由一些更小的“小零<br>件”组成,这每个“小零件”就是一个字母,它们的种类是有限的,对吗?他们的字母不象<br>其它拼音文字那样排成一条线,而是上下左右错落有致地拼在一个方块内,非常别致。象“<br>眼泪”这个词,它们读作nunmul(nun意为“眼睛”,mul意为“水”),写成从左到右两个“<br>方块字”:<br> n m<br> u u<br> n l<p>三、马来亚-玻利尼西亚语系(南岛语系)<br>现在南岛语系语言总人数有二亿多,他们的祖先是生活在中国大陆东南沿海地区,在公元前<br>二千纪至一千纪之间汉族人开始南侵的同时,他们的航海技术也发展到了一定的水平,开始<br>向海外移居,在其后的二千年间,遍布了太平洋和印度洋。 南岛语系分为以下几类:印度尼<br>西亚语族---印度尼西亚语、马来语、爪哇语、他加禄语、占语、马达加斯加语、米沙鄢语、<br>马都拉语、米南卡包语、阿钦尼语、巴塔克语、布金语、巴林语、依洛卡塔语、比科尔语、<br>邦板牙语、帮阿西楠语、依戈罗语、马拉瑙语、爪雷语; 密克罗尼西亚语族---马绍尔语、<br>吉尔伯特语、查莫罗语、波纳佩语、雅普语、帕拉乌语、特鲁克语、瑙鲁语; 美拉尼西亚语<br>族的斐济语、莫图语、雅比姆语; 波里尼西亚语族的毛利语、乌维亚语、萨摩亚语、汤加语<br>、钮埃语、拉罗通加语、塔西提语、土阿莫图语、马克萨斯语、夏威夷语。 中国台湾省的高<br>山族使用排湾、阿眉斯、布嫩、鲁凯、赛设特、卑南、邵、泰耶尔、赛德、邹、沙阿鲁阿、<br>卡那卡那布等语言,属于印度尼西亚语族。<br>新几内亚,面积81万多公里2,其中新几内亚(亦称伊里安岛或巴布亚岛)的面积为78.5万公里<br>2,居民多美拉尼西亚人和巴布亚人。东部居民讲美拉尼西亚语(莫图语)和皮钦英语,西部居<br>民通用马来语。<br>美拉尼西亚意为“黑人群岛”,位于澳大利亚东北、赤道同南回归线之间。陆地总面积15.5<br>万公里2,居民是美拉尼西亚人,当地居民通用美拉尼西亚语,英语为官方语言。主要有俾斯<br>麦群岛(属于巴布亚新几内亚)、所罗门群岛、圣克鲁斯群岛-新赫布里底群岛(属于瓦努阿图<br>, 比斯拉马语)、新喀里多尼亚岛(属于法国)、斐济群岛。<br>密克罗尼西亚意为“小岛群岛”,陆地总面积2584公里2,居民主要是密克罗尼西亚人,主要<br>有马里亚纳群岛(属于美国,查莫罗语)、加罗林群岛(属于帕劳和密克罗尼西亚联邦, 特鲁克<br>语--波纳佩语-雅普语-特鲁克语)、马绍尔群岛、瑙鲁岛、吉尔伯特群岛(属于基里巴斯)等。<br>波利尼西亚意为“多岛群岛”,陆地总面积2万公里2,居民主要是波利尼西亚人,主要有威<br>克岛-中途岛-夏威夷群岛-约翰斯顿岛(属于美国)、菲尼克斯群岛(属于基里巴斯)、图瓦卢群<br>岛、托克劳群岛(属于新西兰)、瓦利斯群岛-富图纳群岛(属于法国)、萨摩亚群岛(西萨摩亚<br>已经独立,东萨摩亚仍为美国占领)、纽埃岛(属于新西兰)、汤加群岛、库克群岛(属于新西兰<br>, 拉罗通加语)、莱恩群岛(属于基里巴斯)、法属波利尼西亚、皮特凯恩群岛(属于英国)。 <br>法属波利尼西亚包括社会群岛(塔西提语)、土布艾群岛、土阿莫土群岛、马克萨斯群岛、甘<br>比尔群岛、马罗蒂里群岛(巴斯群岛)、拉帕岛等。<p>南亚语系(澳斯特罗-亚细亚语系)包括孟-高棉语族、马六甲语族、尼科巴语族、印度的蒙达<br>语族。 孟-高棉语族包括中国的佤族-德昂族-布朗族语言、缅甸的孟语、柬埔寨的高棉语。<br>马六甲语族包括塞芒语﹑萨凯语﹑雅昆语。 尼科巴语族包括卡尔语﹑乔拉语﹑特雷萨语。蒙<br>达语族包括桑塔利语、蒙达里语、霍语、萨瓦拉语、科尔库语,布鲁沙基斯语也勉强划入蒙<br>达语族。 南岛语系与南亚语系合称大南亚语系。<p><br>第四部分 汉藏语系<p>一、简述<br>汉藏语系包括汉、藏缅、苗瑶、壮侗四个语族。<br>说藏缅语族语言的人口在中国有2200万,分布在西藏、青海、甘肃、四川、云南、贵州、湖<br>南、湖北、广西。 直系分支包括藏语支、巴语支、印度kuki-naga、独龙语、僜语、珞巴语?⒚逵镏А⑼良矣铮慌韵捣种Оò子铩⒖子锶骸? 藏语支包括藏语群、白马藏语、羌语?海渲胁赜锶喊ú赜铩⒚虐陀铮加锶喊ㄇ加铩⑵彰子铩?缅语支包括罗罗语群、缅语?海渲新蘼抻锶喊ㄒ陀铩⒗塾铩⒛晌饔铩⒐嵊铩⒗镉铩⒒涤铩⑴铮逵锶喊<br>ň捌挠?克钦语)、阿昌语、缅甸的国语缅甸语。<br>说苗瑶语族语言的人口在中国有940 万,分布在贵州、湖南、云南、四川、广东、广西。包<br>括苗语、布努语、勉(瑶)语、畲语。<br>说壮侗语族语言的人口在中国有2300多万,分布在广西、云南、贵州、湖南、广东、海南。<br>包括侗水语支、壮傣语支、黎语、仡佬语。侗水语支包括侗语﹑水语﹑么佬语﹑毛南语﹑拉<br>珈语;壮傣语支包括壮语﹑布依语﹑泰语(傣语)﹑老挝语﹑掸语(在缅甸)﹑岱语侬语(在越??、阿洪语(在印度阿萨姆)。 古代中国的百越是壮侗语族的祖先。<br>越南语与汉语有远亲关系,越南语有一半的词来源于汉语,但是它们的关系仍有待进一步研<br>究。京族是以百越一支骆越为主体,同时也加入了南岛语系印度尼西亚族的占婆人、南亚语<br>系孟高棉语族的高棉人、少量汉人而重新组合而成的新民族群体。<p>二、汉语<br> 汉语是论人口世界上最大的语言,有十多亿人以汉语为母语:这包括在台湾的2000万、<br>马来西亚的500万、泰国的500万、香港的500万、新加坡的200万、印度尼西亚的100万、越南<br>的100万等。汉语是联合国1945年成立时的五种工作语言之一(1974年又加上了阿拉伯语)。<br>汉语的各个方言之间差别很大,是什么理由语言学仍把这些方言统统归为一种语言?除了长<br>期以来的统一民族、统一文化和统一国家这些因素以外,还有一个重要的原因是文字——汉<br>字。<br> 从商朝的甲古文开始,汉字有三千多年的连续历史,三千多年来汉字的字形、字义的变<br>化都是连续的。与大多数其它语言不同的是,汉字的发展经历了一条象形—表意—形声的途<br>径。这条道路产生了两个主要效应:第一,随着文明的不断发展,语言所要表达的概念不断<br>增加,使得汉字拥有了一个数量庞大的字符集(虽然现代汉语已经不用增加字符来表达新的概<br>念,而是创造新词,这在一定程度上减少了使用的字数)。汉字的庞大的字符集使它显得非常<br>复杂:难学、难记、难用; 第二,历史上的汉字作为表意文字(ideograph),文字与语音没<br>有直接关系,无论用哪种语言或方言去读,意义没有变化。这是几千年来各种口语分化交熔<br>变迁,而汉字一直作为一种统一的文字被所有人认同的原因。这一优势甚至体现在当它被别<br>的语言借用的时候:哪怕不懂日语的人也能读懂一半意思吧。汉字使操不同口语的人互相交<br>流成为可能,而隔膜是统一的主要障碍。<br> 后来,随着汉字的演变,汉字已不再是纯粹的表意文字,许慎《说文解字》中的9353字<br>里面,“形声字”占了80%以上,“会意字”不到20%,而甲骨文中形声字仅占20%多。特别是<br>近年来多音词的比例急剧上升,汉字已向表音文字方向发展。<br> 现代汉语的文字仍有几万字之多,但是使用频率极不平衡。据北京语言学院1985年的统计<br>结果,最常出现的前十个字及其出现频率为:<br>的 4.16% <br>一 1.84%<br>了 1.71%<br>是 1.52%<br>不 1.37%<br>我 1.28%<br>在 1.08%<br>有 0.98%<br>人 0.97%<br>这 0.93%<br>累计 15.85%<br> 前100字的累计字频已达47.34%,500字到了79.76%,2000字覆盖了98.07%,如果你认识<br>4000字,你读一万个字只有四个不认得。<br> 语言学院还统计了词:共计出31159个不同的词,其中单音节词(一个字的)占12.2%,双<br>音节词73.6%,三音节词7.6%,四音节词6.4%,五以上的占0.2%,平均词长2.09。前100词的<br>累计频率为41.7%,2000词为82.2%,9000词为95.85%。不同汉字的构词能力(与别的字组成新<br>词的能力)也不一样,最多的是“子”字,构词668个。<p>三、汉字<br> 汉字是怎样起源,怎样演变的?据汉代纬书《春秋元命苞》:“仓颉生而能书,及受河<br>图录字,于是穷天地之变,仰视奎星圜曲之势,俯察鱼文鸟语,山川指掌,而创文字。”文<br>字虽美,实无所据。传说仓颉为黄帝的史官,而黄帝的生存年代及其事迹都属传说史的范围<br>,具体内容多不可究,“仓颉造字”实在太玄了。又《易经》云:“上古结绳而治,后世圣<br>卜易之以书契。”,意思是说从前的人结绳记事,后来有“圣人”把这改造成了文字。绳结<br>与文字差距甚大,不以为然也。<br> 后世的汉文字学家一般持两种看法:起源于原始氏族社会晚期的陶器符号,或起源于原<br>始图画。得到考古支持的商代甲骨文最早出现在三千三百年前,这比古埃及的文字及两河流<br>域的苏美尔文字都要晚近二千年,汉字学家因而不服,他们认为最早的甲骨文被发现时已有<br>了一定程度的会意和形声成分,所以文字的出现应当比那时早得多,因而推断说例如山东龙<br>山文化中的陶器符号可能是原始的文字(龙山文化据今四至五千年)。这些目前仍缺少考古证<br>据和足够的研究。顺便提一句,至今共发现了五千个以上的甲骨文单字,其中可以认识的约<br>有一千七百字。<br> 总之不管从哪儿来,来了多久,从“帝盘庚迁殷”(公元前1312年)时开始,汉字开始了<br>它的长达三千多年的连续发展史,中华文明史也开始了连续至今的文字记载。可以想象,一<br>开始的象形文字(hieroglyphs)工作得不错。可是随着汉语的不断丰富,有些语言不能用形象<br>表达了,怎么办?<br> 古埃及人和苏美尔人开始创造一些仅代表发音的符号来记录这些语言;玛雅人(美洲印第<br>安人)开始借用那些画得出来的同音字来表达它们(例如,借用画得出来的eye来表示画不出来<br>的I,汉语中叫“通假字”);而中国人则想出了一种叫做“形声字”的“中庸之道”:用两<br>部分拼成一个字,一半表示发音一半表示意思(属性),象“中-盅-忠-钟-种-肿,羊-<br>洋-痒-样”之类。这真是一个好办法:既能表达大量的新概念又与旧的文字体系“兼容”<br>,于是大喜,到秦篆时形声字大增,汉字总数已数万,每当出现一种新概念我就发明一个新<br>字来对付你,一字一意,文章简短,节约用纸。汉字的表达能力大大增加,形成了一个完备<br>的文字体系。春秋战国时期的文化大发展与此不无关系。<br> 原来我们从小学习表意文字,觉得从象形文字演变到现在的汉字非常自然,觉得从象形<br>文字演变到拼音文字很不可思议:现在看来后者比前者好象更自然一点。拼音文字的演变想<br>在讨论中,近东语言的时候再提。<br> 作为语言发展历史的一部分,会意字、表音字、通假字也不同程度地存在于汉语中。会<br>意字如“日+月=明,女+子=好”,这类字是在原始象形文字基础上意义的扩展,但是因<br>为表达能力仍受限制,所以它们占的比例也不太大。通假字在古汉语中出现得比现代汉语多<br>得多(如“说-悦”),说明当时人们也想从这方面想办法,后来认识到这不现实。试想,如<br>果所有的抽象概念都用同音异字表示,那文章读起来大概是太累了,而且多半读不懂。事实<br>上没有一种文字能纯粹用这办法解决问题,最多是部分地采用这技术,多了就不灵了。汉字<br>也有少量的表音字,如“阿”,没有任何意义,只表示一个音节。自春秋时期开始形声字得<br>到了极大的发展,具有了很强的表达能力,这可能反而抑制了向表音文字的进一步发展──<br>表音文字在汉语中至今仍处于初级阶段。<p>四、中国境内各民族的文字概况:<br>汉、回、满三个民族通用汉文,蒙古、藏、维吾尔、哈萨克、柯尔克孜、朝鲜、彝、傣、拉<br>祜、景颇、锡伯、俄罗斯12个民族各有自己的文字。这些文字多数都有较长的历史。其中蒙<br>古族使用一种竖写的拼音文字,通用于蒙古族地区。居住在新疆的蒙古族还使用一种以通用<br>的蒙古文为基础而适合卫拉特方言特点的拼音文字。云南傣族在不同地区使用4 种傣文。上<br>述15个民族共使用17种文字。此外,傈僳族中大部分信仰基督教的群众,使用一种用大写拉<br>丁字母及其颠倒形式的字母拼写傈僳语的文字,还有少数人使用当地农民创制的傈僳音节文<br>字“竹书”。云南省东北部一部分信仰基督教的群众使用一种把表示声,韵,调的符号拼成<br>方块的苗文。云南佤族中信仰基督教的少数群众使用拉丁字母形式的佤文。壮族,白族和瑶<br>族中还有一部分人使用在汉字影响下创制的方块壮字,方块白文和方块瑶字。在中华人民共<br>和国建立前,已使用文字的民族有21个,文字种类有24种。中华人民共和国建立后,又有壮<br>,布依,苗,侗,哈尼,傈僳,佤,黎,纳西,白,土,瑶共12个民族和景颇族中说载瓦语<br>的人使用新创制的以拉丁字母为基础的拼音文字。其中苗族因方言差别大,分别给其黔东,<br>湘西和川黔滇三个方言创制了文字,给滇东北次方言也设计了一种文字方案。因此,现在共<br>有16种拉丁字母形式的新文字。还有一些在历史上使用过,后来停止使用的文字,即突厥文<br>,回鹘文,察合台文,于阗文,焉耆- 龟兹文,窣利文,八思巴字,契丹大字,契丹小字,?飨奈模嫖模屯蓟淖郑嘲屯蓟淖郑拖笮挝淖郑绨臀模椋牡?7?治淖帧U?7种在历史上曾经使用过的文字,加上现在使用的40种文字,共有57种文字。<br> 文字类型:<br> 中国不但语言类型较多,文字类型也很丰富。从类型上看中国文字有非字母文字和字母<br>文字两大类。属于非字母文字一类的:①图画文字。在中国发现的图画文字有两种。一种是<br>云南省纳西族的东巴图画文字,另一种是四川省凉山彝族自治州尔苏人的尔苏沙巴图画文字<br>。这两种文字共同的特点是:尚未形成固定的行款,有从左向右的,也有由右到左的,既有<br>由上到下的,也有由下到上的;常常利用字组构成的形象来表达比较复杂的意思;读出来的<br>经文中的词语,一般都比写出来的字多。这两种文字都还不是成熟的文字,只是文字的雏形<br>。②象形文字。它既包括整体像某事物形体或状态的字和以象形字为基础构成的指事字,又<br>包括由多个单体象形字结合构成的会意字和形声字。词根是单音节的汉藏语系语言使用这种<br>象形文字,基本上都是一个字读一个音节。云南纳西族的象形文字和贵州水族的水书中的大<br>部分字,都是一个字读一个音节。纳西族的象形文字有以下三个特点:一个字只能读一个音<br>节;以单体象形字为主,也有形声字,会意字;就文字的作用说,已经由表意发展到表音。<br>③楷书化汉字和在汉字影响下创制的几种文字。有两类情况:字形结构虽受汉字的影响,但<br>有自己的特点,借用汉字不太多。属这一类的有契丹大字,西夏文和女真文;大量使用音读<br>汉字和训读汉字的方法表达自己的语言,也用形声或其他方法创制表达本族语词的新字。方<br>块壮字,方块白文和方块瑶字,都属于这一类。④音节文字。音节文字的共同特点是每个字<br>表示一个音节,笔画比较简单。这一类文字,目前发现的有三种,即彝文,纳西族的哥巴文<br>和云南迪庆藏族自治州维西县部分地区的傈僳族使用的“竹书”。字母文字也称拼音文字。<br>中国民族的字母文字可按字母形式的来源和其他情况,分成以下七类:①藏文,八思巴字,<br>傣文,于阗文,焉耆龟兹文。这些文字的字母都是直接或间接参考印度的某种字母创制的;<br>②窣利文,回鹘文,蒙古文,满文,锡伯文。窣利文来源于波斯时代的阿拉米文草书。回鹘<br>文字母是参考窣利字母创造的。以后蒙古文字母的制定又参考了回鹘字母,满文字母的制定?虿慰剂嗣晒盼淖帜浮N氖锹牡难有虎鄄旌咸ㄎ模岫模宋模露俗挝<br>摹U馑闹治淖侄家园⒗帜肝 M蛔帜傅牡バ矗诖释罚手校饰玻樾葱问铰<br>杂胁煌芡回饰摹8萃回饰南自缙诜⑾值牡氐悖殖贫醵胍赌崛模虎莩饰模醯<br>ば∽趾头娇槊缥摹U馊治淖衷诤鹤值挠跋煜拢及咽粲谝桓鲆艚诘淖帜钙闯梢桓龇娇椋虎<br>薅砦摹P陆囊晾纾堑鹊赜薪?000俄罗斯族人,他们使用俄文;⑦拉丁字母形式的文?帧@镒澹捌淖搴拓糇宓奈淖郑际抢∽帜感问剑谢嗣窆埠凸⑶熬褪褂谩V泄<br>纳偈褡逯校褂幸恍┯凶约旱挠镅远挥形淖值模菟堑囊庠福粗莆淖只蛘哐<br>∮枚运鞘视玫南钟形淖帧?<br>五、汉语方言<p>(1)北方方言(即官话)<br>北方方言占汉族总人口的3/4,分布在北南文化线(通州县东-南通市东-长江-靖江县北-长江<br>-镇江市东-丹阳县西-金坛县西-溧阳县西-溧水县南-高淳县北-广德县-郎溪县-宣城市-芜湖<br>县北-繁昌县-南陵县东-铜陵县-铜陵市东-青阳县东南-石台县北-彭泽县-湖口县南-九江市南<br>-瑞昌市-长江-黄石市-武汉市南-长江-临湘县-常德市-沅江-怀化市-靖州县-通道县-永州-郴<br>州-桂林东-贺州-柳州南-河池南-百色)以北的全部汉族居住区。官话一般分为六大区,即北<br>方官话、秦晋方言、兰银官话、中原官话(中部官话)、西南官话、江淮官话。<br>北方官话内部又分为胶辽官话、冀鲁官话、北京官话、东北官话。 胶辽官话分布在山东半岛<br>、辽东半岛;冀鲁官话分布在河北省、山东省西部、内蒙古宁城县;北京官话分布在北京、<br>河北省北部、内蒙古赤峰市;东北官话分布在黑龙江省、吉林省、辽宁省北部、内蒙古东北<br>部。<br>西周分封燕国之前,北京居民操阿尔泰语系蒙古语组东胡语支。后来由于燕国的建立和强大<br>,东胡大部分被驱逐,北京开始操关中周族语言(一种原始汉语方言,与黄帝炎帝语言类似)。<br>此后,北京也一直是汉族、蒙古语组诸民族(乌桓、鲜卑、契丹)杂居,于是北京官话的东胡<br>烙印逐渐显现,关中色彩则逐渐淡化。辽金元时代,大量少数民族以北京作为首都并驻兵移<br>民,时间长达430年,汉语北京官话加深了与阿尔泰语系的接触,并加强了与东北官话的联系<br>,与汉语中原官话反而在政治上完全分离,处于开放环境中的北京官话发展迅速,成为方言<br>内部分歧最小,语音结构最简单、保留古音最少的汉语方言,时称元大都话,成为现代北京<br>官话的源头。明朝收复北京后,移民130多万各地的汉族人到残破的北京,由于当时汉族人来<br>源不一,汉族移民们都使用已占少数地位的北京汉族土著所使用的元大都话作为通用语言,<br>元大都话与现在的北京官话基本上没有什么区别。新中国成立后,北京官话又扩散到新疆省<br>阿勒泰地区的布尔津、富蕴、福海、哈巴河、吉木乃,塔城地区的托里、布克赛尔,石河子<br>市、克拉玛依市,库尔勒市东北的博湖县。<br>战国以后,就有大量燕国华夏人移民东北,燕人卫满就是带着东北的华夏移民入主朝鲜建国<br>的。永嘉乱后,北京汉民大量移居东北,但到了唐末全被异族同化了。五代十国时期,契丹<br>人掳掠大量的北京人入关,这些东北汉人说的北京官话奠定了东北官话发展的基础,1122年<br>金兵占领北京,把北京城里人全部掳掠到东北,这些北京人与辽代先期到来的北京人一起,<br>使得东北官话开始形成。由于辽金元时期,北京与东北同处一国,联系密切,而与中原汉语<br>沟通不多,所以东北官话基本上也就等同于北京官话。清军占领明朝的东北领土后,开始说<br>汉语东北官话,1644年满族人和汉八旗人又带着这种方言来到东北人的老家---北京。1620年<br>东北汉族300万人,由于跟随清军入关,清初东北汉族只剩下15万人了,但到咸丰年间有自然<br>增殖到200多万人,都居住在辽宁中北部。咸丰以后,允许汉人入关,山东半岛人跨渤海,一<br>部分定居无人居住的辽东半岛,形成胶辽官话的新分布,一部分向北继续迁移,居住在吉林<br>-黑龙江东部;操冀鲁官话的河北人出山海关,定居于吉林-黑龙江西部。定居吉林-黑龙江的<br>山东人河北人原操与东北官话很接近的北方官话,移民时又都要经过说东北官话的辽宁中北<br>部,加上清政府派遣的官员说北京官话,吉林黑龙江的满族也说东北官话,所以早已在东北<br>扎根的东北官话就成了吉林黑龙江这些山东河北移民的通用语。<br>夏朝时期,今华北平原西部为华夏族、东部为诸多华夏化很深的东夷。商朝时期,商完全华<br>夏化,诸多东夷华夏化程度也加深。西周时期,齐国和鲁国的东夷被华夏化,分别操齐方言<br>、鲁方言,华北平原西部的华夏部落操赵方言、燕方言,但这些方言的差异就如同福州话、<br>闽南话、赣语、客语之间的差别一样大。战国时期,诸侯混战,齐、鲁、赵、燕方言受了中<br>原官话河南方言(雅言)和秦晋方言的影响逐渐趋于统一,秦朝时齐鲁方言已完全融合趋同。<br>黄巾之乱、永嘉之乱,华北内部人口流动频繁,齐鲁方言、赵方言、燕东南方言也越来越混<br>化。北宋定都开封,汴洛音独得天下之正。此时的齐鲁、赵、燕东南都正好处于京都边缘地<br>区,共同的地理形势和经济状况为华北平原的方言提供了融合的机会,冀鲁官话形成。至于<br>北京官话独立于冀鲁官话,那完全是北京一直是东胡汉族杂居,并受辽金两代长期首都性统<br>治有关。元明时期,冀鲁人向天津、北京市平谷县、唐山、秦皇岛移民,扩大了冀鲁官话分<br>布面积。<br>西周初期,山东半岛存在没有丝毫华夏化的东夷,语言是通古斯与百越语言的融合,跟现在<br>的韩语相象,而与当时的汉语齐方言风马牛不相及。虽然后来齐国并吞了山东半岛,但齐国<br>华夏族百姓跟这些东夷仍没有机会进行交流。黄巾之乱、永嘉之乱,山东半岛开始与齐人之<br>间进行相当规模的流动,于是东夷人开始处于诺幕肪持校鸾ケ缓夯毫晒倩靶纬伞?秦晋方言分布在山西省、陕西北部、内蒙古河套、张家口西北、河南省新乡安阳以西。秦晋<br>方言分布区交通闭塞,十里不同音,对古音的保留相对顽固一些,比如保留了入声。由于该<br>方言区历史上一直汉族与阿尔泰民族杂居的地方,所以秦晋方言里也留下了一些少数民族的<br>痕迹。战国时期,该方言占领了今河南省黄河以北地区,1722年该方言又占领了内蒙古的河<br>套地区。<br>兰银官话细分为8片:银川市,石嘴山市-平罗-陶乐-贺兰-永宁-青铜峡-灵武-吴忠市-中宁-<br>同心-中卫,宁夏盐池县,兰州市-榆中-民勤,永登-皋兰,古浪-天祝,河西走廊(除敦煌和<br>景泰),乌鲁木齐市-昌吉州-博尔塔拉州-阿勒泰市与青河县-塔城(除托里、布克赛尔)-哈密<br>。<p>中原官话分布在远古华夏族的传统居住区,今陇海线南北。苏州市吴江县菀坪镇、宣城市以<br>东部分乡村、皖南广德县、浙江长兴县属于中原官话孤岛。 中原官话又细分为河南方言、关<br>中方言东府话、关中方言西府话、秦陇方言、陇中方言、南疆方言。<br>河南方言包括河南省98个市县、河北省南部2个市县、山东省西南部31个市县、山西省西南部<br>汾河谷地28个市县、安徽省淮河以北22个县市和淮河以南的凤阳县-蚌埠市-霍邱县-金寨县、<br>江苏省徐州市-宿迁市-连云港市东海县赣榆县、陕西省安康市白河县。商族语言最初是华夏<br>化很深的东夷语,来到中原后被夏族语言(一种原始汉语方言)和诸多原始汉语方言融化成今<br>日中原官话的雏形--华夏语。以洛阳为标准音的华夏语后来成为东周通用全国的雅言,进而<br>发展成为扬雄《方言》提及的“通语、凡语”。北宋时期河南方言基本定型,与今日河南方<br>言几乎完全一样。今日北方官话之所以与河南方言大同小异,是历史上北方官话区长期以河<br>南方言为标准来规范自己的语汇和语法系统而形成的。<br>关中方言东府话包括西安市、铜川市、咸阳市、渭南市、商洛市下属商县-洛南-丹凤-山阳、<br>陕北的宜川-黄龙-洛川-宜君-黄陵-富县、甘肃宁县;关中方言西府话包括宝鸡市。关中方言<br>区乃炎帝故地,所以后来母系同为炎帝属的周语与夏语近似,又由于地理相近,沟通频繁,<br>所以关中方言与河南方言同属中原官话。<br>秦陇方言包括陕北的延安、甘泉、富县、定边,陕南的略阳、勉县、南郑、汉中市、城固、<br>洋县、西乡、汉阴、安康市、平利、旬阳、镇安,陇东的庆阳、合水、正宁、华池、环县、<br>镇原、平凉、泾川、华亭、崇信、灵台,渭河以南的陇西、漳县、武山、甘谷、礼县、西和<br>、岷县、宕昌、舟曲、武都、成县、徽县、康县、两当、文县(除碧口镇)、临潭、卓尼,敦<br>煌、河西走廊东端的景泰,青海省的西宁市、湟中、湟源、门源、互助、贵德、化隆、平安<br>,宁夏省固原市、彭阳、隆德。<br>陇中方言包括青海省大通、乐都、民和、循化、同仁,宁夏省海原、西吉、泾源,甘肃省永<br>靖、临夏、和政、广河、康乐、临洮、渭源、定西、会宁、通渭、静宁、庄浪、秦安、张家<br>川、清水、天水市。历史上长期受氐羌影响,与关中方言有了不同的特点。<br>南疆方言包括库尔勒、阿克苏、克孜勒苏州、喀什、和田、吐鲁番、伊犁州。<p>西南官话包括11片: 四川省、重庆市、湖北省西部19县市、湖南省西北部、陕西省南部的留<br>坝-佛坪-宁陕-镇坪-岚皋-紫阳-石泉-镇巴-宁强、甘肃省文县碧口镇; 泸州市-宜宾市-乐<br>山市-西昌市、贵州省铜梓-仁怀-沿河-印江、云南省大关-绥江-水富,内江市-自贡市-仁寿<br>县-富顺县,雅安市-石棉县,云南省西北部下关-剑川-宾川-洱源-云龙-丽江市; 云南西部<br>的大理-保山-潞西; 云南省东中部的昆明-昭通-曲靖-玉溪-楚雄-个旧-开远、贵州省贵阳市<br>-安顺市、四川省宁南县;贵州省北部以遵义-六盘水-毕节为中心的27县市、云南省威信-彝<br>良-镇雄、重庆市秀山县、湖南省芷江-怀化-凤凰-新晃-吉首; 贵州省东南部镇远-岑巩-黎<br>平-锦屏-台江、湖南省靖州-通道; 贵州省南部凯里-都匀-贵定县; 湖北省北部的襄樊-<br>十堰-丹江口-老河口-随州; 武汉、湖南省临湘县; 湖南省南部永州、郴州; 广西省<br>以柳州-桂林-百色-河池为中心的56个县市; 海南省昌江县-东方市-儋州市-三亚市的部分<br>地区所讲的军话。 西南官话与江淮官话的分界线在广水县-安陆县-应城县-黄陂-黄冈市-鄂<br>州市-蕲春县一线以西以南。<br>商周秦汉时期,洞庭湖还属于原始汉语与藏缅语、苗瑶语、融合而形成的楚语,永嘉乱后,<br>迁入湖北的秦雍流人(陕西甘肃以及山西一部分)有6万,出现了西南官话的最初雏形。安史之<br>乱后,十倍于土著的北方移民入洞庭湖北部,冲击、涵化并最终取代了当地的楚语,奠定了<br>西南官话的基础。<br>江淮官话分布在淮河和北南文化线之间,福建南平城关、长乐县洋屿村属于江淮官话孤岛。<br> 江淮官话与中原官话方言分界线如下:连云港临洪河口----东海县浦南镇----东海黄川--<br>--东海白塔埠----东海平明----东海房山----东海安峰----新沂黑埠----沭阳阴平(潼阳)--<br>--沭阳颜集镇方圩村----沭阳悦来----宿迁关庙----宿迁丁嘴----泗阳仓集----泗阳屠园--<br>--泗洪曹庙----泗洪金锁----泗洪重岗----泗洪上塘----泗洪峰山南----淮河----凤阳县南<br>----蚌埠市西南----淮河---霍邱县?---金寨县南。<p>(2)北方方言的主要语言特征有:<br>A.语音方面 <br>①塞音和塞擦音声母大都有清声送气与清声不送气之分,而没有清声与浊声的对立,反映出<br>清声母多而浊声母少的特点。 古全浊声母字在现代官话方言各支系中几乎都念为清声母字;<br>古全浊平声念送气清声母,古全浊仄声念不送气清声母。 <br>②韵母方面最突出的特点是辅音韵尾比较少。 <br>③声调方面最突出的特点是调类的数目比较少。除江淮官话、秦晋方言有入声调外,其余各<br>地官话都没有入声调。整个官话方言区的声调以4~5个为最多,尤以4个声调最普遍。古四声<br>中,平、上、去三声在各地官话中的分化、发展情况相似,即:古平声清声母字现念为阴平<br>,如包、周、基、夫、甘、尊、当、江、光等;古平声浊声母字现念为阳平,如爬、徒、锄<br>、奇、条、林、沉、群、同、红等;古上声清声母和次浊声母字现念为上声,如补、早、胆<br>、粉、党、井、榜、选、暖、染、老等;古上声全浊声母字和古去声字,现念去声,如古上<br>声全浊声母字部、父、道、愤、荡和古去声字过、怕、步、带、共、耀等。古入声字在官话<br>方言中的念法比较复杂,除江淮官话、秦晋方言保留入声自成调类外,其余入声调消失的各<br>地官话,古入声字的归属各不相同。 <br>大致说来,北方官话、中原官话东部入声消失后入声调的字分派平、上、去各声,即所谓“<br>入派三声”:入声全浊声母字归阳平,入声次浊声母字归去声,入声清声母字分派到阴平、<br>阳平、上声、去声各调中去;少数地方与北京略有不同:入声清声母字或全归阴平(如济南)<br>,或全归上声(如大连)。 兰银官话、中原官话西部古入声调字的分派有两种情况:或是入声<br>全浊声母字归阳平,其余归阴平,如西安;或是古入声全浊声母字归阳平,其余归去声,如<br>兰州。西南官话古入声字的分派最为划一:只要是古入声字,不论声母是什么,一律念阳平<br>调。 <br>B.词汇方面 <br>官话方言的词汇和普通话的词汇大同小异。官话方言中通行范围比较广的语词,大都已进入<br>共同语,作为基本词汇,没能为共同语吸收的官话方言词,大都只流行于某一个官话方言片<br>或方言小片。南北各地官话在词汇上的差异,比官话和其他各大方言之间的差异小,但有的<br>地方也有与众不同的方言词语。例如北京土话"二乎"意为"犹疑","咋呼"意为"嚣张","冲道<br>"意为"敢做敢说";天津话"广"意为"打","老公"意为"乌鸦","罢了"意为"了不起";西安话"<br>瞎了"意为"浪费"、"糟踏";山东聊城话"毁"意为"打";河南洛阳话"连连儿"意为"赶快"。新<br>乡话用"乱"表示"住",用"红"表示"卖力气";成都、昆明等地"聊天"说成"摆龙门阵",武汉<br>、重庆等地"倒霉"说成"背时","可怜"说成"造孽"……如此等等,都各具一格。"太阳"一词<br>在官话方言区有各种不同的称呼:北京、保定称"老爷儿"(北京也称"太阳"),沈阳、西安称<br>"日头",太原、呼和浩特称"阳婆",合肥称"热头",成都、武汉、昆明称"太阳";光是河北一省<br>,对"太阳"的称呼就有"老爷儿、爷爷儿、爷爷、日头、日头爷、日头影儿、阳婆儿、阳婆、<br>前天爷、佛爷儿"等等,可见词汇上的分歧,即使是在官话方言内部,仍然不容忽视。官话方<br>言的词汇跟其他方言比较,还显示出以下一些特色:<br>①双音节词特别占优势。双音节词在汉语中是整个词汇里占比重最大的一部分,在官话方言<br>中表现得尤为突出,如许多在官话方言中加"子"而成为双音节词的,在其他方言中往往是没<br>有"子"的单音节词,如"稻子"在南方方言或叫"稻"(吴方言、闽方言),或叫"禾"(客家方言、<br>湘方言、赣方言、粤方言);"谷子"在南方方言或叫"谷"(吴、湘、赣、客家、粤等方言),或<br>收"栗"(闽方言);"相片"一词官话方言区各地大都叫"相片"或"相片儿",而南方各方言,除客<br>、赣方言仍用双音节"相片"外,吴方言、粤方言、闽方言都是单音节词,或叫"照"(吴方言苏<br>州话),或叫"相"(粤方言、闽方言)。<br>②古代语词保留得比较少。尽管每个汉语方言都继承了不少古代汉语的语词,但是相对而言<br>,官话方言区各地方言保留古语词的现象比较少。例如"眼睛"一词,官话方言区各地大都说"<br>眼睛",而闽方言至今仍叫"目",粤方言仍叫"眼",保留了古代汉语对这一人体器官的名称;又<br>如"站立"一词,除官话方言区及湘方言外,吴方言叫"立",闽、粤、客家、赣等方言叫"企"<br>,都沿用了古代汉语的说法;此外,还有一批极常见的生活用词,南方各方言保留了古代的<br>说法,而官话方言则采用了跟现代汉语普通话一致的说法。如"看"是官话方言普遍通用的;而<br>粤方言、闽方言(部分地区)却用古代的语词"睇"。 <br>③外来借词比较少。和南方诸方言比较,官话方言中外来的借词比较少。南方闽、粤等地向<br>来为出海门户,与外国接触多,方言中较易借入外语语词,如闽方言中借入不少印度尼西亚<br> -马来语词,粤方言中借入不少英语语词。有时候同一个事物,官话方言与南方各方言却采<br>用不同的词语来表达,显示出"舶来"词与"土产"词的差别。例如"水泥"一词,粤方言区有人叫<br>"士敏土",吴方言叫"水门汀",都是英语cement的译音;闽方言叫"番家灰"、"红毛灰"之类,<br>也显示出外来的色彩,而官话方言大多数和共同语一样用"水泥"(部分地方叫"洋灰")则是地道<br>的汉语语词。又如照相用的"壕?,官话方言各地都叫"胶卷",而粤方言、闽方言、客家方言<br>却都采用英语film的译音词"菲林"。<br>④语气词比较少,用法比较概括。和南方各方言比较,官话方言的语气词比较少,用法更加<br>概括,分工不那么细。例如常见的语气词"呢、吗、啊"之类,官话方言跟共同语是一致的,<br>而南方吴、粤等方言的语气词则丰富得多。 <br>C. 语法方面 <br>①构词方面,修饰性的词素一般在前。如除西南官话偶有"鸡公"、"鸡母"一类说法外,各地<br>官话大都是"公鸡"、"母鸡"、"客人"、"拖鞋"等说法,不象南方某些方言把修饰性的词素加<br>在后面。如"鸡公"、 "人客"、"鞋拖"(闽方言)之类。 <br>②运用语音内部屈折变化表现语法意义的现象比较少。除个别地方外,官话方言很少有语法<br>学上所谓"构形法",即"狭义形态"的东西,粤方言、闽方言用变音的方式来表现某种语法意义<br>的现象在官话方言中很少见。 <br>③结构助词"的、地、得"的运用。官话方言中不少地方有结构助词"的、地、得",用途各不<br>相同。这几个结构助词以北方官话用得最普遍,已进入共同语的语法体系中。在官话以外的<br>南方各大方言中,却很少见,就是有类似的结构助词,也不象官话方言那样"的、地、得"分<br>工明确,用法不混。<br>④重叠式的运用范围相当广。官话方言的重叠式内容相当丰富,使用范围相当广泛。例如亲<br>属称呼,南方闽、粤、客家、吴等方言一般都不用重叠式,多用单音节词素前加"阿"来称呼<br>,如"阿爸"、"阿弟"、"阿嫂"之类。而在官话方言中,则普遍用重叠音节的方式来称呼人,如<br>"哥哥"、"舅舅"、"爸爸"、"嫂嫂"、 "叔叔"之类。又如某些常用的名词,在南方各方言中是<br>不能重叠的,在官话方言中却以重叠的形式出现,如"星星"一词。在西南官话、西北官话中<br>,重叠表示附加的小义。如成都话"盘盘"意为"盘儿","眼眼"意为"眼儿"。"豆豆"意为"豆儿<br>",西安话"帽帽"意为"帽儿"。西北官话有的地方量词和指示词也可以重叠,如西安话度量词<br>重叠表示计量方式:"这米不卖升升"(不按升卖);指示词重叠表示所指的具体位置:"你的站在<br>这这等着"(你们站在这儿等着),这些重叠的用法在南方各大方言中都是没有的。 <br>⑤量词的使用比较概括。官话方言中最常用的量词"个"用途很广,可以用在许多事物上面,虚<br>的实的,都能和" 个 "配搭。称人一般在官话方言中用"个"和"位"(尊称),而在其他各大方言<br>中,却用各种不同的量词,并往往在量词的选用中体现出一定的感情色彩和修辞风格。例如<br>粤方言,既有"这位先生"、"那个 同学"等合乎规范的叫法,而在某些场合, "呢条老坑"(这<br>个老头儿)等指人量词的独特用法。<br>⑥官话方言中一个句子里可出现两个"了"字,前者表示动作、行为的完成,后者作为句末的<br>语气词。如:"他吃了饭了",这种用法在南方各方言中比较少见。 <br>⑦表示被动的介词比较多。在被动句里,表被动的词在官话方言中除了用"被"以外,还可以<br>用"给"(他给人骂了)、"受"(小张受人欺负)、"让"(老鼠让猫逮住了)、"叫(教)"(我今天叫雨<br>淋了一场)等。 <br>⑧官话方言疑问句有两类不同的格式。一类是北方官话用的,跟共同语一样,有"是什么?""好<br>吗?""是不是?"等句式;另一类是西南官话(云南、贵州)及江淮官话用的,跟共同语不一样<br>,有"ke(果)是?(或'可是'?)""ke(果)好?""是不?"等句式。<p>(3) 粤方言<br>粤方言区分布在广东中部--西南部,海南的儋州话-迈话-蛋家话,广西东部-南部,香港,澳<br>门。(东南亚--南北美的华侨华裔也大都以之为母语,粤方言是现代汉语方言中与民族共同语<br>差别最大的一种方言) 使用人数占汉族总人口的5%左右,以广州话为代表。<br>百色-南宁-桂平-梧州-肇庆-广州这一线,是西江航运的黄金水道,通行粤语。粤方言形成于<br>晚唐西江土著乌浒-俚僚消融于汉族的时候,是中古汉语与西江土著语结合的产物。今广府话<br>分布区域远古时居住有岭南三个古代民族:番禺(南越)、骆越、西瓯。秦兵下岭南时,番禺<br>族与秦人结合而成南族;西江流域的西瓯族与西江南路的骆越族保持相对的独立性。今广府<br>话内部南海-番禺-顺德话、肇庆话、云浮市新兴县话的差别,可否追溯到此时。 汉统一岭南<br>,广信(今封开,在梧州东)成为岭南使用汉语的重心。汉末,西瓯演变为乌浒(唐朝时位汉化<br>部分演变为黄峒蛮),骆越与南迁汉族融合为俚僚。汉朝时期汉语在岭南得到一定程度的传播<br>,但远没有普及,这个时期西江土著民族的乌浒语-俚僚语与上古汉语有千丝万缕的联系,是<br>粤方言的前身,但还未成为汉语的方言。五胡乱华以后,南迁汉人亦不断增多,但数量上远<br>不及土著,被土著同化。广府汉族的先民乌浒-俚僚族,不是当时汉族的一部分,而是土著的<br>一部分。故乌浒-俚僚语,是今天壮侗语族的母语。梁陈两代广州都督府驻高要(肇庆市南),<br>高要成为推广汉语的中心。南朝时期,南迁汉人的有势力者成了土著渠帅,如冯氏、宁氏、<br>黄氏、陈氏,对汉语与土著语的结合起了重要作用;今粤语次方言分布区域,与之有一定联<br>系。如高阳话分布区域,主要是冯氏活动范围;钦廉话分布区域,主要是宁氏活动范围;邕<br>浔话分布区域,主要是黄氏活动范围;而广府话分布区域,则主要是陈氏活动范围。<br>初唐至盛唐,渠帅的势力仍相当强大,其时岭南是双语汉河镉胪林锿笔褂谩M硖埔?后,产生了中原汉语与土著语的结合物----广府话。宋朝,广府话经历了进一步吸收中原汉<br>语,使自己与汉语更加接近的进程。元代开始,广府话开始与中原汉语分道扬镳:北方话将<br>中古声韵向口腔前演变,造成前声母、前元音发达,而广府话则将中古声韵向口腔后演变,<br>造成后声母、后元音发达;北方话对古声调进行归并,而广府话对古声调续行分化。<p>(4) 闽方言<br>闽方言分为建瓯、闽东(福州-浙江泰顺县)、永安、莆田、闽南5个次方言,之间互不通行,<br>可能是秦汉时代汉人南侵时与当地的语言交互的结果。闽南次方言又细分为厦门-台湾话、舟<br>山群岛-古琉球群岛王室话、潮州汕头话、雷州半岛话、海南话。<p>(5) 楚语衍生出的三大方言<br>湘方言分布在湖南中部的湘水、资水和沅水中游东岸一带。内部有新、老两派的差异,新湘<br>语流行在长沙、株州等大城市,老湘语流行在沅水东南、湘水以西的娄底市双峰县-衡阳一带<br>。使用人数占汉族总人口的5%,以长沙话为代表。 吴方言使用人数占汉族总人口的8.4%,<br>以苏州话为代表。 分布在舟山市-东海-玉环县-洞头县-平阳县-苍南县-泰顺县-庆元县-福建<br>浦城县-江西上饶县-江西玉山县北-开化县北-建德县南-宁国县南-泾县南-黄山区太平湖-石<br>台县南-北南文化线的内部。 徽方言属于吴方言与赣方言的混合语言,分为五大片。一片包<br>括歙县、绩溪县、宁国县南部洪门乡,二片包括黟县、休宁县,三片包括祁门县、东至县东<br>南部木塔、江西省浮梁县-德兴县,四片包括浙江省淳安县、建德县,五片包括旌德县、石台<br>县占大、祁门县赤岭安凌、黟县美溪柯村。<br>句吴国贵族说的语言可能是周族语言,于越国贵族语言可能是夏族语言,于越句吴交往密切<br>,后来合为一国,周族、夏族语言融为一体,形成原始吴语。原始吴语后来与楚语交往密切<br>,特别是被楚国灭亡后原始吴语、楚语逐渐融合为远古吴语,远古吴语经过600年对土著吴越<br>的统治,二者在汉朝时期融合成中古吴语。永嘉乱后,秦雍流人(陕西甘肃以及山西一部分)<br>到达洞庭湖流域;青徐流人(山东以及江苏安徽一部分)到达太湖流域。 这次移民使北方方言<br>与南方方言的分野超过秦岭淮河一线并成为吴、湘两大系南方汉族的基本源流。南迁的流民<br>计90万,约占刘宋人口的六分之一。其中苏皖二省就占移民总数将近一半,江苏有些区段呈<br>高度集中状态,今南京以东至镇江一带北方侨民甚至比当地土著居民还要多。由于迁徙时间<br>集中,侨寓地区集中,侨居方式又多是聚族而居,因此北方方言必然要对土著方言发生冲击<br>。一方面使宁镇以西北地区奠定了江淮官话的最初基础,另一方面,又使镇江以东原有的中<br>古吴语受到影响,失去一些原有的百越特征,形成当代吴语的最基本源头。 藏缅、苗瑶、<br>扬越、华夏融合而成的楚人在战国时期半华夏化,自大量中原移民到达湖南,古楚语与中原<br>汉语逐渐融合成湘语。<br>(6) 赣客方言<br>赣方言分布在江西省大部(东北沿长江地带和南部除外),湖北省的咸宁市、通城、崇阳、通<br>山、嘉鱼、蒲沂、大冶、阳新,湖南省东部。安徽省岳西、潜山、太湖、宿松、望江、怀宁<br>、东至、贵池(西部及东南角)是受江淮官话包围的赣方言孤岛。以南昌话为代表,使用人数<br>占汉族总人口2.4%。<br>客家话,主要分布于广西东部部分地区、广东梅州、江西赣州、福建龙岩、台湾的苗栗新竹<br>桃园,湖南、四川还有一些客家方言岛。以梅州话为代表。 <br>在江西、湖南最初分布的是苗瑶语和扬越语。战国晚期,楚威王灭扬越,江西受到了楚文化<br>的强烈冲击,江西语言变成半华夏化的楚语与当地苗瑶语-扬越语的融合。永嘉乱后,司豫流<br>人(河南以及河北的一部分)到达鄱阳湖流域;安史乱后,移民江西的数量很大,赣东北的饶<br>州户数净增四倍之多、洪州增三分之二、吉州增五分之一。中原汉族人移民到江西中北部,<br>切断了吴湘二语的紧密联系,形成赣客方言的共同源头。<p><br>--<p>※ 来源:·北大未名站 bbs.pku.edu.cn·<p> <p>--------------------------------------------------------------------------------<br>本讨论区 主题模式 下一篇 同主题展开 <br 学知识,长见识,学! 中国方言部分太肤浅,请找详细文章。
页:
[1]