http://www.cat898.com/lib/readtext.asp?textid=3515
是拉丁化的迷思把文字改革引入了绝路(资料)
作者:朱成荫
--------------------------------------------------------------------------------
文字是最简明的大众化的工具,是不用前提,可以从零学起的知识。他是如此直接了当,根本用不着我们这些学士,硕士,博士去从事大科学的攻坚。我们也许能研制出一种精密的象二进制码或高级C++似的文字,但那已经不再是日常生活中的东西了。
越南文,韩文就是有一个类似汉语拼音字母表的规则来表达他们的语言。这样拼出来的文字能够表达他们的语言,就被大众接受了。我们羡慕人家的文字改革,我们自己也有汉语拼音表。汉语拼音成不了文字只能怪我们自己的语言对拉丁化水土不服。
并不是所有语言都可用26个字母可以清晰表达的。就以同是欧洲语言的西班牙语就有29个字母,但光从发音来说,26个字母完全够了。但一旦只用26个字母就会出来一大堆同音字。而汉语普通话的情况更是严重,1200个音节,但有5倍左右的常用字(GB2312?),所以平均需要再增加5个非发音的表形字母才能表达汉语。考虑到同音字的不均匀分布,再增加5个字母也远远不够。而要用现有26个字母中的某些字母来起到这些不发音字母的作用或用大量的异拼,只会对拼音系统产生干扰,让人觉得还不如汉语拼音本身。拉丁化已经山穷水尽了,该想的办法都想过了。例如分词联写。现有的汉语拼音也只有用分词联写才能读懂。但分词联写是想在词素(字)不清晰的情况下用更大的单位(词)来浑水摸鱼混过去。但实际上还是混不过去。分词联写后歧义很少了,但那时一种没有词素的文字,或者说每一个词都是一个独立的词素。任何两个词之间都没有关系。学和用这样一种文字的工作量比五种欧洲语言的总和都可能不止。分词联写是典型的东施效颦,邯郸学步。汉语是单音节以字为单位的,就象越南语即便是拉丁化了还是但音节拼写的。
我们当然也不必对汉语或汉字自卑,他有传统的拼音文字无法比拟的长出。或许用更多的字母可以实现汉语的拼音文字。但一旦需要用到非表音或表意的成份,恐怕没有什么字母能起到汉字偏旁部首的作用。举一个极端的例子。在汉语的元素周期表里,只要知道了该原素的汉字名,几乎不用背就知道某一元素的类别,属於金属还是非金属,在常态下是固态,液态或气态等。没有一种拼音字母文字有这样的能力。
此外把汉字与拼音文字对立起来,非黑既白,也是一种误解。文字可以是音素化的,也可以是表音(音节)化的(如形声字,日语假名)。如果表音化更适合汉语,为什么非要另起炉灶呢。
楼下汤光大所提到的袁晓园先生的双拼意音文字在技术层面是成功的。他只有很少的同音同形字,而且基本上保留了汉字的偏旁。人们不接受是社会层面的问题了。这恰恰也提醒我们应该尊重汉字自身的规律(形声字),来改良汉字,而不是革命。
国家已经给予拉丁化足够的机会和投入,它是一个抬举不起的阿斗。如果真是为了汉语文字的便利及发展,就应从否定汉语拉丁化,尊重汉字自身的发展规律着手。从文字本身来讲,拉丁化吗?汉语拼音已经到顶了。从个人来讲,文改的热心人士们,在拉丁化的牛角尖上继续钻下去,只是徒然浪费人生而对社会却毫无贡献。
为什么要用字母标调法呢?
从手写的角度,符号标调毫无问题。字母标调使拼式更长。
从印刷出版角度,不知道有没有什么区别。
从机械英文打字机打字的角度,当然字母标调法更方便。因为没有汉语拼音打字机。但现在几乎没有人再用机械的英文打字机了。从打字机的机械设计上来说,声调符号不是什么问题。越南文打字机就可打声调符号。只不过是在打声调符号时水平方向不移位而已。
从电脑键盘输入的角度,几乎所有西欧国家及拉丁美洲国家的文字都是用符号标调的,没有什么输入的困难。在美国英文的键盘上定义成 US International 就可从键盘上直接输入带声调元音字母了。当然目前的拉丁字符集(Western European)现成的只有第二和第四声,第一和第三声没有与汉语拼音完全一致的标调。但可采用相近且一目了然的替代品。如对第二和第四声不愿用替代品,可创立独立的汉语拼音拉丁字符集。
所有这些都是因为从阅读心理的角度,符号标调的准二维特征是最为顺畅的。例如王先生的大名:
Wáng Liángchén
用符号标调非常直截了当,阅读是线性的。
如用字母标调,
Wangk Liangk Chenk
则从W到g或L到g时需要把信息暂存,然后再把声调符号k加上才算完成。
而拼成Liangchenkk 更是不用再评论了。不要小看这一点点磕巴。每个字上积少成多,这恰恰是国语罗马字推行不开的问题之一。而且从横向看,越南文虽然满脸麻点,但人家用得很舒服。拼音壮文和拼音苗文用字母标调,干净利落,而且没有如汉语般严重的同音问题,并且有国家的法定民族文字地位。可人家愣是宁可用古壮字(类似汉字)和汉字。字母标调不能不说是一种失策。
西方文字是以词汇为基本单位的,而汉字虽然也有词的概念,但本质上是单音节的字或词素为基础的。但不管西方词汇也好,汉字词汇也好,都是建立在词素的基础之上的。
假如每种语言都需要20万词汇。
对於汉字来说,就4-5000个字可复合出这20万词汇。每个字相当于一个词素。而且在字的层面上就已经有了属性的含义,例如安按案鞍氨铵,这是西方文字无法比拟的地方。有了词素,分词连写与否无所谓。写成 文字改革运动积极份子 或 文字 改革 运动 积极 份子 没有更便利,也没有更不便利。
对於英文来说,由派生和复合产生这20万词汇,但外来语音译的无理成分多一些。虽没有认真统计过,估计也就一万来个词素。
西班牙语或世界语的派生占主导,词素的重复利用率高。所需词素比英文少一些。
假如分词联写就能成为文字,汉语拼音的20万词汇就需要20万词素。词汇之间无法找出共同成分作为词素。这就是汉语拼音繁难和不能作为文字的根本原因。
对西方文字来说,有的文字喜欢连写成很长的词,如德语。有的文字比较喜欢不太长的词汇。有了清晰的词素,长词和短词一样清晰。例如世界语网站上的自学课这个词。
英文写成三个词 teach-yourself course。
西班牙语写成两个词: curso autodidacta。
荷兰语写成一个词: zelfstudiecursus。
有了, auto, self, Zelf (自己)
teach, didacta(didactic) (教) 或
studie (study) (学)
course, curso, cursus (课程)。
这些清晰的词素后,各语言词汇只是根据自己的喜好可长可短。
对于汉字来说,自学课也有 自 学 课 三个清晰的词素。 所以写成 自学课 或 自学 课 都应该可以。
而对於汉语拼音来说,只有写成,zìxuékè 才猜得出来。因为没有词素, 单独拼写时, zì 或 xué 或 kè 可以是任何东西。
所以没有词素不可能被人们接受为文字,就算分词连写也不可能浑水摸鱼混过去。
把拼音文字视为民族主义的象征
韩国大力推广全面使用表音字起于1950年的韩战。战事中全国青年参军受训。他们由于学历参差不齐,读不懂混有汉字的教科书。于是首先在军队中统一使用表音字。而后扩展到全社会使用表音字。
另一方面,朝鲜北部也从1949年起全面废除使用汉字,逐渐过渡到一律使用表音字。不过1968年在金日成指示下,修改了一律使用表音字方案,逐步恢复汉字教育。目前朝鲜小学生从五年级开始学习汉字,至高中毕业止学习1500个汉字。大学期间再学习1500个。共计教授3000个汉字。同样是在1968年,韩国的朴正熙总统下令从1970年起,公文中禁止使用汉字,强行废除教科书中使用的汉字。
在朴总统坚决推行使用表音字的背后,强调的是土著民主主义以此解释自己的偏执。当时的朴总统企图终身独裁专制,于要求实行欧美式民主的人们针锋相对。以倡导土著民主主义,竭尽全力强调各国各自的土著制度和精神,在此基础上推行文字拼音化。总统的一句话就废除了汉字教育。
独裁者在文化上胡乱多嘴,没有不出乱子的。
鉴于社会舆论对废除汉字教育的批判压力,韩国政府开始修改全面废除使用汉字方针。
1972年确定恢复中学、高中的汉字教育。1974年确定学习1800个基础汉字(初中900个,高中900个)。并允许汉字在国语和国史教科书中加到括号内使用。
但是,在表音字使用占多数人的社会里,青年人对学习汉字无兴趣,考大学试题也不包括汉字知识,学生学习汉字没有压力。学习属于象形文字的汉字,适于从小学学起,从中学开始学习的话效果欠佳,造成一代人不识汉字的后果。
*两派争论逐步升级
随着全面废除汉字教育,人们开始感到不方便,掀起各种形式的要求恢复汉字教育运动。
170多个社会团体联合组成全国汉字教育推广总联合会,1998年11月17日召开总动员大会,提出"从小学接受汉字教育,摆脱文化危机"的口号。大会通过议案︰1,小学学习汉字1000个;2,小学至高中的教科书汉字与表音字混合使用;3,允许公文、路标、招牌等汉字与表音字混用;4,奖励新闻媒体采用汉字表音字混用方式。
大会还向国会提议,"废除表音字专用法案"。赞同的7000多名政界、财界、学术界、宗教界、文艺界知名人士联合签名。
但是,表音字专用者也没有沉默。1997年11月下旬,以韩国表音字学会为中心的表音字专用实践促进会,在诸多大报上发表声明,强调"在韩国解放半个多世纪的今日,更要坚定不移地使用表音字"。他们攻击对方大肆赞美汉字的用意,在于恢复到旧王朝时代,说汉字使用者企图将韩国国语作为方言、表音字只允许作为记述方言的"谚文"。该促进会认为,韩文的表音字功能与汉字相比不但绝对的好,而且能表现出民族自主精神,所以主张全盘表音字化。他们还主张坚决彻底地贯彻"表音字专用"方针,要求立即停止目前的中学汉字教育。此外,该促进会积极促成把制订发布表音字的10月9日定为法定公休节日。
为维护表音字专用法,他们开展了轰轰烈烈的1000万人大签名活动。
双方围绕着是否恢复使用汉字问题的争论升级到不仅是理论之争,扩展升华至民族感情层次。
强调全面废除汉字给社会带来困惑的人们认为,最近政治混乱和经济危机是因为"表音字一代"人文知识欠缺所致,造成伦理、哲学、思想、道德上的混乱。在迎接亚洲太平洋时代,在中国、日本、台湾、新加坡、香港的汉字文化圈中,只有韩国使用表音字特别孤立,妨碍文化交流,阻碍经济发展。
表音字专用者强烈攻击对方,为使其理论合理化,用尽诡辩、谎言招数,且不惜重金刊登广告造谣惑众。在政治腐败严重的情况下,出巨资掀起文化运动,如同搞政治运动,不知其目的何在。他们还纠集有权势人物,企图以金钱和权势左右韩国文化政策。
韩国新闻界对双方褒贬各半,使得双方争论更加激烈。
决大多数常用汉字(三千数内的)和英文都有一对一的关系,比如:I我,YOU你,WE我们,EAT吃,LOOK看,HEAR听,TALK讲,MAKE制作,COME来,GO去,HERE这里,THERE那里,IN在,WORD字,LETTER字母,GOOD好,BAD坏,MEAT肉,MEET遇见,........它们多都是单音节的,这是人类从原始语言状态走来的痕迹.中国人认为这是语言的优势?英文中有上万个单音节字,比汉字一点不少,比常用汉字多的多,它们都是常用的.从如此一一对应来看,汉字的常用字和英文常用字比也是比不过的,而学会这些字,对美国的孩子来说,根本就不用上学,更枉谈用九年时间去学.我昨天去一个台湾朋友家,他的孩子才五岁,也没上过学,就在那里读英文书,她的识字量决不在一两千以下,但她仍然是文盲,因为如果你给她一个科技文章,一个银行表格,一篇报纸,她不一定能读的懂.中国人中有多少具有这种阅读能力的? 如此统计的话,中国的文盲率恐怕要超过50%.著名语言学家吕淑湘先生说得好,"用十年时间,二千七百多个课时,学习本国语文,却多数不合格",他这一个"多数不合格"恐怕比我说的50%还高,这才是有价值的有权威的理论依据!我只相信这样的数据!
Thisbookisveryinteresting.(This book is very interesting.)如果其间不加空格,可能没多少人能一两下子认出来(也可能除本人外别人根本就不知所云),而用汉字来记录则为“这本书很有趣。”即使不分词来写也不会造成解码的错误,
《汉语拼音》小报,有一篇知识小品,题目叫做《Sanxianggui》看不懂;标上声调《San4xiang1gui1》,好象懂了一些,但是拿不准;最后看汉字是《散香龟》这才懂了,是介绍一种能散发香的乌龟。为什么汉字一看就能懂呢?
是用来表示“散”、“得”“龟”这三个词根的整体的音节 书写形式 的基本意义,把它们合起来就理解了新词的含义。所以我们说,先通过若干个不同的音节 书写形式 去定型词根,然后以此为基础去定型词语,是汉字的长处和成功的经验。
huaren好象还是刚涉足汉语拉丁化拼音文字研制的领域,对于文字改革领域的已经发生过争论好象还知之不多。你提的问题其实在拉丁派早就有过争论。所谓“拉丁派”是指主张改汉字为拉丁化汉语拼音文字的一派。这一派的主张在使用拉丁字母方面是一致的,但在如何拼写汉语上却存在“北拉派”和“国罗派”两派的分歧,“北拉派”认为文字是记录语言的工具,语言怎么说,文字就应该怎么写,没有必要将同音的汉字用不同的字形来写;“国罗派”则主张文字不同于音标,文字的表达要能够准确地表达语义,因此对于容易引起歧义的同音词或同音语素要在字形上加以区别。他们所使用的方法大致类似于你所说的增加“形素”的办法吧。但由于汉字的同音词和同音语素太多,至今还未能拿出个大家都能接受的方案。
你说:“从数理逻辑上看,26的三次方就17576个不同组合了,也就是说三个字母的不同排列组合就能造出17576个不同的字.”
这只是个纯数学的计算方法,没有考虑到对于汉语来说,有许多字母是不能够组合的因素。比如X、I、N、G这四个字母 ,按数学方法计算,可以有4*4*4*4=256个组合,而对于汉语来说,只能有XING、XIN、IN、ING、NI、XI这6个音节符合汉语普通话的实际语音。这种情形与汉字的组合是一致的。有人说汉字常用字有3000多个,就可能组合成两字词9000000个,这也是不对的,因为不是每个汉字都能与另一个汉字随意组合成词的。
关于拉丁化汉语拼音文字字形分辨率不高的问题,请看我这篇文章的以下一段:
2.用拉丁字母来拼写汉语,势必造成音节冗长,不利于速阅。
主张拉丁化的人往往也主张音素化,因为只有音素化才能较好地解决拉丁字母不够的问题。但是这样一来,词汇就会变得很冗长、累赘。汉语的特点是:音节整齐、复韵母很多。这些特点很适合双拼,如果采用音素拼,音节就会很长。有人统计,认为汉语拼音文字平均每个音节只有2.5个字母左右。这种统计是不科学的,因为汉语音节的使用频率不同,正确的统计应该是在汉语拼音写的文章中统计。我统计了《语文现代化》刊登的几篇拼音文章,结果是平均每个音节3个字母。值得一提的是,这些词汇都没有解决同音词问题;此外,声调还没有统计在内。可见,如果连声调也统计在内,如果还要用不发音字母来区分同音词根,这些词汇还将更长。这种一条长龙似的文字是不利于速阅的。我们在现实生活中都有这种体会,看短的数字和单词要比长的反应快。例如,“中国有十亿人口”这句话,我们可以一目了然,可是如果把“十亿”分别写成十进位的1000000000,或者写成二进位的111111101100001100101000000000,那么就一定把我们搞得眼花缭乱。为了便于阅读和节省纸张,数学家就想出个好办法来缩短数字,如把1000000000写成10的9次方 ,这样写既简短又明确。汉字实际上就是把音、形、义压缩在一个方块上的文字,很便于眼睛扫描速阅。
3.拉丁化的汉语拼音文字音节沾连不清和容易松散。
26个拉丁字母不能适应汉语语音特点,往往要双字母来表示一个音素,这不但加长了本来就很长的音节,还容易造成音节松散和沾连不清。例如汉语拼音方案的n、g既作声母,又兼作韵尾,而声母为n和g,韵尾为n和ng 的汉字又特别多。我粗略统计一下《汉语小词典》中的7197个汉字,其中以n、g为声母的汉字达总字数的7.89%;以-n为韵尾的汉字达14.38%;以-ng为韵尾的汉字达25.71%。由于汉语词素构词具有灵活缀另的特点,词儿连写后,韵尾n 、ng往往夹在词中间,造成前后音节容易沾连和松散。例如,dangan 可读成dang an(挡案),也可读成dan gan(单干);fangan 可以读成fang an(方案),也可以读成fan gan(反感);即使标上声调,也还人错读的可能,如fanan 可读为fa nan(发难),也可读为fan an(翻案)。还有些音节可以分离为两个,如xian(先)可读成xi an(西安);tian(天)可读为ti an (提案)等等。有许多词,在有前后文的情况下是不会误读的,这是因为我们知道别的读音是无义的。例如tiane(天鹅),我们决不会错读为ti an e 、ti a ne、或tia ne,这是因为我们知道别的读音是没有这个词的。但是,对于不懂汉语的外国人或者是掌握词汇还不丰富的儿童,他们就有可能读错。所以这种文字要不就要标上密密麻麻的调符和隔音符号,不然让外国人来学习,还得借助国际音标,正如我们要靠国际音标来学习英文单词一样麻烦。
4.拉丁化的汉语拼音文字字形分辨率不高,阅读效率很低。
有一些现象很值得研究:我们可以在书中一眼认出一个繁体字来,可是却写不出来;有些字印刷得很模糊,只有个轮廓,可是我们还是能认出来;人们经常弄错的多是些形体相似的字。这些现象说明,人看书时是从大处着眼,从字的轮廓就认出来的。再如:看一段字体潦草的文章不觉得太困难,可是如果把这些字的次序打乱,就很难认出这些字来;初学英语的人往往容易混淆form、 from 和farm 三个单词,掌握一定的语法后,就不会弄错;“他长高了”和“这绳子很长”这两句话中的“长”是同形异义词,人们还不会弄错。可见看书时,逻辑思维起到很大作用,看不清的字或同形词、近形词,我们都可以从前后文分辩出来。
由于这个原因,词性相同词形相近的词往往容易弄错。例如,“房间里设有暖气装置”这句话很容易被误为“房间里没有暖气装置”。拉丁化的纯拼音文字有许多词形相似、词性相同的词,如 ma1(妈) ma2(麻) ma3(马) ma4(骂)只有一个调符之差;fangan (方案)和 fangan(反感)只有两个调符之差;shuang(霜)和 chuang(窗)只有一字母之差;zhuangzhu(壮族)和 zangzhu(藏族)只有二字母之差。由此可见,这种文字的字形分辨率是很低的,可能比任何别的拉丁化拼音文字都低,这是因为汉语实际上只有四百多个音节,加上声调也只有一千三百多个音节的缘故。
字形分辨率这样低的文字,是不利于快速阅读的。平常我们阅读汉字文章要比汉语拼音的快,是因为汉字的字形分辨率高,字形可以直接作为条件反射的信号通过视觉器官引起大脑的反射活动。也就是说字形可以直接达意而不必通过语音媒介。有人不同意这种看法,有位专家写道:“……如果文字的形体能够直接表达人的思维活动、认识活动,我们应该能够教会一个外国人认识汉字的意义而不教给他读音,让他认三、四千个汉字,能看懂《人民日报》,虽然一个字也读不出。难道这可能吗?假如可能,那一定是因为他自动地按照他本国的语言来读汉字:比如《人民日报》他就读为(当然不一定读出声音来)People's Daily ,如果他是英国人;Hapo ha a e a ,如果他是苏联人。不通过语言而能认识整套的文字的方法是没有的。”(注6)
从这位专家的话可以看出,他的意思是说,既然学习文字要通过语言,所以我们看书时也要经过语音媒介才能达意。这个道理似是而非,我们应该搞清楚。
事实上,教会外国人认识汉字的字义而不教给他们读音,却能看懂《人民日报》的事已经有了。据报道,美国有一个时期急需一批中文翻译人员,办了个中文速成班,要求学员只会汉字的字义而不需要学习汉字的读音。结果一年以后,这些学员就可以阅读《人民日报》了。至于这些外国人用本国语言来读汉字,只是为了更快更方便罢了。如果不是这样,就得用实物来帮助他们一个字一个字地认识汉字。例如,教“水”字时,就得拿一桶水来给他们看,这正如教一个天生的聋哑人一样,这多么麻烦。幸好这些外国成年人 原来已经掌握母语,现在只需告诉他“水”是Water就行。由此可见。本国语言在这里只是使汉字和它表示的事物之间建立联系的中介物。当“水”字作为一信息符号在这些外国人脑中建立了条件反射后,他看到“水”字时,他们的脑中所反映的就不会是“Water”这个音,而是一片水而已。我们学习外文都有这种体会:初学时往往要把外文还原成中文才能达意,熟练后,就可以直接达意。
学习本国文字也大致一样,也要通过语言,因为我们在学习文字之前就已经学会口语,通过语音媒介才更方便地掌握文字。幼儿学习文字光靠语言还不够,往往还要借助其他补助手段,如看图识字。这是因为他们的口头语言还不丰富。学会文字后,字形就可以直接作为代表某种意义的信号引起人们的大脑的反射活动,而不需要经过语音媒介了。
由于人学习文字要经过语音帮助,又由于现代文字一般都是意音文字,与语言有一定的关系,所以有些人便误以为人看书时是先经过语音媒介才能达意,从而否定了创制新文字是,应注意新文字要具有较高有字形分辨率。这种否定字形可以直接达意的观点无疑等于否认实物可以直接达意一样。例如,我们看到纸上画着一匹马,是否要嘴里念出“ma”音后,头脑中才能反应出“马”的形象呢?显然不是。巴甫洛夫的实验表明,不仅铃声,单独灯光或者符号都可以引起狗分泌唾液的反射活动;天生的聋哑人可以学会手势语;人看书的速度比听书的速度快:许多人学会看懂英文,却听不懂英语。这些事实都能说明一定的问题。
1、汉字和英文在计算机系统中,可以表示为内码。如果想知道一个字的内码,可以用函数Asc()得到。比如说,asc("a")=97,hex(asc("啊"))=b0a1
2、内码本质上是字形码的地址。无论汉字还是英文,都是用点阵来表示字形的。表达字形的编码叫字形码。显示一个汉字,最小的是用16*16点阵来标示的。英文和汉字的区别只在于它们的字符集大小不同。在早期的计算机中,因为英文的字符集小,当然是读入内存的,而汉字的字符集大,就只能放在磁盘上,这样一来,汉字系统就既复杂又没有效率。现在,这些问题基本不存在了,比如10万汉字,每字32字节,共100000*32=3.2M
存放字形的文件叫字库。除了显示字库,还有打印字库。字库除了点阵字库外还有矢量字库。
3、不同的计算机系统中的内码是可能同的。这样一来,就需要有交换码。交换码是“大同语”。
4、一般来说信息是以文件形式保存在磁盘上的。这样一来,又与文件格式有关了。比如说,word格式或WPS文档各式,还与是否加密有关。
磁盘上的信息,如果能看见,那么,他们象馒头一样,一圈圈地排列着,不同的信息,只是馒头摆放的间隔不同
5、把汉字输入计算机的方法很多。用键盘输入的方法分为:大键盘方案--就是作一个大键盘,上面排列出所有的汉字。中键盘方案,键盘包括构字的部首,然后组字。小键盘方案--就是现在普遍应用的编码输入法。
汉字用输入法输入计算机,仅仅是因为这种方式比较好,(所以大键盘方案已经没人研究了)。
用不用输入法,从用户角度来看,只有按键多少的区别。