设为首页收藏本站

僚人家园

 找回密码
 注册

QQ登录

只需一步,快速开始

点击进入授权页面

只需一步,快速开始

扫一扫,访问微社区

搜索
查看: 3659|回复: 6
打印 上一主题 下一主题

水书水字类属码的研究

[复制链接]

458

主题

2

听众

2万

积分

灶君

Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16

最后登录
2014-11-16
注册时间
2007-2-14
跳转到指定楼层
楼主
发表于 2009-4-15 09:16:00 |只看该作者 |倒序浏览

水书水字类属码的研究

1 引言

在我国贵州省南部的三都水族自治县、荔波县等水族聚居地区,至今还使用流传着一种古老的民族宗教典籍“水书”,见图1在水族人的社会生活中,水书至今还起着很重要的作用,特别是丧葬、营建、出行、过节、占卜、农事等活动中发挥着指导规范的作用。水书水字中蕴藏着的语言、文字、天象、历法、宗教等方面的丰富资料,具有重要的学术价值水书在2006年入选为国家第一批非物质文化遗产名录。水书中所用的符号大致有1200多个,其中异体字很多,将异体字除外大致有500余个。长期以来,国内外许多专家学者对水书进行了深入的研究,在研究过程中需要对大量的水书文献进行信息化处理,水书文字的编码已成为人们关注的问题。本文对水书水字的特点进行了分析,提出了水字类属编码的模式。





  

  

  

  

 

2 水字的构形规律

    水字即水书中所用的符号,按形体及音义对应关系,可分为图象符号和文字符号两类。水字图象符号所代表的含义大致可以理解,但读音不够明确,主要有象形水字与图画水字;水字文字符号则形、音、义俱全,其构形主要有指事、会意、假借以及汉字的反写等几类。

21 水字图象符号

21 水字图象符号

21 水字图象符号

21 水字图象符号

    象形水字,占比重较大,约占水字单字总数的30 以上,这类字抓住实物的特征,用简单的线条来表示。例如:(1)以动物形体特征造字;(2)以植物形体造字;(3)用物质现象造字;(4)模仿用具造字;(5)有的描摩人体器官造字,见图2

图画水字则是水族原始宗教的各种密码符号等,见图3

图画水字则是水族原始宗教的各种密码符号等,见图3

图画水字则是水族原始宗教的各种密码符号等,见图3

图画水字则是水族原始宗教的各种密码符号等,见图3

 










 





 








    22 水字文字符号

    指事字,多为表示方位的字,也有指明某一现象的,约占水字单字的20%。会意字,以两个以上符号或单字合在一起造字,约占水字单字的30% 。假借字,借用已有的字来表示某个同音字。汉字的反写,在水字构成中,有相当数量的汉借字是汉字的反写、倒写、侧写等所以当地人习惯把水书又叫做“反书”,这些“反书”都用水语认读。水书中的多数干支和数目字是汉字的反写,见图4

水书是一种比较原始的文字系统,水书文字因为都是手写,显得随意,古拙,与甲骨文字形特征有相似之处[3 ]。水字大都具有图画性,即使是一些指事字、会意字也是以象形字为基础。水族文字的发展因受到各种条件的限制,均系手写抄录而没有统一的刻版,因此字形的异体字相当多,个别字的异体字达2030来个。 

    3 汉字编码与水字

    31 汉字编码方式与水字编码要求

    目前汉字编码方式可分为形码、音码和音形码三类。形码是按照字形构造特征进行的编码,大致有笔形码,以李金铠的笔形码为代表;字根码,以五笔字形为代表等。形码的思路是将一个字拆分成各个部位,然后根据部位的字形特点进行编码。笔者在前期的研究中,也按照汉字形码的模式,对水书文字进行了编码,提出了水书文字拆分原则和部件形态特征近似归类,并按其归类特征与键盘符号近似实现映射。对于字形复杂的图画水字来说,用汉字形码的模式进行水字编码有很多不足,首先是水字字形复杂,大多不甚规则,在此基础上提取的部件很难与实际的水字字形准确对应,并且很多水字没有明确的分界,无法进行拆分。汉字音码是按照汉字的读音特征进行的编码。由于水字的音节较多,并且发音较难,使用音码来实现水字的有序性也比较困难。音形码是字形和字音的混合编码,其基础必须有字的读音和规则的字形,这对水字也不合适。





    32 水字“象形”编码模式

    由于水字与甲骨文字形相似,参照甲骨文“象形”编码,笔者也试图从水字的“象形” 模式入手构建水字编码。水字“象形”码固然能体现水字图画符号的特点,但由于水字字形复杂,大多不甚规则,在此基础上提取的码元很难与实际的水字字形准确对应。其次是码元较多,记忆很困难,在键盘上执行操作也困难,实用性不足。

    23 水字“部首”编码模式

    传统研究汉字结构的模式是把汉字分解成三级:字符/部首/笔画,以此排列汉字的生成序列。笔者也曾以部首模式进行水字文字符号编码,但这种模式只能解决水字中部分合体结构的字。更确切说,只解决部首具有一定规模的字,而对独体字和少量不具部首规模的合体字,则不好归属,尤其是形体复杂的水字。

4 水字类属编码模式

4 水字类属编码模式

4 水字类属编码模式

4 水字类属编码模式

    从上面的分析,可以看出传统的汉字编码模式不适用于水字编码,水字编码要有自己的编码模式。笔者本着科学、实用、易学的原则,提出水字类属编码模式,下面就其编码模式进行介绍。

41 水字类属码

41 水字类属码

41 水字类属码

41 水字类属码

    水字类属码按照水字内容给予归类,由四位编码组成,第一码位为水字的类别码,其类码内容为:0 正体水字码,是指遵从某种选字规范和标准,确立了官方地位的水字;1 异体水字码,标明该水字为异体水字;二码位为水字的属性码,根据水字内容的属性进行归类编码,具体为:0 星宿鬼神属性码,1 天地属性码, 2 禽兽属性码,3 鱼虫植物属性码, 4 房屋器具食物属性码,5 人体人事属性码 6 季节时辰属性码,7 方位形状属性码,8 数名属性码,9 行为属性码,见表1。第三四位编码为十六进制顺序码,指明水字在各属性中的摆放顺序位置。异体字除第一码位为1外,其他码位内容都相同。 













 例:

 例:

 例:

 例:

       汉字译意为马,正体字,禽兽属性,排列为04,类属码为0204

    汉字译意为上,正体字,方位形状属性,排列为24,十六进制为19H,类属码为0719

42 水字类属码的特点

  ●         水字类码可以标明正体水字和异体水字,这对异体字较多的水字来说,特别适合。

     目前,经过校勘和甄别的正体水字有500余字;异体水字有700余字。水字类属码后两位十六进制顺序码可容纳256字;加上10位属性码,可容纳2560字;再加上2位类码,可容纳5120字,对只有1200余字的水字来说,完全足够。每位属性码的水字统计数见上表。

     水字类属码在水字录入时,不用对水字进行折分,特别适用于可视化录入。2种类码和10种属性码,记忆量很小,只要了解水字的含义就能很方便地进行查找寻入,当然水字可视化输入是不可少的。

43 水字可视化输入的实现

43 水字可视化输入的实现

    水字可视化输人法有别于一般意义上的输人法,它是通过鼠标点击输人水字,而不是编码输入,既形象又不需要记忆。水字可视化输入包括两部分:字库、水字类属码转换码表和输入程序。

字库采用的是黔南民族师范学院自主版权的水书字库,该字库所有水字都是依据水书中较常见字形,经过水书研究人员临摹并加校勘、释文收录正体水字471个.异体水字613个,按照Unicode编码存放于EUDC用户自定义区。

水字类属码转换码表中一个水字对应一条记录,一条记录中有5个字段,各字段间用分号分开。第一字段为水字Unicode编码,指水字存放在用户自定义区Unicode编码的值,也是机内码,用十六进制表示;第二字段为水字汉译名称;第三字段为水字类码第四字段为水字属性码;第五字段为顺序码。例:

 汉字译意为马,类属码为0204,其存放码位值为E020H。在水字类属码转换码表中对应记录应为:E020;马;0204

输入程序读入水字类属码转换码表后,在窗口中显示正体字的全体属性码,鼠标点击某个属性码后,窗口显示选中属性码对应的全部水字及汉译名称,双击某个水字即可在字处理软件(Word)输入该水字。

5 结论

5 结论

5 结论

5 结论

本文对水书水字的特点进行了分析,认为传统的汉字编码模式不适用于水字编码,水字编码要有自己的编码模式,提出了水字类属码的编码模式,概述了实现水字可视化输入的思路,希望得到专家与同行的指正。 

参考文献

 曾晓渝,孙 易. 水族文字新探[J]民族语文, 2004年第 4 :1318页.

蒙景村. “水书”及其造字方法研究[J]黔南民族师范学院学报, 2005年第 1 : 2326页.

邓章应. 水书造字机制探索[J]黔南民族师范学院学报, 2005年第 2 : 6873页.

 董 芳.“水书”文字编码方法研究[J]黔南民族师范学院学报, 2006年第6: 14页.

韦宗林. 水族古文字计算机输入法[J]贵州民族学院学报(哲学社会科学版), 2000年第4: 1319页.

 谢谦,芮建武等. 编码字符集标准及分类研究[J]中文信息学报, 2006年第20卷第4: 8389页.

肖明,赵慧等. 甲骨文象形码编码方法研究[J].

    中文信息学报, 2002年第15卷第5: 6065页.

孙基寿. 汉字输入编码优劣评测方法的探讨[J].

    中文信息学报, 2006年第20卷第5:97104页.

Research on the classified-attributive code of the Sui script

DONG  Fang   Luo  Gang

( Qiannan Normal  College for Nationalities, Duyun 558000, China )

Abstract  So far an ancient ethnic and religious scripture “ShuiShu” has also used in the south of Guizhou province in our country. Since the font style  of the Sui script is complex, it is difficult to correspond to the fonts style of the Sui script  for components and the code dollar in the Chinese character coding theory. It is more difficult to pronounce the words of the Sui script characters, and It is also more difficult to actualize its order by adopting the voice code theory. This article puts forward the coded mode of the class attribute code of the Sui script and also categorizes according to its content. The mode is made up of  four codes. The first code is classified code, which is to differentiate between the upright sui character and sui xenogenous character. The second is attributive code, which is to code the content of the sui script.The third and fourth are to put ordinal positions of the Sui script in every attribute.

( Qiannan Normal  College for Nationalities, Duyun 558000, China )

Abstract  So far an ancient ethnic and religious scripture “ShuiShu” has also used in the south of Guizhou province in our country. Since the font style  of the Sui script is complex, it is difficult to correspond to the fonts style of the Sui script  for components and the code dollar in the Chinese character coding theory. It is more difficult to pronounce the words of the Sui script characters, and It is also more difficult to actualize its order by adopting the voice code theory. This article puts forward the coded mode of the class attribute code of the Sui script and also categorizes according to its content. The mode is made up of  four codes. The first code is classified code, which is to differentiate between the upright sui character and sui xenogenous character. The second is attributive code, which is to code the content of the sui script.The third and fourth are to put ordinal positions of the Sui script in every attribute.

( Qiannan Normal  College for Nationalities, Duyun 558000, China )

Abstract  So far an ancient ethnic and religious scripture “ShuiShu” has also used in the south of Guizhou province in our country. Since the font style  of the Sui script is complex, it is difficult to correspond to the fonts style of the Sui script  for components and the code dollar in the Chinese character coding theory. It is more difficult to pronounce the words of the Sui script characters, and It is also more difficult to actualize its order by adopting the voice code theory. This article puts forward the coded mode of the class attribute code of the Sui script and also categorizes according to its content. The mode is made up of  four codes. The first code is classified code, which is to differentiate between the upright sui character and sui xenogenous character. The second is attributive code, which is to code the content of the sui script.The third and fourth are to put ordinal positions of the Sui script in every attribute.

( Qiannan Normal  College for Nationalities, Duyun 558000, China )

Abstract  So far an ancient ethnic and religious scripture “ShuiShu” has also used in the south of Guizhou province in our country. Since the font style  of the Sui script is complex, it is difficult to correspond to the fonts style of the Sui script  for components and the code dollar in the Chinese character coding theory. It is more difficult to pronounce the words of the Sui script characters, and It is also more difficult to actualize its order by adopting the voice code theory. This article puts forward the coded mode of the class attribute code of the Sui script and also categorizes according to its content. The mode is made up of  four codes. The first code is classified code, which is to differentiate between the upright sui character and sui xenogenous character. The second is attributive code, which is to code the content of the sui script.The third and fourth are to put ordinal positions of the Sui script in every attribute.

Key words  the  characters of Shui minority, the sui script, the classified-attributive code 

:水书正体水字Unicode编码表

作者:董 芳,男,1957年生,教授,专业方向:网络与数据库、民族文字编码研究

联系地址:贵州省都匀市黔南民族师范学院,邮编:558000

联系电话:13885408538       Email: FDong_gz@Tom.comFDong_gz@Tom.comFDong_gz@Tom.com@Tom.com

科研项目:全国社科规划课题:水族水书语音语料库系统研究;编号:07XMZ004



联系电话:13885408538       Email: FDong_gz@Tom.comFDong_gz@Tom.comFDong_gz@Tom.com@Tom.com

科研项目:全国社科规划课题:水族水书语音语料库系统研究;编号:07XMZ004



联系电话:13885408538       Email: FDong_gz@Tom.comFDong_gz@Tom.comFDong_gz@Tom.com@Tom.com

科研项目:全国社科规划课题:水族水书语音语料库系统研究;编号:07XMZ004



联系电话:13885408538       Email: FDong_gz@Tom.comFDong_gz@Tom.comFDong_gz@Tom.com@Tom.com

科研项目:全国社科规划课题:水族水书语音语料库系统研究;编号:07XMZ004



科研项目:全国社科规划课题:水族水书语音语料库系统研究;编号:07XMZ004





 








 

 


[此贴子已经被作者于2009-4-15 17:34:46编辑过]

分享到: QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0
帖子永久地址: 

僚人家园 - 论坛声明1、本主题所有言论和图片仅代表作者个人的立场,不代表本论坛管理方立场。
2、本站所有主题由该帖子作者发表,该帖子作者与僚人家园享有帖子相关版权
3、其他单位或个人使用或转载本论坛原创文章时须征得作者本人及僚人家园论坛管理员的同意
4、发帖者承担因本文发表而直接或间接导致的相关责任。僚人家园管理团队有事先不通知发帖者而删除或屏蔽本文的权利。

回复

使用道具 举报

246

主题

2

听众

2万

积分

灶君

Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16

最后登录
2014-7-27
注册时间
2007-4-21
沙发
发表于 2009-4-15 14:14:00 |只看该作者
乱码

回复

使用道具 举报

16

主题

2

听众

2823

积分

樟树精灵

Rank: 10Rank: 10Rank: 10Rank: 10Rank: 10Rank: 10Rank: 10Rank: 10Rank: 10Rank: 10

最后登录
2017-6-23
注册时间
2008-4-20
板凳
发表于 2009-4-15 15:20:00 |只看该作者

谁说是乱码? 我就能看


Gwnz mbwn doek fwn neix ,cuengq ndaw sim gou blog gu
回复

使用道具 举报

501

主题

5

听众

2万

积分

版主

Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12

最后登录
2015-12-14
注册时间
2008-7-4
地板
发表于 2009-4-15 19:48:00 |只看该作者
乱码

回复

使用道具 举报

458

主题

2

听众

2万

积分

灶君

Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16Rank: 16

最后登录
2014-11-16
注册时间
2007-2-14
5#
发表于 2009-4-15 17:41:00 |只看该作者
运行代码就可以看了

回复

使用道具 举报

683

主题

1

听众

5万

积分

版主

Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12

最后登录
2020-5-27
注册时间
2003-12-15
6#
发表于 2009-4-15 09:50:00 |只看该作者

傻了


登上僚人网站,认识僚人历史, 弘扬僚人文化,增强民族意识, 推动对外开放,促进僚区发展!
回复

使用道具 举报

171

主题

0

听众

1万

积分

热心贝侬

Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12

最后登录
2019-4-12
注册时间
2004-4-18
7#
发表于 2009-4-23 23:21:00 |只看该作者

怎么就没人研究sawndip的类属码???


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册  

允许回帖同步到新浪微博  

Archiver|手机版|壮族在线    

GMT+8, 2024-11-15 18:00 , Processed in 0.189592 second(s), 44 queries .

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

回顶部