设为首页收藏本站

僚人家园

 找回密码
 注册

QQ登录

只需一步,快速开始

点击进入授权页面

只需一步,快速开始

扫一扫,访问微社区

搜索
查看: 6736|回复: 24
打印 上一主题 下一主题

[讨论]壮文与金山词霸结合成实用壮文电子词典

[复制链接]

154

主题

1

听众

1万

积分

版主

Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12

最后登录
2019-1-23
注册时间
2003-4-24
跳转到指定楼层
楼主
发表于 2007-6-26 17:33:00 |只看该作者 |倒序浏览

将壮文和金山词霸结合,先前听一些贝侬提过。每次到了使用壮文的时候就闪过这个念头。将壮文和金山词霸结合,据说关键的就是Windows里Fonts的壮文字库文件,还有金山词霸中要有壮文词典文件。

而目前微软的东亚字库里还没有壮文字库,前阵子听说微软有在做藏文、彝文等中国少数民族文字字库,以便能在windows系统里使用这些语言,就是没有听说做壮文的。将壮文和金山词霸结合,这里面还涉及到知识产权的问题。那么但就技术方面而言,在这些方面技术有特长的贝侬能不能来说说其可行性和详细的步骤、过程或者自己的一些其他方案?


分享到: QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0
帖子永久地址: 

僚人家园 - 论坛声明1、本主题所有言论和图片仅代表作者个人的立场,不代表本论坛管理方立场。
2、本站所有主题由该帖子作者发表,该帖子作者与僚人家园享有帖子相关版权
3、其他单位或个人使用或转载本论坛原创文章时须征得作者本人及僚人家园论坛管理员的同意
4、发帖者承担因本文发表而直接或间接导致的相关责任。僚人家园管理团队有事先不通知发帖者而删除或屏蔽本文的权利。

人的一生有如负重致远,不可急躁。以不自由为常事,则不觉不足。心生欲望时,应回顾贫困之日。心怀宽恕,视怒如敌,则能无事长久。只知胜而不知败,必害其身。责人不如责己。不及胜于过之。
回复

使用道具 举报

154

主题

1

听众

1万

积分

版主

Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12

最后登录
2019-1-23
注册时间
2003-4-24
沙发
发表于 2007-6-26 17:38:00 |只看该作者

如果能做成一个安装程序,以金山词霸补丁的形式,实现傻瓜安装,添加壮文字库和壮文词典,那么将大大方便壮文的使用。现在金山词霸已经实现英,汉,日语三语显示。

同理,可以实现壮汉,壮英,壮日,壮泰语等互译。不过工程浩大倒是事实。


人的一生有如负重致远,不可急躁。以不自由为常事,则不觉不足。心生欲望时,应回顾贫困之日。心怀宽恕,视怒如敌,则能无事长久。只知胜而不知败,必害其身。责人不如责己。不及胜于过之。
回复

使用道具 举报

803

主题

1

听众

3万

积分

超级版主

Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13

最后登录
2017-3-29
注册时间
2002-7-5
板凳
发表于 2007-6-26 18:30:00 |只看该作者

这个想法是我以前提出来的。当时因为还没有电子版的壮汉词典,操作起来工作量太大,我只做了一小部分就停止了。
现在电子版的《壮汉词汇》已经由各位贝侬合力制作完成,应该说为实现当初的设想提供了可能。

标准壮文采用拉丁字母拼写,这意味着并不需要专门的壮文字库,就可以在现有的Windows操作系统上显示。

《金山词霸》提供了“用户词典”的功能,我们完全可以利用这一功能来制作便于查询和使用的壮语电子词典。
目前要做的主要工作就是把电子版的《壮汉词汇》整理成可以导入《金山词霸》,作为用户词典的格式。这在技术上并没有什么难度,可以说只要会进行word之类的软件进行文本编辑就可以。
我们可以参考先前《壮汉词汇》电子化的工作方式,把工作分成小块交由贝侬们分头完成,最后再整合到一起。

请有兴趣参与这项工作的贝侬跟帖报名!


回复

使用道具 举报

16

主题

3

听众

5892

积分

版主

Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12

最后登录
2017-7-24
注册时间
2006-1-12
地板
发表于 2007-6-26 18:34:00 |只看该作者

敢问所谓的“壮文”是指哪种?拉丁字?还是方块?

如果只是要个词典什么的,当前“灵格斯”软件(免费)完全可做到,且其字典格式是开放的,只要符合规范,什么都可往里面装。就算用金山词霸也未尝不可,它本身就支持“用户词库”这一功能,同样也有导入导出功能,供发布之用。

只是,连一个基于网页的词库都不愿参与的人们,是否会对这个软件字典有热忱,倒是值得商榷。

也许也说不定。可能我错误地理解了“网页的受众面比传统软件受众面大”这一观点了吧。


以还原僚语思维、文字为己任。双定壮语:Gou yaenx euq doeg a? Gou zaemh mayj taen-roen gaz!汉  语:余岂好辩哉?余不得已也!
http://blog.tayrau.info
回复

使用道具 举报

803

主题

1

听众

3万

积分

超级版主

Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13

最后登录
2017-3-29
注册时间
2002-7-5
5#
发表于 2007-6-26 19:05:00 |只看该作者

以《金山词霸》(2005版)为例:

1. 在《金山词霸》界面上点击“主菜单”-“用户词典”。



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册  

回复

使用道具 举报

4

主题

1

听众

3823

积分

铜鼓精灵

Rank: 11Rank: 11Rank: 11Rank: 11Rank: 11Rank: 11Rank: 11Rank: 11Rank: 11Rank: 11Rank: 11

最后登录
2010-7-17
注册时间
2006-9-20
6#
发表于 2007-6-26 19:07:00 |只看该作者
这是一个很有意义的事情

回复

使用道具 举报

803

主题

1

听众

3万

积分

超级版主

Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13

最后登录
2017-3-29
注册时间
2002-7-5
7#
发表于 2007-6-26 19:08:00 |只看该作者
QUOTE:
以下是引用梁显宁在2007-6-26 18:34:00的发言:

敢问所谓的“壮文”是指哪种?拉丁字?还是方块?

如果只是要个词典什么的,当前“灵格斯”软件(免费)完全可做到,且其字典格式是开放的,只要符合规范,什么都可往里面装。就算用金山词霸也未尝不可,它本身就支持“用户词库”这一功能,同样也有导入导出功能,供发布之用。

只是,连一个基于网页的词库都不愿参与的人们,是否会对这个软件字典有热忱,倒是值得商榷。

也许也说不定。可能我错误地理解了“网页的受众面比传统软件受众面大”这一观点了吧。

当初我选择《金山词霸》作为制作壮汉电子词典的平台,只是因为我对这个电子词典比较熟悉。
而且我认为这个词典的“鼠标取词”功能用起来很方便。


回复

使用道具 举报

154

主题

1

听众

1万

积分

版主

Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12

最后登录
2019-1-23
注册时间
2003-4-24
8#
发表于 2007-6-26 19:13:00 |只看该作者

哈哈哈,太好了。季人贝侬还在用2005版的?给你一个不错的软件下载网站:http://www.97sky.cn/

上面有最新最好的软件,包括最新的mycrack完整版的金山词霸2007。不过做好防毒准备。

[此贴子已经被作者于2007-6-26 19:21:30编辑过]

人的一生有如负重致远,不可急躁。以不自由为常事,则不觉不足。心生欲望时,应回顾贫困之日。心怀宽恕,视怒如敌,则能无事长久。只知胜而不知败,必害其身。责人不如责己。不及胜于过之。
回复

使用道具 举报

803

主题

1

听众

3万

积分

超级版主

Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13

最后登录
2017-3-29
注册时间
2002-7-5
9#
发表于 2007-6-26 19:15:00 |只看该作者

关于《金山词霸》用户词典格式的说明:

以词条“a”和“”为例,在TXT文件中以如下格式出现:

a|乌鸦[与roegga同]\r\n呀 Caezgya vaiq daeuj ~!大家快来呀!\r\n(见le) 呢 [语气词,表示疑问]\r\n
alungz|(见naxgwiz) 姨丈[泛指]\r\n

说明:
a 单词
| 单词和释义之间的分隔符号
\r\n 换行。由于《金山词霸》不支持同样拼写而含义不同的单词重复出现,因此需要用分行的形式来区别一个单词的不同义项。最后仍以\r\n结尾。换行后开始下一个单词“alungz”。

释义中的方括号、圆括号、波浪号等按照《壮汉词汇》的凡例使用。

[此贴子已经被作者于2007-6-26 19:21:54编辑过]

回复

使用道具 举报

154

主题

1

听众

1万

积分

版主

Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12

最后登录
2019-1-23
注册时间
2003-4-24
10#
发表于 2007-6-26 19:16:00 |只看该作者
QUOTE:
以下是引用季人在2007-6-26 18:30:00的发言:

这个想法是我以前提出来的。当时因为还没有电子版的壮汉词典,操作起来工作量太大,我只做了一小部分就停止了。
现在电子版的《壮汉词汇》已经由各位贝侬合力制作完成,应该说为实现当初的设想提供了可能。

标准壮文采用拉丁字母拼写,这意味着并不需要专门的壮文字库,就可以在现有的Windows操作系统上显示。

《金山词霸》提供了“用户词典”的功能,我们完全可以利用这一功能来制作便于查询和使用的壮语电子词典。
目前要做的主要工作就是把电子版的《壮汉词汇》整理成可以导入《金山词霸》,作为用户词典的格式。这在技术上并没有什么难度,可以说只要会进行word之类的软件进行文本编辑就可以。
我们可以参考先前《壮汉词汇》电子化的工作方式,把工作分成小块交由贝侬们分头完成,最后再整合到一起。

请有兴趣参与这项工作的贝侬跟帖报名!

这可不是一个小工程呀,最好能联系到语言学专业的贝侬们,做得专业点。按照你的方法,通过文件替换和添加就可以了,只要提供路径说明就行,不错不错!


人的一生有如负重致远,不可急躁。以不自由为常事,则不觉不足。心生欲望时,应回顾贫困之日。心怀宽恕,视怒如敌,则能无事长久。只知胜而不知败,必害其身。责人不如责己。不及胜于过之。
回复

使用道具 举报

154

主题

1

听众

1万

积分

版主

Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12

最后登录
2019-1-23
注册时间
2003-4-24
11#
发表于 2007-6-26 19:18:00 |只看该作者
QUOTE:
以下是引用季人在2007-6-26 19:15:00的发言:

关于《金山词霸》用户词典格式的说明:

以词条“a”和“”为例,在TXT文件中以如下格式出现:

a|乌鸦[与roegga同]\r\n呀 Caezgya vaiq daeuj ~!大家快来呀!\r\n(见le) 呢 [语气词,表示疑问]\r\n
alungz|(见naxgwiz) 姨丈[泛指]\r\n

说明:
a 单词
| 单词和释义之间的分隔符号
\r\n 换行。由于《金山词霸》不支持同样拼写而含义不同的单词重复出现,因此需要用分行的形式来区别一个单词的不同义项。最后仍以\r\n结尾。换行后开始下一个单词“alungz”。

释义中的方括号、圆括号、波浪号等按照《壮汉词典》的凡例使用。

金山词霸中分取词词典和查词词典,如果在查词词典里能提供详细的例句就更好了。这些可以从现有词典里照搬吗?


人的一生有如负重致远,不可急躁。以不自由为常事,则不觉不足。心生欲望时,应回顾贫困之日。心怀宽恕,视怒如敌,则能无事长久。只知胜而不知败,必害其身。责人不如责己。不及胜于过之。
回复

使用道具 举报

154

主题

1

听众

1万

积分

版主

Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12

最后登录
2019-1-23
注册时间
2003-4-24
12#
发表于 2007-6-26 19:19:00 |只看该作者
呵呵,音频方面估计就暂时无法实现了。不过如果能实现了取词和查词,就是一个大进步!

人的一生有如负重致远,不可急躁。以不自由为常事,则不觉不足。心生欲望时,应回顾贫困之日。心怀宽恕,视怒如敌,则能无事长久。只知胜而不知败,必害其身。责人不如责己。不及胜于过之。
回复

使用道具 举报

803

主题

1

听众

3万

积分

超级版主

Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13

最后登录
2017-3-29
注册时间
2002-7-5
13#
发表于 2007-6-26 19:20:00 |只看该作者
我已经完成从a到bi开头的部分,有兴趣继续的贝侬可以先跟帖认领自己想要完成的部分,制作成符合格式要求的TXT文件后上传。
为统一格式,建议方括号、圆括号和波浪号一律使用全角符号。

回复

使用道具 举报

803

主题

1

听众

3万

积分

超级版主

Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13

最后登录
2017-3-29
注册时间
2002-7-5
14#
发表于 2007-6-26 19:21:00 |只看该作者
QUOTE:
以下是引用山魂在2007-6-26 19:18:00的发言:

金山词霸中分取词词典和查词词典,如果在查词词典里能提供详细的例句就更好了。这些可以从现有词典里照搬吗?

可以把《壮汉词汇》中的例句也加到释义中。你看我举的例子里就有例句:Caezgya vaiq daeuj ~!大家快来呀!

回复

使用道具 举报

803

主题

1

听众

3万

积分

超级版主

Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13

最后登录
2017-3-29
注册时间
2002-7-5
15#
发表于 2007-6-26 19:26:00 |只看该作者
QUOTE:
以下是引用山魂在2007-6-26 19:13:00的发言:

哈哈哈,太好了。季人贝侬还在用2005版的?给你一个不错的软件下载网站:http://www.97sky.cn/

上面有最新最好的软件,包括最新的mycrack完整版的金山词霸2007。不过做好防毒准备。


我用2005版只是因为习惯。不过参与这项工作的各位贝侬最好还是能统一使用某个版本,以免出现兼容问题。
不知道2007版金山词霸的用户词典格式和2005版是否相同?


回复

使用道具 举报

154

主题

1

听众

1万

积分

版主

Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12

最后登录
2019-1-23
注册时间
2003-4-24
16#
发表于 2007-6-26 19:32:00 |只看该作者
QUOTE:
以下是引用季人在2007-6-26 19:26:00的发言:

我用2005版只是因为习惯。不过参与这项工作的各位贝侬最好还是能统一使用某个版本,以免出现兼容问题。
不知道2007版金山词霸的用户词典格式和2005版是否相同?

07的用户词典放在dicts文档里,虽然大都是txt格式,但打开都是乱码,估计是字体问题,或者打开方式不对。


人的一生有如负重致远,不可急躁。以不自由为常事,则不觉不足。心生欲望时,应回顾贫困之日。心怀宽恕,视怒如敌,则能无事长久。只知胜而不知败,必害其身。责人不如责己。不及胜于过之。
回复

使用道具 举报

154

主题

1

听众

1万

积分

版主

Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12

最后登录
2019-1-23
注册时间
2003-4-24
17#
发表于 2007-6-26 19:46:00 |只看该作者
看来07版的用户词典的格式是个问题。

人的一生有如负重致远,不可急躁。以不自由为常事,则不觉不足。心生欲望时,应回顾贫困之日。心怀宽恕,视怒如敌,则能无事长久。只知胜而不知败,必害其身。责人不如责己。不及胜于过之。
回复

使用道具 举报

803

主题

1

听众

3万

积分

超级版主

Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13Rank: 13

最后登录
2017-3-29
注册时间
2002-7-5
18#
发表于 2007-6-26 19:49:00 |只看该作者
从网上的一些文章来看,《金山词霸》2007版的用户词典格式似乎和2005版没有区别。
你可以试试把我提供的a.TXT导入2007版,看行不行。或者把你从2007版导出的用户词典文件发给我看看。
[此贴子已经被作者于2007-6-26 19:50:34编辑过]

回复

使用道具 举报

154

主题

1

听众

1万

积分

版主

Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12

最后登录
2019-1-23
注册时间
2003-4-24
19#
发表于 2007-6-26 19:55:00 |只看该作者
在上面的那个网站里,现在就可以下载那个金山07软件合集,因为是压缩包,安装的时候先解压,里面包括金山词霸07和金山快译07等,可以不从外面的主安装exe进入,而从分文件夹中选要安装的软件,比如jscb2007,直接安装金山词霸07版完全版。

人的一生有如负重致远,不可急躁。以不自由为常事,则不觉不足。心生欲望时,应回顾贫困之日。心怀宽恕,视怒如敌,则能无事长久。只知胜而不知败,必害其身。责人不如责己。不及胜于过之。
回复

使用道具 举报

154

主题

1

听众

1万

积分

版主

Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12Rank: 12

最后登录
2019-1-23
注册时间
2003-4-24
20#
发表于 2007-6-26 19:59:00 |只看该作者
QUOTE:
以下是引用季人在2007-6-26 19:49:00的发言:
从网上的一些文章来看,《金山词霸》2007版的用户词典格式似乎和2005版没有区别。
你可以试试把我提供的a.TXT导入2007版,看行不行。或者把你从2007版导出的用户词典文件发给我看看。

好的。刚才试过了直接发,说上传错误。我用压缩包的形式试试,里面放两个词典文件。

 



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册  

人的一生有如负重致远,不可急躁。以不自由为常事,则不觉不足。心生欲望时,应回顾贫困之日。心怀宽恕,视怒如敌,则能无事长久。只知胜而不知败,必害其身。责人不如责己。不及胜于过之。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册  

允许回帖同步到新浪微博  

Archiver|手机版|壮族在线    

GMT+8, 2024-9-13 01:17 , Processed in 0.200304 second(s), 45 queries .

Powered by Discuz! X2.5

© 2001-2012 Comsenz Inc.

回顶部