沙南曼森 发表于 2005-10-30 18:24:00

贝侬辛苦,我来晚了(关于《壮汉词汇》的上传工作)

<P>我这段时间上网少,今天才注意到 <STRONG>SAWLOIH CUENGH GUN 壮汉词汇</STRONG> <a href="http://www.rauz.net/bbs/dispbbs.asp?boardID=20&amp;ID=15270" target="_blank" >http://www.rauz.net/bbs/dispbbs.asp?boardID=20&amp;ID=15270</A> 这个帖子涉及一项宏大的工程。我原先竟以为是一个普通的帖子,惭愧惭愧。</P>
<P><STRONG><FONT face=Verdana color=#da2549>Stoneman</FONT></STRONG>、<STRONG><FONT face=Verdana color=#61b713>Honghlaj</FONT></STRONG>、<STRONG><FONT face=Verdana color=#da2549>marsuncle</FONT></STRONG>三位贝侬已把《<STRONG>SAWLOIH CUENGH GUN 壮汉词汇</STRONG>》整理上传到正文180页,已完成752页正文的24%,实在了不起。</P>
<P>2002年12月在广西民族报社获赠《壮汉词汇》和《汉壮词汇》之后,我今年初又在南宁文化宫旧书市场上买到一本《壮汉词汇》,可惜它们至今没发挥充分的作用。多备的这一本《壮汉词汇》我得赶快送人才行,不知哪位在南宁或百色的贝侬愿意使之物尽所值(该书目前放在南宁)?</P>
<P>我的扫描仪近半年没启动了,再不用就浪费了。11月份我也来接一棒吧。</P>
[此贴子已经被作者于2005-10-30 18:27:53编辑过]

红水河 发表于 2005-10-30 18:50:00

上学的学龄儿童每个人应有一本

卜蛮 发表于 2005-10-30 19:37:00

能否仿效布依在线搞个《壮汉电子词典》?<a href="http://www.5481.net/bbs/dispbbs.asp?boardID=33&amp;ID=2158" target="_blank" >http://www.5481.net/bbs/dispbbs.asp?boardID=33&amp;ID=2158</A>

Honghlaj 发表于 2005-10-30 19:44:00

人多力量大,希望更多贝侬参与此项工作。

山之凤 发表于 2005-10-30 20:41:00

沙南曼森贝侬:送给我如何,我手头的这一本是图书馆的。

闻多 发表于 2005-10-30 21:35:00

我也想支持一下,我的扫描仪也很久没用了.但总是没有合适的时间.上网来览贴也是很匆忙的.非常遗憾 !

mbwenndit 发表于 2005-10-30 22:19:00

<P>建议扫描后作个电子图书吧,让更多有需要的贝侬拥有她</P>

Stoneman 发表于 2005-11-1 14:44:00

<P>有能力做的贝侬能否分工一下?例如,每人每周负责扫描10页,按页码顺序上传,再由 Honghlaj 贝侬 OCR 上传; 或会 OCR 的贝侬扫描完后直接上传。愿意参与此项工作的贝侬在开始扫描之前应相互通报一下,以避免做重复工作。11月份按如下去做如何:</P>
<P><STRONG><FONT face=Verdana color=#da2549>沙南曼森</FONT></STRONG>:181-190</P>
<P><STRONG><FONT face=Verdana color=#61b713>闻多:</FONT></STRONG>191-200</P>
<P>Stoneman: 201-210</P>
<P><STRONG><FONT face=Verdana color=#da2549>沙南曼森</FONT></STRONG>:211-220</P>
<P><STRONG><FONT face=Verdana color=#61b713>闻多:</FONT></STRONG>221-230</P>
<P><STRONG><FONT face=Verdana color=#da2549>Stoneman</FONT></STRONG>: 231-240</P>
<P>如此往后。由 Honghlaj 贝侬统一 OCR 上传。</P>

Honghlaj 发表于 2005-11-1 23:10:00

<P>我将第1~180页做成了CHM格式的电子书,有谁教我如何上传?</P>

沙南曼森 发表于 2005-11-2 01:06:00

<DIV class=quote><B>以下是引用<I>山之凤</I>在2005-10-30 20:41:29的发言:</B><BR>沙南曼森贝侬:送给我如何,我手头的这一本是图书馆的。</DIV>
<br>你学过壮文,送给你应该是合适的。你什么时候有空到南宁呢?不然你通过悄悄话告知你的地址,我给你邮寄过去。

沙南曼森 发表于 2005-11-2 01:09:00

<DIV class=quote><B>以下是引用<I>Stoneman</I>在2005-11-1 14:44:43的发言:</B><BR>
<P>有能力做的贝侬能否分工一下?例如,每人每周负责扫描10页,按页码顺序上传,再由 Honghlaj 贝侬 OCR 上传; 或会 OCR 的贝侬扫描完后直接上传。愿意参与此项工作的贝侬在开始扫描之前应相互通报一下,以避免做重复工作。11月份按如下去做如何:</P>
<P><STRONG><FONT face=Verdana color=#da2549>沙南曼森</FONT></STRONG>:181-190</P>
<P><STRONG><FONT face=Verdana color=#61b713>闻多:</FONT></STRONG>191-200</P>
<P>Stoneman: 201-210</P>
<P><STRONG><FONT face=Verdana color=#da2549>沙南曼森</FONT></STRONG>:211-220</P>
<P><STRONG><FONT face=Verdana color=#61b713>闻多:</FONT></STRONG>221-230</P>
<P><STRONG><FONT face=Verdana color=#da2549>Stoneman</FONT></STRONG>: 231-240</P>
<P>如此往后。由 Honghlaj 贝侬统一 OCR 上传。</P></DIV>
<br>昨天我还想着亲自OCR呢。要这样做也行。我想问一下,贝侬用的分辨率是多少呢?方便OCR的分辨率用300,图片大了点。只是用于阅读的话,分辨率用200就可以了。

Stoneman 发表于 2005-11-2 17:27:00

我不知道我扫描出来的图片的分辨率是多少,一般应在200KB以上OCR才能分辨出来。具体请与Honghlaj 贝侬联系。<STRONG><FONT face=Verdana color=#da2549>沙南</FONT></STRONG>贝侬,我不知道<STRONG><FONT face=Verdana color=#61b713>闻多</FONT></STRONG>贝侬愿不愿意参与此项工作?您打算先扫描多少页?

沙南曼森 发表于 2005-11-2 18:14:00

<P>今晚先扫描10页吧。如果进度比较快,我就一口气干完20页。</P>
<P>这书是32开的,又比较厚,扫描麻烦一些。如果是16开或A4的,就好操作多了。</P>
<P>我以前扫描、识别(OCR)并校对一页资料所需要的时间是10分钟,10页资料从扫描、识别到校对、编辑,需要约两个小时的时间。今天仅需扫描、上传,花费时间应该不很多。</P>

Honghlaj 发表于 2005-11-2 20:08:00

<DIV class=quote><B>以下是引用<I>沙南曼森</I>在2005-11-2 1:09:54的发言:</B><br><br><br>昨天我还想着亲自OCR呢。要这样做也行。我想问一下,贝侬用的分辨率是多少呢?方便OCR的分辨率用300,图片大了点。只是用于阅读的话,分辨率用200就可以了。</DIV>
<P>沙南贝侬:如能OCR上来最好,因为OCR比较费时,我最近要进行保先总结,下月又要年终总结迎检,可能忙些,怕赶不上你们的进度。谢谢。<br>
<P>扫描还是分辨率高一些好,识别率高,可以减少校对时间。</P>
[此贴子已经被作者于2005-11-2 20:09:05编辑过]

季人 发表于 2005-11-3 09:56:00

各位贝侬扫描之后,我也可以做一些OCR的工作。

Stoneman 发表于 2005-11-3 16:32:00

<P>本周沙南贝侬负责181-200页,我来负责扫描201-220页,等沙南贝侬上传完181-200页,Honghlaj 贝侬识别、校对、编辑完并上传181-200页后,我再上传201-220页。</P>
<P>季人贝侬如果能做一些OCR的工作是最好不过了。为避免做重复工作,您最好与Honghlaj 贝侬联系分工事宜。</P>

沙南曼森 发表于 2005-11-3 17:29:00

昨晚我已经扫描、识别并校对181-185页。因乱码较多,校对工作量大(发现乱码、错字要当场对照原稿修改),每页约需30分钟。今晚再干两个小时,我就可以完成181-190页的扫描、识别、校对及编辑、上传了。

Honghlaj 发表于 2005-11-3 21:02:00

关于OCR分工:我负责Stoneman贝侬上传的,季人贝侬负责沙南贝侬上传的,如一时无时间,可先回帖,保留位置,完成OCR后再修改帖子,如何?

marsuncle 发表于 2005-11-4 07:56:00

<P>我用相机拍的话应该比扫描的速度快些,分辨率自然不及扫描仪。不知上面几位觉得如何??</P>

季人 发表于 2005-11-4 08:55:00

沙南贝侬可以通过电子邮件直接把扫描文件发给我。
页: [1] 2 3
查看完整版本: 贝侬辛苦,我来晚了(关于《壮汉词汇》的上传工作)