沙南曼森 发表于 2005-11-4 09:08:00

<P>我已完成第181-190页的扫描、识别、校对及编辑、上传。这10页耗费了我5个小时的时间,由此可知<STRONG><FONT face=Verdana color=#61b713>Honghlaj</FONT></STRONG>等贝侬的艰辛。我用的是方正OCR,差错率挺高,校对效率很低。<STRONG><FONT face=Verdana color=#61b713>Honghlaj</FONT></STRONG>贝侬用的是哪个OCR软件呢?我感觉你的校对、编辑效率比我高一倍以上。</P>

沙南曼森 发表于 2005-11-4 09:14:00

<DIV class=quote><B>以下是引用<I>Stoneman</I>在2005-11-3 16:32:18的发言:</B><BR>
<P>本周沙南贝侬负责181-200页,我来负责扫描201-220页,等沙南贝侬上传完181-200页,Honghlaj 贝侬识别、校对、编辑完并上传181-200页后,我再上传201-220页。</P>
<P>季人贝侬如果能做一些OCR的工作是最好不过了。为避免做重复工作,您最好与Honghlaj 贝侬联系分工事宜。</P></DIV>
<P>191-200页的扫描、识别我暂时没时间来完成。明天起一个星期内我可能都不上网也不用电脑。贝侬可以留一个回帖的位置给191-200页,然后从201页继续往下扫描、识别。我一个星期后再来完成191-200页的相关工作。</P>

Honghlaj 发表于 2005-11-4 12:36:00

<P>回沙南:我用的是汉王文本王,识别、校对10页约需2.5~3个小时。</P>
<P>回Marsuncle:用相机拍也可以,估计Stoneman也是这样做的。</P>
[此贴子已经被作者于2005-11-4 12:40:17编辑过]

Stoneman 发表于 2005-11-5 15:54:00

<P>回沙南贝侬:我来负责扫描上传191-210页吧。</P>
<P>回Honghlaj:我是用扫描机扫描的,软件是VistaScan。扫描20页大约用30分钟,上传20页大约也用40到60分钟,因为我没有用宽带。</P>
[此贴子已经被作者于2005-11-6 16:29:19编辑过]

Stoneman 发表于 2005-11-12 16:24:00

本周末我来负责扫描上传211-230页。愿意帮忙的贝侬请从231页起扫描上传。

Honghlaj 发表于 2005-11-12 20:27:00

<P>本周至年底我较忙,季人贝侬能否帮忙OCR?谢谢!</P>
<P>期间Stoneman贝侬尽管上传,如我能抽出时间就可以OCR。</P>

marsuncle 发表于 2005-11-13 10:21:00

gou gaenq hwnjcienz 231-269.
[此贴子已经被作者于2005-11-13 11:35:48编辑过]

季人 发表于 2005-11-14 10:43:00

<DIV class=quote><B>以下是引用<I>Honghlaj</I>在2005-11-12 20:27:27的发言:</B><BR>
<P>本周至年底我较忙,季人贝侬能否帮忙OCR?谢谢!</P>
<P>期间Stoneman贝侬尽管上传,如我能抽出时间就可以OCR。</P></DIV>
<br>我开始OCR第211页-220页的内容,分批上传。请各位贝侬注意避免重复劳动。

季人 发表于 2005-11-15 14:09:00

<P>第211页-220页OCR并上传完毕。为便于校对,我把扫描图片和OCR后的文本放在一起。</P>
<P>接下来我准备开始OCR第221-230页,请各位贝侬注意避免重复劳动。</P>

marsuncle 发表于 2005-11-15 22:43:00

<P>gou yaek laebdaeb hwnjcienz 270-290</P>

Stoneman 发表于 2005-11-19 16:13:00

Marsuncle, 季人, song boux sou dwgrengz lo!

右江水红河岸 发表于 2005-11-19 20:29:00

gyongq beixnuengx dwgrengz lailai

Honghlaj 发表于 2005-11-19 23:50:00

<DIV class=quote><B>以下是引用<I>marsuncle</I>在2005-11-15 22:43:31的发言:</B><br>
<P>gou yaek laebdaeb hwnjcienz 270-290</P></DIV>
<P>
<P>首先对Marsuncle贝侬付出的辛劳表示感谢,不可否认你上传的图片分辨率较高,如文字没有变形的,OCR的识别效率比Stoneman贝侬上传的高许多,但也不得不指出的是部分图片(约占1/3强)文字严重变形,严重影响识别,有时甚至比打字还费时,所以还望贝侬能改进。谢谢!</P>
<P>另外,Marsuncle贝侬遗漏了第256页没有上传,哪位贝侬帮忙补上?同时,我已完成第250~269页的OCR,其他贝侬可不再重复劳动。</P>
[此贴子已经被作者于2005-11-20 1:57:38编辑过]

marsuncle 发表于 2005-11-20 02:15:00

<DIV class=quote><B>以下是引用<I>Honghlaj</I>在2005-11-19 23:50:24的发言:</B><BR><BR>
<P>
<P>首先对Marsuncle贝侬付出的辛劳表示感谢,不可否认你上传的图片分辨率较高,如文字没有变形的,OCR的识别效率比Stoneman贝侬上传的高许多,但也不得不指出的是部分图片(约占1/3强)文字严重变形,严重影响识别,有时甚至比打字还费时,所以还望贝侬能改进。谢谢!</P>
<P>另外,Marsuncle贝侬遗漏了第256页没有上传,哪位贝侬帮忙补上?同时,我已完成第250~269页的OCR,其他贝侬可不再重复劳动。</P><BR></DIV>
<P>多谢提醒,以后拍照时我会尽量压平书再照。我已经在251-269的帖子中补入256页。</P>

Stoneman 发表于 2005-11-27 15:09:00

<P>marsuncle, Honghlaj, 季人辛苦啦。我最近换了新工作,比较忙;另外,我的扫描器也出了点问题。所以,下来的工作靠各贝侬了。</P>

marsuncle 发表于 2005-11-27 16:42:00

mbouj miz problem.

沙南曼森 发表于 2005-11-27 23:12:00

291-300页的扫描和识别工作,我明晚来做吧。不好意思了,贝侬们。

沙南曼森 发表于 2005-11-30 14:37:00

由于32开的厚书页面太小,压不平,扫描变形严重,识别正确率较低,我在三天里先后弄了三次才把291-300页的资料扫描、识别、校对完毕,今天中午才得以编辑、上传。耽误大家了,不好意思。

季人 发表于 2005-11-30 17:05:00

<P>我发现大家在标点符号的使用上有不一致的地方,主要是全角和半角的区别。<BR>虽然是小问题,但是如果能统一起来应该更好。例如在壮文例句中,是否应当全部使用半角符号?</P>

Stoneman 发表于 2005-12-16 14:37:00

看来季人,沙南最近都很忙,我前两天也才到新公司工作,最近不会有太多时间上网,只有marsuncle 和 Honghlaj 两位在坚持, 两位辛苦啦。
页: 1 [2] 3
查看完整版本: 贝侬辛苦,我来晚了(关于《壮汉词汇》的上传工作)