【PDF】 双层PDF图片+文字

Jerry

版主
这个,是Dasha自己制作电子书的基本方式。
据他自己说,是图片用abbyyocr,自行校对一遍文字,保存为双层:图片+文字,最后封装成PDF
不过究竟怎么封装?
ocr图片我们都会,ocr分离出的文字也都明白,怎么合起来?
abbyy我只发现:ocr后单独保存的文本,该文本可以人工再校错一遍,以消除提错的绿色表示。
ocr以后的图片,“保存图像”然后转PDF的结果,应该如同没有ocr一样。
附一张图,抽自他做的书,供各位高手研究。
 

angstyu

活跃会员
回复: 双层PDF图片+文字

看了一下jerry兄传的页面,没什么特别的呀,就是保存为“页面图像下方的文本”,自然就是双层的了。你说封装,应该是在finereader程序下,生成pdf之前,一边对照图片,一边在程序界面下校对的吧。不可能是在不保存工作进度,比如关闭finereader后,再单独一个页面,再加一个单独文本,拼装成双层的吧。
还是我没理解jerry兄的意思?
 

Jerry

版主
回复: 双层PDF图片+文字

选项里确实可以改保存模式,不过这样我做出来的图片+文本,感觉锯齿比较严重,发一张上来看看。
进一步求教:
我扫描用的是灰度300dpi,然后用SK扩成600,黑白模式,难道是这个原因导致图像质量不佳?需要用300灰度的原始扫描图片,灰蒙蒙的那就更不好看了。

又或者颠倒过来,先用300灰度扫描,在abbyy中识别一遍,再转到SK中扩600变黑白?
 

angstyu

活跃会员
回复: 双层PDF图片+文字

选项里确实可以改保存模式,不过这样我做出来的图片+文本,感觉锯齿比较严重,发一张上来看看。
进一步求教:
我扫描用的是灰度300dpi,然后用SK扩成600,黑白模式,难道是这个原因导致图像质量不佳?需要用300灰度的原始扫描图片,灰蒙蒙的那就更不好看了。

又或者颠倒过来,先用300灰度扫描,在abbyy中识别一遍,再转到SK中扩600变黑白?
😥,不应该啊,我也用finereader保存图片+文本很多次了,不存在这个问题啊。不知道你原来的图片质量是什么样的。你在“图像质量”里面有没有选择“最佳质量(原图像分辨率)“呢?
附上一张我自扫的吧,一体机。扫描的时候,只是简单的选择600dpi,黑白。反正自用,也不追求啥最佳效果了。
 

Jerry

版主
回复: 双层PDF图片+文字

600dpi相对来说比较慢,不如300dpi速度快。学校很多大型扫描仪,貌似默认也不是600dpi
图像质量这个选项我没找到。我回头再试试看。
 

angstyu

活跃会员
回复: 双层PDF图片+文字

600dpi相对来说比较慢,不如300dpi速度快。学校很多大型扫描仪,貌似默认也不是600dpi
图像质量这个选项我没找到。我回头再试试看。
300dpi的,我也扫过,也ocr过,没出现过你的情况。只要选择保留原图片质量,无论双不双层,不会出现图片清晰度改变的情况。。
 
顶部