Jerry
版主
自用canon扫描仪,以前图便利,用的是第三方软件启动扫描,Abbyy,因为不用每扫一页都点一次扫描键(无论是电脑上还是扫描仪上),可以边扫描边干点别的事情,实现一心二用。
canon自带的扫描软件很渣,连灰度这种都不是可选项,点文本的话直接出黑白图片。
Abbyy在保存也自带输出PDF格式,当然也有若干图片格式,灰常多,双手手指都数不过来。
以前为了输出时显示清爽都是保存为PDF,后来被劝了,加上后期制作需要于是改保存为jpg彩色或者灰度。
因为我也试过,从这种直接保存出来的PDF导出Tiff进行后期制作,因为Tiff体积很大,所以我感觉也很放心,以为在第一次保存为PDF时对图片是无损的。
在逻辑上,最好的选择当然是扫描档输出时就无损,但是有时候很难办到,因为我试过Tiff保存图片,一本200多页的书可能高达1.5G,纯文字不带图片。就算rar压缩比率超过70%这个数值还是远远高于保存为jpg的图片(不压缩)。
我的问题如下:
第一,在扫描档直接保存为PDF时,有没有损失(跟直接保存为图片相比,jpg或者Tiff)
另一个直接出PDF的例子是Book2net这种机器,默认也可以出Tiff,jpg或者PDF,扫全书的话这个毫无疑问必选PDF,因为本人试过,灰度图片在保存为多个jpg时,保存时间甚至相当于扫描时间。这是这个机器本身的问题(它应该内置一个系统),因为本身设计初衷估计也不是提供给批量整本扫描,硬件(内存)也比较渣,所以。。。
第二,扫描档保存为jpg和Tiff图片,之间的损失程度如何根据压缩率估量?
对这两个问题的回答直接决定了,若干个选择哪种选择会更好
A直接保存为Tiff,然后打包——以刷硬盘为代价
B直接保存为jpg,然后打包
C直接保存为PDF,需要制作再相机转换成jpg或者Tiff
众所周知,我们面对的基本都是纯文本的图片,说得实际点,有时候压缩或者有损可以接受乃是出于以下两种考虑——后期制作后的显示效果(肉眼舒适度)以及ocr识别率——可以保证的话。
再说一个例子,德国某网站提供了ocr后的灰度文本PDF,检索基本是全文式的,这也是利用了灰度图片最适于ocr的原理。不过我们在后期时往往要经过灰度转黑白放大dpi的过程,放大dpi我可以理解为在ocr时“欺骗”ocr软件比如adobe。不过,我上面所言的这个ocr方面灰度优于黑白的原理,到底建立在什么预设前提下?灰度没有经过后期的图片可以避免黑白图片带来的不必要的脏污以及干扰ocr效果的现象?
canon自带的扫描软件很渣,连灰度这种都不是可选项,点文本的话直接出黑白图片。
Abbyy在保存也自带输出PDF格式,当然也有若干图片格式,灰常多,双手手指都数不过来。
以前为了输出时显示清爽都是保存为PDF,后来被劝了,加上后期制作需要于是改保存为jpg彩色或者灰度。
因为我也试过,从这种直接保存出来的PDF导出Tiff进行后期制作,因为Tiff体积很大,所以我感觉也很放心,以为在第一次保存为PDF时对图片是无损的。
在逻辑上,最好的选择当然是扫描档输出时就无损,但是有时候很难办到,因为我试过Tiff保存图片,一本200多页的书可能高达1.5G,纯文字不带图片。就算rar压缩比率超过70%这个数值还是远远高于保存为jpg的图片(不压缩)。
我的问题如下:
第一,在扫描档直接保存为PDF时,有没有损失(跟直接保存为图片相比,jpg或者Tiff)
另一个直接出PDF的例子是Book2net这种机器,默认也可以出Tiff,jpg或者PDF,扫全书的话这个毫无疑问必选PDF,因为本人试过,灰度图片在保存为多个jpg时,保存时间甚至相当于扫描时间。这是这个机器本身的问题(它应该内置一个系统),因为本身设计初衷估计也不是提供给批量整本扫描,硬件(内存)也比较渣,所以。。。
第二,扫描档保存为jpg和Tiff图片,之间的损失程度如何根据压缩率估量?
对这两个问题的回答直接决定了,若干个选择哪种选择会更好
A直接保存为Tiff,然后打包——以刷硬盘为代价
B直接保存为jpg,然后打包
C直接保存为PDF,需要制作再相机转换成jpg或者Tiff
众所周知,我们面对的基本都是纯文本的图片,说得实际点,有时候压缩或者有损可以接受乃是出于以下两种考虑——后期制作后的显示效果(肉眼舒适度)以及ocr识别率——可以保证的话。
再说一个例子,德国某网站提供了ocr后的灰度文本PDF,检索基本是全文式的,这也是利用了灰度图片最适于ocr的原理。不过我们在后期时往往要经过灰度转黑白放大dpi的过程,放大dpi我可以理解为在ocr时“欺骗”ocr软件比如adobe。不过,我上面所言的这个ocr方面灰度优于黑白的原理,到底建立在什么预设前提下?灰度没有经过后期的图片可以避免黑白图片带来的不必要的脏污以及干扰ocr效果的现象?