【PDF】 从PDF导出图片的一点心得

teiler

知名会员
管理成员
有时候我们需要从PDF文件中导出图片重新使用第三方软件(比如ScanKromsator)处理扫描文本。最方便的方法当然是直接使用Acrobat Pro 的导出所有图片功能。

1、两种导出图片的方式

1a) 导出所有图像

以Acrobat XI Pro 为例(版本X应该也是一样的)。你可以从“工具——文档处理——导出所有图像”唤出此功能。方便起见,你也可以自定义快捷工具栏,将此功能的快捷方式放置于工具栏上。

图片可以导出为四种格式,分别是JPEG, PNG, TIFF, JPEG2000。其中默认是JPEG,你可以根据需要选择其他格式,比如TIFF。JPEG将保存为灰度模式,而TIFF只能保存黑白两色,所以在图源本身是灰度模式的情况下,请使用JPEG格式。在弹出的对话窗口左下方有“设置”选项,如果你需要导出的图片具有更高的质量,就需要在这里作出相应修改。

1b) 另存为图像

然而有时候使用 1a 的方法也会带来问题,那就是当一个页面包含多个图片的时候,这些图片会分别导出而不是保持页面原来的样子。针对这种情况你需要使用将PDF文件另存为图片的功能。即“文件——另存为其他——图像——JPEG, PNG, TIFF, JPEG2000”。至于此模式下图片参数的调整,请参考下文。

2、如何调整导出图片的像素

需要注意的是,这两种方式导出的图片像素有时候并不一致。我曾经碰到某些文件,按照 1a 方式导出得到的是300dpi 的图片,而按照 1b 方式得到的则是150dpi 的。如果导出图片的像素比本来的值低,就会导致图像质量变差,这不是我们想要的。问题原因可能是因为软件默认的自动判定像素的功能有些问题,但我们可以通过手动调整设置解决此问题。

对于“导出所有图像”,可以直接通过对话窗口的“设置”来修改。而对于第二种办法,则需要通过“编辑——首选项——从PDF装换——相应的格式(比如JPEG或者TIFF)——编辑设置”来修改。不过两者的设置界面是一样的。我们需要调整的是“转换——分辨率”。将默认的“自动确定”更改为需要的值。这里的几组数值是预设,并不是我们刚才讨论的150、300或600。但实际上 118.11 像素/厘米 = 300 dpi,236.22 像素/厘米 = 600 dpi。以此类推。
 
由版主最后修改:

davidldq

荣誉会员
回复: 从PDF导出图片的一点心得

如果原图片是灰度,可以通过插值算法放大图片并减色,从而获得更好的阅读效果和更小的文件。以此为目的,tif是保存灰度图片的较好选择,因为它是无损格式。同样,在扫描电子书时,原始图片保存为灰度tif是较好选择。

灰度和彩色图片保存为jpg时文件较小,而保存为tif时文件剧增,是因为jpg采用有损压缩。
 

teiler

知名会员
管理成员
回复: 从PDF导出图片的一点心得

david兄是对的,我昨天半夜发帖的时候可能脑子有点糊涂,看到TIFF文件设置中的单色就做出了这样的判断。

不过灰度模式下的TIFF文件体积相当大,如果图源质量有保证,即使保存为JPEG+300dpi,通过SK处理后也能得到满意的结果。无论是清晰度还是OCR效果,都是可以保证的。

以前我也将扫描的300dpi灰度图片保存为TIFF格式,后来就改为JPEG了,因为从最终结果看有损压缩的JPEG带来的影响微乎其微,基本可以忽略不计。当然,这一结论的前提是扫描的图片质量必须有保证。

当然,PDF导出的图片一般只是作为进一步加工的材料,如果无需长期保存,TIFF可能更合适,毕竟无损就是无损。
 

davidldq

荣誉会员
回复: 从PDF导出图片的一点心得

单位发了一台一体机,有自动进纸器,挺爽。一般的工作流程:
1、让打字社把书切成散页
2、送入自动进纸器,600DPI灰度扫描(tif保存,文件巨大,一页30M)
3、用SK减色为黑白图片,对其版心。锐华柔化之类的可有可无。用pic2pdf转PDF
4、找打字社,把散页装订成书

打印社老板一直怀疑我不正常:D
 

teiler

知名会员
管理成员
回复: 从PDF导出图片的一点心得

david兄太大手笔了。拜服。
 

wsmyh

荣誉会员
回复: 从PDF导出图片的一点心得

单位发了一台一体机,有自动进纸器,挺爽。一般的工作流程:
1、让打字社把书切成散页
2、送入自动进纸器,600DPI灰度扫描(tif保存,文件巨大,一页30M)
3、用SK减色为黑白图片,对其版心。锐华柔化之类的可有可无。用pic2pdf转PDF
4、找打字社,把散页装订成书

打印社老板一直怀疑我不正常:D
自动进纸器!该省多少时间!页面歪斜的问题也不必劳神了!
 

Jerry

版主
回复: 从PDF导出图片的一点心得

单位发了一台一体机,有自动进纸器,挺爽。一般的工作流程:
1、让打字社把书切成散页
2、送入自动进纸器,600DPI灰度扫描(tif保存,文件巨大,一页30M)
3、用SK减色为黑白图片,对其版心。锐华柔化之类的可有可无。用pic2pdf转PDF
4、找打字社,把散页装订成书

打印社老板一直怀疑我不正常:D
通过最后一句话我可以想象那个老板:这小子在烧钱玩吧。
哎哟,笑得我不行了
 
顶部