有时候我们需要从PDF文件中导出图片重新使用第三方软件(比如ScanKromsator)处理扫描文本。最方便的方法当然是直接使用Acrobat Pro 的导出所有图片功能。
1、两种导出图片的方式
1a) 导出所有图像
以Acrobat XI Pro 为例(版本X应该也是一样的)。你可以从“工具——文档处理——导出所有图像”唤出此功能。方便起见,你也可以自定义快捷工具栏,将此功能的快捷方式放置于工具栏上。
图片可以导出为四种格式,分别是JPEG, PNG, TIFF, JPEG2000。其中默认是JPEG,你可以根据需要选择其他格式,比如TIFF。JPEG将保存为灰度模式,而TIFF只能保存黑白两色,所以在图源本身是灰度模式的情况下,请使用JPEG格式。在弹出的对话窗口左下方有“设置”选项,如果你需要导出的图片具有更高的质量,就需要在这里作出相应修改。
1b) 另存为图像
然而有时候使用 1a 的方法也会带来问题,那就是当一个页面包含多个图片的时候,这些图片会分别导出而不是保持页面原来的样子。针对这种情况你需要使用将PDF文件另存为图片的功能。即“文件——另存为其他——图像——JPEG, PNG, TIFF, JPEG2000”。至于此模式下图片参数的调整,请参考下文。
2、如何调整导出图片的像素
需要注意的是,这两种方式导出的图片像素有时候并不一致。我曾经碰到某些文件,按照 1a 方式导出得到的是300dpi 的图片,而按照 1b 方式得到的则是150dpi 的。如果导出图片的像素比本来的值低,就会导致图像质量变差,这不是我们想要的。问题原因可能是因为软件默认的自动判定像素的功能有些问题,但我们可以通过手动调整设置解决此问题。
对于“导出所有图像”,可以直接通过对话窗口的“设置”来修改。而对于第二种办法,则需要通过“编辑——首选项——从PDF装换——相应的格式(比如JPEG或者TIFF)——编辑设置”来修改。不过两者的设置界面是一样的。我们需要调整的是“转换——分辨率”。将默认的“自动确定”更改为需要的值。这里的几组数值是预设,并不是我们刚才讨论的150、300或600。但实际上 118.11 像素/厘米 = 300 dpi,236.22 像素/厘米 = 600 dpi。以此类推。
1、两种导出图片的方式
1a) 导出所有图像
以Acrobat XI Pro 为例(版本X应该也是一样的)。你可以从“工具——文档处理——导出所有图像”唤出此功能。方便起见,你也可以自定义快捷工具栏,将此功能的快捷方式放置于工具栏上。
图片可以导出为四种格式,分别是JPEG, PNG, TIFF, JPEG2000。其中默认是JPEG,你可以根据需要选择其他格式,比如TIFF。
1b) 另存为图像
然而有时候使用 1a 的方法也会带来问题,那就是当一个页面包含多个图片的时候,这些图片会分别导出而不是保持页面原来的样子。针对这种情况你需要使用将PDF文件另存为图片的功能。即“文件——另存为其他——图像——JPEG, PNG, TIFF, JPEG2000”。至于此模式下图片参数的调整,请参考下文。
2、如何调整导出图片的像素
需要注意的是,这两种方式导出的图片像素有时候并不一致。我曾经碰到某些文件,按照 1a 方式导出得到的是300dpi 的图片,而按照 1b 方式得到的则是150dpi 的。如果导出图片的像素比本来的值低,就会导致图像质量变差,这不是我们想要的。问题原因可能是因为软件默认的自动判定像素的功能有些问题,但我们可以通过手动调整设置解决此问题。
对于“导出所有图像”,可以直接通过对话窗口的“设置”来修改。而对于第二种办法,则需要通过“编辑——首选项——从PDF装换——相应的格式(比如JPEG或者TIFF)——编辑设置”来修改。不过两者的设置界面是一样的。我们需要调整的是“转换——分辨率”。将默认的“自动确定”更改为需要的值。这里的几组数值是预设,并不是我们刚才讨论的150、300或600。但实际上 118.11 像素/厘米 = 300 dpi,236.22 像素/厘米 = 600 dpi。以此类推。
由版主最后修改: