PDF后期加工的技术含量不高,只是需要称手的软件。我现在比较喜欢用的软件包括:acrobat professional 9、Finereader 9.0.0.1019、Scanfix 4.2、FreePic2Pdf。这些软件都有破解版或免费版,可以通过迅雷或Google搜到。
一般制作程序如下:
1、切割页面。用Finereader 9.0.0.1019打开源文件。这个软件运行很慢,优点是自动化程度高。打开以后(通常需要半个小时以上),选择图像编辑-自动切割页面-应用到所有页面,软件开始切割页面,一分为二。有些页面不能自动切割(当包含空白页时),此时可以手动切割。
2、倾斜校正。在图像编辑窗口选择倾斜校正-应用到所有页面。当源文件有明显扭曲时,还可以使用“对齐文本行”功能,不过通常没有明显变化。
3、导出图像,建议选择TIFF-黑白-300DPI-无压缩。关闭Finereader,不必保存。
4、运行Scanfix 4.2。如果源文件页面比较干净,可以只打开“切除空白”功能,其他全关闭。选择刚才存储图像的文件夹,批量处理。
5、用FreePic2Pdf转成PDF。
6、用acrobat professional 9处理得到的PDF,统一页面。这个过程比较麻烦,一般程序:选择一个标准页面;重设页面大小,确保大于所有页面,应用到全部页面;删除本页空白边距;把本页的裁剪值应用与所有页面;依次检查各页面,必要时用高级编辑工具拖动页面内容。
7、导出图像,建议用tif-黑白-118像素(注意厘米和英寸的差别,118即300dpi),用PIC2PDF重新封装为PDF。这个过程的目的是抛弃冗余数据。
8、对于比较厚而且比较重要的书,可以添加目录。用Finereader识别目录页面,导出XLS表格,用宏命令把表格中的数据写入PDF文件。
9、在属性中添加书名、作者等信息。
10、用Acrobat Professional 9的OCR功能处理全书,设置clearscan、300DPI。(可选。如果源文件基础较好,OCR之后页面很漂亮,而且文件小了很多。)
11、添加封面和封底等彩色页面,保存。
12、向老婆炫耀一下,吃一只水果庆祝。(可选,呵呵~)
用这个程序也可以直接处理DJVU电子书。对于非常重要的经典书,也可以用Finereader进行OCR识别,输出PDF文件。Finereader的OCR比acrobat professional还强劲,缺点是需要人工校对,而且字体比较呆板。
以上方法的效率不是很高,好处的比较容易驾驭。真正的高手通常不会这样做。他们善用一些专用的小工具和PhotoShop。国学数典论坛有一个“先利其器”版面,讨论这类技术。另外可以看一些PDF论坛。不过没有必要搞这么透彻。
一般制作程序如下:
1、切割页面。用Finereader 9.0.0.1019打开源文件。这个软件运行很慢,优点是自动化程度高。打开以后(通常需要半个小时以上),选择图像编辑-自动切割页面-应用到所有页面,软件开始切割页面,一分为二。有些页面不能自动切割(当包含空白页时),此时可以手动切割。
2、倾斜校正。在图像编辑窗口选择倾斜校正-应用到所有页面。当源文件有明显扭曲时,还可以使用“对齐文本行”功能,不过通常没有明显变化。
3、导出图像,建议选择TIFF-黑白-300DPI-无压缩。关闭Finereader,不必保存。
4、运行Scanfix 4.2。如果源文件页面比较干净,可以只打开“切除空白”功能,其他全关闭。选择刚才存储图像的文件夹,批量处理。
5、用FreePic2Pdf转成PDF。
6、用acrobat professional 9处理得到的PDF,统一页面。这个过程比较麻烦,一般程序:选择一个标准页面;重设页面大小,确保大于所有页面,应用到全部页面;删除本页空白边距;把本页的裁剪值应用与所有页面;依次检查各页面,必要时用高级编辑工具拖动页面内容。
7、导出图像,建议用tif-黑白-118像素(注意厘米和英寸的差别,118即300dpi),用PIC2PDF重新封装为PDF。这个过程的目的是抛弃冗余数据。
8、对于比较厚而且比较重要的书,可以添加目录。用Finereader识别目录页面,导出XLS表格,用宏命令把表格中的数据写入PDF文件。
9、在属性中添加书名、作者等信息。
10、用Acrobat Professional 9的OCR功能处理全书,设置clearscan、300DPI。(可选。如果源文件基础较好,OCR之后页面很漂亮,而且文件小了很多。)
11、添加封面和封底等彩色页面,保存。
12、向老婆炫耀一下,吃一只水果庆祝。(可选,呵呵~)
用这个程序也可以直接处理DJVU电子书。对于非常重要的经典书,也可以用Finereader进行OCR识别,输出PDF文件。Finereader的OCR比acrobat professional还强劲,缺点是需要人工校对,而且字体比较呆板。
以上方法的效率不是很高,好处的比较容易驾驭。真正的高手通常不会这样做。他们善用一些专用的小工具和PhotoShop。国学数典论坛有一个“先利其器”版面,讨论这类技术。另外可以看一些PDF论坛。不过没有必要搞这么透彻。