【PDF】 【求教】为何可复制粘贴的pdfcopy出来的是乱码?

Jerry

版主
电子书都是能复制粘贴的,不过copy出一堆长线短线,然后使用导出功能转存为word,页面显示则是乱码,但是pdf本身能阅读,也可复制,但是不能copy出来?

没见到加密啊?

giga上的两本书,Hodges的狄尔泰的哲学和Bambach的海德格尔、狄尔泰与历史主义批判都是如此?

请教高人,这是什么原因,有什么办法解决。
 

au

版主
回复: 求教:为何可复制粘贴的pdfcopy出来的是乱码?

我也遇到过这样的情况,估计可能是算法不同导致不能识别。
我用的是一个笨方法。先把PDF文件导出为图片文件(.JPG 或.TIFF都行),再把导出的图片制作成新的PDF,然后再OCR识别。虽然识别率不是很高,但是还是可以接受。如果不需要整本书OCR,可以考虑试试这个笨方法。:D
 
顶部