CAJ、PDF文档转换成WORD文档的方法

发布人:网络与教育技术中心  发布时间:2014-05-06   浏览次数:1096

    前几天需要把电子刊物CAJ格式和PDF格式的论文转成WORD格式进行编辑,在网上找了几个软件,有在线转换的,有扫描仪专业OCR软件等,都无法快速有效的进行转换。主要有这样几个问题 , PDF文件转换WORD后乱码太多,版面需要重新编辑排版,CAJ格式文件识别不成功,成本太高等等。经过几天的查找摸索,找到一个好方法,特别是图文混编的文件,成功率都能到95%以上,基本可以满足大家的日常的转化要求。
    电子刊物CAJ格式转换成WORD需要用到下面三个软件:
    首先是CAJViewer,CAJ全文浏览器是中国期刊网的专用全文格式阅读器,它支持中国期刊网的CAJ、NH、KDH和PDF格式文件。它可配合网上原文的阅读,也可以阅读下载后的中国期刊网全文,并且它的打印效果与原版的效果一致,当然,您必须具有浏览原文的权限。
     
    其次是TinyPDF,TinyPDF是一款小巧免费的PDF虚拟打印机程序。它不依赖Acrobat、GhostScript等程序,可以生成高质量的PDF文档。
    最后一个软件就是ABBYY FineReader11,如果是PDF软件转WORD的话只要用这个软件就够了。ABBYY FineReader 可以看作是超级无敌的 PDF 转换器,能转换任意类型的 PDF,其他 PDF 转换工具、或清华紫光OCR、尚书七号、汉王OCR等在它面前都可谓是浮云。比较常用的功能为:扫描到 WORD、将PDF/图像、图片转换为 WORD 文档或者可编辑的PDF文档,另外也支持将PDF图像转换为 Excel 文档。 


    下面举个CAJ文件转化的列子来说明一下。
    CAJ文件转换WORD时有两种情况:一种是用ABBYY FineReader11打开CAJ文件时可以直接识别,用法就和一般PDF格式文件转换方法一样;另外有时ABBYY FineReader11无法识别CAJ文件。

 

 

    出现这种不能顺利转换的情况后,首先用CAJViewer,打开不能识别的CAJ文件。

    打开需要转换的文件后点打印后出现下面窗口。

    选择TinyPDF,注意只有安装了TinyPDF PDF虚拟打印机程序后,才会有此选项,点确认后保存。

    到这一步,不能被ABBYY FineReader11直接识别的CAJ文件就转化成能识别的PDF文件了。支持批量转换,大大节省时间。

    打开ABBYY FineReader11,选择第二项:文件至到WORD ,打开上一步转化好的PDF文件。

   

    第一次使用时需要先设置一下语言,可多选,多选后可大大提高识别率,比较下来精确副本成功率较高,设置好后点击读取。

    识别成功后点击发送,转换成功WORD文件,稍微调整一下即可,看一下转化好的。试试这个方法吧,相信一定不会让你失望的。