从中国知网下载而来的资料,大都是.CAJ、.NH、.KDH、.PDF等格式,需使 用中国期刊网的专用全文格式阅读器 CAJViewer 全文浏览器进行查看。.PDF转换成.DOC格式,网上能找到很多的方法,自己动手去找吧。在这里,主要介绍的是.CAJ、.NH、.KDH等使用 CAJViewer 全文浏览器阅读的文件转换成.DOC格式文件。
首先到中国知网(www.cnki.net) 下载CAJViewer阅读器,安装CAJViewer阅读器软件。运行CAJViewer阅读器并点击“文件”打开.CAJ、.NH、.KDH等格式文 件。接下来选择“文件→打印”菜单,在打开的“打印”设置窗口中将“打印机”栏中的“名称”设置为“Microsoft Office Document Image Writer”,确认后将.CAJ、.NH、.KDH等格式文件输出为MDI格式的虚拟打印文件。
(如果 你在“名称”设置的下拉列表中没有找到“Microsoft Office Document Image Writer”项,那证明你在安装Office 2003的时候没有安装该组件,请使用Office 2003安装光盘中的“添加/删除组件”更新安装该组件。)
运行Microsoft Office Document Imaging,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word”菜单,并在弹出的窗口中勾选“在输出时保持图片版式不变”,确 认后系统提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”,不用管它,点确认即可。
(目前,包括此工具在内的所有软件对PDF转DOC的识别率都不是特别完美,而且转换后会丢失原来的排版格式,所以大家在转换后还需要手工对其进行后期排版和校对工作。)
大功告成!补充一下,PDF格式文件也可以按照上面的方法转换成DOC格式文件。
还有一个方法如下所述:
首先用CAJViewer7.02版本阅读器打开nh文件,在你当前打开页的左上方有个保存为图片的按钮
, 把当前页面保存为图片。然后下载安装一个汉王6.0,安装好后打开。注意,此软件安装好后没有快捷方式,需要按照下面的步骤打开:开始--程序--汉王 ocr6.0--汉王ocr6.0.打开后按照下面的操作就可以识别图片,转换成文字。文件--打开图像--识别--开始识别--输出--到指定格式文 件,保存为txt文件就可以了。现在打开刚刚保存的文件,是不是看见文字转换好了!
如果你还在上学,总有一天你会用到的!呵呵,收藏吧。
方法一:
一部分CAJ格式文件可以转换成word文档编辑,方法是,点击CAJ全文浏览器编辑中的全选,然后复制粘贴到word文档中,可一页一页复制,也可以点击TXT标记,选择需要的段落和文字复制。如果全选表示为白色,该文件不能转换成word文档
方法二:
caj文件的识别:
1)局部文字识别:直接使用caj浏览器的ocr
2)全文件识别:打印到Microsoft Office Document Image Writer打印机,后面和上面的2)操作一样
3)博硕论文全文下载:在线阅读博硕论文,待可以看到最后一页后,不要关闭caj浏览器,到caj安装目录下cache中找到一个较大的文件,拷贝到其他位置即可。然后使用2)全部转化为word。