不久前在Winzheng论坛发现一个pdf文件OCR工具——CAJViewer,很好很强大。今天在论坛上看到有人想将PDF文件的文字导出来,特发贴分享......
=====软件简介=====
CAJViewer是中国期刊网的专用全文格式阅读器,它支持中国期刊网的CAJ、NH、KDH和PDF格式文件。它可配合网上原文的阅读,也可以阅读下载后的中国期刊网全文。现在与大家分享的CAJViewer绿色版是Winzheng网友江柏在CAJViewer7.0的基础上,去除PDL后绿化而成,可以阅读CAJ、NH、KDH和PDF格式文件,支持ORC文字识别,识别率很高。
=====下载地址=====
江柏新浪博客:http://home.iask.com/user.php?uid=1305403402
2个rar分卷压缩包+1个txt说明文件
解压密码: jiangb@winzheng
纳米盘分流下载
http://www.namipan.com/d/%E3%80%90%E6%B1%9F%E6%9F%8F%E4%BD%9C%E5%93%81%E3%80%91%E4%B9%8B%20CAJViewer7_1_.0%E7%BB%BF%E8%89%B2%E5%85%8D%E5%AE%89%E8%A3%85%E7%89%88.rar/58cb724b5bcd635d88d8c54cd7879259ce0f4eae118dfa01
=====识别PDF文字的方法=====
1.下载CAJViewer绿色版,并解压。解压后可发现有CAJViewer 7.0.rar文件和MD5码检测工具。如果你是从上面的地址下载的,可以不用管MD5码,再把CAJViewer 7.0.rar解压。因为已经绿化,不用安装,可直接打开CAJViewer.exe(截图中选中的那个文件)。

2.用CAJViewer绿色版打开要识别的PDF文件。

3.选择识别范围。刚打开的PDF文件可见到文字识别按钮是灰色不可用的,要先选择识别范围,识别范围最大只能一页。

4.点文字识别按钮进行文件识别。

5.识别效果。你可以把识别好的文字复制到剪贴板,然后粘贴到论坛,TXT文档等地方,也可以直接发送到Word。有一些识别不准确的地方,粘贴出来后再自行修正。

使用过程中如遇到什么问题,可跟贴,也与我联系。
QQ:66515185
Email: