小学科学教学论坛

注册

 

发新话题 回复该主题

[分享]PDF文件文字识别工具——CAJViewer绿色版 [复制链接]

1#

[分享]PDF文件文字识别工具——CAJViewer绿色版

不久前在Winzheng论坛发现一个pdf文件OCR工具——CAJViewer,很好很强大。今天在论坛上看到有人想将PDF文件的文字导出来,特发贴分享......

=====软件简介=====

CAJViewer是中国期刊网的专用全文格式阅读器,它支持中国期刊网的CAJ、NH、KDH和PDF格式文件。它可配合网上原文的阅读,也可以阅读下载后的中国期刊网全文。现在与大家分享的CAJViewer绿色版是Winzheng网友江柏在CAJViewer7.0的基础上,去除PDL后绿化而成,可以阅读CAJ、NH、KDH和PDF格式文件,支持ORC文字识别,识别率很高。

=====下载地址=====
江柏新浪博客:http://home.iask.com/user.php?uid=1305403402 
2个rar分卷压缩包+1个txt说明文件
解压密码: jiangb@winzheng

纳米盘分流下载
http://www.namipan.com/d/%E3%80%90%E6%B1%9F%E6%9F%8F%E4%BD%9C%E5%93%81%E3%80%91%E4%B9%8B%20CAJViewer7_1_.0%E7%BB%BF%E8%89%B2%E5%85%8D%E5%AE%89%E8%A3%85%E7%89%88.rar/58cb724b5bcd635d88d8c54cd7879259ce0f4eae118dfa01

=====识别PDF文字的方法=====
1.下载CAJViewer绿色版,并解压。解压后可发现有CAJViewer 7.0.rar文件和MD5码检测工具。如果你是从上面的地址下载的,可以不用管MD5码,再把CAJViewer 7.0.rar解压。因为已经绿化,不用安装,可直接打开CAJViewer.exe(截图中选中的那个文件)。

2.用CAJViewer绿色版打开要识别的PDF文件。

3.选择识别范围。刚打开的PDF文件可见到文字识别按钮是灰色不可用的,要先选择识别范围,识别范围最大只能一页。

4.点文字识别按钮进行文件识别。

5.识别效果。你可以把识别好的文字复制到剪贴板,然后粘贴到论坛,TXT文档等地方,也可以直接发送到Word。有一些识别不准确的地方,粘贴出来后再自行修正。

使用过程中如遇到什么问题,可跟贴,也与我联系。
QQ:66515185
Email:

分享 转发
舍就是得
TOP
2#

感谢周泉,我会了.相信这为集体备课的许多朋友解决了燃眉之急.

嘻嘻.鉴于周泉的突出表现,特聘任为本论坛贵宾.


[此贴子已经被作者于2008-2-9 3:39:22编辑过]

TOP
3#

以下是引用不睡觉的兔在2008-2-9 3:35:57的发言:

感谢周泉,我会了.相信这为集体备课的许多朋友解决了燃眉之急.

嘻嘻.鉴于周泉的突出表现,特聘任为本论坛贵宾.


竟然可以当贵宾,突如其来的幸福啊.....


[此贴子已经被作者于2008-2-9 3:41:16编辑过]

舍就是得
TOP
4#

感谢周泉!欢迎周泉!

[此贴子已经被不睡觉的兔于2008-2-11 2:12:50编辑过]

三江居 http://blog.kxsy.net/user1/7267/
TOP
5#

谢谢呀,我的系统默认能看的,就是找不到能导出的软件.
王琦峰
浙江省慈溪市龙山镇龙山小学 315311
QQ:151412943
Email:FS00120@163.com   wangqf@zjxxkx.com
TOP
6#

仔细看了下周老师的介绍,我明白了pdf其实就是一幅幅图片,而该软件就是把图片识别成文字,有一定的错误率,需要教师们进行修改。
王琦峰
浙江省慈溪市龙山镇龙山小学 315311
QQ:151412943
Email:FS00120@163.com   wangqf@zjxxkx.com
TOP
7#

以下是引用龙山黄泥螺在2008-2-9 21:30:07的发言:
仔细看了下周老师的介绍,我明白了pdf其实就是一幅幅图片,而该软件就是把图片识别成文字,有一定的错误率,需要教师们进行修改。

pdf不是图,而是一种电子书的格式。有些pdf里面的文字本身可选、可复制、粘贴,但兔子给我这个不知为什么不可选,所以只能用其它软件识别。

舍就是得
TOP
8#

以下是引用周泉在2008-2-10 16:53:52的发言:

pdf不是图,而是一种电子书的格式。有些pdf里面的文字本身可选、可复制、粘贴,但兔子给我这个不知为什么不可选,所以只能用其它软件识别。

谢谢,有些pdf都是软件的说明文档,扫描进去的,所以认识上有所偏差,谢谢
王琦峰
浙江省慈溪市龙山镇龙山小学 315311
QQ:151412943
Email:FS00120@163.com   wangqf@zjxxkx.com
TOP
9#

谢谢周泉!
TOP
10#

以下是引用龙山黄泥螺在2008-2-10 19:50:56的发言:
谢谢,有些pdf都是软件的说明文档,扫描进去的,所以认识上有所偏差,谢谢

兔子传给我那pdf应该不是扫描的图像。估计是出版社用排版软件做出来的文件。软件的说明文件如果是pdf的话,多数都是OpenOffice之类的软件生成的。

舍就是得
TOP
发新话题 回复该主题