4月19日 17:17 PDF是电子图书常用的文件格局,但是因为PDF文件未便阅读(需要安拆Acrobat才气看),并且少则几百K,多则十来兆,未便网上传输,我们常常希望能把它转化成文本文件格局,却又往往无从下手。其实,那并非一件难事。
起首,我要向各人介绍一个能将PDF文件转成TXT文件的软件——Aerial2。
0。
我们晓得,阅读PDF文件的东西,当属Adobe的Acrobat reader软件了,而Aerial则是Acrobat的一个插件。在安拆了Aerial之后,Acrobat reader的菜单中的"plug-ins"就会多出一项"Aerial"。
Aerial 2。0为我们阅读PDF文件供给了强大的功用:
dex manager:用于查找和办理文章的索引(必需要有Acrobat Exchange);
vigator: 为PDF文件成立树构造,便利我们阅读;
per clip page:剪贴页办理(必需要有Acrobat Exchange);
py table to clipboard:将表格复造到剪贴板;
ve as RTF :那才是我们最需要的功用,转化之后不只保留了文字,连字体和颜色图案都能保留下来!
但是,Aerial并非全能的,它对中文撑持不太好,排版有时会比力紊乱,并且赶上扫描的纯图形的PDF文件时就力所不及了。
要想把此类PDF文件转化成文本文件,就相对费事一些了,详细步调如下:
1。先用Acrobat翻开PDF文件,选定区域,放大到300%500%(视详细情况而定),复造到剪贴板。
2。用Photoshop或Photoimpact等图形软件调出剪贴板的图形,存成单色的(留意:必然要单色)TIF、PCX或BMP文件,图形文件格局视你所用的OCR软件而定。
笔者保举利用BMP文件存盘。
3。用OCR软件识别图形文件(笔者用的是Wtocr7。0),颠末简单的排版校正后,一般能有95%以上的识别率。再颠末你的手工修改后,就能够了。
以上是笔者在现实过程中的一些经历,希望能对伴侣们有所启发。
Aerial 能够到 下载。