PDF是什么软件?
扫描版的pdf文件里面是图片,文档版的pdf文件里面是由图、表、文字构成,后者可以复制出来到其它文本编辑器中使用,前者要使用其中的文字需要OCR识别才可以,从文件大小方面说前者文件要大一点,而且受扫描分辨率的影响,可能不清楚,后者文字、表是矢量格式,可以无限放大不失真,打印效果好
当你在网上下载了一个PDF文件,打开发现是扫描版的,无法直接复制、编辑里面的文字,该怎么办呢?
有人会选择对照PDF,手动一个一个字地输入,这种做法简直太蠢了,既浪费时间又浪费生命。聪明人会利用一些现成的OCR识别工具,将PDF文字提取出来,就可以自由地复制编辑啦!
那么问题来了:我们怎么识别图片文字、扫描版PDF呢?下面教你几种方法。
一、利用在线OCR识别工具
在线OCR识别工具的优点是无需安装、打开即用,比如下面这款「在线迅捷PDF转换器」,它不仅支持OCR,还支持文档格式转换、语音识别、在线PS等功能。
下面我们就对它的OCR识别工具做一个简要介绍:
1、图片局部识别
这个功能可以让你自由地选择图片识别区域,选完后网站会自动对图片文字进行识别,十分快捷。
2、图片OCR识别
如果整张图片的文字都需要识别,可以利用此功能直接将整张图片上传到网站。
3、PDF OCR识别
将一整个扫描版PDF上传到网站,选择识别页码、效果以及转换格式,让网站自动处理。
这就是利用在线工具进行图片文字、扫描PDF识别的方法,下面我们再看另外一种方法。
二、利用微信小程序
微信上有一款叫做「迅捷文字识别」的小程序,可以把它理解为上面那个网站的小程序版,它也支持图片识别的功能。
打开小程序后选择功能,上传图片,小程序就会自动识别图片文字了。
识别完成后,可以自由对文字进行翻译、复制、转发。
那么,这两种图片文字识别的方式,你学会了吗?