Capture Text是一款文字识别软件。能够将所抓取的文本或者图像文件转化为可以编辑的文字。
Capture Text使用说明:
Capture Text为什么有些网页和PDF无法提取文字?
两种情况不一样,不能提取网页文字是因为在制作网页编写代码时,禁用了复制功能,而PDF文件分两种情况,一种是在制作PDF文件时安全设置禁止复制拷贝,另外一种情况是PDF文件本身是使用图片文件制作的,文字以图片的形式存在,自然不能单独提取。
对于PDF文件,有安全设置的可以使用PDF Password Remover 或其他破解软件,解除安全设置后查看文件是否是非图片的,如果是,可以复制文字使用,如果是图片转化的,需要使用文字识别软件,尚书不错,但是需要图片的分辨率达到300dbi或以上,效果很好。
PDF文件有两种制作方式,一种是源文件是图片的,一种是使用办公软件或使用其他软件转化生成的,通常在Adobe Acrobat软件中未作安全设置的,可以提取非图片转换的文字,如果要是图片转化的,可以把其中的图片取出来(拷屏或使用软件提取图片),再使用尚书或其他文字识别软件进行识别后使用.
Capture Text详细使用截图:
∨ 展开