难得的是,PDF Expert 3.0 新增的这些功能并不是滥竽充数,这段时间我使用下来后惊奇地发现效果远超预期,就算是中文用户也能正常地使用这些功能。
真正好用的 OCR 识别功能
PDF 格式的文件包罗万象,可以由各种各样其它格式的文件转换而来,而源文件基本上就决定了转换后的 PDF 文件是否可以直接使用里面的文本内容。比如说,将 DOC 文件转换为 PDF 文件,文本内容可以直接使用;将 JPG 文件转换为 PDF 文件,则文本内容无法直接使用。
在PDF 文件中的文本内容无法直接使用的情况下,我们就需要用到 OCR 技术来识别这些文本内容。有不少 App 也内置了 OCR 功能,但它们大多不是识别率堪忧,就是对中文的支持不好,抑或是像 Acrobat Pro 一样价格昂贵。
Readdle 在 PDF Expert 上非常聪明地采用了 Apple 的 Apple Vision 框架,在降低跨平台适配成本的基础上又保证了识别率和对多语言的支持。另外,Readdle 还通过机器学习技术来识别文档中的不同字体,就算是手写字迹也有不错的识别成功率。
在不手动启用 OCR 识别功能的情况下,使用 PDF Expert 就可以直接高亮或者复制扫描版 PDF 文件中的文本。不过,在测试的过程中我发现部分扫描版 PDF 文件无法选中文本,不清楚是否是新版本的 Bug。
如果想获得整页 PDF 文档或者整个 PDF 文档的文本内容,那么可以在工具栏中选择「扫描与识别」>「识别文字」,OCR 完成后 PDF Expert 会直接在原来扫描版的文字上面使用识别后的文字覆盖。在这里可以发现 PDF Expert 中 OCR 功能的第一个优点,那就是可以保留原文档的排版格式。
PDF Expert 中 OCR 功能的第二个优点就是支持多种语言,包括了简体中文和繁体中文,且识别率相当不错。
而第三个优点是 PDF Expert 支持对 OCR 识别后的文档进行单独纠正,点击文档中任意一个划分好的区块,就可以看到这部分的原图(扫描版文字),如果识别结果错误,那么可以直接在输入框中输入正确的结果,文档中显示的文本也会随之改正过来。
方便实用的格式转换
借助于 OCR 技术,PDF Expert 把格式转换功能变得非常简单。只需要在「文件」>「导出到」中选择任意一种格式,PDF Expert 就会把当前的 PDF 文档转换为指定的文件格式,并且还能保留原来的排版格式。
我测试了 Word 文档、Excel 表单、富文本格式等几种较为复杂的格式,转换的效果基本令人满意。其中,PDF 文件转换为 Excel 表单后数据会自动填入单元格中。
如果是 PDF 文件转换为 Word 文档,那么源文件会被保留,识别好的文本内容会直接覆盖在源文件上,划词选择后可以直接使用。
智能的扫描提升
我们阅读的 PDF 文档很多都是通过扫描得来的,但是扫描质量参差不齐,导致阅读体验差强人意。PDF Expert 在新版本中新增的扫描提升功能可以帮助我们优化扫描质量,通过增强扫描、拆分页面、裁剪页面、清除空白边等功能来提升扫描文档的可读性。
增强扫描包含了彩色过滤、移除失真、设置页面大小这 3 个选项,启用增强后可以更改扫描图像的对比度、扭曲度和页面大小,让画面看起来更加清晰和端正。
清除空白边这个功能的实际效果和它的名称不太一致,其实它是用纯色来填充页面的 4 个页边,方便写标记或者提升整个版面的美观度。
拆分页面这个功能也非常实用,如果我们扫描文件或者书籍的时候是左右两页同时扫描,那么这个功能可以帮助我们自动识别中缝并拆分成两个独立的页面。
总结
自从 PDF Expert 面世以来,我就一直将其作为主力 PDF 阅读器,如果你还没有尝试过这个 App,我推荐你要不妨趁着新版本推出的机会试试看。
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!