文本和图像提取工具包PDFlib TET已更新至v5.2,新增.NET Core的新语言绑定,pCOS接口的次要扩展等功能。
PDFlib TET(文本内容提取工具包)是一款可以从任意PDF文档格式中可靠地提取文本信息的软件。它不仅可以作为一种库/控件,还可以作为一种命令行工具。该工具包可以使得PDF格式的文本内容转换成Unicode(统一的字符编码标准)字符串,并附加详细的字形和字体信息。
欢迎下载PDFlib TETv5.2试用版
新增:
-
可在TETML和API中标记工件(不相关的文本和图像)。
-
可从注释和模式中提取文本和图像。
-
支持软掩码中的内嵌图像和图像(具有透明组XObject的图形状态)。
-
.NET Core的新语言绑定。
-
所有语言和最新语言版本更新的增强功能绑定。
-
第三方库的安全更新。
-
可选择在更简单的替代颜色空间中检索Separation和DeviceN文本颜色,而不是相当复杂的原生颜色空间。
-
pCOS接口的次要扩展。
改进:
-
通过行和列跨度识别改进了表检测。
-
损坏的PDF的许多错误修复,改进和解决方法。
不仅是PDFlib TET,PDFlib TET PDF IFilter也同步更新至v5.2,这是一款是基于TET PDF IFilter的产品,它可用于提取PDF页面的内容和元数据来作为原始文本,TET还可以作为一个Adobe Acrobat的免费插件,该插件允许在TET的高质量文本中进行交互式测试和提取评估。
对正版授权PDFlib TET和PDFlib TET PDF IFilter感兴趣的朋友,可以联系在线客服>>咨询购买
标签:
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!