文本和图像提取工具包PDFlib TET已更新至v5.2,新增.NET Core语言绑定等功能

文本和图像提取工具包PDFlib TET已更新至v5.2,新增.NET Core的新语言绑定,pCOS接口的次要扩展等功能。

    PDFlib TET(文本内容提取工具包)是一款可以从任意PDF文档格式中可靠地提取文本信息的软件。它不仅可以作为一种库/控件,还可以作为一种命令行工具。该工具包可以使得PDF格式的文本内容转换成Unicode(统一的字符编码标准)字符串,并附加详细的字形和字体信息。

欢迎下载PDFlib TETv5.2试用版 


新增:

  • 可在TETML和API中标记工件(不相关的文本和图像)。

  • 可从注释和模式中提取文本和图像。

  • 支持软掩码中的内嵌图像和图像(具有透明组XObject的图形状态)。

  • .NET Core的新语言绑定。

  • 所有语言和最新语言版本更新的增强功能绑定。

  • 第三方库的安全更新。

  • 可选择在更简单的替代颜色空间中检索Separation和DeviceN文本颜色,而不是相当复杂的原生颜色空间。

  • pCOS接口的次要扩展。

改进:

  • 通过行和列跨度识别改进了表检测。

  • 损坏的PDF的许多错误修复,改进和解决方法。

    不仅是PDFlib TET,PDFlib TET PDF IFilter也同步更新至v5.2,这是一款是基于TET PDF IFilter的产品,它可用于提取PDF页面的内容和元数据来作为原始文本,TET还可以作为一个Adobe Acrobat的免费插件,该插件允许在TET的高质量文本中进行交互式测试和提取评估。


    对正版授权PDFlib TETPDFlib TET PDF IFilter感兴趣的朋友,可以联系在线客服>>咨询购买

标签:

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2019年8月3日
下一篇 2019年8月3日

相关推荐

发表回复

登录后才能评论