OCR 识别工具LEADTOOLS OCR Module:可将 PDF 转换为150多种受支持的文档格式

LEADTOOLS OCR Module – LEAD Engine(原Advantage Engine )增加了将光学字符识别(OCR)和智能字符识别(ICR)技术合并到应用程序中的一些方法,并且包含用于开发稳健的,高性能的和可扩展的图像识别方案所需要的一切技术。LEADTOOLS OCR Module – LEAD Engine可与LEADTOOLS SDKs在文档和医疗产品方面集成在一起使用。

最新版LEADTOOLS 试用

下面概述了有关如何开始使用C#,VB和Java从PDF阅读文本的一些概述。

C#–从PDF获取文本

以下是C#控制台应用程序的概述,该应用程序将对输入文件进行OCR并将文本打印到控制台。

public void DocumentPageGetTextExample(){ar options = new LoadDocumentOptions();sing (var document = DocumentFactory.LoadFromFile(Path.Combine(LEAD_VARS.ImagesDir, "input.pdf"), options))var ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.LEAD);var rasterCodecs = new RasterCodecs();var documentWriter = new DocumentWriter();ocrEngine.Startup(rasterCodecs, documentWriter, null, LEAD_VARS.OcrLEADRuntimeDir);document.Text.OcrEngine = ocrEngine;// get textvar page = document.Pages[0];var pageText = page.GetText();if (pageText != null){ageText.BuildText();ar text = pageText.Text;onsole.WriteLine(text);}else{onsole.WriteLine("Failed!");}}static class LEAD_VARS{ublic const string ImagesDir = @"C:Input_File_Path";ublic const string OcrLEADRuntimeDir = @""C:LEADTOOLS21BinCommonOcrLEADRuntime"";}

Visual Basic –从PDF获取文本

以下VB代码将对输入文件进行OCR并将文本打印到控制台。

Public Shared Sub DocumentPageGetTextExample()im options As New LoadDocumentOptions()sing document As Leadtools.Document.LEADDocument = DocumentFactory.LoadFromFile(Path.Combine(DocumentPath.Path

                                                        

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年5月4日
下一篇 2021年5月4日

相关推荐

发表回复

登录后才能评论