LEADTOOLS OCR Module – LEAD Engine(原Advantage Engine )增加了将光学字符识别(OCR)和智能字符识别(ICR)技术合并到应用程序中的一些方法,并且包含用于开发稳健的,高性能的和可扩展的图像识别方案所需要的一切技术。LEADTOOLS OCR Module – LEAD Engine可与LEADTOOLS SDKs在文档和医疗产品方面集成在一起使用。
最新版LEADTOOLS 试用
下面概述了有关如何开始使用C#,VB和Java从PDF阅读文本的一些概述。
C#–从PDF获取文本
以下是C#控制台应用程序的概述,该应用程序将对输入文件进行OCR并将文本打印到控制台。
public void DocumentPageGetTextExample(){ar options = new LoadDocumentOptions();sing (var document = DocumentFactory.LoadFromFile(Path.Combine(LEAD_VARS.ImagesDir, "input.pdf"), options))var ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.LEAD);var rasterCodecs = new RasterCodecs();var documentWriter = new DocumentWriter();ocrEngine.Startup(rasterCodecs, documentWriter, null, LEAD_VARS.OcrLEADRuntimeDir);document.Text.OcrEngine = ocrEngine;// get textvar page = document.Pages[0];var pageText = page.GetText();if (pageText != null){ageText.BuildText();ar text = pageText.Text;onsole.WriteLine(text);}else{onsole.WriteLine("Failed!");}}static class LEAD_VARS{ublic const string ImagesDir = @"C:Input_File_Path";ublic const string OcrLEADRuntimeDir = @""C:LEADTOOLS21BinCommonOcrLEADRuntime"";}
Visual Basic –从PDF获取文本
以下VB代码将对输入文件进行OCR并将文本打印到控制台。
Public Shared Sub DocumentPageGetTextExample()im options As New LoadDocumentOptions()sing document As Leadtools.Document.LEADDocument = DocumentFactory.LoadFromFile(Path.Combine(DocumentPath.Path声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!