LEADTOOLS如何将PDF转换为C#、VB和Java中的文本?

LEADTOOLS Recognition Imaging SDK是精选的LEADTOOLS SDK功能集,旨在在企业级文档自动化解决方案中构建端到端文档成像应用程序,这些解决方案需要OCR,MICR,OMR,条形码,表单识别和处理,PDF,打印捕获 ,档案,注释和图像查看功能。 这套功能强大的工具利用LEAD屡获殊荣的图像处理技术,智能识别可用于识别和提取任何类型的扫描或传真形式图像数据的文档功能。

LEADTOOLS 试用版

下面概述了有关如何开始使用C#,VB和Java从PDF阅读文本的一些概述。

C#–从PDF获取文本

以下是C#控制台应用程序的概述,该应用程序将对输入文件进行OCR并将文本打印到控制台。

public void DocumentPageGetTextExample(){ar options = new LoadDocumentOptions();sing (var document = DocumentFactory.LoadFromFile(Path.Combine(LEAD_VARS.ImagesDir, "input.pdf"), options))var ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.LEAD);var rasterCodecs = new RasterCodecs();var documentWriter = new DocumentWriter();ocrEngine.Startup(rasterCodecs, documentWriter, null, LEAD_VARS.OcrLEADRuntimeDir);document.Text.OcrEngine = ocrEngine;// get textvar page = document.Pages[0];var pageText = page.GetText();if (pageText != null){ageText.BuildText();ar text = pageText.Text;onsole.WriteLine(text);}else{onsole.WriteLine("Failed!");}}static class LEAD_VARS{ublic const string ImagesDir = @"C:Input_File_Path";ublic const string OcrLEADRuntimeDir = @""C:LEADTOOLS21BinCommonOcrLEADRuntime"";}

Visual Basic –从PDF获取文本

以下VB代码将对输入文件进行OCR并将文本打印到控制台。

Public Shared Sub DocumentPageGetTextExample()im options As New LoadDocumentOptions()sing document As Leadtools.Document.LEADDocument = DocumentFactory.LoadFromFile(Path.Combine(DocumentPath.Path

                                                        

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年3月6日
下一篇 2021年3月6日

相关推荐

发表回复

登录后才能评论