该 LEADTOOLS文档转换器SDK 是一个简单的工具能够处理所有的文档和图像转换的需求结合起来。
LEADTOOLS Recognition Imaging SDK是精选的LEADTOOLS SDK功能集,旨在在企业级文档自动化解决方案中构建端到端文档成像应用程序,这些解决方案需要OCR,MICR,OMR,条形码,表单识别和处理,PDF,打印捕获 ,档案,注释和图像查看功能。 这套功能强大的工具利用LEAD屡获殊荣的图像处理技术,智能识别可用于识别和提取任何类型的扫描或传真形式图像数据的文档功能。
LEADTOOLS Recognition Imaging SDK试用版
在后台,Document Converter使用人工智能来选择LEADTOOLS Raster, SVG, OCR和 Document Writer 技术的正确组合, 以快速而精确地转换图像和文档。
在接下来的几周中,我们将通过向您展示如何在特定格式之间进行转换,来证明我们的文档转换技术的多功能性。今天的博客重点介绍如何将PDF转换为Word格式(DOC / DOCX)。
在C#中将PDF转换为DOC或DOCX
使用LEADTOOLS轻松将PDF转换为Word(DOC / DOCX)文档。下面的示例使用C#,但是LEADTOOLS支持其他几种语言,包括Java和VB。首先,导入LEADTOOLS SDK。
using Leadtools;using Leadtools.Codecs;using Leadtools.Document.Converter;using Leadtools.Document.Writer;using Leadtools.Ocr;
然后,初始化文档转换器。
namespace Convert_Files_with_Document_Converter{lass Programstatic void Main(string[] args){tring directory = @"C:InputFileDirectory";etLicense();sing (IOcrEngine ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.LEAD))sing (DocumentConverter docConverter = new DocumentConverter())ocrEngine.Startup(null, null, null, @"C:LEADTOOLS21BinCommonOcrLEADRuntime");docConverter.SetOcrEngineInstance(ocrEngine, false);// Change the DocumentFormat enumeration to whichever format is neededConvertToDocument(directory, docConverter, DocumentFormat.Doc);}}
最后,转换文档。
static void ConvertToDocument(string directory, DocumentConverter docConverter, DocumentFormat docFormat){tring[] files = Directory.GetFiles(directory, "*.pdf");tring outputDir = Path.Combine(directory, "Converted");f (!Directory.Exists(outputDir))Directory.CreateDirectory(outputDir);oreach (string file in files)Console.WriteLine($"Converting {file}...");string fileName = Path.GetFileNameWithoutExtension(file);string ext = DocumentWriter.GetFormatFileExtension(docFormat);string outFile = Path.Combine(outputDir, $"{fileName}.{ext}");DocumentConverterJobData jobData = DocumentConverterJobs.CreateJobData(file, outFile, docFormat);jobData.JobName = "Convert to Image Job";DocumentConverterJob job = docConverter.Jobs.CreateJob(jobData);docConverter.Jobs.RunJob(job);if (job.Errors.Count > 0)oreach (var error in job.Errors)Console.WriteLine($"Error during conversion: {error.Error.Message}n");elseonsole.WriteLine($"Successfully Convereted {file} to {outFile}n");}
在Visual Basic中将PDF转换为DOC或DOCX
LEADTOOLS还支持Visual Basic .NET应用程序。只需使用下面的功能,即可将LEADTOOLS Document Converter集成到您的应用程序中。
Public Sub DocumentConverterExample()sing documentConverter As New DocumentConverter()Dim inFile As String = Path.Combine(ImagesPath.Path, "Leadtools.pdf")Dim outFile As String = Path.Combine(ImagesPath.Path, "output.doc")Dim format As DocumentFormat = DocumentFormat.DocDim jobData As DocumentConverterJobData = DocumentConverterJobs.CreateJobData(inFile, outFile, format)jobData.JobName = "conversion job"Dim job As DocumentConverterJob = documentConverter.Jobs.CreateJob(jobData)documentConverter.Jobs.RunJob(job)If job.Status = DocumentConverterJobStatus.Success Thenonsole.WriteLine("Success")Elseonsole.WriteLine("{0} Errors", job.Status)or Each errorItem As DocumentConverterJobError In job.ErrorsConsole.WriteLine(" {0} at {1}: {2}", errorItem.Operation, errorItem.InputDocumentPageNumber, errorItem.Error.Message)extEnd Ifnd UsingEnd Sub
用Java将PDF转换为DOC或DOCX
使用LEADTOOLS Java Document Converter时发现了类似的方法。在Java中,应用程序将使用以下功能创建转换作业。
static void ConvertToDocument(String inputFile, DocumentConverter docConverter, OcrEngine ocrEngine){ocumentWriter docWriter = new DocumentWriter();crEngine.startup(new RasterCodecs(), docWriter, null, null);tring outputFile = "C:\LEADTOOLS21\Resources\Images\documentConverter.pdf";ocConverter.setDocumentWriterInstance(docWriter);ocConverter.setOcrEngineInstance(ocrEngine, true);ocumentConverterJobData jobData = DocumentConverterJobs.createJobData(inputFile, outputFile, DocumentFormat.Doc);obData.setJobName("DocumentConversion");ocumentConverterJob job = docConverter.getJobs().createJob(jobData);ocConverter.getJobs().runJob(job);f (job.getErrors().size() > 0)for (DocumentConverterJobError error : job.getErrors())ystem.out.println("nError during conversion: " + error.getError().getMessage());lseSystem.out.println("Successfully converted file to " + outputFile);}
有关Java文档转换器的更多信息,请查看我们有关LEADTOOLS Java文档转换器的完整教程 。
这就是将文件从PDF转换为Word格式的全部,但是为什么到此为止呢看所有 LEADTOOLS支持的格式。
试用版下载>>>
LEADTOOLS 使用教程>>>
想要购买LEADTOOLS正版授权,或了解更多产品信息请点击【咨询在线客服】
标签:
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!