一、C++ Microsoft Word 文件转换器 API – 安装
我们需要安装 Aspose.Words for C++ API 来转换 Microsoft Word (DOCX/DOC) 文件。您可以轻松地从NuGet库安装 API或在控制台上使用以下命令安装它。
Install-Package Aspose.Words.Cpp -Version 20.8.0
二、使用 C++ 将 Word (DOCX/DOC) 转换为 HTML
当您想要呈现内容以便在浏览器中显示时,Word 到 HTML 的转换很有用。您的 C++ 应用程序可以通过以下步骤快速执行转换:
- 加载源字文件
- 以 HTML 格式保存文档
下面的代码显示了如何使用 C++ 将 word 转换为 HTML:
// Load the document fromSystem::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");// Save the word document in HTML formatdoc->Save(u"Document_out.html", SaveFormat::Html);
三、使用 C++ 将 Word 转换为带有嵌入式字体的 HTML
word 文件 (DOCX/DOC) 可能包含某些平台可能不支持的自定义字体。在这种情况下,字体在输出结果中可能会出现乱码。但是,Aspose.Words for C++ API 允许您使用 Base64 编码将字体资源嵌入到 HTML 中。您可以设置 ExportFontsAsBase64 属性,该属性将在输出 HTML 文件中嵌入字体。您需要按照以下步骤来实现这些要求:
- 加载源 DOCX 文件
- 设置ExportFontsAsBase64属性
- 保存输出的 HTML 文件
以下代码片段显示了如何使用 C++ 将 Word 转换为带有嵌入式字体的 HTML:
// Load source DOCX fileSystem::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.docx");// Initialize HtmlSaveOptions objectSystem::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();saveOptions->set_ExportFontResources(true);saveOptions->set_ExportFontsAsBase64(true);// Save output HTMLSystem::String outputPath = u"ExportFontsAsBase64.html";doc->Save(outputPath, saveOptions);

四、使用 C++ 中的往返信息将 Word 转换为 HTML
Microsoft Word 文档可以包含很多信息和功能,而这些信息和功能在 HTML 文件格式中是不支持的。有时您需要将 Word 转换为 HTML,然后再转换回 Word 格式。为了确保这些转换之间的最大保真度,一些被称为“往返信息”的信息可以由 Aspose.Words for C++ API 额外保存。让我们按照以下步骤来测试这样的转换:
- 加载源 DOCX 文件
- 将ExportRoundtripInformation设置为 true
- 保存输出的 HTML 文件
下面的代码片段显示了如何使用 C++ 将 Word 转换为带有往返信息的 HTML:
// Load input DOCX fileSystem::SharedPtr<Document> doc = System::MakeObject<Document>(u"Document.doc");// Set HtmlSaveOptionsSystem::SharedPtr<HtmlSaveOptions> saveOptions = System::MakeObject<HtmlSaveOptions>();saveOptions->set_ExportFontResources(true);saveOptions->set_ExportFontsAsBase64(true);// Save output HTML fileSystem::String outputPath = u"ExportFontsAsBase64.html";doc->Save(outputPath, saveOptions);
五、在 C++ 中将 Word 转换为 MHTML
MHTML 文件格式很受欢迎,因为它包含单个输出文件中的所有内容。您可以使用 C++ 通过以下步骤将 Word 文件 (DOCX/DOC) 转换为 MHTML 格式:
- 加载源 DOCX 文件
- 以 MHTML 格式保存输出
下面的代码片段显示了如何使用 C++ 将 Word 转换为 MHTML:
// Load the document into Aspose.Words.System::SharedPtr<Document> doc = System::MakeObject<Document>(u"Test File.docx");// Save output in MHTML format.doc->Save(u"Document_out.mhtml", SaveFormat::Mhtml);
以上便是使用 C++ 以编程方式将 Word 转换为 HTML 、MHTML,要是您还有其他关于产品方面的问题,欢迎咨询我们,或者加入我们官方技术交流群。
欢迎下载|体验更多Aspose产品
点此获取更多Aspose产品信息 或 加入Aspose技术交流群()
标签:
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!