Spire.Doc 文本教程(5):C# 读取Word文档的文本内容

本篇文章主要介绍如何使用Spire.Doc组件读取Word文档的文本内容。

这篇文章将介绍如何使用Spire.Doc组件读取Word文档的文本内容。

下载Spire.Doc最新试用版

Spire.Doc提供了两种方法来读取Word文档的文本内容,一种是通过Document.GetText方法直接读取文档中的所有文本,另一种是遍历文档中的节和其中的段落,然后获取段落的文本。下面将逐一介绍这两种方法。

Word文档截图:

read text from word document-1

直接获取所有文本

//加载Word文档Document doc = new Document();document.LoadFromFile(@"测试文档.docx");//使用GetText方法获取文档中的所有文本string s = doc.GetText();File.WriteAllText("文本1.txt", s.ToString());

效果图如下:

read text from word document-2

遍历段落获取文本

//加载Word文档Document document = new Document();document.LoadFromFile(@"测试文档.docx");StringBuilder sb = new StringBuilder();//遍历节和段落,获取段落中的文本foreach (Section section in document.Sections){    foreach (Paragraph paragraph in section.Paragraphs)    {        sb.AppendLine(paragraph.Text);    }}File.WriteAllText("文本2.txt", sb.ToString());

效果图如下:

read text from word document-3
想要购买正版授权,或者获取更多Spire.Doc相关信息的朋友可以点击” 咨询在线客服 “~

标签:文档管理Officeword文档处理

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2019年1月10日
下一篇 2019年1月10日

相关推荐

发表回复

登录后才能评论