Word处理控件Aspose.Words功能演示:使用 C# 将 Word 文档转换为 HTML

本文介绍了如何使用 C# 将 Word DOCX或DOC文件转换为 HTML。此外,您将学习如何使用不同的选项动态控制 Word 到 HTML 的转换。

Word 到 HTML C#

在各种情况下,您需要在 Web 或桌面应用程序中显示 Word 文档的内容。在这种情况下,合适的选项之一是将 Word 文档转换为HTML。为了在 .NET 应用程序中实现这一点,本文介绍了如何使用 C# 将 Word DOCX或DOC文件转换为 HTML。此外,您将学习如何使用不同的选项动态控制 Word 到 HTML 的转换。

用于 Word 到 HTML 转换的 C# API

要在 .NET 应用程序中执行 Word 到 HTML 的转换,我们将使用Aspose.Words for .NET。它是一个功能强大的类库,可让您创建和操作 Word 文档。此外,它还允许您将 Word 文档转换为各种其他文件格式。您可以下载API 或使用NuGet安装它。

PM> Install-Package Aspose.Words
在 C# 中将 Word 文档转换为 HTML

Aspose.Words for .NET 使您可以更轻松地将 Word 文档转换为 HTML。只需加载 Word 文档并将其保存为 HTML 文件。以下是在 C# 中将 Word DOCX 文件转换为 HTML 的步骤。

  • 使用Document类加载 Word 文档。
  • 使用Document.Save(string, SaveFormat)方法将 Word 文档转换为 HTML 。

以下代码示例演示如何使用 C# 将 Word 文档转换为 HTML。

// Load the document from diskDocument doc = new Document("Document.docx");// Save the document as HTMLdoc.Save("Document.html", SaveFormat.Html);
在 C# 中自定义 Word 到 HTML 的转换

Aspose.Words for .NET 还允许您使用不同的选项自定义 Word 到 HTML 的转换。例如,您可以指定一个文件夹来分别保存资源文件(CSS、字体和图像)。此外,您可以导出文档的往返信息。以下部分演示了如何使用这些选项。

将 Word 中的往返信息导出到 HTML 转换

MS Word 提供了广泛的功能,但并非所有这些功能都受 HTML 支持。因此,为了使 HTML 的内容接近原始文档,使用了往返信息。以下步骤显示如何在 Word 到 HTML 转换中导出往返信息。

  • 使用Document类加载 Word 文档。
  • 创建HtmlSaveOptions类的对象。
  • 使用HtmlSaveOptions.ExportRoundtripInformation属性启用往返信息的导出。
  • 使用Document.Save(string, HtmlSaveOptions)方法将 Word 文档转换为 HTML 。

下面的代码示例演示如何将 Word 中的往返信息导出到 HTML 转换。

// Load the document from diskDocument doc = new Document("Document.docx");// Enable roundtrip informationHtmlSaveOptions options = new HtmlSaveOptions();options.ExportRoundtripInformation = true;// Save as HTMLdoc.Save("ExportRoundtripInformation_out.html", options);
在 Word 到 HTML 转换中指定资源文件夹

在执行 Word 到 HTML 转换时,您可以将资源文件保存在单独的文件夹中。此外,您可以指定文件夹以分别保存字体和图像。以下是实现此目的的步骤。

  • 使用Document类加载 Word 文档。
  • 创建HtmlSaveOptions类的对象。
  • 使用HtmlSaveOptions.ResourceFolder属性设置资源文件夹。
  • 使用Document.Save(string, HtmlSaveOptions)方法将 Word 文档转换为 HTML 。

下面的代码示例演示如何在 Word 到 HTML 的转换中将资源保存在单独的文件夹中。

// Load documentDocument doc = new Document("document.docx");// Set folder for resourcesHtmlSaveOptions saveOptions = new HtmlSaveOptions();saveOptions.CssStyleSheetType = CssStyleSheetType.External;saveOptions.ExportFontResources = true;saveOptions.ResourceFolder = dataDir + @"Resources";saveOptions.ResourceFolderAlias = "http://example.com/resources";// Convert document to HTMLdoc.Save("ExportResourcesUsingHtmlSaveOptions.html", saveOptions);
结论

在本文中,您学习了如何使用 C# 将 Word DOCX 或 DOC 文档转换为 HTML。此外,您还了解了如何使用不同的选项来自定义 Word 到 HTML 的转换。您还可以使用文档探索 Aspose.Words for .NET 的其他功能。


欢迎下载|体验更多Aspose产品

获取更多信息请咨询在线客服 或 加入Aspose技术交流群(
标签:

来源:慧都

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年6月12日
下一篇 2022年6月12日

相关推荐

发表回复

登录后才能评论