Word处理控件Aspose.Words功能演示:从 Java 中的 Word DOC 中提取图像

本文介绍了如何从 Java 中的 DOC 中提取图像。

使用Java从word文档中提取图像

图像通常用于表示 Word DOC 文档中的重要信息。在文本旁边包含图像使内容更具吸引力。在某些情况下,您可能需要以编程方式提取 DOC 文档中嵌入的图像。为此,本文介绍了如何从 Java 中的 DOC 中提取图像。

Java API 从 DOC 文件中提取图像

Aspose.Words for Java是一个功能强大且功能丰富的 API,用于创建、操作和转换 MS Word 文档。因此,我们将使用此 API 从 DOC 文档中提取图像。您可以使用以下 Maven 配置下载API 的 JAR 或将其安装到您的 Java 应用程序中。

<repository><id>AsposeJavaAPI</id><name>Aspose Java API</name><url>https://repository.aspose.com/repo/</url></repository><dependency><groupId>com.aspose</groupId><artifactId>aspose-words</artifactId><version>21.11</version><type>pom</type></dependency>

如何在 Java 中从 DOC 中提取图像
  • DOC 文档中的图像使用形状对象表示。因此,要检索图像,您必须处理文档中的每个形状。以下是从 Java 中的 DOC 文件中提取图像的步骤。

    • 首先,使用Document类加载 DOC 文件。
    • 然后,使用Document.getChildNodes(NodeType.SHAPE, Boolean)方法将所有形状放入NodeCollection对象中。
    • 循环遍历检索到的形状。
    • 在每次迭代中,使用Shape.hasImage()方法检查形状是否有图像。
    • 最后,提取图像并使用Shape.getImageData().save(string)方法保存。

以下代码示例展示了如何从 Java 中的 DOC 文档中提取图像。

// Load Word documentDocument doc = new Document("Document.docx");// Get all the shapesNodeCollection<Shape> shapes = (NodeCollection<Shape>) doc.getChildNodes(NodeType.SHAPE, true);int imageIndex = 0;// Loop through the shape collectionfor (Shape shape : shapes) {// Check if shape has imageif (shape.hasImage()) {// Extract and save the imageString imageFileName = String.format("Image.ExportImages.{0}_out_{1}", imageIndex, FileFormatUtil.imageTypeToExtension(shape.getImageData().getImageType()));shape.getImageData().save(dataDir + imageFileName);imageIndex++;}}
结论

在本文中,您学习了如何在 Java 中从 DOC 文档中提取图像。此外,代码示例还展示了如何从 DOC 文件中提取图像并将其保存到所需位置。此外,Aspose.Words for Java 提供了广泛的文档操作功能。


欢迎下载|体验更多Aspose产品

获取更多信息请咨询在线客服 或 加入Aspose技术交流群(
标签:

来源:慧都

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年7月13日
下一篇 2022年7月13日

相关推荐

发表回复

登录后才能评论