PPT处理控件Aspose.Slides功能演示:使用 Java 从 PowerPoint 文件中提取文本

有时需要从 PowerPoint 幻灯片中提取文本以执行文本分析。另一方面,可能希望提取文本并将其保存在文件或数据库中以供进一步处理。据此,本文介绍了如何使用 Java 从 PowerPoint 演示文稿中提取文本。特别是,您将学习如何从特定幻灯片或整个演示文稿中提取文本。

  • 从 PowerPoint 幻灯片中提取文本
  • 从 PowerPoint 演示文稿中提取文本

为了操作 PowerPoint 演示文稿,我们将使用Aspose.Slides for Java,旨在在 Java 应用程序中实现 PowerPoint 自动化功能。它还提供了一些从 PPT/PPTX 演示文稿中提取文本的简单方法。

用 Java 从 PowerPoint 幻灯片中提取文本

以下是使用 Java 从 PowerPoint 演示文稿中的幻灯片中提取文本的步骤。

  • 使用Presentation类加载演示文稿。
  • 使用SlideUtil.getAllTextBoxes()方法将幻灯片中的所有文本框获取到ITextFrame数组中。
  • 循环遍历每个ITextFrame并使用ITextFrame.getParagraphs()方法访问其文本。
  • 从段落的每个IPortion中检索和打印文本。

以下代码示例展示了如何从 PowerPoint 幻灯片中提取文本。

//Instatiate PresentationEx class that represents a PPTX filePresentation pptxPresentation = new Presentation("presentation.pptx");//Get an Array of ITextFrame objects from the first slideITextFrame[] textFramesSlideOne = SlideUtil.getAllTextBoxes(pptxPresentation.getSlides().get_Item(1));//Loop through the Array of TextFramesfor (int i = 0; i < textFramesSlideOne.length; i++) { //Loop through paragraphs in current TextFrame for (IParagraph para : textFramesSlideOne[i].getParagraphs()) { //Loop through portions in the current Paragraph for (IPortion port : para.getPortions()) { //Display text in the current portion System.out.println(port.getText()); //Display font height of the text System.out.println(port.getPortionFormat().getFontHeight()); //Display font name of the text System.out.println(port.getPortionFormat().getLatinFont().getFontName()); } } }

从整个 PowerPoint 演示文稿中提取文本

还可以从整个 PowerPoint 演示文稿中提取文本。以下是执行此操作的步骤。

  • 使用Presentation类加载演示文稿。
  • 使用SlideUtil.getAllTextFrames()方法获取演示文稿中的所有文本框。
  • 循环遍历每个ITextFrame并访问其段落。
  • 访问段落的各个部分并打印它们的文本。

以下代码示例展示了如何从 PowerPoint 演示文稿中提取文本。

//Instatiate PresentationEx class that represents a PPTX filePresentation pptxPresentation = new Presentation("presentation.pptx");//Get an Array of ITextFrame objects from the first slideITextFrame[] textFrames = SlideUtil.getAllTextFrames(pptxPresentation, true);//Loop through the Array of TextFramesfor (int i = 0; i < textFrames.length; i++) { //Loop through paragraphs in current TextFrame for (IParagraph para : textFrames[i].getParagraphs()) { //Loop through portions in the current Paragraph for (IPortion port : para.getPortions()) { //Display text in the current portion System.out.println(port.getText()); } } }





