Java 将PDF转为HTML时保存到流的方法和步骤

网友投稿 610 2022-09-01


Java 将PDF转为HTML时保存到流的方法和步骤

本文介绍如何通过java后端程序代码将PDF文件转为HTML,并将转换后的HTML文件保存到流。在实现转换时,可设置相关转换属性,如:是否嵌入SVG、是否嵌入图片等。下面是实现转换的方法和步骤:

1. 导入jar包

本次转换的方法通过导入Free Spire.PDF for Java中的Spire.Pdf.jar免费jar来实现。可按照如下两种方法中的任意一种导入jar:

方法1:从Maven仓库中导入。在pom.xml中配置如下内容:

com.e-iceblue

https://repo.e-iceblue.cn/repository/maven-public/

e-iceblue

spire.pdf.free

4.4.1

方法2:下载 jar包到本地,解压,找到lib文件夹下的Spire.Pdf.jar文件。然后执行如下图步骤完成导入:

2. Java代码

将PDF转换为HTML时,主要通过以下步骤中的类及方法实现:

实例化PdfDocument类的对象,并通过PdfDocument.loadFromFile(String filename)方法加载PDF文档PdfDocument. getConvertOptions().setPdfToHtmlOptions(boolean useEmbeddeSvg, boolean useEmbeddeIhttp://mg)方法设置转换为HTML格式时的相关转换属性。PdfDocument.saveToStream(OutputStream stream, FileFormate format)方法转换成HTML时保存到流。

Java

import com.spire.pdf.*;

import java.io.File;

import java.io.FileNotFoundException;

import java.io.FileOutputStream;

import java.io.OutputStream;

public class SaveToStream {

public static void main(String[] args) throws FileNotFoundException {

//加载PDF文档

PdfDocument pdf = new PdfDocument();

pdf.loadFromFile("咖啡豆.pdf");

//设置useEmbeddedSvg和 useEmbeddedImg布尔值为true

pdf.getConvertOptions().setPdfToHtmlOptions(true,true);

//保存到流

File outFile = new File("toHTML.html");

OutputStream outputStream = new FileOutputStream(outFile);

pdf.saveToStream(outputStream, FileFormat.HTML);

pdf.close();

}

}

3. 执行代码后,生成html文件。


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:python之开发规范(Python开发规范)
下一篇:python之json操作
相关文章

 发表评论

暂时没有评论,来抢沙发吧~