JAVA读取PDF、WORD文档实例代码

网友投稿 286 2023-05-22


JAVA读取PDF、WORD文档实例代码

读取PDF文件jar引用

org.apache.pdfbox

pdfbox

1.8.13

读取WORD文件jar引用

org.apache.poi

poi-scratchpad

3.16-beta1

org.apache.poi

poi

3.16-beta1

读取WORD文件方法

/**

*

* @Title: getTextFromWord

* @Description: 读取word

* @param filePath

* 文件路径

* @return: String 读出的Word的内容

*/

public static String getTextFromWord(String filePath) {

String result = null;

File file = new File(filePath);

FileInputStream fis = null;

try {

fis = new FileInputStream(file);

@SuppressWarnings("resource")

WordExtractor wordExtractor = new WordExtractor(fis);

result = wordExtractor.getText();

} catch (FileNotFoundException e) {

e.printStackTrace();

} catch (IOException e) {

e.printStackTrace();

} finally {

if (fis != null) {

try {

fis.close();

} catch (IOException e) {

e.printStackTrace();

}

}

}

return result;

}

读取PDF文件方法

/**

*

* @Title: getTextFromPdf

* @Description: 读取pdf文件内容

* @param filePath

* @return: 读出的pdf的内容

*/

public static String getTextFromPdf(String filePath) {

String result = null;

FileInputStream is = null;

PDDocument document = null;

try {

is = new FileInputStream(filePath);

PDFParser parser = new PDFParser(is);

parser.parse();

document = parser.getPDDocument();

PDFTextStripper stripper = new PDFTextStripper();

result = stripper.getText(document);

} catch (FileNotFoundException e) {

e.printStackTrace();

} catch (IOException e) {

e.printStackTrace();

} finally {

if (is != null) {

try {

is.close();

} catchptFUdd (IOException e) {

e.printStackTrace();

}

}

if (document != null) {

try {

document.close();

} catch (IOException e) {

e.printStackTrace();

}

}

}

return result;

}

希望本篇实例代码可以帮到您


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:Java String 和 new String()的比较与区别
下一篇:微信小程序 跳转方式总结
相关文章

 发表评论

暂时没有评论,来抢沙发吧~