java poi解析word的方法

网友投稿 391 2023-05-17


java poi解析word的方法

之前做过用java读取word文档,获取word文本内容。

但发现docx的支持,doc就异常了。

后来找了很多资料发现是解析方法不一样。

首先要导入poi相关的jar包

我用的是maven,pom.xml引入如下:

org.apache.poi

poi-ooxml

3.8

org.apache.poi

poi-scratchpad

3.8

java获取word文本内容如下:

public BaseResp getParsedTxt(MultipartFile file) throws Exception {

BaseResp br=new BaseResp("200","") ;

String textType = file.getContentType();

String txt = "";

if(textType.equals(TXT_TYPE)){

String code = getCharset(file);

txt = new String(file.getBytes(),code);

}else if(textType.equals(DOC_TYPE)){

HWPFDocument doc = new HWPFDocument(file.getInputStream());

Range rang = doc.getRange();

txt = rang.text();

System.out.println(txt);

}else if(textType.equals(DOCX_TYPE)){

File uFile = new File("tempFile.docx");

if(!uFile.exists()){

uFile.createNewFile();

}

FileCopyUtils.copy(file.getBytes(), uFile);

tJHHQw OPCPackage opcPackage = POIXMLDocument.openPackage("tempFile.docx");

POIXMLTextExtractor extractor = new XWPFWordExtractor(opcPackage);

txt= extractor.getText();

uFile.delete();

}else{

br = new BaseResp("300","上传文件格式错误,请上传.txt或者.docx");

return br;

}

br.setDatas(txt);

return br;

}

功能实现了。


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:SpringBoot(十)之邮件服务
下一篇:Eolinker开启全新品牌升级之路!
相关文章

 发表评论

暂时没有评论,来抢沙发吧~