Java使用Apache POI库读取Excel表格文档的示例

网友投稿 233 2023-07-14


Java使用Apache POI库读取Excel表格文档的示例

Apache POI 是用java编写的免费开源的跨平台的 Java API,Apache POI提供API给Java程式对Microsoft Office格式档案读和写的功能。

项目下载页:http://poi.apache.org/dowhttp://nload.html

Apache POI 是创建和维护操作各种符合Office Open XML(OOXML)标准和微软的OLE 2复合文档格式(OLE2)的Java API。用它可以使用Java读取和创建,修改MS Excel文件.而且,还可以使用Java读取和创建MS Word和MSPowerPoint文件。Apachehttp:// POI 提供Java操作Excel解决方案。

HSSF - 提供读写Microsoft Excel XLS格式档案的功能。

XSSF - 提供读写Microsoft Excel OOXML XLSX格式档案的功能。

HWPF - 提供读写Microsoft Word DOC格式档案的功能。

HSLF - 提供读写Microsoft PowerPoint格式档案的功能。

HDGF - 提供读Microsoft Visio格式档案的功能。

HPBF - 提供读Microsoft Publisher格式档案的功能。

HSMF - 提供读Microsoft Outlook格式档案的功能。

读取Excel文档示例

我们使用POI中的HSSFWorkbook来读取Excel数据。

public void test(File file) throws IOException {

InputStream inp = new FileInputStream(file);

HSSFWorkbook workbook = new HSSFWorkbook(inp);

// workbook...遍历操作

}

上边代码,读取Excel2003(xls)的文件没问题,但是一旦读取的是Excel2007(xlsx)的文件,就会报异常:“The supplied data appears to be in the Office 2007+ XML. You are calling the part of POI that deals with OLE2 Office Documents. You need to call a different part of POI to process this data (eg XSSF instead of HSSF)”

查阅了资料,Excel2007版本的Excel文件需要使用XSSFWorkbook来读取,如下:

public void test(File file) throws IOException {

InputStream inp = new FileInputStream(file);

XSSFWorkbook workbook = new XSSFWorkbook(inp);

// workbook...遍历操作

}

注意:XSSFWorkbook需要额外导入poi-ooxml-3.9-sources.jar和poi-ooxml-schemas-3.9.jar。

这样,Excel2007的导入没问题了,但是导入Excel2003又报异常。

所以,在导入Excel的时候,尽量能判断导入Excel的版本,调用不同的方法。

我想到过使用文件后缀名来判断类型,但是如果有人将xlsx的后缀改为xls时,如果使用xlsx的函数来读取,结果是报错;虽然后缀名对了,但是文件内容编码等都不对。

最后,推荐使用poi-ooxml中的WorkbookFactory.create(inputStream)来创建Workbook,因为HSSFWorkbook和XSSFWorkbook都实现了Workbook接口。代码如下:

Workbook wb = WorkbookFactory.create(is);

可想而知,在WorkbookFactory.create()函数中,肯定有做过对文件类型的判断,一起来看一下源码是如何判断的:

/**

* Creates the appropriate HSSFWorkbook / XSSFWorkbook from

* the given InputStream.

* Your input stream MUST either support mark/reset, or

* be wrapped as a {@link PushbackInputStream}!

*/

public static Workbook create(InputStream inp) throws IOException, InvalidFormatException {

// If clearly doesn't do mark/reset, wrap up

if(! inp.markSupported()) {

inp = new PushbackInputStream(inp, 8);

}

if(POIFSFileSystem.hasPOIFSHeader(inp)) {

return new HSSFWorkbook(inp);

}

if(POIXMLDocument.hasOOXMLHeader(inp)) {

return new XSSFWorkbook(OPCPackage.open(inp));

}

throw new IllegalArgumentExcepNWTcvmndCtion("Your InputStream was neither an OLE2 stream, nor an OOXML stream");

}

可以看到,有根据文件类型来分别创建合适的Workbook对象。是根据文件的头部信息去比对进行判断的,此时,就算改了后缀名,还是一样通不过。


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:Java数据类型转换详解
下一篇:Java字母加数字组合比较大小
相关文章

 发表评论

暂时没有评论,来抢沙发吧~