Apache POI là gì? Đọc ghi file Office bằng Java
Trong nhiều trường hợp, phần mềm của chúng ta được yêu cầu tạo, đọc dữ liệu từ các file MS Office. Để xử lý các file MS Office ta cần các API phục vụ cho việc đọc ghi đơn giản hơn.
(Mặc định trong Java chỉ hỗ trợ đọc/ghi các file text/binary đơn giản)
Apache POI là một thư viện cung cấp các API như vậy.
1. Apache POI là gì?
Apache POI là một API phổ biến nhất, cho phép các lập trình viên tạo, chỉnh sửa và hiển thị các file MS Office sử dụng ngôn ngữ Java.
Apache POI là một thư viện mã nguồn mở được phân phối bởi Apache.
Apache POI gồm các class, method phục vụ việc mã hóa, giải mã dữ liệu từ các file MS Office.
2. Các thành phần của Apache POI
- POIFS (Poor Obfuscation Implementation File System) − Đây là thành phần cơ bản nhất của POI. Nó được sử dụng để đọc các file khác nhau một cách rõ ràng.
- HSSF (Horrible SpreadSheet Format) − Được dùng để đọc ghi các file MS-Excel 2003 (.xls)
- XSSF (XML SpreadSheet Format) − Được dùng để đọc ghi các file MS-Excel 2007 trở về sau (.xlsx)
- HPSF (Horrible Property Set Format) − Được sử dụng để trích xuất các thuộc tính của các file MS-Office
- HWPF (Horrible Word Processor Format) − Được dùng để đọc ghi các file MS-Word 2003 (.doc)
- XWPF (XML Word Processor Format) − Được dùng để đọc ghi các file MS-Office 2007 trở về sau (.docx)
- HSLF (Horrible Slide Layout Format) − Được dùng để đọc ghi, chỉnh sửa các file Powerpoint
- HDGF (Horrible DiaGram Format) − Gồm các class và method cho xử lý các file MS-Visio binary
- HPBF (Horrible PuBlisher Format) − Được dùng để đọc, ghi các file MS-Publisher
Lưu ý, từ version 3.5 thì Apache POI mới hỗ trợ các file MS-Office 2007 trở lên như: docx, xlsx, pptx…
3. Đọc – Ghi file MS-Office bằng Java với Apache POI
- Đọc ghi file MS-Excel bằng Java với Apache POI
- Đọc ghi file MS-Work bằng Java với Apache POI
- Đọc ghi file PowerPoint bằng Java với Apache POI
Apache POI là gì? Đọc ghi file Office bằng Java
References: