27 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Обзор библиотеки Apache POI — работа с приложениями пакета Microsoft Office в Java

Apache POI – the Java API for Microsoft Documents

Project News

17 February 2020 – POI 4.1.2 available

The Apache POI team is pleased to announce the release of 4.1.2. This release features better chart support in XDDF, various rendering fixes in the Common SL/EMF modules and OOM fixes when handling arbitrary slide indexes in XSLF (+ a new dependency to SparseBitSet 1.2). Several dependencies were also updated to their latest versions to pick up security fixes and other improvements.

A summary of changes is available in the Release Notes. A full list of changes is available in the change log. People interested should also follow the dev list to track progress.

See the downloads page for more details.

POI requires Java 8 or newer since version 4.0.1.

20 October 2019 – CVE-2019-12415 – XML External Entity (XXE) Processing in Apache POI versions prior to 4.1.1

Description:
When using the tool XSSFExportToXml to convert user-provided Microsoft Excel documents, a specially crafted document can allow an attacker to read files from the local filesystem or from internal network resources via XML External Entity (XXE) Processing.

Mitigation:
Apache POI 4.1.0 and before: users who do not use the tool XSSFExportToXml are not affected. affected users are advised to update to Apache POI 4.1.1 which fixes this vulnerability.

Credit: This issue was discovered by Artem Smotrakov from SAP

26 March 2019 – XMLBeans 3.1.0 available

The Apache POI team is pleased to announce the release of XMLBeans 3.1.0. Featured are a handful of bug fixes.

The Apache POI project has unretired the XMLBeans codebase and is maintaining it as a sub-project, due to its importance in the poi-ooxml codebase.

A summary of changes is available in the Release Notes. People interested should also follow the POI dev list to track progress.

The XMLBeans JIRA project has been reopened and feel free to open issues.

POI 4.1.0 uses XMLBeans 3.1.0.

XMLBeans requires Java 6 or newer since version 3.0.2.

11 January 2019 – Initial support for JDK 11

We did some work to verify that compilation with Java 11 is working and that all unit-tests pass.

See the details in the FAQ entry.

Mission Statement

The Apache POI Project’s mission is to create and maintain Java APIs for manipulating various file formats based upon the Office Open XML standards (OOXML) and Microsoft’s OLE 2 Compound Document format (OLE2). In short, you can read and write MS Excel files using Java. In addition, you can read and write MS Word and MS PowerPoint files using Java. Apache POI is your Java Excel solution (for Excel 97-2008). We have a complete API for porting other OOXML and OLE2 formats and welcome others to participate.

OLE2 files include most Microsoft Office files such as XLS, DOC, and PPT as well as MFC serialization API based file formats. The project provides APIs for the OLE2 Filesystem (POIFS) and OLE2 Document Properties (HPSF).

Office OpenXML Format is the new standards based XML file format found in Microsoft Office 2007 and 2008. This includes XLSX, DOCX and PPTX. The project provides a low level API to support the Open Packaging Conventions using openxml4j.

Читать еще:  Как с помощью maven работать с библиотеками, которых в maven нет

For each MS Office application there exists a component module that attempts to provide a common high level Java api to both OLE2 and OOXML document formats. This is most developed for Excel workbooks (SS=HSSF+XSSF). Work is progressing for Word documents (WP=HWPF+XWPF) and PowerPoint presentations (SL=HSLF+XSLF).

The project has some support for Outlook (HSMF). Microsoft opened the specifications to this format in October 2007. We would welcome contributions.

As a general policy we collaborate as much as possible with other projects to provide this functionality. Examples include: Cocoon for which there are serializers for HSSF; Open Office.org with whom we collaborate in documenting the XLS format; and Tika / Lucene, for which we provide format interpretors. When practical, we donate components directly to those projects for POI-enabling them.

Why should I use Apache POI?

A major use of the Apache POI api is for Text Extraction applications such as web spiders, index builders, and content management systems.

So why should you use POIFS, HSSF or XSSF?

You’d use POIFS if you had a document written in OLE 2 Compound Document Format, probably written using MFC, that you needed to read in Java. Alternatively, you’d use POIFS to write OLE 2 Compound Document Format if you needed to inter-operate with software running on the Windows platform. We are not just bragging when we say that POIFS is the most complete and correct implementation of this file format to date!

You’d use HSSF if you needed to read or write an Excel file using Java (XLS). You’d use XSSF if you need to read or write an OOXML Excel file using Java (XLSX). The combined SS interface allows you to easily read and write all kinds of Excel files (XLS and XLSX) using Java. Additionally there is a specialized SXSSF implementation which allows to write very large Excel (XLSX) files in a memory optimized way.

Components

The Apache POI Project provides several component modules some of which may not be of interest to you. Use the information on our Components page to determine which jar files to include in your classpath.

Contributing

So you’d like to contribute to the project? Great! We need enthusiastic, hard-working, talented folks to help us on the project, no matter your background. So if you’re motivated, ready, and have the time: Download the source from the Subversion Repository, build the code, join the mailing lists, and we’ll be happy to help you get started on the project!

Please read our Contribution Guidelines. When your contribution is ready submit a patch to our Bug Database.

Как подключить библиотеку apache poi к проекту

Возникла потребность вывести массив в файл excel.
Почитав немного, понял что самая “адекватная” библиотека для этого – это apache poi.

Но вот беда, на странице скачивания лежат несколько ссылок на файлы:

Binary Distribution:
poi-bin-3.9-20121203.tar.gz
poi-src-3.9-20121203.zip

Source Distribution:
poi-src-3.9-20121203.tar.gz
poi-src-3.9-20121203.zip

дополнительную сумятицу вносит следующий текст:

Что за central Maven repository такой ?

Скачав архив и распаковав poi-bin-3.9-20121203.tar.gz обнаружил папку poi-3.9 с 6-ю *.jar, 2-мя текстовыми файлами и тремя папками.

Читать еще:  Сравнение iphone 6 и 6s на русском

Что с этим богатством делать?
Какой *.jar подключать к проекту?

С jsoup такого затыка что-то не возникло, просто скачал jsoup-1.7.3.jar и подключил, а здесь прям . теряюсь

Как подключить Apache POI
я новичок в java, работаю в intellij, нужно написать считку с excel файла, но не могу подключить.

Как подключить dll библиотеку написанную на Delphi к проекту на Java?
Добрый день. Подскажите пожалуйста, как подключить dll библиотеку написанную на Delphi к проекту.

Не удается подключить библиотеку Apache.poi
Здравствуйте Уважаемые форумчане. Такой вопрос: Работаю с Excel.Использую Apache poi в maven.

Как подключить библиотеку к проекту
Не могу понять почему не работает. Папку заголовков и папку с библиотекой выбрал, линковщику.

Maven – это популярный инструмент для автоматизации сборки проектов и управления зависимостями. Используя Maven вам достаточно в специальном конфигурационном файле проекта прописать, какие библиотеки вы хотите использовать – их вместе с зависимостями Maven скачает и подключит к вашему проекту самостоятельно.

Вот сайт central Maven repository. В принципе, вы сами руками можете оттуда скачать нужные вам *.jar (введите в строке поиска “org.apache.poi” и в колонке Downloads нажмите jar для скачивания нужной версии библиотеки).

Все таки хочу разобраться как начать использовать библиотеку POI.
Предыдущая попытка не увенчалась успехом

Может кто прям как для деревянных расписать пошаговую инструкцию?

Использую NetBeans
Скачал архив poi-bin-3.10-FINAL-20140208.zip
В архиве:
Папки:
1).docs;
2).lib;
3).ooxml-lib
JAR’ы:
1).poi-3.10-FINAL-20140208;
2).poi-examples-3.10-FINAL-20140208;
3).poi-excelant-3.10-FINAL-20140208;
4).poi-ooxml-3.10-FINAL-20140208;
5).poi-ooxml-schemas-3.10-FINAL-20140208;
6).poi-scratchpad-3.10-FINAL-20140208;

Пробовал уже и добавлять все jar и отдельно poi-3.10-FINAL-20140208 (Сервис->Библиотеки->Создать библиотеку->Ввожу POI->Выбираю все шесть jar из архива->ok->Добавить библиотеку (в проекте)-> Выбираю POI)
Пробовал и просто в проекте Библиотеки->Добавить файл jar папку

Все одно при вводе:

Workbook и HSSFWorkbook подчеркивает красным и при наведении курсором:

cannot find symbol
symbol: class Workbook
symbol: class HSSFWorkbook

Microsoft Word Processing в Java с Apache POI

1. Обзор

Apache POI – это библиотека Java для работы с различными форматами файлов на основе стандартов Office Open XML (OOXML) и формата Microsoft OLE 2 Compound Document (OLE2).

В этом руководстве рассматривается поддержка Apache POI для Microsoft Word , наиболее часто используемого формата файлов Office. В нем рассматриваются шаги, необходимые для форматирования и создания файла MS Word, и способы синтаксического анализа этого файла.

2. Зависимости Maven

Единственная зависимость, которая требуется для Apache POI для обработки файлов MS Word:

Пожалуйста, нажмите here для последней версия этого артефакта.

3. Подготовка

Давайте теперь рассмотрим некоторые элементы, используемые для облегчения создания файла MS Word.

3.1. Файлы ресурсов

Мы соберем содержимое трех текстовых файлов и запишем их в файл MS Word с именем rest-with-spring.docx .

Кроме того, файл logo-leaf.png используется для вставки изображения в этот новый файл. Все эти файлы существуют в пути к классам и представлены несколькими статическими переменными:

Для тех, кому интересно, содержимое этих файлов ресурсов в репозитории, чья ссылка приведена в последнем разделе этого урока, извлечено из ссылки:/rest-with-spring-course? Utm__source = blog

3.2. Вспомогательный метод

Основной метод, состоящий из логики, используемой для создания файла MS Word, который описан в следующем разделе, использует вспомогательный метод:

Этот метод извлекает содержимое, содержащееся в текстовом файле, расположенном в пути к классам, имя которого является переданным аргументом String . Затем он объединяет строки в этом файле и возвращает присоединяющуюся String .

4. Создание файлов MS Word

В этом разделе приведены инструкции по форматированию и созданию файла Microsoft Word. Прежде чем работать с любой частью файла, нам нужно иметь экземпляр XWPFDocument

4.1. Форматирование заголовка и субтитров

Чтобы создать заголовок, нам нужно сначала создать экземпляр класса XWPFParagraph и установить выравнивание для нового объекта:

Читать еще:  Эволюция ПК: от момента создания до массового производства.

Содержимое абзаца должно быть заключено в объект XWPFRun .

Мы можем настроить этот объект, чтобы установить текстовое значение и связанные с ним стили:

Нужно уметь определять цели set-методов из их имен.

Аналогичным образом мы создаем экземпляр XWPFParagraph , содержащий субтитры:

Давайте также отформатируем субтитры:

Метод setTextPosition устанавливает расстояние между субтитрами и последующим изображением, а setUnderline определяет шаблон подчеркивания.

Обратите внимание, что мы жестко закодировали содержимое заголовка и подзаголовка, так как эти операторы слишком короткие, чтобы оправдать использование вспомогательного метода.

4.2. Вставка изображения

Изображение также необходимо обернуть в экземпляр XWPFParagraph . Мы хотим, чтобы изображение располагалось по центру по горизонтали и помещалось под субтитрами, поэтому ниже приведенный выше код должен содержать следующий фрагмент:

Вот как установить расстояние между этим изображением и текстом под ним:

Изображение берется из файла на пути к классам, а затем вставляется в файл MS Word с указанными размерами:

4.3. Форматирование абзацев

Вот как мы создаем первый абзац с содержимым, взятым из файла poi-word-para1.txt :

Очевидно, что создание абзаца похоже на создание заголовка или подзаголовка. Единственным отличием здесь является использование вспомогательного метода вместо жестко закодированных строк.

Аналогичным образом мы можем создать два других абзаца, используя содержимое файлов poi-word-para2.txt и poi-word-para3.txt :

Создание этих трех абзацев практически одинаково, за исключением некоторых стилей, таких как выравнивание или курсив.

4.4. Создание файла MS Word

Теперь мы готовы записать файл Microsoft Word в память из переменной document :

Все фрагменты кода в этом разделе обернуты в метод с именем handleSimpleDoc .

5. Разбор и тестирование

В этом разделе описывается разбор файлов MS Word и проверка результата.

5.1. Подготовка

Мы объявляем статическое поле в тестовом классе:

Это поле используется для ссылки на экземпляр класса, который включает в себя все фрагменты кода, показанные в разделах 3 и 4.

Перед анализом и тестированием нам нужно инициализировать статическую переменную, объявленную выше, и сгенерировать файл rest-with-spring.docx в текущем рабочем каталоге, вызвав метод handleSimpleDoc :

Давайте перейдем к последнему шагу: анализ файла MS Word и проверка результата.

5.2. Разбор файла MS Word и проверка

Сначала мы извлекаем содержимое из указанного файла MS Word в каталоге проекта и сохраняем содержимое в List из XWPFParagraph :

Далее, давайте удостоверимся, что содержание и стиль заголовка такой же, как мы установили ранее:

Для простоты мы просто проверяем содержимое других частей файла, не используя стили. Проверка их стилей аналогична тому, что мы сделали с заголовком:

Теперь мы можем быть уверены, что создание файла rest-with-spring.docx прошло успешно.

6. Заключение

В этом руководстве была представлена ​​поддержка Apache POI для формата Microsoft Word. Он прошел шаги, необходимые для создания файла MS Word и проверки его содержимого.

Реализация всех этих примеров и фрагментов кода может быть найдена в a проекте GitHub .

голоса
Рейтинг статьи
Ссылка на основную публикацию
Статьи c упоминанием слов: