четверг, 7 февраля 2013 г.

экспорт из djvu

Изменения коснулись и обработки сфотографированных документов: лучше работает автоматическое исправление искажений. Кроме того, появился обновленный редактор изображений в нём можно вручную скорректировать яркость, контрастность, уровни интенсивности света и тени или устранить трапециевидные искажения.

Что ещё? Более стабильной стала работа с большими (более 100 файлов) пакетами документов. Теперь они обрабатываются с такой же скоростью, что и отдельные документы.

Кстати, на приведённых изображениях видно ещё одно продвижение FineReader а на пути к совершенству таблицы стали лучше разбиваться на ячейки. В среднем по сравнению с десятой версией количество ошибок разбиения таблиц на ячейки уменьшилось на 25%. Кроме того, ошибок при определении колонтитулов стало меньше на 40%, а картинки и диаграммы «находятся» лучше на 15%. Впрочем, вопрос, как измерять количество ошибок анализа, довольно тонкий и, возможно, заслужит отдельного внимания. А с таблицами-то всё ясно мы одной ошибкой считаем или разбиение ячейки на две, или наоборот, объединение двух ячеек в одну.

Теперь мы знаем о существовании таких книг и сообщили об этом нашему детищу. В результате блоки выделяются правильно.

В результате такого выделения программа считала, что строки из второй колонки это продолжение строк из первой, и текст выстраивался неправильно.

Как мы уже сказали, в новом FineReader блоки разных типов определяются более точно это помогает правильнее «собирать» строки текста. Например, прошлая версия иногда впадала в ступор, видя ультра-модную вёрстку книжек с «авторскими заметками на полях»:

Сегодня ABBYY FineReader 11, и сейчас мы расскажем вам, чем он отличается от десятой версии. Прежде всего, достаточно заметно донастроились алгоритмы поиска на странице текста, картинок и таблиц то, что у нас называют «Анализ документа», а в мире понятным словом zoning. Главное, к чему мы стремились, работая над новой версией, улучшить «понимание» документов, с которыми пользователи сталкиваются каждый день: книг, договоров, журналов. Одним из легко заметных изменений стало то, что FineReader 11 научился находить вертикальные колонтитулы.

Что нового в ABBYY FineReader 11? / Блог компании ABBYY / Хабрахабр

Комментариев нет:

Отправить комментарий