Программа Djvu OCR 2.4 - текст в djvu файле
Скачать Djvu OCR v.2.4 Rus (6.3 Mb):
Программа Djvu OCR предназначена для внедрения текстового OCR слоя в djvu книги. Текстовый слой позволяет использовать поиск по документу и копировать текст из djvu в doc (word) или txt.
Рис.1. Главное окно программы Djvu OCR 2.4.
Djvu OCR работает совместно с программой FineReader 7/8/9 версий, предназначенной для распознавания текста. Оцифровка происходит в три этапа:
- Djvu OCR конвертирует документ в формат tiff
- FineReader распознает текст в полученных изображениях
- Djvu OCR обрабатывает рабочий проект Finereader, извлекает необходимую информацию и интегрирует текстовый слой в djvu.
Кроме интеграции программа может извлекать уже существующий текстовый слой в djvu файла (режим Извлечь OCR Слой). Можно указать диапазон страниц для извлечения текста или обработать весь документ. Выходной формат: txt, html.
Программа не требует установки. В архиве 4 исполняемых файла:
- DjvuOCR - Win32 GUI версия
- FRFGrab - консольная версия
- Djvused - стандартная утилита пакета djvulibre
- cvthtml2 - конвертация OCR слоя в HTML (UTF8)
Продвинутые пользователи могут использовать консольную версию программы (подробное описание команд есть в файле справки), остальным же достаточно запустить DjvuOCR.exe, который имеет привычный интерфейс.