Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » DjvuOCR

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

Открыть новую тему     Написать ответ в эту тему

vitaly1



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DjvuOCR
by gencho

Программа для добавление OCR информации в djvu-книги с помощью программы распознавания текста ABBYY FineReader версий 7-9. Есть также другие полезные функции для работы с djvu.
 
Текущая версия: 2.4 beta
 
Офсайт  
Софт на ЯДиске

Авторская документация к DjvuOCR (в формате HTM)  
 
 
FR9frfPatch для автоматического исправления перепутанных страниц после распознавания в FineReader 9 на многоядерном процессоре
 
Статья Создание в djvu-файле текстового слоя и интерактивного содержания
 
Статья OCR в djvu файлах - новый подход к старым возможностям (немного устаревшая).
 
Статья OCR && DJVU || DJVU && OCR или есть ли текст в дежавю? (немного устаревшая).

Всего записей: 5415 | Зарегистр. 28-08-2004 | Отправлено: 22:28 28-02-2007 | Исправлено: TelecomUral, 13:44 22-07-2020
asku



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый вечер. Прошу помочь.
 
Есть много дежавю-файлов. В текстовом слое нужно заменить один символ на другой. Ну например, Єє заменить на Її.
 
Как это можно Есть ли программы, которые это делают? Если бы речь шла об одном файле, то я бы перераспознал сканы и перезалил слой. Но файлов много...

Всего записей: 239 | Зарегистр. 04-05-2016 | Отправлено: 17:36 19-11-2020 | Исправлено: asku, 17:40 19-11-2020
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
djvused из djvulibre для извлечения и заливки обратно текстового слоя  + sed или tr для замены символа. Ну и все это в bash или cmd  скрипте с циклом for.

Всего записей: 759 | Зарегистр. 14-12-2005 | Отправлено: 19:28 19-11-2020
AlexeiPetrov

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Тут такая проблема нарисовалась. Если извлеченный текст при помощи DjvuOCR внедрить в DJVU-файл, то почему-то тире часто переносится на другую строчку. Получается что-то типа:
 

Цитата:
 
олжности. — Высказывание Дантона. — Указы, обнародованные при свете  
факелов.  
—  
Господа Майярдо, д'Обиньи и Карль убиты.  
—  
Четыре кельи  
монастыря фельянов.  
—  
Двадцать пять луидоров.  
—  
Законодательное  

 
Хотя все тире должны быть на тех же строчках, что и нижние или верхние фразы. Как-то с этим возможно бороться?

Всего записей: 20 | Зарегистр. 29-08-2021 | Отправлено: 19:23 03-01-2022 | Исправлено: AlexeiPetrov, 19:29 03-01-2022
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlexeiPetrov
Надо смотреть файлы откуда извлекается (из ФР или djvu) и куда извлекается и что точно делается.  
Приведите минимальный воспроизводимый пример, тогда будет о чем предметно разговаривать.

Всего записей: 759 | Зарегистр. 14-12-2005 | Отправлено: 21:27 03-01-2022
AlexeiPetrov

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Надо смотреть файлы откуда извлекается

Извлекаю из готового DJVU, или сделанного из FR11, или сконвертированного из PDF. Разницы нет, потому что ошибка и там и там.
Потом извлеченный текст ставлю в чистый DJVU.

Всего записей: 20 | Зарегистр. 29-08-2021 | Отправлено: 21:50 03-01-2022
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlexeiPetrov
так и выложите исходный djvu из которого извлекаете и результирующий djvu куда вставляете и где тире как-то неправильно себя ведет.

Всего записей: 759 | Зарегистр. 14-12-2005 | Отправлено: 22:06 03-01-2022
AlexeiPetrov

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
так и выложите исходный djvu из которого извлекаете и результирующий djvu

Разобрался. Проблема не в DjvuOCR, а в конвертере.
Прошу прощения за беспокойство.

Всего записей: 20 | Зарегистр. 29-08-2021 | Отправлено: 23:40 03-01-2022
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

Компьютерный форум Ru.Board » Компьютеры » Программы » DjvuOCR


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2020

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru

Рейтинг.ru