Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » DjvuOCR

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

Открыть новую тему     Написать ответ в эту тему

vitaly1



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DjvuOCR
by gencho

Программа для добавление OCR информации в djvu-книги с помощью программы распознавания текста ABBYY FineReader версий 7-9. Есть также другие полезные функции для работы с djvu.
 
Текущая версия: 2.4 beta
 
Офсайт  
Софт на ЯДиске

Авторская документация к DjvuOCR (в формате HTM)  
 
 
FR9frfPatch для автоматического исправления перепутанных страниц после распознавания в FineReader 9 на многоядерном процессоре
 
Статья Создание в djvu-файле текстового слоя и интерактивного содержания
 
Статья OCR в djvu файлах - новый подход к старым возможностям (немного устаревшая).
 
Статья OCR && DJVU || DJVU && OCR или есть ли текст в дежавю? (немного устаревшая).

Всего записей: 5415 | Зарегистр. 28-08-2004 | Отправлено: 22:28 28-02-2007 | Исправлено: TelecomUral, 13:44 22-07-2020
ycheff



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Какая у Вас версия DjVu OCR?   Вроде бы для FR 9.0 и 10.0 нет версий DjVu OCR.
DivuOCR 2.4 beta работает с FR 8.0, но там нет белорусского языка.

Всего записей: 249 | Зарегистр. 27-09-2008 | Отправлено: 20:40 04-02-2011
gjc

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ну я уже и 2.2 и 2.4 использовал..
 
Весело, если нет беларуского для восьмого FR - я скачал вчера, но подумал, что это усечённая версия и что язык для него можно будет найти в нете.
 
Так если всё так "радужно" получается - неужто нет другого способа тогда добавить распознанный текст?!?

Всего записей: 4 | Зарегистр. 04-02-2011 | Отправлено: 23:04 04-02-2011
ycheff



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вот тут среди дополнительных языков (даже чукотский есть) для ФР 8.0 есть и белорусский:
OtherLang (FR 8.0).rar.html
После установки - выбрать белорусский из "полного списка".   Должно все получится.

Всего записей: 249 | Зарегистр. 27-09-2008 | Отправлено: 08:58 05-02-2011 | Исправлено: ycheff, 09:04 05-02-2011
gjc

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
То ycheff:
 
Вялікі і шчыры дзякуй табе!!!

 
То бишь огромное тебе спасибо!
 
Всё заработало.
Буду тогда в восьмёрке всё добавлять пока ничего нового не появится.
Главное что работает.

Всего записей: 4 | Зарегистр. 04-02-2011 | Отправлено: 18:15 05-02-2011
skysand

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Простейший способ создания документа с оглавлением из DjVu:
1 - Программой DjVu.OCR v2.4 преобразуем файлы DjVu в TIFF.
2 - Открываем и распознаем в FineReader v10, сохраняем в PDF.
3 - Открываем в FoxitPhantom и создаем (вставляем) закладки!!!
В результате у нас будет полноценный документ, но в PDF. А собственно, какая мне разница, что результат не в DjVu, главное удобство!

Всего записей: 377 | Зарегистр. 02-07-2007 | Отправлено: 09:24 26-05-2011
ycheff



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
распознаем в FineReader v10, сохраняем в PDF.  

И получаем  книгу с морем крокозябликов вместо формул.
Получение pdf в FineReader надо делать постранично и поблочно внутри страницы, а это очень трудоёмкое занятие.
Иногда, тем не менее, делаю такую процедуру с отдельными страницами pdf-книги (растровыми, с картинками или с одним лишь простым текстом).   Это позволяет часто снизить раздутый размер pdf.

Всего записей: 249 | Зарегистр. 27-09-2008 | Отправлено: 18:39 26-05-2011 | Исправлено: ycheff, 19:24 27-05-2011
Yevgenijz

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
12:24 26-05-2011

Цитата:
Простейший способ создания документа с оглавлением из DjVu:  
1 - Программой DjVu.OCR v2.4 преобразуем файлы DjVu в TIFF.  
2 - Открываем и распознаем в FineReader v10, сохраняем в PDF.  
3 - Открываем в FoxitPhantom и создаем (вставляем) закладки!!!  
В результате у нас будет полноценный документ, но в PDF. А собственно, какая мне разница, что результат не в DjVu, главное удобство!


Ну и способ! Посмеялся от души!
1. Зачем преобразовывать в TIFF? FR10 и так умеет открывать DJVU, без всякого TIFF. Итого 1 шаг лишний.
2. Открываем и распознаем в FineReader v10, сохраняем в PDF.
Тут конечно, может получиться всякая каша, которую надо долго и упорно доводить до ума. Лучше всего этот шаг тоже пропустить и перейти сразу к шагу 3
Ну и что, что получился нераспознанный PDF, зато с закладками!
А если серьёзно, для вставки закладок в DjVu DjVu.OCR не нужен. Закладки можно вставить программой DjVuDocumentExpressEditor или DjVuBookmarker, и это будут закладки именно в дежавюшке, которые не исчезнут при пересылке файла на другой компьютер. А также закладки в дежавю может делать и WinDjVu, но она пишет закладки в реестр, поэтому её закладки исчезают на другом компе или при переустановке системы.

Всего записей: 957 | Зарегистр. 08-06-2009 | Отправлено: 15:55 25-06-2011 | Исправлено: Yevgenijz, 17:42 02-08-2011
VidelSamogO



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Yevgenijz
Ненавижу FR-10. Жрёт место.

Всего записей: 764 | Зарегистр. 16-08-2008 | Отправлено: 19:20 26-06-2011
Yevgenijz

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VidelSamogO

Цитата:
Ненавижу FR-10. Жрёт место.

ничего не могу сказать по этому поводу.
я юзаю FR9. Насчет FR-10 написал, потому что процитировал skysand и посмеялся над его бредом.

Всего записей: 957 | Зарегистр. 08-06-2009 | Отправлено: 17:41 02-08-2011
denver 22

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Последняя версия 2.4 beta нормально принимает распознавание от FR9?
Всё ещё пользуюсь связкой 2.3 + FR8.

Всего записей: 597 | Зарегистр. 28-07-2005 | Отправлено: 20:09 02-08-2011
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
denver 22
Разбирались полтора года назад в этой теме с FR9 - там несколько проблем нашлось. Одну - перетасовку страниц из-за многопоточности удалось даже решить (утилита FR9frfPatch в шапке). Но все равно какие-то еще косяки остались. Короче, я тоже на FR8 остановился в итоге.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 21:21 02-08-2011
antabu

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
У меня версия 8 портабельная, поэтому без хелпа. В пакете создаёт двухстраничные .tif, на второй странице - миниатюра. Для сборки .djvu приходится прогонять через IrfanView, хоть и быстрая операция, но явно лишняя. Как настроить на одностраничные тифы?

Всего записей: 401 | Зарегистр. 07-12-2008 | Отправлено: 08:36 07-11-2011
vladlen666



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
А что мешает  
1. распознать Djvu-книгу в FR10 или FR11 и  
2. сохранить в PDF (обязательно сохранив РАЗМЕР ОРИГИНАЛА, а тип выбрать ТОЛЬКО ТЕКСТ И КАРТИНКИ),  
3. затем перегнать PDF в Djvu (не знаю как сразу извлечь OCR без пересохранения его в Djvu, программа для экспорта Pdftodjvu Light Edition),  
4. Извлечь из полученного файла OCR с помощью DjvuOCR
5. и внедрить в первоначальную Djvu-книгу.
 
FR 11, вроде как умеет сохранять в DJVU, но я еще не пробовал эту версию. По отзывам делает он это через задницу.

Всего записей: 271 | Зарегистр. 20-11-2008 | Отправлено: 05:08 14-11-2011 | Исправлено: vladlen666, 05:31 14-11-2011
ycheff



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
1. распознать Djvu-книгу в FR10 или FR11 и  
2. сохранить в PDF  

Получится полная ерунда.   Так можно действовать только с текстами без формул.
Из-за подобных действий в сети часто появляются книги в крокозябликами в формулах и на рисунках.

Всего записей: 249 | Зарегистр. 27-09-2008 | Отправлено: 18:23 14-11-2011
vladlen666



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ycheff
А я с вами не спорю. Я же говорю просто о внедрение OCR в DJVU-книгу. Есть к примеру DjVU книга, а вам хочется внедрить в нее OCR. Программа DjvuOCR стабильно работает только с FR8, в то время как качество распознавания у FR9,10 заметно лучше. Вот тут мне и приходит на помощь формат PDF, только затем чтобы выдернуть из него распознанный файнридером текст и вернуть его моей DJVU-книге.
 
Короче говоря я хотел обратить внимание как можно с помощью FR9 и 10 и DjvuOCR внедрить OCR в Djvu книгу. При этом если FR11 сохраняет DJVU c OCR, можно видимо вообще обойтись без PDF. Собственно Djvu книгу созданная FR11, как я слышал вызывает много нареканий. Но видимо ничто не помещает вытаскивать из этих файлов OCR и внедрять в Djvu-книги созданные в других программах.

Всего записей: 271 | Зарегистр. 20-11-2008 | Отправлено: 12:57 15-11-2011 | Исправлено: vladlen666, 13:08 15-11-2011
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vladlen666
Вопрос переноса текстового слоя из pdf в djvu уже обсуждался на 10 странице топика..  
И на форуме ФР http://finereader.abbyy.ru/forum/actualthread.aspx?bid=7&tid=344&pg=33

Всего записей: 715 | Зарегистр. 14-12-2005 | Отправлено: 17:41 15-11-2011 | Исправлено: U235, 17:47 15-11-2011
antabu

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Как должна решаться проблема пустых страниц?

Всего записей: 401 | Зарегистр. 07-12-2008 | Отправлено: 19:24 20-12-2011
vladlen666



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите как решить проблему.
У меня стоит FR11, с этой версией DjvuOCR не работает.
Поэтому до недавнего времени я поступал так. Распознавал созданный DjVU и сохранял новый файл. Так как создаваемый FR файл меня не устраивает я извлекаю из него OCR слой с помощью DjvuOCR  и внедряю в предыдущий исходный файл.  
 
Все казалось бы ОК. Но тут оказалось что OCR в создаваемом FR DjVU-файле имеет тип (так кажется это называется) СТРОКА. А мне кается оптимальным тип OCR - СЛОВО. При внедрении OCR из проекта FR в DjVU-файл в программе есть возможность выбора типа OCR (СТРОКА, СЛОВО, СИМВОЛ), а вот при внедрении OCR в виде txt файла этого пункта нет.
 
Можно ли что-то сделать. В настройках FR я ничего не нашел.

Всего записей: 271 | Зарегистр. 20-11-2008 | Отправлено: 06:17 17-03-2012
vladlen666



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Говорят пословный OCR в последней версии fr11 то есть надо установить посл. версию.

Всего записей: 271 | Зарегистр. 20-11-2008 | Отправлено: 01:34 09-04-2012
Dimi7777



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Как должна решаться проблема пустых страниц?

у меня тот же вопрос
 
Если в djvu файле попадаются пустые страницы, возникают проблемы, как с этим бороться?

Всего записей: 233 | Зарегистр. 11-02-2011 | Отправлено: 22:55 12-02-2013
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

Компьютерный форум Ru.Board » Компьютеры » Программы » DjvuOCR


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2020

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru