Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

Открыть новую тему     Написать ответ в эту тему

NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

DjVu Nano Mega Editor
(DjVuNMEditor)

Программа для редактирования в DjVu-книгах:
1) текстового слоя;
2) аннотаций; в текущей версии не реализовано
3) закладок (bookmarks, outline); в текущей версии не реализовано
4) метаданных; в текущей версии не реализовано
5) еще чего-то?
Описание
Скачать v1.1

TurnTheText

Утилита TurnTheText предназначена для устранения несоответствия графического и текстового слоев в DjVu-книгах, возникающего при использовании FineReader версии 8 (и ниже) для распознавания текста..
Может быть использована, например, перед внедрением оглавления в DjVu-книгу с помощью программы DjVu Hyperlinks Editor..
Описание
Скачать v1.1

DjVu Annotations Editor

Программа для редактирования гиперссылок (annotations/hyperlinks) в файлах формата djvu, преимущественно, после создания оглавлений в книге при помощи DjVu Hyperlinks Editor'а..
Выполняет сдвиг, выравнивание, изменение размеров, цвета, свойств и др..
Описание
Скачать v0.2

HeadWorder

Программа для полуавтоматического извлечения заголовков словарных статей из DjVu-словарей, энциклопедий и т.п. и последующего внедрения их в книгу в виде закладок DjVu или WinDjView (с позиционированием)..
может быть в будущем, когда описание сделаю..  

FR11 DjVu Text Layer Crutch

Программа для исправления текстового слоя в файле DjVu, созданного посредством ABBYY FineReader билд 11.0.102.583 и выше (в т.ч. ФР12)..
Выполняет следующие действия:
- удаляет блоки Char;
- создает зоны Line и Paragraph;
- объединяет две половинки слова, разделенного знаком переноса, в одно;
- позволяет переносить текстовый слой из одного файла в другой..
Описание
Скачать v0.3.1

DjVu Chunk Remover

Программа для удаления блоков (чанков), а также страниц из файлов формата DjVu.. может удалять фон (BG44, BGjp), закладки (NAVM), аннотации (ANTa, ANTz), текст (TXTa, TXTz), информацию о цвете маски(FG44, FGbz) и др.. запрещено удаление блоков INFO, Sjbz, Djbz и INCL, содержащих ссылки на Djbz-словари символов..
Описание
Скачать v0.5

DjVu Text Mover

Программа позволяет поворачивать и двигать текстовый слой в файлах DjVu..
Скачать v0.1

DjVu Title Maker

Программа для создания заголовков страниц (переименования страниц) в файлах DjVu..  
Таким образом, страницы можно называть "Обложка", I, II, III, IV и т.п., автоматически или вручную переименовывать страницы со сдвинутой нумерацией (в т.ч. при удалении пустых страниц) для соответствия нумерации электронной книги её бумажному оригиналу..
Описание
Скачать v0.1

DjVu Clean Page Inserter

Программа для быстрого создания и внедрения в книгу пустых страниц.. Нужна для восстановления соответствия бумажной и электронной нумерации, что облегчает навигацию по книге..
Описание
Скачать v0.1

DjVu Blits Merger

Программа для добавления на страницы djvu-книги графических изображений (mask-слоя) из другого djvu-файла.. Может применяться для добавления в книгу номеров страниц, колонтитулов, другой необходимой информации без перекодирования файла, а также для объединения графики с двух страниц, закодированных с разной степенью сжатия (например, aggressive и lossless)..
Описание
Скачать v0.1

DjVu Blits Hider

Программа для удаления со страниц djvu-книги графических изображений mask-слоя (blits).. может применяться для очистки страницы от "грязных пятен", лишних элементов маски и т.п. без перекодирования файла.. совместно с DjVu Blits Merger'ом позволяет редактировать mask-слой djvu-книги - Hider удаляет, а Merger вставляет на это место нужную графику..
Описание
Скачать v0.1.1

Все программы в одной папке


Программы, которых еще нет, но, возможно, когда-нибудь сделаю..


• аналог DjVu Hyperlinks Editor'у с бОльшим функционалом и предварительным просмотром..
программа для создания и внедрения в книгу пустых страниц.. DjVu Clean Page Inserter
программа для удаления страниц из книги.. DjVu Chunk Remover
программа для удаления пустых чанков, типа CIDa.. DjVu Chunk Remover
программа для добавления текста в нужное место на странице (+ к существующему) DjVuNMEditor
программа для удаления блитов со страницы DjVu Blits Hider
• программа для разделения разворотов на 2 страницы
программа для добавления новых блитов на существующую страницу (объединение графики с двух страниц на одну) DjVu Blits Merger
• программа для перемещения блитов на странице
• программа для кодирования ч/б растра без потерь одним или несколькими большими по размеру шейпами
• еще что-то хотел сделать.. но забыл.. вспомню - запишу))
 
если найдутся желающие сделать эти программы - добро пожаловать)) мыслями и наработками с удовольствием поделюсь)) это относится и к следующему блоку тоже..

Программы, которых нет, и я, к сожалению, наврядли осилю((..

визивиг-редактор текстового слоя.. DjVuNMEditor
• Hyperlinks-редактор, типа Document Express Editor, но с возможностью групповой правки гиперссылок..  
• полноценный визивиг редактор графики DjVu с возможностью удаления, сдвига, правки шейпов в маске.. а может быть и корректировки фона тоже..
WinDjView с поиском текста в закладках.. ну и некоторыми другими дополнительными возможностями.. таки осилил))
 

продолжение следует..

Всего записей: 1280 | Зарегистр. 26-07-2007 | Отправлено: 22:57 06-02-2012 | Исправлено: NME, 14:42 10-06-2021
hogu77

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME

Цитата:
касательно видео - это либо баг, либо ручное вмешательство в текстовый слой.. буду посмотреть..

На данный момент у меня остался ещё один такой интересный файлов, с мягкими переносами. OCR'ил с помощью ФР11, но ещё до появления вашей программы, в этих двух - текст в дореформенной орфографии, так что спрашиваю о кодировках не оттого "лишь бы побольше умных вопросов задать".

Цитата:
в общем, на 99,9% что текстовый слой был модифицирован.. программа такие случаи не обрабатывает и не будет обрабатывать

Почему же v.0.2 корректно склеила слова, как и показано в видео?
Вот ещё один, модифицированный файл. Результат такой же, как и на первом примере.
http://rghost.ru/56274917

Всего записей: 118 | Зарегистр. 14-02-2012 | Отправлено: 21:32 09-06-2014 | Исправлено: hogu77, 21:39 09-06-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hogu77
в djvu текст хранится в utf8, соответственно с данным форматом и идет работа..
 
v.0.2 работает с текстовым файлом, импортированным из djvu с помощью djvused, а с 0.3 текст берется непосредственно из djvu.. если данный слой перекидывать из одного файла в другой с помощью djvused, то эта утилита добавляет пробелы после слов и логика работы программы нарушается.. но, раз 0.2 справляется, то это выход - результат (за исключением параграфов) будет такой же..

Всего записей: 1280 | Зарегистр. 26-07-2007 | Отправлено: 21:58 09-06-2014
hogu77

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Такая же фигня и с "перевёрнутым" текстом (табличные данные, схемы, пр.) в книгах/журналах, особенно технической тематики. Так что если в книге много всяких графиков, сопоставлений, выборок, и всего того что влазить только в лэндскэйп, то лучше v.0.2 использовать.  
Которой к сожалению нет, выше.

Всего записей: 118 | Зарегистр. 14-02-2012 | Отправлено: 17:24 11-06-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hogu77
примеры?

Всего записей: 1280 | Зарегистр. 26-07-2007 | Отправлено: 18:05 11-06-2014
hogu77

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
Пример есть, смысл? Использовал Djvu.OCR v2.4 beta и PatchOcrDirection 0.3 а это, как сами понимаете - "текстовый слой был модифицирован", ну-и дальше по тексту.
Вот архив, если интересно:
http://rghost.ru/56315619
P.S. А, забыл добавить, горизонтальные страницы переворачивал с помощью Document Express Editor 6.5, когда они из FR12 "перекрученными" вышли, потом Djvu.OCR, PatchOcrDirection и дальше по старой схеме.

Всего записей: 118 | Зарегистр. 14-02-2012 | Отправлено: 18:38 11-06-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hogu77
случай неоднозначный, но использование 0.3 здесь вполне применимо также, как и 0.2 (и деление на параграфы можно сохранить), надо только порядок действий изменить..
для этого:
1. переносим НЕмодифицированный слой из Abbyy.djvu в Original.djvu (Crutch)
2. поворачиваем текст, страницы (Document Express Editor 6.5, djvused (DjvuOCR), PatchOcrDirection)
3. возвращаем модифицированные djvused'ом (DjvuOCR'ом) разделители зон - в столбце "не ФР11+" напротив параграфа ставим "0A", напротив строки - "Ничего"..
 
какие есть недочеты помимо использования большой кучи софта - PatchOcrDirection неверно поворачивает текст - он не совпадает с реальной графикой.. это видимо связано с тем, что размеры текстовой зоны Page не совпадают с размерами страницы..  
 
какой выход на сегодняшний день - не разрешать файну поворачивать страницы или самому предварительно перед распознанием их поворачивать в том же Document Express Editor'е..
 
теоретически, я бы мог в своей программе ввести проверку на поворот страниц, НО! в какую сторону он был произведен, по или против часовой? автоматически этого сейчас я определить не смогу.. если только вручную.. не знаю, стоит ли заморачиваться.. проще, наверное, для этого дела отдельную утилитку сделать - типа PatchOcrDirection, но с возможностью ручного поворота и сдвига текста..

Всего записей: 1280 | Зарегистр. 26-07-2007 | Отправлено: 21:23 11-06-2014
hogu77

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
Спасибо за ещё один вариант решения, но мне удобнее сначала поворачивать страницы)  
По существу:

Цитата:
какие есть недочеты помимо использования большой кучи софта - PatchOcrDirection неверно поворачивает текст - он не совпадает с реальной графикой.. это видимо связано с тем, что размеры текстовой зоны Page не совпадают с размерами страницы..  

Уверяю вас, это самый мелкий недочёт. Лучше что бы в djvu был текстовый слой в таблицах чем его отсутствие. А насчёт "красивостей" размещения текста то, надеюсь вы со мной согласитесь, глазами лучше воспринимается так -
чем так -
Поэтому, функция поворота в кратче была бы как нельзя кстати.

Цитата:
в какую сторону он был произведен, по или против часовой? автоматически этого сейчас я определить не смогу.. если только вручную..  

Автоматически и не надо, зачем такие сложности?
В подавляющем большинстве случаев, по крайней мере в совдеповской научно(-популярно)й литературе таблицы в книге размещаются, "от корешка". Т.е. поворот как это реализовано в PatchOcrDirection'е. В любом случае, повторюсь, гораздо лучше иметь данные и с таких вот "перевёртышей", которых иногда довольно много содержится в работе.

Всего записей: 118 | Зарегистр. 14-02-2012 | Отправлено: 22:57 11-06-2014
Bu

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Не подскажете какая из этих утилит может поменять dpi готового djvu файла. Есть DjVuToy он может менять dpi, но только у одного файла, и похоже консольных команд у него нет, а мне надо поменять dpi у нескольких сотен файлов.

Всего записей: 79 | Зарегистр. 08-10-2001 | Отправлено: 23:55 11-06-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hogu77

Цитата:
но мне удобнее сначала поворачивать страницы)

каждый ... как он хочет)) я на 100% с этим согласен! а в данном случае если "сначала" будет до распознания, то результат сразу будет нужный, без последующего геморроя..

Цитата:
надеюсь вы со мной согласитесь, глазами лучше воспринимается так

типа "это Г лучше того Г" - для меня все Г неприемлемо.. делать надо или хорошо, или никак..

Цитата:
В подавляющем большинстве случаев...

в примере повернуты 2 станицы, и обе - в разные стороны..  
ладно, заканчиваю флудить.. то, что я хотел сказать по этому поводу, в принципе, я уже сказал в предыдущем посте..
 
Bu
никогда этим не занимался.. м.б. djvumake?
 
Добавлено:
хотя, djvumake вроде для одностраничных документов..

Всего записей: 1280 | Зарегистр. 26-07-2007 | Отправлено: 00:22 12-06-2014
amaid



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
вот еще такая чушь встречается
http://rghost.ru/56346663
для крутча сгодится?

Всего записей: 556 | Зарегистр. 25-01-2006 | Отправлено: 08:17 13-06-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amaid
нет, это творение ФР11 версии ниже 11.0.102.583.. в файле нет информации о координатах слов, поэтому - только перераспознавать..

Всего записей: 1280 | Зарегистр. 26-07-2007 | Отправлено: 11:25 13-06-2014
amaid



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
глядя на эволюцию OCR в разных версиях файна, не покидает чувство, что на каком-то этапе в ABBYY проникли диверсанты или как минимум вредители

Всего записей: 556 | Зарегистр. 25-01-2006 | Отправлено: 13:49 13-06-2014
hogu77

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME

Цитата:
в примере повернуты 2 станицы, и обе - в разные стороны..  

Точнее не страницы, а текстовый слой. Это я куролесил в Document Express Editor 6.5, можно было и без этих извращений, так как после перевёртыша из под FR12 возвращать настоящее местоположение надо OCR а не странице как таковой. Всё равно же нам из abbyy нужен только текст. А это и с v.0.3 делаться, так что, извиняюсь за поспешность в выводе.
 
amaid

Цитата:
глядя на эволюцию OCR в разных версиях файна, не покидает чувство, что на каком-то этапе в ABBYY проникли диверсанты или как минимум вредители

Можно даже точно определить время проникновения - с 9-ой версии.

Всего записей: 118 | Зарегистр. 14-02-2012 | Отправлено: 00:31 14-06-2014 | Исправлено: hogu77, 00:32 14-06-2014
Dracula



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите, как выровнять оглавление, когда оно поделено на 2 части на 1 странице - по типу на 2 столбца поделено.  
NME
Вы в видео хорошо показали когда оглавление скажем так с одним столбцом на всю страницу, а как быть с двумя? Я открываю в djview.exe и не знаю что именно там взять ведь там 2 значения уже будут вместо одного - типа левая и правая колонка внизу посмотреть значение и вписать его в DjVu Annotation Editor 0.2 в поле "Выровнять".
Привожу пример такого оглавления. Подскажите:
http://rghost.ru/56468788

----------
+=._.=++=._.=++=._.=++=._.=++=._.=++=._.=++=._.=+

Всего записей: 3305 | Зарегистр. 22-12-2003 | Отправлено: 19:02 19-06-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dracula
для выравнивания таких оглавлений есть крыжик "Область".. выравнивание производится для каждого столбца отдельно..
если оглавление двухстолбцовое и каждый столбец находится на своей половине (как в примере), то выбираем сначала область "Лев.", выбираем страницу "На стр.", и дальше действуем как в видеомануале..  
если деление столбцов не посередине - указываем редактируемую область вручную "Ручн."..
если оглавление на нескольких страницах - рекомендуется сначала обработать все левые столбцы, а затем все правые - так править меньше придется..
кстати, только сейчас заметил - если при изменении оглавления книга открыта в DjView, то через какое-то небольшое время страница самообновляется - некое подобие WYSIWYG'а))

Всего записей: 1280 | Зарегистр. 26-07-2007 | Отправлено: 20:25 19-06-2014
Bu

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Написал батник для пакетной обработки:

Код:
Djvu файлы из FR должны быть помещены в папку OCR.
Оригинальные djvu файлы (с теми же именами) должны
быть помещены в папку OUT.
В итоге должна получиться структура:
    /OCR/Book.djvu
    /OUT/Book.djvu
    /fr11DTLcrutch03.exe
    /ocr.bat

Скачать: https://github.com/1v/ocr.bat/archive/master.zip
Git: https://github.com/1v/ocr.bat

Всего записей: 79 | Зарегистр. 08-10-2001 | Отправлено: 05:59 20-06-2014 | Исправлено: Bu, 06:01 20-06-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
проще, наверное, для этого дела отдельную утилитку сделать ... с возможностью ручного поворота и сдвига текста..

в шапке..

Всего записей: 1280 | Зарегистр. 26-07-2007 | Отправлено: 00:13 22-06-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
при использовании DjVu Text Mover'а надо понимать, куда выполнять поворот и где должна оказаться  точка с нулевыми координатами (левая нижняя точка)..
в приведенном выше примере можно повернуть текст на нужных страницах относительно центра, а потом долго и упорно подгонять его местоположение сдвигом..  
или понять, что после переноса текста на стр. 14 нулевая точка должна оказаться в правом нижнем углу, а на стр. 16 - в левом верхнем.. тогда, выполнив нужные действия (стр.14 - поворот на 90 против часовой + сдвиг по горизонтали на величину ширины страницы 3357, а на стр.16 - на 90 по часовой + сдвиг по вертикали на высоту страницы 4700) мы получим нужный результат..

Всего записей: 1280 | Зарегистр. 26-07-2007 | Отправлено: 13:44 22-06-2014
Dracula



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
Спасибо огромное - очень помогло - так ровненько всё вышло, что приятно глянуть, если бы не Ваши проги не знаю чтобы и делал я - было бы всё вкривь и вкось.

----------
+=._.=++=._.=++=._.=++=._.=++=._.=++=._.=++=._.=+

Всего записей: 3305 | Зарегистр. 22-12-2003 | Отправлено: 17:26 22-06-2014
Songs0fFailure



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
• визивиг-редактор текстового слоя..

Нашел тут интересное, WebDjVuTextEd - http://sourceforge.net/projects/webdjvutexted/
Посмотреть тут можно - http://www.djvu.hu/editor/
 
А ещё тут проблема возникла с аннотациями с ссылками для предметного указателя, пробовал contentm от monday2000, DjVu Hyperlinks Editor, DjVu Annotations Editor, но что-то ничем не помогли они. =\
А хотелось бы просто взять координаты всех line на нужной странице и сделать аннотации.

Всего записей: 14 | Зарегистр. 20-01-2012 | Отправлено: 20:37 12-08-2014
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2020

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru