Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36

Открыть новую тему     Написать ответ в эту тему

NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

DjVu Nano Mega Editor
(DjVuNMEditor)

Программа для редактирования в DjVu-книгах:
1) текстового слоя;
2) аннотаций;
3) заголовков страниц (title);
4) закладок (bookmarks, outline); в текущей версии не реализовано
5) метаданных; в текущей версии не реализовано
6) еще чего-то?
Описание
Скачать v3.5
Английская локализация

TurnTheText

Утилита TurnTheText предназначена для устранения несоответствия графического и текстового слоев в DjVu-книгах, возникающего при использовании FineReader версии 8 (и ниже) для распознавания текста..
Может быть использована, например, перед внедрением оглавления в DjVu-книгу с помощью программы DjVu Hyperlinks Editor..
Описание
Скачать v1.1

DjVu Annotations Editor

Программа для редактирования гиперссылок (annotations/hyperlinks) в файлах формата djvu, преимущественно, после создания оглавлений в книге при помощи DjVu Hyperlinks Editor'а..
Выполняет сдвиг, выравнивание, изменение размеров, цвета, свойств и др..
Описание
Скачать v0.2
Практически весь функционал программы реализован в DjVuNMEditor'е

HeadWorder

Программа для полуавтоматического извлечения заголовков словарных статей из DjVu-словарей, энциклопедий и т.п. и последующего внедрения их в книгу в виде закладок DjVu или WinDjView (с позиционированием)..
Программа устарела так и не выйдя в свет((

FR11 DjVu Text Layer Crutch

Программа для исправления текстового слоя в файле DjVu, созданного посредством ABBYY FineReader билд 11.0.102.583 и выше (в т.ч. ФР12)..
Выполняет следующие действия:
- удаляет блоки Char;
- создает зоны Line и Paragraph;
- объединяет две половинки слова, разделенного знаком переноса, в одно;
- позволяет переносить текстовый слой из одного файла в другой..
Описание
Скачать v0.3.3
Основной функционал программы реализован также в DjVuNMEditor'е

DjVu Chunk Remover

Программа для удаления блоков (чанков), а также страниц из файлов формата DjVu.. может удалять фон (BG44, BGjp), закладки (NAVM), аннотации (ANTa, ANTz), текст (TXTa, TXTz), информацию о цвете маски(FG44, FGbz) и др.. запрещено удаление блоков INFO, Sjbz, Djbz и INCL, содержащих ссылки на Djbz-словари символов..
Описание
Скачать v0.5

DjVu Text Mover

Программа позволяет поворачивать и двигать текстовый слой в файлах DjVu..
Скачать v0.1

DjVu Title Maker

Программа для создания заголовков страниц (переименования страниц) в файлах DjVu..  
Таким образом, страницы можно называть "Обложка", I, II, III, IV и т.п., автоматически или вручную переименовывать страницы со сдвинутой нумерацией (в т.ч. при удалении пустых страниц) для соответствия нумерации электронной книги её бумажному оригиналу..
Описание
Скачать v0.1
Основной функционал программы реализован также в DjVuNMEditor'е

DjVu Clean Page Inserter

Программа для быстрого создания и внедрения в книгу пустых страниц.. Нужна для восстановления соответствия бумажной и электронной нумерации, что облегчает навигацию по книге..
Описание
Скачать v0.1

DjVu Blits Merger

Программа для добавления на страницы djvu-книги графических изображений (mask-слоя) из другого djvu-файла.. Может применяться для добавления в книгу номеров страниц, колонтитулов, другой необходимой информации без перекодирования файла, а также для объединения графики с двух страниц, закодированных с разной степенью сжатия (например, aggressive и lossless)..
Описание
Скачать v0.1

DjVu Blits Hider

Программа для удаления со страниц djvu-книги графических изображений mask-слоя (blits).. может применяться для очистки страницы от "грязных пятен", лишних элементов маски и т.п. без перекодирования файла.. совместно с DjVu Blits Merger'ом позволяет редактировать mask-слой djvu-книги - Hider удаляет, а Merger вставляет на это место нужную графику..
Описание
Скачать v0.1.1

FR12 Parser

Программа для извлечения координат символов из проекта ФР12-15..
Описание
Скачать v2.3.1

Все программы в одной папке


Программы, которых еще нет, но, возможно, когда-нибудь сделаю..


аналог DjVu Hyperlinks Editor'у с бОльшим функционалом и предварительным просмотром.. DjVuNMEditor
программа для создания и внедрения в книгу пустых страниц.. DjVu Clean Page Inserter
программа для удаления страниц из книги.. DjVu Chunk Remover
программа для удаления пустых чанков, типа CIDa.. DjVu Chunk Remover
программа для добавления текста в нужное место на странице (+ к существующему) DjVuNMEditor
программа для удаления блитов со страницы DjVu Blits Hider
• программа для разделения разворотов на 2 страницы
программа для добавления новых блитов на существующую страницу (объединение графики с двух страниц на одну) DjVu Blits Merger
• программа для перемещения блитов на странице
• программа для кодирования ч/б растра без потерь одним или несколькими большими по размеру шейпами
• еще что-то хотел сделать.. но забыл.. вспомню - запишу))
 
если найдутся желающие сделать эти программы - добро пожаловать)) мыслями и наработками с удовольствием поделюсь)) это относится и к следующему блоку тоже..

Программы, которых нет, и я, к сожалению, наврядли осилю((..

визивиг-редактор текстового слоя.. DjVuNMEditor
Hyperlinks-редактор, типа Document Express Editor, но с возможностью групповой правки аннотаций.. DjVuNMEditor
• полноценный визивиг редактор графики DjVu с возможностью удаления, сдвига, правки шейпов в маске.. а может быть и корректировки фона тоже..
WinDjView с поиском текста в закладках.. ну и некоторыми другими дополнительными возможностями.. таки осилил))
 

продолжение следует..

Всего записей: 1427 | Зарегистр. 26-07-2007 | Отправлено: 22:57 06-02-2012 | Исправлено: NME, 18:28 25-09-2022
hogu77

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME

Цитата:
касательно видео - это либо баг, либо ручное вмешательство в текстовый слой.. буду посмотреть..

На данный момент у меня остался ещё один такой интересный файлов, с мягкими переносами. OCR'ил с помощью ФР11, но ещё до появления вашей программы, в этих двух - текст в дореформенной орфографии, так что спрашиваю о кодировках не оттого "лишь бы побольше умных вопросов задать".

Цитата:
в общем, на 99,9% что текстовый слой был модифицирован.. программа такие случаи не обрабатывает и не будет обрабатывать

Почему же v.0.2 корректно склеила слова, как и показано в видео?
Вот ещё один, модифицированный файл. Результат такой же, как и на первом примере.
http://rghost.ru/56274917

Всего записей: 118 | Зарегистр. 14-02-2012 | Отправлено: 21:32 09-06-2014 | Исправлено: hogu77, 21:39 09-06-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hogu77
в djvu текст хранится в utf8, соответственно с данным форматом и идет работа..
 
v.0.2 работает с текстовым файлом, импортированным из djvu с помощью djvused, а с 0.3 текст берется непосредственно из djvu.. если данный слой перекидывать из одного файла в другой с помощью djvused, то эта утилита добавляет пробелы после слов и логика работы программы нарушается.. но, раз 0.2 справляется, то это выход - результат (за исключением параграфов) будет такой же..

Всего записей: 1427 | Зарегистр. 26-07-2007 | Отправлено: 21:58 09-06-2014
hogu77

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Такая же фигня и с "перевёрнутым" текстом (табличные данные, схемы, пр.) в книгах/журналах, особенно технической тематики. Так что если в книге много всяких графиков, сопоставлений, выборок, и всего того что влазить только в лэндскэйп, то лучше v.0.2 использовать.  
Которой к сожалению нет, выше.

Всего записей: 118 | Зарегистр. 14-02-2012 | Отправлено: 17:24 11-06-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hogu77
примеры?

Всего записей: 1427 | Зарегистр. 26-07-2007 | Отправлено: 18:05 11-06-2014
hogu77

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
Пример есть, смысл? Использовал Djvu.OCR v2.4 beta и PatchOcrDirection 0.3 а это, как сами понимаете - "текстовый слой был модифицирован", ну-и дальше по тексту.
Вот архив, если интересно:
http://rghost.ru/56315619
P.S. А, забыл добавить, горизонтальные страницы переворачивал с помощью Document Express Editor 6.5, когда они из FR12 "перекрученными" вышли, потом Djvu.OCR, PatchOcrDirection и дальше по старой схеме.

Всего записей: 118 | Зарегистр. 14-02-2012 | Отправлено: 18:38 11-06-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hogu77
случай неоднозначный, но использование 0.3 здесь вполне применимо также, как и 0.2 (и деление на параграфы можно сохранить), надо только порядок действий изменить..
для этого:
1. переносим НЕмодифицированный слой из Abbyy.djvu в Original.djvu (Crutch)
2. поворачиваем текст, страницы (Document Express Editor 6.5, djvused (DjvuOCR), PatchOcrDirection)
3. возвращаем модифицированные djvused'ом (DjvuOCR'ом) разделители зон - в столбце "не ФР11+" напротив параграфа ставим "0A", напротив строки - "Ничего"..
 
какие есть недочеты помимо использования большой кучи софта - PatchOcrDirection неверно поворачивает текст - он не совпадает с реальной графикой.. это видимо связано с тем, что размеры текстовой зоны Page не совпадают с размерами страницы..  
 
какой выход на сегодняшний день - не разрешать файну поворачивать страницы или самому предварительно перед распознанием их поворачивать в том же Document Express Editor'е..
 
теоретически, я бы мог в своей программе ввести проверку на поворот страниц, НО! в какую сторону он был произведен, по или против часовой? автоматически этого сейчас я определить не смогу.. если только вручную.. не знаю, стоит ли заморачиваться.. проще, наверное, для этого дела отдельную утилитку сделать - типа PatchOcrDirection, но с возможностью ручного поворота и сдвига текста..

Всего записей: 1427 | Зарегистр. 26-07-2007 | Отправлено: 21:23 11-06-2014
hogu77

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
Спасибо за ещё один вариант решения, но мне удобнее сначала поворачивать страницы)  
По существу:

Цитата:
какие есть недочеты помимо использования большой кучи софта - PatchOcrDirection неверно поворачивает текст - он не совпадает с реальной графикой.. это видимо связано с тем, что размеры текстовой зоны Page не совпадают с размерами страницы..  

Уверяю вас, это самый мелкий недочёт. Лучше что бы в djvu был текстовый слой в таблицах чем его отсутствие. А насчёт "красивостей" размещения текста то, надеюсь вы со мной согласитесь, глазами лучше воспринимается так -
чем так -
Поэтому, функция поворота в кратче была бы как нельзя кстати.

Цитата:
в какую сторону он был произведен, по или против часовой? автоматически этого сейчас я определить не смогу.. если только вручную..  

Автоматически и не надо, зачем такие сложности?
В подавляющем большинстве случаев, по крайней мере в совдеповской научно(-популярно)й литературе таблицы в книге размещаются, "от корешка". Т.е. поворот как это реализовано в PatchOcrDirection'е. В любом случае, повторюсь, гораздо лучше иметь данные и с таких вот "перевёртышей", которых иногда довольно много содержится в работе.

Всего записей: 118 | Зарегистр. 14-02-2012 | Отправлено: 22:57 11-06-2014
Bu

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Не подскажете какая из этих утилит может поменять dpi готового djvu файла. Есть DjVuToy он может менять dpi, но только у одного файла, и похоже консольных команд у него нет, а мне надо поменять dpi у нескольких сотен файлов.

Всего записей: 79 | Зарегистр. 08-10-2001 | Отправлено: 23:55 11-06-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hogu77

Цитата:
но мне удобнее сначала поворачивать страницы)

каждый ... как он хочет)) я на 100% с этим согласен! а в данном случае если "сначала" будет до распознания, то результат сразу будет нужный, без последующего геморроя..

Цитата:
надеюсь вы со мной согласитесь, глазами лучше воспринимается так

типа "это Г лучше того Г" - для меня все Г неприемлемо.. делать надо или хорошо, или никак..

Цитата:
В подавляющем большинстве случаев...

в примере повернуты 2 станицы, и обе - в разные стороны..  
ладно, заканчиваю флудить.. то, что я хотел сказать по этому поводу, в принципе, я уже сказал в предыдущем посте..
 
Bu
никогда этим не занимался.. м.б. djvumake?
 
Добавлено:
хотя, djvumake вроде для одностраничных документов..

Всего записей: 1427 | Зарегистр. 26-07-2007 | Отправлено: 00:22 12-06-2014
amaid



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
вот еще такая чушь встречается
http://rghost.ru/56346663
для крутча сгодится?

Всего записей: 575 | Зарегистр. 25-01-2006 | Отправлено: 08:17 13-06-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amaid
нет, это творение ФР11 версии ниже 11.0.102.583.. в файле нет информации о координатах слов, поэтому - только перераспознавать..

Всего записей: 1427 | Зарегистр. 26-07-2007 | Отправлено: 11:25 13-06-2014
amaid



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
глядя на эволюцию OCR в разных версиях файна, не покидает чувство, что на каком-то этапе в ABBYY проникли диверсанты или как минимум вредители

Всего записей: 575 | Зарегистр. 25-01-2006 | Отправлено: 13:49 13-06-2014
hogu77

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME

Цитата:
в примере повернуты 2 станицы, и обе - в разные стороны..  

Точнее не страницы, а текстовый слой. Это я куролесил в Document Express Editor 6.5, можно было и без этих извращений, так как после перевёртыша из под FR12 возвращать настоящее местоположение надо OCR а не странице как таковой. Всё равно же нам из abbyy нужен только текст. А это и с v.0.3 делаться, так что, извиняюсь за поспешность в выводе.
 
amaid

Цитата:
глядя на эволюцию OCR в разных версиях файна, не покидает чувство, что на каком-то этапе в ABBYY проникли диверсанты или как минимум вредители

Можно даже точно определить время проникновения - с 9-ой версии.

Всего записей: 118 | Зарегистр. 14-02-2012 | Отправлено: 00:31 14-06-2014 | Исправлено: hogu77, 00:32 14-06-2014
Dracula



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите, как выровнять оглавление, когда оно поделено на 2 части на 1 странице - по типу на 2 столбца поделено.  
NME
Вы в видео хорошо показали когда оглавление скажем так с одним столбцом на всю страницу, а как быть с двумя? Я открываю в djview.exe и не знаю что именно там взять ведь там 2 значения уже будут вместо одного - типа левая и правая колонка внизу посмотреть значение и вписать его в DjVu Annotation Editor 0.2 в поле "Выровнять".
Привожу пример такого оглавления. Подскажите:
http://rghost.ru/56468788

----------
+=._.=++=._.=++=._.=++=._.=++=._.=++=._.=++=._.=+

Всего записей: 3489 | Зарегистр. 22-12-2003 | Отправлено: 19:02 19-06-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dracula
для выравнивания таких оглавлений есть крыжик "Область".. выравнивание производится для каждого столбца отдельно..
если оглавление двухстолбцовое и каждый столбец находится на своей половине (как в примере), то выбираем сначала область "Лев.", выбираем страницу "На стр.", и дальше действуем как в видеомануале..  
если деление столбцов не посередине - указываем редактируемую область вручную "Ручн."..
если оглавление на нескольких страницах - рекомендуется сначала обработать все левые столбцы, а затем все правые - так править меньше придется..
кстати, только сейчас заметил - если при изменении оглавления книга открыта в DjView, то через какое-то небольшое время страница самообновляется - некое подобие WYSIWYG'а))

Всего записей: 1427 | Зарегистр. 26-07-2007 | Отправлено: 20:25 19-06-2014
Bu

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Написал батник для пакетной обработки:

Код:
Djvu файлы из FR должны быть помещены в папку OCR.
Оригинальные djvu файлы (с теми же именами) должны
быть помещены в папку OUT.
В итоге должна получиться структура:
    /OCR/Book.djvu
    /OUT/Book.djvu
    /fr11DTLcrutch03.exe
    /ocr.bat

Скачать: https://github.com/1v/ocr.bat/archive/master.zip
Git: https://github.com/1v/ocr.bat

Всего записей: 79 | Зарегистр. 08-10-2001 | Отправлено: 05:59 20-06-2014 | Исправлено: Bu, 06:01 20-06-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
проще, наверное, для этого дела отдельную утилитку сделать ... с возможностью ручного поворота и сдвига текста..

в шапке..

Всего записей: 1427 | Зарегистр. 26-07-2007 | Отправлено: 00:13 22-06-2014
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
при использовании DjVu Text Mover'а надо понимать, куда выполнять поворот и где должна оказаться  точка с нулевыми координатами (левая нижняя точка)..
в приведенном выше примере можно повернуть текст на нужных страницах относительно центра, а потом долго и упорно подгонять его местоположение сдвигом..  
или понять, что после переноса текста на стр. 14 нулевая точка должна оказаться в правом нижнем углу, а на стр. 16 - в левом верхнем.. тогда, выполнив нужные действия (стр.14 - поворот на 90 против часовой + сдвиг по горизонтали на величину ширины страницы 3357, а на стр.16 - на 90 по часовой + сдвиг по вертикали на высоту страницы 4700) мы получим нужный результат..

Всего записей: 1427 | Зарегистр. 26-07-2007 | Отправлено: 13:44 22-06-2014
Dracula



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
Спасибо огромное - очень помогло - так ровненько всё вышло, что приятно глянуть, если бы не Ваши проги не знаю чтобы и делал я - было бы всё вкривь и вкось.

----------
+=._.=++=._.=++=._.=++=._.=++=._.=++=._.=++=._.=+

Всего записей: 3489 | Зарегистр. 22-12-2003 | Отправлено: 17:26 22-06-2014
Songs0fFailure



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
• визивиг-редактор текстового слоя..

Нашел тут интересное, WebDjVuTextEd - http://sourceforge.net/projects/webdjvutexted/
Посмотреть тут можно - http://www.djvu.hu/editor/
 
А ещё тут проблема возникла с аннотациями с ссылками для предметного указателя, пробовал contentm от monday2000, DjVu Hyperlinks Editor, DjVu Annotations Editor, но что-то ничем не помогли они. =\
А хотелось бы просто взять координаты всех line на нужной странице и сделать аннотации.

Всего записей: 14 | Зарегистр. 20-01-2012 | Отправлено: 20:37 12-08-2014
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36

Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru