Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

Открыть новую тему     Написать ответ в эту тему

NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

DjVu Nano Mega Editor
(DjVuNMEditor)

Программа для редактирования в DjVu-книгах:
1) текстового слоя;
2) аннотаций; в текущей версии не реализовано
3) закладок (bookmarks, outline); в текущей версии не реализовано
4) метаданных; в текущей версии не реализовано
5) еще чего-то?
Описание
Скачать v1.1

TurnTheText

Утилита TurnTheText предназначена для устранения несоответствия графического и текстового слоев в DjVu-книгах, возникающего при использовании FineReader версии 8 (и ниже) для распознавания текста..
Может быть использована, например, перед внедрением оглавления в DjVu-книгу с помощью программы DjVu Hyperlinks Editor..
Описание
Скачать v1.1

DjVu Annotations Editor

Программа для редактирования гиперссылок (annotations/hyperlinks) в файлах формата djvu, преимущественно, после создания оглавлений в книге при помощи DjVu Hyperlinks Editor'а..
Выполняет сдвиг, выравнивание, изменение размеров, цвета, свойств и др..
Описание
Скачать v0.2

HeadWorder

Программа для полуавтоматического извлечения заголовков словарных статей из DjVu-словарей, энциклопедий и т.п. и последующего внедрения их в книгу в виде закладок DjVu или WinDjView (с позиционированием)..
может быть в будущем, когда описание сделаю..  

FR11 DjVu Text Layer Crutch

Программа для исправления текстового слоя в файле DjVu, созданного посредством ABBYY FineReader билд 11.0.102.583 и выше (в т.ч. ФР12)..
Выполняет следующие действия:
- удаляет блоки Char;
- создает зоны Line и Paragraph;
- объединяет две половинки слова, разделенного знаком переноса, в одно;
- позволяет переносить текстовый слой из одного файла в другой..
Описание
Скачать v0.3.1

DjVu Chunk Remover

Программа для удаления блоков (чанков), а также страниц из файлов формата DjVu.. может удалять фон (BG44, BGjp), закладки (NAVM), аннотации (ANTa, ANTz), текст (TXTa, TXTz), информацию о цвете маски(FG44, FGbz) и др.. запрещено удаление блоков INFO, Sjbz, Djbz и INCL, содержащих ссылки на Djbz-словари символов..
Описание
Скачать v0.5

DjVu Text Mover

Программа позволяет поворачивать и двигать текстовый слой в файлах DjVu..
Скачать v0.1

DjVu Title Maker

Программа для создания заголовков страниц (переименования страниц) в файлах DjVu..  
Таким образом, страницы можно называть "Обложка", I, II, III, IV и т.п., автоматически или вручную переименовывать страницы со сдвинутой нумерацией (в т.ч. при удалении пустых страниц) для соответствия нумерации электронной книги её бумажному оригиналу..
Описание
Скачать v0.1

DjVu Clean Page Inserter

Программа для быстрого создания и внедрения в книгу пустых страниц.. Нужна для восстановления соответствия бумажной и электронной нумерации, что облегчает навигацию по книге..
Описание
Скачать v0.1

DjVu Blits Merger

Программа для добавления на страницы djvu-книги графических изображений (mask-слоя) из другого djvu-файла.. Может применяться для добавления в книгу номеров страниц, колонтитулов, другой необходимой информации без перекодирования файла, а также для объединения графики с двух страниц, закодированных с разной степенью сжатия (например, aggressive и lossless)..
Описание
Скачать v0.1

DjVu Blits Hider

Программа для удаления со страниц djvu-книги графических изображений mask-слоя (blits).. может применяться для очистки страницы от "грязных пятен", лишних элементов маски и т.п. без перекодирования файла.. совместно с DjVu Blits Merger'ом позволяет редактировать mask-слой djvu-книги - Hider удаляет, а Merger вставляет на это место нужную графику..
Описание
Скачать v0.1.1

Все программы в одной папке


Программы, которых еще нет, но, возможно, когда-нибудь сделаю..


• аналог DjVu Hyperlinks Editor'у с бОльшим функционалом и предварительным просмотром..
программа для создания и внедрения в книгу пустых страниц.. DjVu Clean Page Inserter
программа для удаления страниц из книги.. DjVu Chunk Remover
программа для удаления пустых чанков, типа CIDa.. DjVu Chunk Remover
программа для добавления текста в нужное место на странице (+ к существующему) DjVuNMEditor
программа для удаления блитов со страницы DjVu Blits Hider
• программа для разделения разворотов на 2 страницы
программа для добавления новых блитов на существующую страницу (объединение графики с двух страниц на одну) DjVu Blits Merger
• программа для перемещения блитов на странице
• программа для кодирования ч/б растра без потерь одним или несколькими большими по размеру шейпами
• еще что-то хотел сделать.. но забыл.. вспомню - запишу))
 
если найдутся желающие сделать эти программы - добро пожаловать)) мыслями и наработками с удовольствием поделюсь)) это относится и к следующему блоку тоже..

Программы, которых нет, и я, к сожалению, наврядли осилю((..

визивиг-редактор текстового слоя.. DjVuNMEditor
• Hyperlinks-редактор, типа Document Express Editor, но с возможностью групповой правки гиперссылок..  
• полноценный визивиг редактор графики DjVu с возможностью удаления, сдвига, правки шейпов в маске.. а может быть и корректировки фона тоже..
WinDjView с поиском текста в закладках.. ну и некоторыми другими дополнительными возможностями.. таки осилил))
 

продолжение следует..

Всего записей: 1276 | Зарегистр. 26-07-2007 | Отправлено: 22:57 06-02-2012 | Исправлено: NME, 14:42 10-06-2021
fozzie

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Кто-нибудь поделитесь ссылкой на DjVuToy

Официальный репозиторий автора: https://www.mediafire.com/folder/f0z2hexqdnr9a/Software

Всего записей: 54 | Зарегистр. 03-09-2001 | Отправлено: 11:20 14-11-2020
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
LonerD

Цитата:
но переименование делается очень быстро и без перекодировки..

Это вряд ли. Мне года три назад, или чуть поменее, не удалось найти никакого способа переименования именно поля name. Только полный экстракт в граф.файлы, переименование и кодирование заново. Иначе да, пухнет словарь, книга раздувается раз в тридцать.  
Я напрягал разработчика DSM, textsharik, по сходной проблеме, но и он подтвердил, что имена страниц - нечто незыблемое для его программы. Видимо, библиотека разбора djvu на страницы так спроектирована.
С одной стороны, тема неразработанная. С другой - а зачем новое именование? Его ж нигде и не видать, кроме листка в djvutoy да свойств документа в djview из djvulibre. Поиск и то не сделать.
 
Вполне вероятно, что батниками+djvulibre можно разобрать дежавю на слои, переименовать, а затем заново собрать с компрессией lossless, что сохранит (должно!) оригинальный словарь нетронутым. Но как задний слой оставить неповреждённым повторной компрессией - ?

Всего записей: 1383 | Зарегистр. 15-07-2010 | Отправлено: 08:06 17-11-2020
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral Можно как-то так, если в Linux/Cygwin/Termux:  
1.Преобразовать bundled djvu с помощью djvmcvt в indirect.
2. С помощью dd skip=27 if=idx1.djvu of=out.bin bs=1 вырезать кодированую часть DIRM чанка.
3. Декодировать эту часть bzz -d out.bin >out2.bin
4. Сделать замену названий каким-нибудь sed'ом  в бинарном режиме на нужные(там названия разделены нулевым байтом).
5. Кодировать в bzz
6. Зная размеры новой и старой кодированых частей скорректировать в 2х местах индексного файла размеры чанка и заменить старую bzz часть на новую (думаю что dd и тут выручит).
7. Переименовать сами файлы в папке и собрать bundled djvu.
Это если не править названия общих словарей и аннотаций, если нужно править и названия словарей djbz, то придется корректировать не только один индексный файл, но и в самих страницах менять байты.

Всего записей: 715 | Зарегистр. 14-12-2005 | Отправлено: 19:06 17-11-2020
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Пример djvu заменой поля name:
https://www.upload.ee/files/12533907/1.zip.html
Внутри архива исходник, bash скрипт (еще сырой, запускал в cygwin) и результат.
Замена имен была просто на номера по порядку (для демонстрации возможностей). Названия общих словарей не менялись.

Всего записей: 715 | Зарегистр. 14-12-2005 | Отправлено: 08:32 18-11-2020
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235
любопытно.
 
А я не парился и написал Ма Цзяну чтоб ввел правку поля в PageEditor

Всего записей: 1383 | Зарегистр. 15-07-2010 | Отправлено: 08:43 18-11-2020
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
но переименование делается очень быстро и без перекодировки..


Цитата:
Это вряд ли.

к чему сомнения? если проверить это можно за пару минут и убедиться, что я прав.. размеры страниц будут совпадать 1 в 1, а итоговый файл будет меньше весить за счет того, что имена файлов короче + лучше жмутся..
U235
DjVuToy примерно то же самое делает в 2 приёма - (1) разбирает постранично + переименовывает (2) собирает обратно.. только имхо гораздо проще, чем заморачиваться со скриптами..  
вот общие словари - да, не знаю общедоступных инструментов, способных их переименовать..  
но вообще все эти переименования по моему мнению фигня ниочем.. влияет на конечный размер файла, но совсем немного.. если Ма захочет, он добавит в свои утилиты инструмент по правке имен (м.б. в т.ч. и имен словарей), но мне этим заниматься не интересно..

Всего записей: 1276 | Зарегистр. 26-07-2007 | Отправлено: 14:26 18-11-2020 | Исправлено: NME, 14:26 18-11-2020
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME

Цитата:
к чему сомнения? если проверить это можно за пару минут и убедиться, что я прав..


Вот я взял и убедился, что вы не правы
Взял файл из пакета U235 (hartshorne.djvu размером 1685312 байт). Открыл в djvutoy303beta. Рассыпал его (закладка Splitter) отдельными дежавюшками в папку, внутри получил 161 файл общим размером 3458428 байт.
Собрал обратно закладкой Merger, получил файл размером 3459146 байт.
Что-то я сделал не так?
 
UPD
сам разобрался: надо было снять галочку embed INCL chunk. Тогда словарь выгружается отдельными файлами. Действительно, размер остался почти идентичен исходнику.
Но, как я понимаю, произвольно изменить именование файлов в данном случае невозможно? Только уже в редакторе порядок менять.

Всего записей: 1383 | Зарегистр. 15-07-2010 | Отправлено: 14:58 18-11-2020 | Исправлено: TelecomUral, 15:15 18-11-2020
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Что-то я сделал не так?

галку "embed incl chunk" надо было снять, чтоб словарь в каждую страницу не встраивался
 
Добавлено:

Цитата:
Но, как я понимаю, произвольно изменить именование файлов в данном случае невозможно?  

там есть выбор сортировки, если под какую-то попадает - то хорошо, если нет - то, видимо, ручками придется..

Всего записей: 1276 | Зарегистр. 26-07-2007 | Отправлено: 15:15 18-11-2020
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
Да. Спасибо!
 
А не знаете, что такое by PDG order сортировка там? в яндексе что-то на биржевые ордера ссылаются

Всего записей: 1383 | Зарегистр. 15-07-2010 | Отправлено: 15:22 18-11-2020
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
А не знаете, что такое by PDG order сортировка там?

точно не знаю, но, если интересно, то советую начать копать с программы PdgCntEditor того же китайского автора.. скорее всего это и есть произвольная сортировка, прописываемая в каком-то файле..

Всего записей: 1276 | Зарегистр. 26-07-2007 | Отправлено: 00:19 19-11-2020
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ма Цзян прикололся - ответил что "как минимум, я не знаю, как это сделать"
 
UPD
после просмотра шелл-скрипта от U235 и пары уточнений сказал, что всё сделает (вероятно, как я попросил - прямо в редакторе PageEditor), только программировать небыстро.

Всего записей: 1383 | Зарегистр. 15-07-2010 | Отправлено: 15:40 19-11-2020 | Исправлено: TelecomUral, 06:14 20-11-2020
fozzie

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А не знаете, что такое by PDG order сортировка там?

PDG - это китайский графический формат, используемый в китайских же электронных книгах (SSreader Document Format). Там имеется некий регламент для имён файлов страниц - основного корпуса, обложки, оглавления, предисловия, выходных данных и т.п. Чтобы в результате преобразования из PDG в djvu был сохранён правильный порядок страниц, необходим такой вид сортировки.  

Всего записей: 54 | Зарегистр. 03-09-2001 | Отправлено: 17:06 19-11-2020
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
всё, djvutoy v3.04 поддерживает переименование:

Цитата:
 Please update to v3.04.
You may try Rename, Export and Import buttons in toolbar, or double click a line in list to rename it.

Всего записей: 1383 | Зарегистр. 15-07-2010 | Отправлено: 09:25 22-11-2020
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
всё, djvutoy v3.04 поддерживает переименование:

ну, хорошо, пусть будет еще один бесмалополезный инструмент в небольшой копилке инструментов DjVu

Всего записей: 1276 | Зарегистр. 26-07-2007 | Отправлено: 12:27 22-11-2020
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Всем привет!
Уже много лет в шапке в разделе "Программы, которые я навряд ли осилю" на первом месте указан "визивиг-редактор текстового слоя".. Так я думал раньше (про ниасилю), но после того, как получилось допилить WinDjView под свои нужды, это мне уже не кажется непосильной задачей..
Так сошлись звёзды, что некоторое время назад у меня возникло желание создать wysiwyg DjVu-редактор, способный как минимум править текстовый слой и аннотации, а дальше как попрёт - м.б. и графику тоже..
к сожалению, скудные познания с++, а также небольшие запасы свободного времени сильно растягивают процесс написания проги, тем не менее, кое-какие результаты уже вырисовываются..
Здесь то, что у меня получилось на сегодняшний день.. Это демо-версия, сохранение результата пока не реализовано - с этим есть определенные сложности.. В идеале, конечно, результат нужно сохранять сразу в djvu-файл.. Как это сделать в с# я знаю, сам писал код, а вот в с++ - пока не разобрался.. А сохранять в текстовый файл для последующего внедрения с помощью djvused или djvutoy (xml-файл) не вижу смысла - это дополнительные ненужные операции..
Те, кто откроют программу, увидят очень знакомый интерфейс)) Да, это интерфейс WinDjView с небольшими изменениями, в котором на боковой панели появилась новая вкладка "Текстовый слой (Hidden Text)".. Весь функционал реализован пока только в окне этой вкладки..
При наличии текста на текущей странице в данном окне отображается дерево с зонами от PAGE ДО CHAR (при наличии).. Выпадающее меню появляется при клике ПКМ на элементах дерева.. Список команд тут:
Пока на этом всё с функционалом, осталось только сделать сохранение измененного текста в djvu-файл..
Из не обязательного - есть желание попробовать включить выделение нескольких веток сразу - для более быстрого объединения зон или переноса текста.. Может быть еще сделать возможность ручного указания координат и размеров зон нижнего уровня (в соответствии с выделенной прямоугольной областью на поле чертежа)..  
Можно также набросать идей для совсем далёкого будущего:
- всплывающее окошко с текстом при наведении на него мышкой (в самой книге, а не в дереве с текстом) и нажатии Ctrl или Shift, с возможностью редактирования текста сразу в данном окошке;
- выделение в дереве текста (динамическое или при нажатии определенной кнопки), соответствующего тому, который находится под курсором в книге;
- перетаскивание мышкой веток дерева;
- отображение скрытого текста поверх графики с определённой прозрачностью;
- отмена действий;
- и т.п..
Это то, что касается текстового слоя.. Также есть в планах добавить функционал редактирования аннотаций, которого нет в Document Express Editor'e - это групповая правка свойств аннотаций, выравнивание и т.п.. М.б. в дальнейшем заодно и создание TOC-оглавлений сюда припилить - иногда алгоритмы DjVu Hyperlinks Editor'а хромают, не хватает возможности установки фильтров и др..
Для редактирования закладок/букмарков уже есть хорошие программы, но можно и здесь реализовать данный функционал "до кучи"..
Над созданием/редактированием метаданных можно подумать..
На "тяжелое" - это редактирование графики.. Можно сделать удаление, перемещение, замену, раскраску блитов и т.п.. Редактирования фона в программе точно не будет, разве что экспорт, импорт и удаление..
Фантазируя дальше, можно также включить функционал других программ и утилит (моих и не только)..
Во какие грандиозные, в большинстве своём скорее всего никогда не реализуемые, планы на программу!!)))) И название должно быть подходящее - типа DJVUMEGAEDITOR))) Но в реальности, скорее NanoEditor))) Объединив их, получается DjVuNanoMegaEditor или сокращенно DjVuNMEditor, что почему-то мне нравится больше - пусть будет так)))
Посмотрите, потестируйте, может будут какие-то предложения по программе или сообщения об ошибках.. Можно писать здесь или в личку..

Всего записей: 1276 | Зарегистр. 26-07-2007 | Отправлено: 15:55 26-12-2020
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
класс.
Проблемка: при merge пробелы пропадают. Из нескольких слов получается одно.
 
Предложение по функционалу.
Можно ли связать окошечко с числом габарита и соответствующую границу рамочки на экране? Чтобы гоняя стрелочками "больше-меньше" это число - сразу же визуально смотреть на результат.

Всего записей: 1383 | Зарегистр. 15-07-2010 | Отправлено: 04:18 27-12-2020 | Исправлено: TelecomUral, 07:34 27-12-2020
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Проблемка: при merge пробелы пропадают. Из нескольких слов получается одно.

это не баг, а фича)) если объединяешь 2 слова в одно, то логично, что пробелы - это лишнее)) пробел удаляется между объединяемыми зонами "word", между другими не удаляется..

Цитата:
Можно ли связать окошечко с числом габарита и соответствующую границу рамочки на экране? Чтобы гоняя стрелочками "больше-меньше" это число - сразу же визуально смотреть на результат.

я об этом знаю, это конечно лучше, нагляднее, но надо окно немодальным делать - там свои заморочки.. я пробовал это сделать еще в WinDjView Extended, пару дней потратил - не получилось.. если в будущем разберусь - конечно сделаю, но пока только так..

Всего записей: 1276 | Зарегистр. 26-07-2007 | Отправлено: 23:05 27-12-2020
stoller



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME, даже в текущем варианте это просто шикарная прога! Давно ждал чего-то подобного, править опечатки без переделки всей книги - это очень нужная возможность, которой сильно не хватает на текущий момент. Жду доделки сохранений.
Попробовал править несколько книг - везде работает, сбоев не было.
Одна хотелка есть: неплохо бы иметь возможность править LINE целиком. Зачастую распознавание сбивается некоторыми областями, например, сканирование было проведено датчиком CIS, и неровности бумаги приводят к размытию, и это чаще всего сказывается на работе алгоритма не в отдельных словах, а пятнами. Если править каждое слово по-отдельности, то придётся делать много лишних движений, правка строки целиком от этих движений избавила бы.
Я не знаю, получится ли реализовать подобное, но, если возможность есть, желательно её применить.
Спасибо!

Всего записей: 18 | Зарегистр. 25-10-2012 | Отправлено: 09:00 29-12-2020
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
stoller

Цитата:
правка строки целиком от этих движений избавила бы.  

сейчас у каждого слова есть своя определенная прямоугольная область (если разбивка была до WORD, а не до CHAR).. если сделать возможность правки LINE, то при изменении количества слов не понятно, какие координаты у появившегося нового слова или какую область удалить (или слить с другой), если количество слов уменьшилось.. так что возможность правки зон, кроме самой нижней, я делать не буду..
а вот горячие клавиши на команды - скорее всего в будущем сделаю..

Всего записей: 1276 | Зарегистр. 26-07-2007 | Отправлено: 16:30 29-12-2020
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
то при изменении количества слов не понятно, какие координаты

ну, это ведь несложно обойти логически: не давать вводить пробел и стирать его.

Всего записей: 1383 | Зарегистр. 15-07-2010 | Отправлено: 17:34 29-12-2020
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2020

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru