Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36

Открыть новую тему     Написать ответ в эту тему

NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

DjVu Nano Mega Editor
(DjVuNMEditor)

Программа для редактирования в DjVu-книгах:
1) текстового слоя;
2) аннотаций;
3) заголовков страниц (title);
4) закладок (bookmarks, outline); в текущей версии не реализовано
5) метаданных; в текущей версии не реализовано
6) еще чего-то?
Описание
Скачать v3.5
Английская локализация

TurnTheText

Утилита TurnTheText предназначена для устранения несоответствия графического и текстового слоев в DjVu-книгах, возникающего при использовании FineReader версии 8 (и ниже) для распознавания текста..
Может быть использована, например, перед внедрением оглавления в DjVu-книгу с помощью программы DjVu Hyperlinks Editor..
Описание
Скачать v1.1

DjVu Annotations Editor

Программа для редактирования гиперссылок (annotations/hyperlinks) в файлах формата djvu, преимущественно, после создания оглавлений в книге при помощи DjVu Hyperlinks Editor'а..
Выполняет сдвиг, выравнивание, изменение размеров, цвета, свойств и др..
Описание
Скачать v0.2
Практически весь функционал программы реализован в DjVuNMEditor'е

HeadWorder

Программа для полуавтоматического извлечения заголовков словарных статей из DjVu-словарей, энциклопедий и т.п. и последующего внедрения их в книгу в виде закладок DjVu или WinDjView (с позиционированием)..
Программа устарела так и не выйдя в свет((

FR11 DjVu Text Layer Crutch

Программа для исправления текстового слоя в файле DjVu, созданного посредством ABBYY FineReader билд 11.0.102.583 и выше (в т.ч. ФР12)..
Выполняет следующие действия:
- удаляет блоки Char;
- создает зоны Line и Paragraph;
- объединяет две половинки слова, разделенного знаком переноса, в одно;
- позволяет переносить текстовый слой из одного файла в другой..
Описание
Скачать v0.3.3
Основной функционал программы реализован также в DjVuNMEditor'е

DjVu Chunk Remover

Программа для удаления блоков (чанков), а также страниц из файлов формата DjVu.. может удалять фон (BG44, BGjp), закладки (NAVM), аннотации (ANTa, ANTz), текст (TXTa, TXTz), информацию о цвете маски(FG44, FGbz) и др.. запрещено удаление блоков INFO, Sjbz, Djbz и INCL, содержащих ссылки на Djbz-словари символов..
Описание
Скачать v0.5

DjVu Text Mover

Программа позволяет поворачивать и двигать текстовый слой в файлах DjVu..
Скачать v0.1

DjVu Title Maker

Программа для создания заголовков страниц (переименования страниц) в файлах DjVu..  
Таким образом, страницы можно называть "Обложка", I, II, III, IV и т.п., автоматически или вручную переименовывать страницы со сдвинутой нумерацией (в т.ч. при удалении пустых страниц) для соответствия нумерации электронной книги её бумажному оригиналу..
Описание
Скачать v0.1
Основной функционал программы реализован также в DjVuNMEditor'е

DjVu Clean Page Inserter

Программа для быстрого создания и внедрения в книгу пустых страниц.. Нужна для восстановления соответствия бумажной и электронной нумерации, что облегчает навигацию по книге..
Описание
Скачать v0.1

DjVu Blits Merger

Программа для добавления на страницы djvu-книги графических изображений (mask-слоя) из другого djvu-файла.. Может применяться для добавления в книгу номеров страниц, колонтитулов, другой необходимой информации без перекодирования файла, а также для объединения графики с двух страниц, закодированных с разной степенью сжатия (например, aggressive и lossless)..
Описание
Скачать v0.1

DjVu Blits Hider

Программа для удаления со страниц djvu-книги графических изображений mask-слоя (blits).. может применяться для очистки страницы от "грязных пятен", лишних элементов маски и т.п. без перекодирования файла.. совместно с DjVu Blits Merger'ом позволяет редактировать mask-слой djvu-книги - Hider удаляет, а Merger вставляет на это место нужную графику..
Описание
Скачать v0.1.1

FR12 Parser

Программа для извлечения координат символов из проекта ФР12-15..
Описание
Скачать v2.3.1

Все программы в одной папке


Программы, которых еще нет, но, возможно, когда-нибудь сделаю..


аналог DjVu Hyperlinks Editor'у с бОльшим функционалом и предварительным просмотром.. DjVuNMEditor
программа для создания и внедрения в книгу пустых страниц.. DjVu Clean Page Inserter
программа для удаления страниц из книги.. DjVu Chunk Remover
программа для удаления пустых чанков, типа CIDa.. DjVu Chunk Remover
программа для добавления текста в нужное место на странице (+ к существующему) DjVuNMEditor
программа для удаления блитов со страницы DjVu Blits Hider
• программа для разделения разворотов на 2 страницы
программа для добавления новых блитов на существующую страницу (объединение графики с двух страниц на одну) DjVu Blits Merger
• программа для перемещения блитов на странице
• программа для кодирования ч/б растра без потерь одним или несколькими большими по размеру шейпами
• еще что-то хотел сделать.. но забыл.. вспомню - запишу))
 
если найдутся желающие сделать эти программы - добро пожаловать)) мыслями и наработками с удовольствием поделюсь)) это относится и к следующему блоку тоже..

Программы, которых нет, и я, к сожалению, наврядли осилю((..

визивиг-редактор текстового слоя.. DjVuNMEditor
Hyperlinks-редактор, типа Document Express Editor, но с возможностью групповой правки аннотаций.. DjVuNMEditor
• полноценный визивиг редактор графики DjVu с возможностью удаления, сдвига, правки шейпов в маске.. а может быть и корректировки фона тоже..
WinDjView с поиском текста в закладках.. ну и некоторыми другими дополнительными возможностями.. таки осилил))
 

продолжение следует..

Всего записей: 1427 | Зарегистр. 26-07-2007 | Отправлено: 22:57 06-02-2012 | Исправлено: NME, 18:28 25-09-2022
fozzie

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Кто-нибудь поделитесь ссылкой на DjVuToy

Официальный репозиторий автора: https://www.mediafire.com/folder/f0z2hexqdnr9a/Software

Всего записей: 141 | Зарегистр. 03-09-2001 | Отправлено: 11:20 14-11-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
LonerD

Цитата:
но переименование делается очень быстро и без перекодировки..

Это вряд ли. Мне года три назад, или чуть поменее, не удалось найти никакого способа переименования именно поля name. Только полный экстракт в граф.файлы, переименование и кодирование заново. Иначе да, пухнет словарь, книга раздувается раз в тридцать.  
Я напрягал разработчика DSM, textsharik, по сходной проблеме, но и он подтвердил, что имена страниц - нечто незыблемое для его программы. Видимо, библиотека разбора djvu на страницы так спроектирована.
С одной стороны, тема неразработанная. С другой - а зачем новое именование? Его ж нигде и не видать, кроме листка в djvutoy да свойств документа в djview из djvulibre. Поиск и то не сделать.
 
Вполне вероятно, что батниками+djvulibre можно разобрать дежавю на слои, переименовать, а затем заново собрать с компрессией lossless, что сохранит (должно!) оригинальный словарь нетронутым. Но как задний слой оставить неповреждённым повторной компрессией - ?

Всего записей: 2993 | Зарегистр. 15-07-2010 | Отправлено: 08:06 17-11-2020
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral Можно как-то так, если в Linux/Cygwin/Termux:  
1.Преобразовать bundled djvu с помощью djvmcvt в indirect.
2. С помощью dd skip=27 if=idx1.djvu of=out.bin bs=1 вырезать кодированую часть DIRM чанка.
3. Декодировать эту часть bzz -d out.bin >out2.bin
4. Сделать замену названий каким-нибудь sed'ом  в бинарном режиме на нужные(там названия разделены нулевым байтом).
5. Кодировать в bzz
6. Зная размеры новой и старой кодированых частей скорректировать в 2х местах индексного файла размеры чанка и заменить старую bzz часть на новую (думаю что dd и тут выручит).
7. Переименовать сами файлы в папке и собрать bundled djvu.
Это если не править названия общих словарей и аннотаций, если нужно править и названия словарей djbz, то придется корректировать не только один индексный файл, но и в самих страницах менять байты.

Всего записей: 881 | Зарегистр. 14-12-2005 | Отправлено: 19:06 17-11-2020
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Пример djvu заменой поля name:
https://www.upload.ee/files/12533907/1.zip.html
Внутри архива исходник, bash скрипт (еще сырой, запускал в cygwin) и результат.
Замена имен была просто на номера по порядку (для демонстрации возможностей). Названия общих словарей не менялись.

Всего записей: 881 | Зарегистр. 14-12-2005 | Отправлено: 08:32 18-11-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235
любопытно.
 
А я не парился и написал Ма Цзяну чтоб ввел правку поля в PageEditor

Всего записей: 2993 | Зарегистр. 15-07-2010 | Отправлено: 08:43 18-11-2020
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
но переименование делается очень быстро и без перекодировки..


Цитата:
Это вряд ли.

к чему сомнения? если проверить это можно за пару минут и убедиться, что я прав.. размеры страниц будут совпадать 1 в 1, а итоговый файл будет меньше весить за счет того, что имена файлов короче + лучше жмутся..
U235
DjVuToy примерно то же самое делает в 2 приёма - (1) разбирает постранично + переименовывает (2) собирает обратно.. только имхо гораздо проще, чем заморачиваться со скриптами..  
вот общие словари - да, не знаю общедоступных инструментов, способных их переименовать..  
но вообще все эти переименования по моему мнению фигня ниочем.. влияет на конечный размер файла, но совсем немного.. если Ма захочет, он добавит в свои утилиты инструмент по правке имен (м.б. в т.ч. и имен словарей), но мне этим заниматься не интересно..

Всего записей: 1427 | Зарегистр. 26-07-2007 | Отправлено: 14:26 18-11-2020 | Исправлено: NME, 14:26 18-11-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME

Цитата:
к чему сомнения? если проверить это можно за пару минут и убедиться, что я прав..


Вот я взял и убедился, что вы не правы
Взял файл из пакета U235 (hartshorne.djvu размером 1685312 байт). Открыл в djvutoy303beta. Рассыпал его (закладка Splitter) отдельными дежавюшками в папку, внутри получил 161 файл общим размером 3458428 байт.
Собрал обратно закладкой Merger, получил файл размером 3459146 байт.
Что-то я сделал не так?
 
UPD
сам разобрался: надо было снять галочку embed INCL chunk. Тогда словарь выгружается отдельными файлами. Действительно, размер остался почти идентичен исходнику.
Но, как я понимаю, произвольно изменить именование файлов в данном случае невозможно? Только уже в редакторе порядок менять.

Всего записей: 2993 | Зарегистр. 15-07-2010 | Отправлено: 14:58 18-11-2020 | Исправлено: TelecomUral, 15:15 18-11-2020
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Что-то я сделал не так?

галку "embed incl chunk" надо было снять, чтоб словарь в каждую страницу не встраивался
 
Добавлено:

Цитата:
Но, как я понимаю, произвольно изменить именование файлов в данном случае невозможно?  

там есть выбор сортировки, если под какую-то попадает - то хорошо, если нет - то, видимо, ручками придется..

Всего записей: 1427 | Зарегистр. 26-07-2007 | Отправлено: 15:15 18-11-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
Да. Спасибо!
 
А не знаете, что такое by PDG order сортировка там? в яндексе что-то на биржевые ордера ссылаются

Всего записей: 2993 | Зарегистр. 15-07-2010 | Отправлено: 15:22 18-11-2020
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
А не знаете, что такое by PDG order сортировка там?

точно не знаю, но, если интересно, то советую начать копать с программы PdgCntEditor того же китайского автора.. скорее всего это и есть произвольная сортировка, прописываемая в каком-то файле..

Всего записей: 1427 | Зарегистр. 26-07-2007 | Отправлено: 00:19 19-11-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ма Цзян прикололся - ответил что "как минимум, я не знаю, как это сделать"
 
UPD
после просмотра шелл-скрипта от U235 и пары уточнений сказал, что всё сделает (вероятно, как я попросил - прямо в редакторе PageEditor), только программировать небыстро.

Всего записей: 2993 | Зарегистр. 15-07-2010 | Отправлено: 15:40 19-11-2020 | Исправлено: TelecomUral, 06:14 20-11-2020
fozzie

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А не знаете, что такое by PDG order сортировка там?

PDG - это китайский графический формат, используемый в китайских же электронных книгах (SSreader Document Format). Там имеется некий регламент для имён файлов страниц - основного корпуса, обложки, оглавления, предисловия, выходных данных и т.п. Чтобы в результате преобразования из PDG в djvu был сохранён правильный порядок страниц, необходим такой вид сортировки.  

Всего записей: 141 | Зарегистр. 03-09-2001 | Отправлено: 17:06 19-11-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
всё, djvutoy v3.04 поддерживает переименование:

Цитата:
 Please update to v3.04.
You may try Rename, Export and Import buttons in toolbar, or double click a line in list to rename it.

Всего записей: 2993 | Зарегистр. 15-07-2010 | Отправлено: 09:25 22-11-2020
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
всё, djvutoy v3.04 поддерживает переименование:

ну, хорошо, пусть будет еще один бесмалополезный инструмент в небольшой копилке инструментов DjVu

Всего записей: 1427 | Зарегистр. 26-07-2007 | Отправлено: 12:27 22-11-2020
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Всем привет!
Уже много лет в шапке в разделе "Программы, которые я навряд ли осилю" на первом месте указан "визивиг-редактор текстового слоя".. Так я думал раньше (про ниасилю), но после того, как получилось допилить WinDjView под свои нужды, это мне уже не кажется непосильной задачей..
Так сошлись звёзды, что некоторое время назад у меня возникло желание создать wysiwyg DjVu-редактор, способный как минимум править текстовый слой и аннотации, а дальше как попрёт - м.б. и графику тоже..
к сожалению, скудные познания с++, а также небольшие запасы свободного времени сильно растягивают процесс написания проги, тем не менее, кое-какие результаты уже вырисовываются..
Здесь то, что у меня получилось на сегодняшний день.. Это демо-версия, сохранение результата пока не реализовано - с этим есть определенные сложности.. В идеале, конечно, результат нужно сохранять сразу в djvu-файл.. Как это сделать в с# я знаю, сам писал код, а вот в с++ - пока не разобрался.. А сохранять в текстовый файл для последующего внедрения с помощью djvused или djvutoy (xml-файл) не вижу смысла - это дополнительные ненужные операции..
Те, кто откроют программу, увидят очень знакомый интерфейс)) Да, это интерфейс WinDjView с небольшими изменениями, в котором на боковой панели появилась новая вкладка "Текстовый слой (Hidden Text)".. Весь функционал реализован пока только в окне этой вкладки..
При наличии текста на текущей странице в данном окне отображается дерево с зонами от PAGE ДО CHAR (при наличии).. Выпадающее меню появляется при клике ПКМ на элементах дерева.. Список команд тут:
Пока на этом всё с функционалом, осталось только сделать сохранение измененного текста в djvu-файл..
Из не обязательного - есть желание попробовать включить выделение нескольких веток сразу - для более быстрого объединения зон или переноса текста.. Может быть еще сделать возможность ручного указания координат и размеров зон нижнего уровня (в соответствии с выделенной прямоугольной областью на поле чертежа)..  
Можно также набросать идей для совсем далёкого будущего:
- всплывающее окошко с текстом при наведении на него мышкой (в самой книге, а не в дереве с текстом) и нажатии Ctrl или Shift, с возможностью редактирования текста сразу в данном окошке;
- выделение в дереве текста (динамическое или при нажатии определенной кнопки), соответствующего тому, который находится под курсором в книге;
- перетаскивание мышкой веток дерева;
- отображение скрытого текста поверх графики с определённой прозрачностью;
- отмена действий;
- и т.п..
Это то, что касается текстового слоя.. Также есть в планах добавить функционал редактирования аннотаций, которого нет в Document Express Editor'e - это групповая правка свойств аннотаций, выравнивание и т.п.. М.б. в дальнейшем заодно и создание TOC-оглавлений сюда припилить - иногда алгоритмы DjVu Hyperlinks Editor'а хромают, не хватает возможности установки фильтров и др..
Для редактирования закладок/букмарков уже есть хорошие программы, но можно и здесь реализовать данный функционал "до кучи"..
Над созданием/редактированием метаданных можно подумать..
На "тяжелое" - это редактирование графики.. Можно сделать удаление, перемещение, замену, раскраску блитов и т.п.. Редактирования фона в программе точно не будет, разве что экспорт, импорт и удаление..
Фантазируя дальше, можно также включить функционал других программ и утилит (моих и не только)..
Во какие грандиозные, в большинстве своём скорее всего никогда не реализуемые, планы на программу!!)))) И название должно быть подходящее - типа DJVUMEGAEDITOR))) Но в реальности, скорее NanoEditor))) Объединив их, получается DjVuNanoMegaEditor или сокращенно DjVuNMEditor, что почему-то мне нравится больше - пусть будет так)))
Посмотрите, потестируйте, может будут какие-то предложения по программе или сообщения об ошибках.. Можно писать здесь или в личку..

Всего записей: 1427 | Зарегистр. 26-07-2007 | Отправлено: 15:55 26-12-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
класс.
Проблемка: при merge пробелы пропадают. Из нескольких слов получается одно.
 
Предложение по функционалу.
Можно ли связать окошечко с числом габарита и соответствующую границу рамочки на экране? Чтобы гоняя стрелочками "больше-меньше" это число - сразу же визуально смотреть на результат.

Всего записей: 2993 | Зарегистр. 15-07-2010 | Отправлено: 04:18 27-12-2020 | Исправлено: TelecomUral, 07:34 27-12-2020
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Проблемка: при merge пробелы пропадают. Из нескольких слов получается одно.

это не баг, а фича)) если объединяешь 2 слова в одно, то логично, что пробелы - это лишнее)) пробел удаляется между объединяемыми зонами "word", между другими не удаляется..

Цитата:
Можно ли связать окошечко с числом габарита и соответствующую границу рамочки на экране? Чтобы гоняя стрелочками "больше-меньше" это число - сразу же визуально смотреть на результат.

я об этом знаю, это конечно лучше, нагляднее, но надо окно немодальным делать - там свои заморочки.. я пробовал это сделать еще в WinDjView Extended, пару дней потратил - не получилось.. если в будущем разберусь - конечно сделаю, но пока только так..

Всего записей: 1427 | Зарегистр. 26-07-2007 | Отправлено: 23:05 27-12-2020
stoller



Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME, даже в текущем варианте это просто шикарная прога! Давно ждал чего-то подобного, править опечатки без переделки всей книги - это очень нужная возможность, которой сильно не хватает на текущий момент. Жду доделки сохранений.
Попробовал править несколько книг - везде работает, сбоев не было.
Одна хотелка есть: неплохо бы иметь возможность править LINE целиком. Зачастую распознавание сбивается некоторыми областями, например, сканирование было проведено датчиком CIS, и неровности бумаги приводят к размытию, и это чаще всего сказывается на работе алгоритма не в отдельных словах, а пятнами. Если править каждое слово по-отдельности, то придётся делать много лишних движений, правка строки целиком от этих движений избавила бы.
Я не знаю, получится ли реализовать подобное, но, если возможность есть, желательно её применить.
Спасибо!

Всего записей: 22 | Зарегистр. 25-10-2012 | Отправлено: 09:00 29-12-2020
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
stoller

Цитата:
правка строки целиком от этих движений избавила бы.  

сейчас у каждого слова есть своя определенная прямоугольная область (если разбивка была до WORD, а не до CHAR).. если сделать возможность правки LINE, то при изменении количества слов не понятно, какие координаты у появившегося нового слова или какую область удалить (или слить с другой), если количество слов уменьшилось.. так что возможность правки зон, кроме самой нижней, я делать не буду..
а вот горячие клавиши на команды - скорее всего в будущем сделаю..

Всего записей: 1427 | Зарегистр. 26-07-2007 | Отправлено: 16:30 29-12-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
то при изменении количества слов не понятно, какие координаты

ну, это ведь несложно обойти логически: не давать вводить пробел и стирать его.

Всего записей: 2993 | Зарегистр. 15-07-2010 | Отправлено: 17:34 29-12-2020
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36

Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru