Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

Открыть новую тему     Написать ответ в эту тему

NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

DjVu Nano Mega Editor
(DjVuNMEditor)

Программа для редактирования в DjVu-книгах:
1) текстового слоя;
2) аннотаций; в текущей версии не реализовано
3) закладок (bookmarks, outline); в текущей версии не реализовано
4) метаданных; в текущей версии не реализовано
5) еще чего-то?
Описание
Скачать v1.1

TurnTheText

Утилита TurnTheText предназначена для устранения несоответствия графического и текстового слоев в DjVu-книгах, возникающего при использовании FineReader версии 8 (и ниже) для распознавания текста..
Может быть использована, например, перед внедрением оглавления в DjVu-книгу с помощью программы DjVu Hyperlinks Editor..
Описание
Скачать v1.1

DjVu Annotations Editor

Программа для редактирования гиперссылок (annotations/hyperlinks) в файлах формата djvu, преимущественно, после создания оглавлений в книге при помощи DjVu Hyperlinks Editor'а..
Выполняет сдвиг, выравнивание, изменение размеров, цвета, свойств и др..
Описание
Скачать v0.2

HeadWorder

Программа для полуавтоматического извлечения заголовков словарных статей из DjVu-словарей, энциклопедий и т.п. и последующего внедрения их в книгу в виде закладок DjVu или WinDjView (с позиционированием)..
может быть в будущем, когда описание сделаю..  

FR11 DjVu Text Layer Crutch

Программа для исправления текстового слоя в файле DjVu, созданного посредством ABBYY FineReader билд 11.0.102.583 и выше (в т.ч. ФР12)..
Выполняет следующие действия:
- удаляет блоки Char;
- создает зоны Line и Paragraph;
- объединяет две половинки слова, разделенного знаком переноса, в одно;
- позволяет переносить текстовый слой из одного файла в другой..
Описание
Скачать v0.3.1

DjVu Chunk Remover

Программа для удаления блоков (чанков), а также страниц из файлов формата DjVu.. может удалять фон (BG44, BGjp), закладки (NAVM), аннотации (ANTa, ANTz), текст (TXTa, TXTz), информацию о цвете маски(FG44, FGbz) и др.. запрещено удаление блоков INFO, Sjbz, Djbz и INCL, содержащих ссылки на Djbz-словари символов..
Описание
Скачать v0.5

DjVu Text Mover

Программа позволяет поворачивать и двигать текстовый слой в файлах DjVu..
Скачать v0.1

DjVu Title Maker

Программа для создания заголовков страниц (переименования страниц) в файлах DjVu..  
Таким образом, страницы можно называть "Обложка", I, II, III, IV и т.п., автоматически или вручную переименовывать страницы со сдвинутой нумерацией (в т.ч. при удалении пустых страниц) для соответствия нумерации электронной книги её бумажному оригиналу..
Описание
Скачать v0.1

DjVu Clean Page Inserter

Программа для быстрого создания и внедрения в книгу пустых страниц.. Нужна для восстановления соответствия бумажной и электронной нумерации, что облегчает навигацию по книге..
Описание
Скачать v0.1

DjVu Blits Merger

Программа для добавления на страницы djvu-книги графических изображений (mask-слоя) из другого djvu-файла.. Может применяться для добавления в книгу номеров страниц, колонтитулов, другой необходимой информации без перекодирования файла, а также для объединения графики с двух страниц, закодированных с разной степенью сжатия (например, aggressive и lossless)..
Описание
Скачать v0.1

DjVu Blits Hider

Программа для удаления со страниц djvu-книги графических изображений mask-слоя (blits).. может применяться для очистки страницы от "грязных пятен", лишних элементов маски и т.п. без перекодирования файла.. совместно с DjVu Blits Merger'ом позволяет редактировать mask-слой djvu-книги - Hider удаляет, а Merger вставляет на это место нужную графику..
Описание
Скачать v0.1.1

Все программы в одной папке


Программы, которых еще нет, но, возможно, когда-нибудь сделаю..


• аналог DjVu Hyperlinks Editor'у с бОльшим функционалом и предварительным просмотром..
программа для создания и внедрения в книгу пустых страниц.. DjVu Clean Page Inserter
программа для удаления страниц из книги.. DjVu Chunk Remover
программа для удаления пустых чанков, типа CIDa.. DjVu Chunk Remover
программа для добавления текста в нужное место на странице (+ к существующему) DjVuNMEditor
программа для удаления блитов со страницы DjVu Blits Hider
• программа для разделения разворотов на 2 страницы
программа для добавления новых блитов на существующую страницу (объединение графики с двух страниц на одну) DjVu Blits Merger
• программа для перемещения блитов на странице
• программа для кодирования ч/б растра без потерь одним или несколькими большими по размеру шейпами
• еще что-то хотел сделать.. но забыл.. вспомню - запишу))
 
если найдутся желающие сделать эти программы - добро пожаловать)) мыслями и наработками с удовольствием поделюсь)) это относится и к следующему блоку тоже..

Программы, которых нет, и я, к сожалению, наврядли осилю((..

визивиг-редактор текстового слоя.. DjVuNMEditor
• Hyperlinks-редактор, типа Document Express Editor, но с возможностью групповой правки гиперссылок..  
• полноценный визивиг редактор графики DjVu с возможностью удаления, сдвига, правки шейпов в маске.. а может быть и корректировки фона тоже..
WinDjView с поиском текста в закладках.. ну и некоторыми другими дополнительными возможностями.. таки осилил))
 

продолжение следует..

Всего записей: 1280 | Зарегистр. 26-07-2007 | Отправлено: 22:57 06-02-2012 | Исправлено: NME, 14:42 10-06-2021
AlexeiPetrov

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Как этот файл прикрепить? Или можно просто дать ссылку на него?

Всего записей: 5 | Зарегистр. 29-08-2021 | Отправлено: 19:50 29-08-2021
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ссылку.
только небольшой, не сотни мегов.

Всего записей: 1651 | Зарегистр. 15-07-2010 | Отправлено: 20:02 29-08-2021
AlexeiPetrov

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Вот, например - https://disk.yandex.ru/d/avV4GllDbdEblQ

Всего записей: 5 | Зарегистр. 29-08-2021 | Отправлено: 20:05 29-08-2021
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Занятно. Жаль, но я не спец в ФР. Пользуюсь восьмым и доволен.
Можно грохнуть этот символ в текстовом файле xml.
Но вроде бы это стандартный символ новой строки, судя по вики. Его, типа, все юникодовские проги игнорить должны при копипасте. И как правильно игнорить - фиг знает.

Всего записей: 1651 | Зарегистр. 15-07-2010 | Отправлено: 21:15 29-08-2021
los

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlexeiPetrov,
так лучше?
_https://workupload.com/file/zTwUBF7rsnd

Всего записей: 4891 | Зарегистр. 08-09-2001 | Отправлено: 21:31 29-08-2021
AlexeiPetrov

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los
Так, конечно, лучше. Но вот как его, этот дурацкий символ, убирать? И чтобы абзацы были вменяемые.

Всего записей: 5 | Зарегистр. 29-08-2021 | Отправлено: 21:38 29-08-2021
los

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlexeiPetrov,
я убирал в vim, но можно и с помощью других программ - sed и т.п.
попробуйте заменить этот символ на newline(\n) или на u+2029(paragraph separator) возможно получится лучше.

Всего записей: 4891 | Зарегистр. 08-09-2001 | Отправлено: 22:51 29-08-2021
AlexeiPetrov

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los
Для меня это темный лес.
Скачал Vim, а как им пользоваться, понять не могу.

Всего записей: 5 | Зарегистр. 29-08-2021 | Отправлено: 23:28 29-08-2021
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlexeiPetrov
у вас три пути
1. изменить выдачу из ФР. можете проконсультироваться в их поддержке
2. понять, какой программой можно извлечь ваш текст корректно
3. в имеющемся дежавю исправить текст, для чего экспортировать его в xml или txt (допустим, через djvutoy), затем умным текстовым редактором поправить символ (я пользовался notepad++), и вставить xml обратно. hex-редактором (winhex и т.п.), вероятно, это можно сделать прямо в djvu. Но я не пробовал так.
 
Но эти пути тут оффтоп. Так что гуглите инструкции.
 
И вообще-то дежавю не предназначен для экспорта текста, тем более красиво оформленного, ocr там встраивается для поиска нужного места.

Всего записей: 1651 | Зарегистр. 15-07-2010 | Отправлено: 04:19 30-08-2021
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlexeiPetrov
99,9% что текст сделан первыми версиями файнридера, позволяющими сохранять сразу в djvu - не помню, это 10ка или 11 билдом менее 11.0.102.583.. Тогда минимальная степень детализации была строка (LINE).. По хорошему, вердикт такому текстовому слою может быть один - перераспознание! Если перераспознать в 11.0.102.583 и выше (хоть до 15) с последующей обработкой DjVu Text Layer Crutch'ем, то будут и абзацы.. Если делать 8кой + DjVuOCR, то абзацев не будет - после каждой строки будет символ перевода строки 0x0A..
Либо ничего не делать, но тратить время чтобы из г сделать чуть лучшее г - имхо не целесообразно..

Всего записей: 1280 | Зарегистр. 26-07-2007 | Отправлено: 09:36 30-08-2021
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
 то будут и абзацы..

Я покопался xml-ке, только блоки LINE. Правда, конец абзаца можно вычислить по отсутствию LSEP в конце строки.
 
upd


Всего записей: 1651 | Зарегистр. 15-07-2010 | Отправлено: 13:13 30-08-2021 | Исправлено: TelecomUral, 13:17 30-08-2021
fozzie

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Страничка перераспознанная в соответствии с рекомендациями NME: https://disk.yandex.ru/d/cFUtmKTlOLPy6w

Всего записей: 59 | Зарегистр. 03-09-2001 | Отправлено: 22:56 30-08-2021
los

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Кто-нибудь пробовал? Работает? Как впечатление?
_https://github.com/trufanov-nok/tesseract2djvused

Всего записей: 4891 | Зарегистр. 08-09-2001 | Отправлено: 16:10 31-08-2021
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
los скомпилировал, попробовал.  tesseract2djvused просто транслирует hocr в dused формат и все.  Большого смысла в этой утилите, как самостоятельном продукте, на мой взгляд, нет, т.к. существует гораздо более продвинутая ocrdjvu.

Всего записей: 744 | Зарегистр. 14-12-2005 | Отправлено: 06:35 02-09-2021
corrector

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235
Можно поподробнее про ocrdjvu?

Всего записей: 210 | Зарегистр. 15-05-2006 | Отправлено: 12:11 03-09-2021
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
corrector
https://github.com/jwilk/ocrodjvu

Всего записей: 1651 | Зарегистр. 15-07-2010 | Отправлено: 12:35 03-09-2021
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
Вы нашли плохие буквы, а метода их исправить в готовом дежавю без перекодирования не существует. Всё равно расслаивать.

Существует на винде.. Blits Hider и Blits Merger в помощь..

Всего записей: 1280 | Зарегистр. 26-07-2007 | Отправлено: 09:10 21-09-2021
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME
да помню я про этот способ. Но уж больно трудоёмко. Вот если бы мышкой тягать... блит прихватил и по ПКМ в корзину, другой блит прихватил и наложил на неправильный.

Всего записей: 1651 | Зарегистр. 15-07-2010 | Отправлено: 10:57 21-09-2021
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Можно что-то типа Template Matching использовать для массовой замены на уже выровненных сканах, без сильных искажений (и да, без перекодирования маски не получится). Описание тут: https://docs.opencv.org/4.5.2/d4/dc6/tutorial_py_template_matching.html
Как пример, замена буквы "и"  на скане. В архиве исходник (страница из djvu), скрипт, образец, результат поиска с красными рамками, результат с заменой.
https://www.upload.ee/files/13491676/template.zip.html

Всего записей: 744 | Зарегистр. 14-12-2005 | Отправлено: 07:34 22-09-2021 | Исправлено: U235, 07:34 22-09-2021
TelecomUral

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

U235
за ссылочку спасибо, буду иметь ввиду.
 
 
оффтоп
 
Подробнее...

Всего записей: 1651 | Зарегистр. 15-07-2010 | Отправлено: 08:37 22-09-2021 | Исправлено: TelecomUral, 08:53 22-09-2021
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2020

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru