Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

Открыть новую тему     Написать ответ в эту тему

NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

DjVu Nano Mega Editor
(DjVuNMEditor)

Программа для редактирования в DjVu-книгах:
1) текстового слоя;
2) аннотаций; в текущей версии не реализовано
3) закладок (bookmarks, outline); в текущей версии не реализовано
4) метаданных; в текущей версии не реализовано
5) еще чего-то?
Описание
Скачать v1.1

TurnTheText

Утилита TurnTheText предназначена для устранения несоответствия графического и текстового слоев в DjVu-книгах, возникающего при использовании FineReader версии 8 (и ниже) для распознавания текста..
Может быть использована, например, перед внедрением оглавления в DjVu-книгу с помощью программы DjVu Hyperlinks Editor..
Описание
Скачать v1.1

DjVu Annotations Editor

Программа для редактирования гиперссылок (annotations/hyperlinks) в файлах формата djvu, преимущественно, после создания оглавлений в книге при помощи DjVu Hyperlinks Editor'а..
Выполняет сдвиг, выравнивание, изменение размеров, цвета, свойств и др..
Описание
Скачать v0.2

HeadWorder

Программа для полуавтоматического извлечения заголовков словарных статей из DjVu-словарей, энциклопедий и т.п. и последующего внедрения их в книгу в виде закладок DjVu или WinDjView (с позиционированием)..
может быть в будущем, когда описание сделаю..  

FR11 DjVu Text Layer Crutch

Программа для исправления текстового слоя в файле DjVu, созданного посредством ABBYY FineReader билд 11.0.102.583 и выше (в т.ч. ФР12)..
Выполняет следующие действия:
- удаляет блоки Char;
- создает зоны Line и Paragraph;
- объединяет две половинки слова, разделенного знаком переноса, в одно;
- позволяет переносить текстовый слой из одного файла в другой..
Описание
Скачать v0.3.1

DjVu Chunk Remover

Программа для удаления блоков (чанков), а также страниц из файлов формата DjVu.. может удалять фон (BG44, BGjp), закладки (NAVM), аннотации (ANTa, ANTz), текст (TXTa, TXTz), информацию о цвете маски(FG44, FGbz) и др.. запрещено удаление блоков INFO, Sjbz, Djbz и INCL, содержащих ссылки на Djbz-словари символов..
Описание
Скачать v0.5

DjVu Text Mover

Программа позволяет поворачивать и двигать текстовый слой в файлах DjVu..
Скачать v0.1

DjVu Title Maker

Программа для создания заголовков страниц (переименования страниц) в файлах DjVu..  
Таким образом, страницы можно называть "Обложка", I, II, III, IV и т.п., автоматически или вручную переименовывать страницы со сдвинутой нумерацией (в т.ч. при удалении пустых страниц) для соответствия нумерации электронной книги её бумажному оригиналу..
Описание
Скачать v0.1

DjVu Clean Page Inserter

Программа для быстрого создания и внедрения в книгу пустых страниц.. Нужна для восстановления соответствия бумажной и электронной нумерации, что облегчает навигацию по книге..
Описание
Скачать v0.1

DjVu Blits Merger

Программа для добавления на страницы djvu-книги графических изображений (mask-слоя) из другого djvu-файла.. Может применяться для добавления в книгу номеров страниц, колонтитулов, другой необходимой информации без перекодирования файла, а также для объединения графики с двух страниц, закодированных с разной степенью сжатия (например, aggressive и lossless)..
Описание
Скачать v0.1

DjVu Blits Hider

Программа для удаления со страниц djvu-книги графических изображений mask-слоя (blits).. может применяться для очистки страницы от "грязных пятен", лишних элементов маски и т.п. без перекодирования файла.. совместно с DjVu Blits Merger'ом позволяет редактировать mask-слой djvu-книги - Hider удаляет, а Merger вставляет на это место нужную графику..
Описание
Скачать v0.1.1

Все программы в одной папке


Программы, которых еще нет, но, возможно, когда-нибудь сделаю..


• аналог DjVu Hyperlinks Editor'у с бОльшим функционалом и предварительным просмотром..
программа для создания и внедрения в книгу пустых страниц.. DjVu Clean Page Inserter
программа для удаления страниц из книги.. DjVu Chunk Remover
программа для удаления пустых чанков, типа CIDa.. DjVu Chunk Remover
программа для добавления текста в нужное место на странице (+ к существующему) DjVuNMEditor
программа для удаления блитов со страницы DjVu Blits Hider
• программа для разделения разворотов на 2 страницы
программа для добавления новых блитов на существующую страницу (объединение графики с двух страниц на одну) DjVu Blits Merger
• программа для перемещения блитов на странице
• программа для кодирования ч/б растра без потерь одним или несколькими большими по размеру шейпами
• еще что-то хотел сделать.. но забыл.. вспомню - запишу))
 
если найдутся желающие сделать эти программы - добро пожаловать)) мыслями и наработками с удовольствием поделюсь)) это относится и к следующему блоку тоже..

Программы, которых нет, и я, к сожалению, наврядли осилю((..

визивиг-редактор текстового слоя.. DjVuNMEditor
• Hyperlinks-редактор, типа Document Express Editor, но с возможностью групповой правки гиперссылок..  
• полноценный визивиг редактор графики DjVu с возможностью удаления, сдвига, правки шейпов в маске.. а может быть и корректировки фона тоже..
WinDjView с поиском текста в закладках.. ну и некоторыми другими дополнительными возможностями.. таки осилил))
 

продолжение следует..

Всего записей: 1276 | Зарегистр. 26-07-2007 | Отправлено: 22:57 06-02-2012 | Исправлено: NME, 14:42 10-06-2021
amaid



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
потому что там цифры вместо "¬" и "-"

Всего записей: 546 | Зарегистр. 25-01-2006 | Отправлено: 08:16 17-01-2015
hogu77

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amaid
Вы в чём правите? Если надо слить слова, между кусками которых находиться мягкий перенос то я использую регулярные выражения, а просто заменить один символ на другой, и правда, можно в каждом текстовом редакторе.
 
P.S. Покажите кусок текста, если возможно.

Всего записей: 118 | Зарегистр. 14-02-2012 | Отправлено: 16:52 17-01-2015 | Исправлено: hogu77, 16:55 17-01-2015
rooleg



BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
последняя версия проги стабильно работает? не глюкавая?
никто ничего случайно не заметел?

Всего записей: 140 | Зарегистр. 26-03-2006 | Отправлено: 18:17 17-01-2015
amaid



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hogu77
взгляните внутрь и вы поймёте, что дело обстоит не так просто
https://yadi.sk/d/Dbg8Mdkye36J8
djvu и вытянутый из него текст

Всего записей: 546 | Зарегистр. 25-01-2006 | Отправлено: 23:42 17-01-2015
hogu77

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amaid

Цитата:
люди грамотные, подскажите, можно ли в блокноте заменить "¬" на "-" в извлеченном из djvu текстовом слое?


Цитата:
взгляните внутрь и вы поймёте, что дело обстоит не так просто

 
http://rghost.ru/60425445
Я вас правильно понял?

Всего записей: 118 | Зарегистр. 14-02-2012 | Отправлено: 20:23 18-01-2015
amaid



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
вопрос только в том, удастся ли после таких конвертаций внедрить полученный текст в djvu.
как-то я сомневаюсь
и еще вопрос: откуда взялся файл _original?

Всего записей: 546 | Зарегистр. 25-01-2006 | Отправлено: 23:52 18-01-2015
hogu77

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amaid

Цитата:
<...> откуда взялся файл _original?

Файл - экспорт текста; в WinDjView Extendet. Обычный текстовый слой.

Цитата:
вопрос только в том, удастся ли после таких конвертаций внедрить полученный текст в djvu.  как-то я сомневаюсь

Не удастся, я думал вы текст для "читалки" готовите.

Всего записей: 118 | Зарегистр. 14-02-2012 | Отправлено: 08:19 19-01-2015 | Исправлено: hogu77, 08:20 19-01-2015
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amaid

Цитата:
потому что там цифры вместо "¬" и "-"

1) цифры только вместо  "¬"..
это насколько я помню восьмеричное представление utf8 символов.. символ "¬" = 0хАС = /254.. т.о. замена /254" на -" подойдет.. обращаю внимание, что после /254 и - при замене надо ставить кавычку, иначе испортятся символы мягкого знака, записываемые как D0 AC = /320/254..
здесь символ "¬" представлен двумя байтами С2 АС,  соответственно менять надо /302/254 на -..
2) чтобы отображались нормальные символы, а не цифры, давно уже предусмотрен ключик "-u" в новых djvused.. предполагаю, что для извлечения скорее всего используется djvuocr, но в нем использование данного ключа не предусмотрено..
3) текстовый слой данной книги сделан в фр<11.0.102.583 - деление только построчное - в топку.. имхо либо перераспознать (рекомендуется), либо вообще удалить..

Всего записей: 1276 | Зарегистр. 26-07-2007 | Отправлено: 10:13 20-01-2015 | Исправлено: NME, 10:55 20-01-2015
amaid



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
спасибо за разъяснения!
обычно я такие файлы перераспознаю, но тут целая серия, десятки книжек - подумал, может, удастся как-то исхитриться.

Всего записей: 546 | Зарегистр. 25-01-2006 | Отправлено: 14:08 20-01-2015
amaid



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
повозился - замена работает, но... в общем, придется перераспознавать

Всего записей: 546 | Зарегистр. 25-01-2006 | Отправлено: 16:30 20-01-2015
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
NME 10:24 09-10-2014
кстати, на днях таки должен доделать DjVuCleanPageInserter, чтобы была возможность удобного восстановления того, что удалили или недосканировали отдельные граждане.. там осталось только сделать автоматическую вставку страниц в книги с заголовками страниц (title), если какие-то номера пропущены..  

пришлось подзабить на несколько месяцев, но таки доделал..
Описание
Скачать

Всего записей: 1276 | Зарегистр. 26-07-2007 | Отправлено: 16:47 23-01-2015
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Доработал (вернее, полностью переделал) утилиту TurnTheText, актуальная версия 1.0..
Описание
Основное отличие - полностью автоматическое определение необходимого направления и угла поворота текстового слоя.. Также теперь отсутствует необходимость использования сторонних утилит DjVuToy и djvused, программа берет всю необходимую информацию из слоя Sjbz.. Ну и еще некоторые изменения, полное описание есть в шапке..
В общем, программа получилась именно такой, какой я ее изначально задумывал, но не мог ранее реализовать - удобная, простая, практически "однокнопочная")).. Тем, кто пользуется старой версией, советую обновиться..

Всего записей: 1276 | Зарегистр. 26-07-2007 | Отправлено: 13:50 24-03-2015 | Исправлено: NME, 16:05 16-05-2021
AlexeiKozlov

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
подскажите, вот есть djvu +ocr слой.
хочу выдернуть текст + сохранение параграфов как самое оптимальное.
причина в том, что сканированный текст не удобно читать, плохие начертания букв.

Всего записей: 1984 | Зарегистр. 16-10-2004 | Отправлено: 00:43 03-07-2015
GF777

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
AlexeiKozlov
 
DjvuToy. Раздел "Hidden text".  
Правда с сохранением параграфов придётся повозиться.

Всего записей: 150 | Зарегистр. 10-07-2003 | Отправлено: 07:52 03-07-2015
AlexeiKozlov

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ну да утилитка чисто тех ническая.
 
тогда finereader все и так умеет делать.
я запустил этот djvu в нем, он все распознал как и в этом ocr слое, думаю он его и считал. также он сохранил форматирование.
сейчас тогда пробегу исправлю ошибки ocr слоя и все с этим делом.
 

Всего записей: 1984 | Зарегистр. 16-10-2004 | Отправлено: 09:50 03-07-2015
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А можно ли в DjVu Annotations Editor  
добавить такое.
Чтобы он ссылки на страницы N с определенным дипазоном номеров заменял на N+x
 
Объясняю.  
есть джву такой структуры  страницы с нумерацией, вставка, нумерауия, вставка, нумерация. И когда делаются гиперлинки смещение надо делать несколько раз. на разное число страниц в этих вставках. А в имеющихся прогах везде только один.  
 
То есть грубо говоря после гиперлинк эдитора нужно так
Если ссылка ведет на страницы с 800 п 900 заменить её на 800+x  ... 900+x

Всего записей: 683 | Зарегистр. 13-06-2013 | Отправлено: 06:06 25-07-2015
ptichkaXFC

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Попробовал FR11 DjVu Text Layer Crutch v0.3. Прога нужная, но имеется недостаток - она добавляет дополнительные пробелы перед/после знаков препинания. Может это я что-то не так делаю?  

Всего записей: 5 | Зарегистр. 24-01-2013 | Отправлено: 22:44 26-07-2015
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
А можно ли в DjVu Annotations Editor   добавить такое.

 
не хочется мне трогать эту программу.. она очень старая - это вообще моя первая публичная утилита.. если что-то начать там переделывать, то по-хорошему переписывать её надо целиком..  
 
а для решения поставленной задачи можно написать простейшую программку, которая в извлеченном djvused'ом текстовом файле поменяет одну цифру на другую.. вопрос в том, насколько это нужно, и, может быть, проще потратить 10-20 минут и вручную поменять все эти страницы, чем тратить 30-60 минут на написание программы?
 
Добавлено:
ptichkaXFC
нужны примеры исходного файла и неудовлетворительного результата..

Всего записей: 1276 | Зарегистр. 26-07-2007 | Отправлено: 23:17 26-07-2015
ptichkaXFC

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Исходный  текст:  
Стр. 473. …я невольно вспомнил Эзопову корзину с хлебом… — Сущест¬
вует предание, что раб Эзоп, легендарный древнегреческий баснописец, от¬
правляясь в дорогу вместе с другими рабами, предпочел взвалить себе
на плечи тяжелый груз — большую корзину с хлебом. Зато к месту на¬
значения он пришел с пустой корзиной, тогда как у остальных поклажа
осталась прежней.
Исправленный:
Стр. 473.  …я невольно вспомнил Эзопову корзину с хлебом…  — Существует предание, что раб Эзоп, легендарный древнегреческий баснописец, отправляясь в дорогу вместе с другими рабами, предпочел взвалить себе на плечи тяжелый груз — большую корзину с хлебом. Зато к месту назначения он пришел с пустой корзиной, тогда как у остальных поклажа осталась прежней.  
 
Лишние пробелы появляются практически на каждой странице в 1-2 местах.

Всего записей: 5 | Зарегистр. 24-01-2013 | Отправлено: 23:42 26-07-2015 | Исправлено: ptichkaXFC, 11:39 27-07-2015
ptichkaXFC

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Создал новый файл только из двух страниц - проблема исчезла, доп. пробелы отсутствуют. Ранее я обрабатывал файл из 600 страниц. Имеется ограничение по объему файла? Что посоветуете?

Всего записей: 5 | Зарегистр. 24-01-2013 | Отправлено: 11:44 27-07-2015
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

Компьютерный форум Ru.Board » Компьютеры » Программы » Утилиты для DjVu: DjVuNMEditor, FR11 DTL Crutch и др.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2020

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru