Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
 
А прикрутить поддержку пакетов FR можно?
Чёрно-белые тифы пакетов находятся в папках с номерами файлов и имеют название bwpage.frdat.  
Файл открывается любым редактором путём переименования в .tif.
 
Сохраняться такие файлы должны с исходным именем и бэкапом исходного файла.
 
 
Структура пакета последних версий ФР делает очень неудобной работу с графическими файлами пакета вовне.
 
Отсутствие залочки блоков от перераспознавания и функции автоматического перераспознавания исправленных блоков делает менее проблемным исправление оригинала картинки (запечатка дефектов, например), нежели текста в блоке. Тем более что на такие дефекты в SK часто не обращаешь внимание.
Про убогость встроенного редактора изображений ФР я даже говорить не буду.
 
Да и при исправлении изображения в SK, а не в ФР не приведёт к утрате расставленных блоков на странице.
 
Кроме того из ФР можно исправлять искажение строк, которое в 15 версии стало гораздо лучше, чем в предыдущих версиях.

Всего записей: 3673 | Зарегистр. 17-09-2001 | Отправлено: 13:28 16-04-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Чищу с глифами в 6.71 в режиме подсветки спеклов с отключенной по OCR подсветкой знаков препинания.  (Если это может играть роль). Удобная штучка на самом деле.
Вставка глифа (пасте) у меня подвязана на хоткей Ctrl+Q.
Сравниваю с 6.61  (правда, без OCR-подсветки. там не так, и по моей моторной памяти раньше тоже было не так).
Включено автопозиционирование.
 
Итак, суть проблемы.
 
Раньше:
пасте глиф (встал точно) - пошевелил мышь - снова пасте тот же глиф (снова встал точно)
 
Теперь:
пасте глиф (встал точно) - пошевелил мышь - снова пасте тот же глиф (встал неточно, сдвинулся вслед за мышью)
 
автопозиционирование теперь включается только после дополнительного клика по картинке
 

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 11:11 19-04-2021 | Исправлено: daa2013, 11:32 19-04-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В новой версии 6.71 так и задумано, это не баг и не проблема.
Проблема скорее у пользователя, который хочет дважды вставить один и тот же глиф в одно и тоже место.

Всего записей: 4431 | Зарегистр. 09-09-2002 | Отправлено: 14:30 19-04-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Нет, это проблема, причем серьезная. Потому что раньше, если курсор был в неудачной для автопозиционирования точке, вставку (хоткеем Ctrl+Q) можно было (хоткеем Ctrl+Z) отменить, пошевелить мышку и вставить снова, чтобы глиф встал правильно.  
Теперь же вместо того, чтобы встать правильно, он просто смещается относительно предыдущего неправильного положения и встаёт еще хуже. А каждый раз лишний клик делать - не накликаешься.  (Видимо, только если предварительно наклюкаешься ... )
 
Раз так было "задумано", то добавьте в преференсез для глифов чекбокс, который возвращает предыдущее поведение.

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 19:48 19-04-2021 | Исправлено: daa2013, 20:15 19-04-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Опечатка в сообщении после обработки:
 
finilized   вместо  finalized

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 04:48 18-05-2021
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Здравствуйте. Как обработать такой случай — текст на картинке? — https://disk.yandex.ru/i/rFsELGmtHFdtwA

Всего записей: 1367 | Зарегистр. 05-04-2010 | Отправлено: 18:20 20-05-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
D1D1D1D
непонятно, чего вы хотите в итоге.  
 
Такие картинки - как полноцветные журналы, в jpeg и точка. А если пытаться выделить черный текст в передний слой, то перепада яркости кое-где не хватит для отделения от фона. Ну, можно маленькими зонами попробовать это победить, разными порогами для разной бледности текста. Только смысла мало, ибо трудоёмко. Проще уж перевёрстку страницы сделать.

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 04:20 21-05-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я бы отделял текст путем кодирования джву и выдергивания из него маски.
Потом ее почистить с глифами надо  и поверх исходника наложить.  
 
 
https://disk.yandex.ru/d/CUdBULC9rQShAA

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 06:25 21-05-2021
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Хотелось бы быстро и красиво обработать множество страниц. Вдохновляюсь вот этим роликом — https://youtu.be/HbW8MPPzdEo Используемым там фильтром неплохо получается выделить и текст и изо.
 
daa2013
Интересно. В сочетании с методом выше наверно и все буквы получилось бы вытащить на передний план точнее. Можно подсказку, как и чем вы выполняли эти действия? Кодирование — это наверно "DjVu Small". А чем потом извлекать маску и накладывать поверх исходника?

Всего записей: 1367 | Зарегистр. 05-04-2010 | Отправлено: 14:41 21-05-2021 | Исправлено: D1D1D1D, 14:42 21-05-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп
 
D1D1D1D
Насчет вытаскивания букв. Я напомню, что в последних версиях DSM появился редактор зон. Вроде бы его задумка в том, чтобы вручную уточнять сегментеру, какие куски картинки обязательно отправлять в передний слой. В данном случае такая фича может помочь - у daa2013 далеко не все буквы пошли в маску.

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 14:52 21-05-2021 | Исправлено: TelecomUral, 14:53 21-05-2021
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
В итоге вот так получилось по методу из ролика —  
 
DJVU — https://disk.yandex.ru/d/dUy9CIh56HToww
PDF   — https://disk.yandex.ru/d/YejceRSi9ahQAQ
 
Произведена обработка фильтром с уменьшением в 300dpi (чтобы розетки уменьшить), а потом Topaz Denoise. Как, по-Вашему?

Всего записей: 1367 | Зарегистр. 05-04-2010 | Отправлено: 15:16 21-05-2021 | Исправлено: D1D1D1D, 15:34 21-05-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
D1D1D1D

Цитата:
Как, по-Вашему?

главное, чтоб вам нравилось
 
Ну а мне сильно не нравится - забеленные места появились, как передержка при проявлении. Оригинальный скан много приятнее, цвета "правильнее", соотносятся хоть между собой гармонично. И вас ведь про конкретику спрашивал - чего ж вы-то хотите от обработки. Тема про СК. А занимаемся "внешним видом".

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 15:35 21-05-2021
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
В данном случае такая фича может помочь - у daa2013 далеко не все буквы пошли в маску.

Поэтому предполагаю, что если сначала произвести обработку как предложено в ролике, а потом извлекать маску, она точнее извлечется, так как буквы уже будут хорошо выделены.
 
 
Добавлено:
TelecomUral
Насчёт забеленного согласен, но если как метод рассматривать, в отношении простоты и скорости — он лучше других?

Всего записей: 1367 | Зарегистр. 05-04-2010 | Отправлено: 15:37 21-05-2021 | Исправлено: D1D1D1D, 15:41 21-05-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Кодирование и вытаскивание - Document Express (Enterprise).  
Хотя, как уже тут в ветке обсуждали, разбирать можно DjvuLibre.  
Для сборки задников и масок я использую FSD, но можно и DjvuSmallMod.
 
"Не все буквы пошли в маску". Должно делаться глифирование . Тогда они и вставятся.  
Не захватился всего с десяток букв. На такую страницу - это мелочь.  
 
ЗЫ
По- любому проще букву как глиф вставить, чем ее в зону захватывать, что в СК, что в DSM.
 

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 16:19 21-05-2021 | Исправлено: daa2013, 16:22 21-05-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
оффтоп
 
D1D1D1D

Цитата:
в отношении простоты и скорости — он лучше других?

есть такая штука "проектный треугольник"... и проигрываете вы в качестве.

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 20:08 21-05-2021
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Для качества надо разделить по слоям? Я и хочу так, предварительно обрабатывая в фотошопе,  чтобы более контрастный текст лучше извлекался. Написал daa2013, так как пока не понятна последовательность, где и в которой надо обрабатывать.

Всего записей: 1367 | Зарегистр. 05-04-2010 | Отправлено: 20:31 21-05-2021 | Исправлено: D1D1D1D, 20:32 21-05-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
опять оффтоп. Всё стараюсь это прекратить, но вы не реагируете.
 
D1D1D1D

Цитата:
Для качества надо разделить по слоям?

я про другое. Книга служит некой цели коммуникации. Что-то передать от автора читателю - образы, знание, смысл, "кусок" культуры. Качество как термин обозначает коэффициент при передаче.
Поэтому "для качества..." надо вам понять, что вы передаете. Чтобы вычислить коэффициент.
 
 
Добавлено:
daa2013

Цитата:
Не захватился всего с десяток букв

Восемьдесят семь штук
https://disk.yandex.ru/i/zWLczVunTnq6GA

Всего записей: 3047 | Зарегистр. 15-07-2010 | Отправлено: 03:30 22-05-2021
hydrochaeris

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Как связаться с автором ScanKromsator для коммерческого предложения? (В смысле, я хочу предложить автору денег, а не наоборот.) Электронный адрес bolega@hotmail.ru, который везде указан, уже лет сорок не работает, а личное сообщение пользователю bolega через этот форум не удаётся отправить. Мне пишут: «вам запрещено отправлять сообщения, если вы считаете это ошибкой, обратитесь к администратору». Я обращаюсь по почте на support@ru-board.com, а там, естественно, никто никогда не отвечает. В общем, как связаться с автором?

Всего записей: 1 | Зарегистр. 29-05-2021 | Отправлено: 14:50 31-05-2021 | Исправлено: hydrochaeris, 14:51 31-05-2021
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
hydrochaeris
Страшное дело - вы 40 лет не можете связаться с автором СК.
Считайте, что уже связались, захочет - выйдет на связь.

Всего записей: 6970 | Зарегистр. 14-01-2005 | Отправлено: 15:12 31-05-2021
trion1

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hydrochaeris
В ПМ для нубов немного ограничено:
http://forum.ru-board.com/topic.cgi?forum=13&topic=2383&start=1160#20

Всего записей: 1984 | Зарегистр. 15-03-2006 | Отправлено: 15:16 31-05-2021
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru