Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
gentle так называется, потому что выполняет не сильное (деликатное), сглаживание.
Для его использования не нужно включать опцию contour smooth

Всего записей: 4427 | Зарегистр. 09-09-2002 | Отправлено: 09:26 05-12-2020 | Исправлено: bolega, 10:32 05-12-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
D1D1D1D

Цитата:
Почему когда по CTRL или ALT во вкладке "C.Smooth", пытаюсь опцию "Gentle smooth" назначить всем страницам — этого не происходит?

Серьезный баг. Вместо gentle может скопироваться случайно выбранная опция
Для клонирования опции пользуйтесь контекстным меню этой опции.

Всего записей: 4427 | Зарегистр. 09-09-2002 | Отправлено: 21:22 11-12-2020
anion23

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Уважаемые специалисты-кромсаторы! Если у кого-то из вас найдется немного свободного времени, я был бы очень благодарен за помощь в подборе оптимальных настроек SK для обработки скана книги 30-х годов. Скан делал не я, поэтому возникли проблемы с качественной обработкой. Я сканирую в градациях серого с разрешением 600 dpi, и под свои сканы мне удалось нормально настроить SK для получения качественного результата (благодаря выложенным в шапке мануалам). Однако этот скан сделан цветным, с разрешением 300 dpi и пожат в jpg.
Возможно, вы сможете порекомендовать подходящие настройки, поскольку у меня не получается нащупать оптимальный режим обработки. Вот примеры страниц: https://anonfiles.com/zfLfm9ybp4/scan_zip

Всего записей: 394 | Зарегистр. 22-07-2010 | Отправлено: 20:32 12-12-2020
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
anion23
В вашем сообщении присутствуют два субъективных понятия: " оптимальный режим обработки" и "качественная обработка" - у каждого свои представления об этом.
Я бы остановился на понятии "приемлемая".
Для этого пометьте  в СК ваши три скана (слева внизу правая пиктограмма),поставьте на закладке Page в параметр Despeckle галку, на закладке Binarization для всех сканов Auto, на закладке Options параметр Despeckle=Fine и на закладке Files параметры DPI=600 и Color=B/W.
Если текст устраивает (а он будет приемлемым), занимаетесь далее резаками, автомарджином, дескью и т.п.

Всего записей: 6970 | Зарегистр. 14-01-2005 | Отправлено: 02:33 13-12-2020 | Исправлено: shch_vg, 03:03 13-12-2020
anion23

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
Спасибо за ответ! Я, помимо описанных вами настроек, еще лез в раздел Quality и игрался с настройками улучшателей изображения. Результат получался в основном такой: https://anonfiles.com/5a82wcy0p2/result_zip
Просто обработать сканы без настроек Quality не пробовал, спасибо за наводку.
А как бы вы обработали такой скан при условии, что нет возможности пересканировать нормально и хочется выжать максимум качества? Или в данном случае это невозможно?

Всего записей: 394 | Зарегистр. 22-07-2010 | Отправлено: 10:19 13-12-2020
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
anion23
Опять вопрос о субъективности.
Мне приходилось обрабатывать гораздо худшие сканы.
Эти же я считаю вполне приемлемыми для обработки, и приведенных мной параметров вполне достаточно, чтобы получить нормально читаемый вариант.
Какие-то дальнейшие улучшения это чисто по вкусу обработчика.

Всего записей: 6970 | Зарегистр. 14-01-2005 | Отправлено: 21:41 13-12-2020 | Исправлено: shch_vg, 21:42 13-12-2020
anion23

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
Ясно, спасибо!

Всего записей: 394 | Зарегистр. 22-07-2010 | Отправлено: 23:44 13-12-2020
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Прошлый раз я писал о том, что если есть ячейка буквы, и в ней опознаны спеклы заданного размера, то можно эту ячейку подсовывать пользователю и и предлагать на замену букву, которой сделан OCR в ячейке.
 
Сейчас вожусь с разрушенными буквами, и меня осенило, что это тоже можно автоматизировать.  
 
"Разрушенная буква" - это такая буква, часть которой не пропечаталась. Т.е. это не оторванный спекл, а как бы понадкусанная буква или буква с проплешинами.  
Что можно сделать:
 
а) есть ячейка и распознанная буква в ней.
 
 
б) рассчитать некий коэффициент полноты, то есть:  
 
Х = число пикселей в ячейке/число пикселей сопоставленного это букве глифа.
 
и если он вышел за заданный пользователем порог, то подсовывать ему эту ячейку для обработки и контролируемой замены глифа, предлагая ему это глиф.  
 
 
в) часто я правлю такие глифы не путем замены на идеальный, а путем вклеивания более тонкого глифа в режиме транспарентности белого. Так буквы получаются естественнее.  (Толщина и плотность букв на станицах могут гулять. И мой "идеальный" может смотреться где-то тонковато, а где-то толстовато. ). Соответственно при режиме автоподсказки по глифам (который когда-нибудь, возможно, появится) хорошо бы дать опцию перевода всей работы в режим транспарентности.
Возможно, дать два набора букв. Один для расчета коэфф. Другой для замены.  
(с разных закладок/страниц библиотеки глифов их брать)

Всего записей: 1017 | Зарегистр. 13-06-2013 | Отправлено: 16:29 19-12-2020 | Исправлено: daa2013, 16:45 19-12-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Что-то не получается у меня использовать кнопку визарда дежавю "Create result djvu".  
Дочистил мусор на чб странице (в основном задании), пересобрал step2. По времени создания смотрю - да, он новенький. Жму вышеуказанную кнопку - а она мне подсовывает старый файл.
Прикольнее всего, что даже если я меняю имя файла, то он генерируется со старой датой

Всего записей: 3044 | Зарегистр. 15-07-2010 | Отправлено: 07:45 26-12-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
А step1 и step3 отсутствуют?

Всего записей: 4427 | Зарегистр. 09-09-2002 | Отправлено: 10:54 26-12-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
в обработке два скана, оба на step3 приписаны. Файл step3 конечно есть.
 
 
Добавлено:
bolega
И большое спасибо за инструмент Soft brush. Я наконец добрался его опробовать - мне понравилось. Края рисунка слегка размываются, и вид более приятный глазу.

Всего записей: 3044 | Зарегистр. 15-07-2010 | Отправлено: 11:45 26-12-2020
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Файл step3 конечно есть.  

Если переделали step2, то переделка step3 обязательна. При наличии step3 в result берется именно он, т.к. step3=step2+зоны, т.е. это следующая стадия
Напомню, что кодируется на
STEP2: ч/б страница + ч/б зоны (раскрашенные, а также special с опцией separate b/w-coding). При этом раскрашенные bw кодируются, но пока не раскрашиваются. И они кодируются вместе со страницей, т.е. с использованием общего словаря. Special separate b/w-coding кодируются раздельно от страницы и затем полученный чанк встраивается в чанк страницы.
STEP3: цветные зоны (МПФ) целиком, few-color-зоны целиком (losseless), а также добавляется цвет для раскрашенных bw зон. Входным файлом для step3 является файл step2.djvu.
Result djvu = step3.djvu+вклейка на свои места страниц из step1.djvu и step4.djvu

Всего записей: 4427 | Зарегистр. 09-09-2002 | Отправлено: 12:28 26-12-2020 | Исправлено: bolega, 12:39 26-12-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
аа

Всего записей: 3044 | Зарегистр. 15-07-2010 | Отправлено: 13:16 26-12-2020
DmitryKz

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите, ошибка это в SK или я что-то не так делаю:
Picture-зона BW, 600dpi, задан цвет фона. Создаю на ней рамку с помощью Draw frame, внешнюю белую область выделяю и делаю White transparent. Таким образом, содержимое рамки окрашено в какой-либо цвет.
Финализирую, затем out-task и генерируется pdf-файл.
При импорте такого pdf-файла в FR, страница, на которой имеется созданная вышеописанным способом рамка, не открывается и не обрабатывается — в области ее просмотра FR пишет:
"Image size exceeds limits (32512 x 32512)"
 
Задание: https://yadi.sk/d/cmCfrA2DP_jPAw

Всего записей: 3142 | Зарегистр. 29-09-2005 | Отправлено: 12:45 27-12-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DmitryKz
В ФР8 открылось и распозналось.

Всего записей: 3044 | Зарегистр. 15-07-2010 | Отправлено: 15:36 27-12-2020
DmitryKz

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В ФР8 открылось и распозналось.

С FR8 могу подтвердить, что открывается.
Но я пользуюсь FR14 (лицензия) и там вот такая бяка (в FR15 вроде также, но наверняка не скажу — под рукой сейчас FR15 нету).

Всего записей: 3142 | Зарегистр. 29-09-2005 | Отправлено: 15:49 27-12-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DmitryKz
Тю. Зачем тогда тут спрашивать, пошлите в абби, в поддержку.

Всего записей: 3044 | Зарегистр. 15-07-2010 | Отправлено: 16:22 27-12-2020
DmitryKz

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Здрасте
Если программа пишет, что размеры изображения в файле, полученном из СК, превышают лимит, значит она видит его таким по каким-то причинам. Т.е. не исключено, что СК не добавляет информацию о размерах изображения, и FR берет, скажем, произвольно какие-то максимальные значения — это может быть следствием изменения алгоритма парсинга pdf, ужесточением проверок корректности файла.
Я же не о любом файле, загружаемом в FR спрашиваю — а о файле, полученном из СК.
А здесь только автор СК может внести ясность, а никак не вы.

Всего записей: 3142 | Зарегистр. 29-09-2005 | Отправлено: 16:29 27-12-2020 | Исправлено: DmitryKz, 16:30 27-12-2020
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
DmitryKz
Именно что здрасьте. восьмерка-то берет pdf.  Ни один вьювер из четырех, что я использую, также не ругается на ваш файл.
 
Итого разница не внутри СК, а внутри алгоритма ФР. К кому вопросы, как не к разрабам ФР. Один и тот же файл два алгоритма, писанных одной командой, разбирают по разному. Вопрос к алгоритмам или к файлу - ? Ну не однозначно ли к алгоритмам? А вы спрашиваете bolega - "а подстроились ли вы под алгоритмы нового ФР?" Вы ещё потребуйте соответствующего тестирования от него
 
Я не защищаю bolega, моя цель - спрямить вам дорогу к правде.
 
upd
вот если бы вы сначала послали файл в абби, получили от них ответ " ваш pdf некорректен в таком-то месте" и написали тут "bolega, поправьте генерацию pdf, у вас ошибка потому-то и потому-то". Тогда другое дело.

Всего записей: 3044 | Зарегистр. 15-07-2010 | Отправлено: 17:23 27-12-2020 | Исправлено: TelecomUral, 17:32 27-12-2020
DmitryKz

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А вы спрашиваете bolega - "а подстроились ли вы под алгоритмы нового ФР?"

Ну вот давайте вы все же не будете додумывать о чем я спрашиваю.
Мой вопрос был прост: "ошибка это в SK или я что-то не так делаю". Иными словами я вовсе не исключаю, что дело не в СК и тем более не прошу его автора что-либо сделать или починить.
 
Логические рассуждения ваши могут также быть однобокими, как и мои.
Я в свою очередь исхожу из того, что все файлы, созданные СК, ФР открывает вполне себе успешно. Но на страницах, где был применен White transparent, происходит упомянутая выше ошибка — и это единственная ошибка, с которой я столкнулся, работая со сгенерированными СК пдфками.
 
Поэтому я вполне могу посчитать, что СК тут отработал некорректно.
И поскольку оба варианта могут быть — ошибка в СК, или в ФР — таким и был мой вопрос. С этой позиции, как мне думается, неважно, кого спрашивать первым: автора СК или поддержку ФР. Потому что, уверен, если bolega будет несложно ответить — он вполне может это сделать и даст более устраивающий меня ответ, будучи автором СК.
 
В общем, я вполне допускаю, что вы правы — но дождусь ответа bolega, ежели таковой последует.

Всего записей: 3142 | Зарегистр. 29-09-2005 | Отправлено: 17:47 27-12-2020
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru