Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
niccolo

Цитата:
За один проход, я так понимаю, нельзя

Теоретически можно, если под одним проходом Вы понимаете обработку всех сканов на автомате, но для этого нужно произвести определенную настройку.
Более того в этом случае еще можно подключить в этот проход выравнивание страницы по вертикали.

Всего записей: 7130 | Зарегистр. 14-01-2005 | Отправлено: 18:53 22-03-2021 | Исправлено: shch_vg, 18:56 22-03-2021
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
За идеи спасибо
 
Пошёл немного иначе - повернул всё на 90 вовне, а затем просто половину на 180.
 
Bolega - по ссылке и есть «красные» сканы, о которых я когда-то говорил....

Всего записей: 3713 | Зарегистр. 17-09-2001 | Отправлено: 21:15 22-03-2021
anion23

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Хотел узнать, так задумано или баг... Если так было задумано, то заранее прошу извинить за оффтоп.
Ситуация такая: в окне результата если активировать режим "Highlight speckles" и в режиме mouse-up-despeckle-mode выделить только часть подсвеченного красным спекла, то происходит удаление (обрезка) этой части как-будто в режиме mouse-up-clear-mode. Если выделять часть серого символа, то выделение в режиме mouse-up-despeckle-mode срабатывает штатно (ничего не обрезает). Версия последняя 6.71.

Всего записей: 394 | Зарегистр. 22-07-2010 | Отправлено: 13:29 30-03-2021 | Исправлено: anion23, 13:29 30-03-2021
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Странное действие команды Import.
Делаю импорт одной страницы из пдф, она импортируется и появляется в главном окне.
Выполняю команду Result->Show source files и в RV окне получаю пустую страницу, а внизу в информационной строке стоит имя только что загруженной страницы.
Что не так?

Всего записей: 7130 | Зарегистр. 14-01-2005 | Отправлено: 14:38 30-03-2021 | Исправлено: shch_vg, 14:39 30-03-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
anion23

Цитата:
Хотел узнать, так задумано или баг... Если так было задумано, то заранее прошу извинить за оффтоп

Так и задумано. В режиме подсветки удаляет просто красные пиксели. В обычном режиме СК на лету ищет спеклы в области выделения. В режиме подсветки по-другому: сперва ищет спеклы по всей странице, а потом просто удаляет красное уже ничего не ища.
Кстати у подсветки есть и другой режим: не удаления, а замены красного на черное (серое). Иногда так бывает нужнее, т.е. убрать из выделения ложные спеклы, а затем избавиться от всего оставшегося красного одним нажатием "D". Правда в этом режиме undo не работает по отношению к убранному красному...
 
shch_vg

Цитата:
получаю пустую страницу

Может все ушло в зоны? Не пробовали переключиться в режим просмотра зон?

Всего записей: 4538 | Зарегистр. 09-09-2002 | Отправлено: 18:03 30-03-2021
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Нет не пробовал.
При этом импорте создавалось два файла при импорте одной страницы: один нормальный, другой пустой. Причем в списке присутствовало имя пустого файла, хотя в главном окне высвечивалась импортируемая страница. Начал экспериментировать с параметрами окна импорта. В окошке Do not zones cтояла галка, вроде бы нормально, зоны мне не нужны. Но когда я эту галку убрал, страницы начали импортироваться нормально. Похоже галка действует противоположно предполагаемому варианту.

Всего записей: 7130 | Зарегистр. 14-01-2005 | Отправлено: 19:02 30-03-2021 | Исправлено: shch_vg, 20:33 30-03-2021
anion23

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Кстати у подсветки есть и другой режим

Спасибо за ответ и за интересные подробности работы данного режима. Было бы полезно добавить эту информацию в шапку или в _advices.txt.

Всего записей: 394 | Зарегистр. 22-07-2010 | Отправлено: 12:28 31-03-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
в шапку или в _advices.txt.

Когда-нибудь добавлю.  
Кстати, если сделать ocr, то подсветка станет более направленной, СК не будет включать в подсветку заведомо не-спеклы: знаки препинания, рваные кусочки букв и т.п.

Всего записей: 4538 | Зарегистр. 09-09-2002 | Отправлено: 12:39 31-03-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
а можно, чтобы знаки препинания исключал, а рваные кусочки букв подсвечивал ?

Всего записей: 1037 | Зарегистр. 13-06-2013 | Отправлено: 17:08 31-03-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
можно. по умолчанию так и есть. Только еще и спеклы будут светиться. Пользователь сам задает какие символы/буквы (целиком или части) исключать

Всего записей: 4538 | Зарегистр. 09-09-2002 | Отправлено: 18:00 31-03-2021
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Прошу помочь. Подскажите, пожалуйста, как улучшить качество на выходе. Как мог, сделал. Но может я упускаю какие-нибудь важные опции.

 
Тест-файл.
 
Редкий текст, хотел бы его попробовать через файнридер пропустить. Но с таким качеством это будет проблематично.

Всего записей: 575 | Зарегистр. 04-05-2016 | Отправлено: 21:13 03-04-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asku
Поменяйте метод correct illum на safe. Можно уменьшить unsharp до 6/5
На закладке enhance я бы добавил blur=1 или даже blur2=1

Всего записей: 4538 | Зарегистр. 09-09-2002 | Отправлено: 08:55 04-04-2021
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega спасибо! Значительно лучше.
А на закладку enhance (Smooth, Blur, Sharpen и т.д.) я даже внимания не обращал...

Всего записей: 575 | Зарегистр. 04-05-2016 | Отправлено: 17:28 04-04-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я снова про ячейки тессеракта.
На них можно было бы не только лослесс зоны подвязать.
Но и аншарп зоны. BW -зоны.
 
Вот, например, замазывается дырочка в петельке в букве З. Ее можно бло бы бинаризовать с боле низким порогом. и персональный аншарп букве делать.
Или пропадают ножки у буквы М - бинаризовать буквы М с более высоким порогом.

Всего записей: 1037 | Зарегистр. 13-06-2013 | Отправлено: 10:26 14-04-2021
bearjrgm



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
а можно как-то подключить 4 версию тессеракта? Интересно посмотреть на результаты.

Всего записей: 787 | Зарегистр. 03-07-2005 | Отправлено: 11:49 14-04-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Вот, например, замазывается дырочка в петельке в букве З.

Защита и сейчас есть. Только замазывается она в з как правило из-за fill hole, а не порога. Вот именно защита от Fill hole заданных букв сейчас и есть. И ввел ее в свое время именно из-за "з"

Цитата:
Или пропадают ножки у буквы М - бинаризовать буквы М с более высоким порогом.

И это давно есть.
Интересно, whatsnew кто-нибудь когда-нибудь читал? Похоже, что никто и никогда.
 

Цитата:
а можно как-то подключить 4 версию тессеракта?  

Чтобы подключить, нужно купить новую версию DLL. Самому ее создавать у меня ни времени, ни сил нет. Цена ее для меня великовата, я не готов столько тратить. И еще автор не дал информации о ее совместимости с версиями компилятора. Если она окажется несовместима с той, на которой я собираю СК, все будет напрасно, компилятор из-за нее я менять не собираюсь.
Наверно, есть еще вариант вызова T через комстроку. Но это будет слишком долго с точки зрения быстродействия.
 
 
 
 
 

Всего записей: 4538 | Зарегистр. 09-09-2002 | Отправлено: 12:27 14-04-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Интересно, whatsnew кто-нибудь когда-нибудь читал? Похоже, что никто и никогда.

я читал И очень правильно вы развиваете именно это направление с защитой. Я после экспериментов U235 с марашками окончательно понял, что ваш путь правильнее.
 
upd
а что там по деньгам за dll ?

Всего записей: 3296 | Зарегистр. 15-07-2010 | Отправлено: 13:05 14-04-2021 | Исправлено: TelecomUral, 13:25 14-04-2021
bearjrgm



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
спасибо за ответ

Всего записей: 787 | Зарегистр. 03-07-2005 | Отправлено: 13:37 14-04-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я защитой (ужирнением порога) пользуюсь в основном не для буквы "м", а для "н" и "и". Причем СК позволяет увеличить порог не для всей буквы (это было бы некрасиво и выделялось бы на фоне остальных букв), а для ее части, т.е. например, для пространства в области перемычек. Тогда ужирнение практически не заметно.
Еще одно применение (редкое) связано не с ужирнением, а наоборот, с понижением порога для области серифов (вблизи гориз. центра букв) , чтобы они не сливались друг с другом. Иногда это бывает полезно для букв "н" (сверху и снизу) и "п" (снизу).

Всего записей: 4538 | Зарегистр. 09-09-2002 | Отправлено: 15:24 14-04-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
а что там по деньгам за dll ?

Я ни от кого это не принимаю

Всего записей: 4538 | Зарегистр. 09-09-2002 | Отправлено: 18:00 14-04-2021
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru