Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
Хочу поймать разорванные напополам Н.  

Известно, что Н состоит из одной части. Если частей >1, значит вот вам разорванная.  
Ладно, пусть внутри мелкие спеклы. Они действительно могут ввести в заблуждение алгоритм, т.е. частей несколько, а буква все-таки не разорвана. Тогда согласен, можно не считать частью буквы те спеклы, которые меньше заданного размера. Но ограничивать размер еще и сверху это излишне.
Т.е. я согласен контролировать только нижнюю границу спекла, но не максимальную.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 16:37 16-12-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
1.  
Тогда это будет работать только в сочетании с заданием конкретной буквы и задействованием других критериев.
 
При подсветке вы контролируете именно максимальную границу !
И если задать только минимальную для группы букв, то подсветятся все нормальные буквы.
 
 
Вот как у меня, например, как другая книга выглядит (обратите внимание на Ы):
   
не буду перечислять подлежащие замене буквы.  
 
 
2.
А просто со спеклами как вы будете бороться ?  Допустим буква хорошая, но спекл мешается.  
Автоматом удалять ? Глазами по всей странице искать ?
А так ячейка со спеклом будет продемонстрирована пользователю.
(глиф в этом случае вставляться не будет, руками метелкой почистится.)
 
 
3.  Почему не дать лишнюю гибкость и возможность ?
Наверняка, обнаружится сценарий, где это будет полезно, тем более что сейчас так и работает (по максимальной границе).
 
 
У вас удаление вертикальных черточек сейчас полностью автоматическое или все-таки под контролем юзера ?

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 17:06 16-12-2021 | Исправлено: daa2013, 17:14 16-12-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
не буду перечислять подлежащие замене буквы

нет уж, перечислите. Иначе я не пойму чего вы хотите от алгоритма

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 18:24 16-12-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Соответственно, те буквы, в которых видны красные элементы:
чсь
учу
ызч
ч
 
 
 
Добавлено:
Другой пример:
 
 
   
 
Там где П не уверен, что она не будет опознана как Г. Там и ножка, и спекл есть.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 18:45 16-12-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Соответственно, те буквы, в которых видны красные элементы:

ну так они все и так автоматом отберутся, т.к. в каждой из них есть разрыв. Т.е. никаких дополнительных критериев для их отбора не потребуется.
Для второй картинки отберутся щ,р и возможно н. Можно и ю, если другой критерий задействовать.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 19:23 16-12-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вы мне так и не ответили, меняется тут автоматом или подсовывается под нос пользователю, и он каждую замену кликом "одобряет" .
 
Если все-таки подсовывается, то буду продолжать настаивать на необходимости контроля за спеклами по размеру.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 19:48 16-12-2021
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
А когда планируется выпустить новую версию СК?

Всего записей: 525 | Зарегистр. 04-05-2016 | Отправлено: 19:51 16-12-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Вы мне так и не ответили, меняется тут автоматом или подсовывается под нос пользователю, и он каждую замену кликом "одобряет" .  

Я же писал, замена в двух режимах: щелчком по букве (но ничего не подсовывается) или скопом. В любом варианте предварительно все замены демонстрируются в отдельном окошке, в котором список замен можно отсеивать, фильтром или вручную (галку убрать напротив замены).

Цитата:
удаление вертикальных черточек сейчас полностью автоматическое или все-таки под контролем юзера

В СК нет ничего полностью автоматического, неужели вы до сих пор этого не поняли.

Цитата:
А когда планируется выпустить новую версию СК?

СК это хобби, ни планов, ни графиков у меня нет. Как получится, так получится.
 
 

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 20:20 16-12-2021 | Исправлено: bolega, 20:26 16-12-2021
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
СК это хобби, ни планов, ни графиков у меня нет. Как получится, так получится.

 
Понял! Очень хочется научиться исправлять буквы (тессеракт и т.п.).

Всего записей: 525 | Зарегистр. 04-05-2016 | Отправлено: 21:09 16-12-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Давайте вспомним Долгополова.
Спекл прижался к букве и затерялся на 3000 страниц.
 
Был бы поиск по ячейкам со спеклами - нашелся бы вмиг.
 

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 04:40 17-12-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
Спекл прижался к букве и затерялся на 3000 страниц.

Пробую осмыслить всё написанное за последние дни в комплексе. Плохо получается.
Откуда вообще возникает ситуация "поискать нечто мелкое в огромной куче"? Ведь из-за того, что в результирующем djvu вы увидели размноженную некрасивую букву, так? То есть в СК это не надо для его функционала?
Я вот поглядел на ваши примеры скриншотов - окромя изувеченной "п" лично я бы ни одного исправления делать не стал. Всё читаемо. Нафиг эти разрывчики у "з" и "у" исправлять, глаз их не отметит и не споткнётся.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 06:36 17-12-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
лично я бы ни одного исправления делать не стал

Все замены проводятся под контролем пользователя.
Если не хотите заменять, то и не заменяйте.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 09:55 17-12-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
да я к тому, что выделено излишне много.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 10:13 17-12-2021
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Большее число критериев отбора с возможностями комбинирования  увеличит гибкость в формировании выделений.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 12:34 17-12-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Почему в режиме Compare на панельке ребинаризации около метода ("Auto", галка "The same" снята) порог то показывается, то не показывается? Обратил внимание на "мигание" в этом месте, быстро листая совершенно однотипно обработанные странички.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 06:26 20-12-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Не воспроизводится. Метод какой, custom или auto?

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 09:53 20-12-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
Метод Auto.
Видео https://disk.yandex.ru/i/qpTHW0XQSeQ2zQ
Логика моей работы:
Расставил метод "Auto", запустил процесс, потом в VR выбрал Compare. Пошёл листать от первой страницы, кнопкой "W", и глядеть жирность и габариты. Где-то к 70й странице понял, что мне надо выставить градиент, вверху жирнее и мелкие буквы снизу часто полупропадают. Открыл панельку ребинаризации, разместил её поудобнее в центре на чистом поле. Ну и почти сразу заметил мелькание циферок порога.
На видео видно, что я уже начал мотать обратно к первой странице, и в конце видео цифры порога появляются всегда. Вполне вероятно это потому, что я сделал там ребинаризацию.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 10:21 20-12-2021
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
Это баг. Если обработка идет в несколько потоков, то потоки не передавали в основной вычисленные значения порога.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 12:11 21-12-2021
shttd

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите пожалуйста при просмотре результата есть ли шорткат для действия "Finalize current page"?

Всего записей: 43 | Зарегистр. 20-07-2008 | Отправлено: 13:45 24-12-2021
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shttd
я не проверял на практике, а в списке хоткеев есть: Finalize page. По умолчанию клавиши не назначены.

Всего записей: 3011 | Зарегистр. 15-07-2010 | Отправлено: 14:42 24-12-2021
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru