Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)

Модерирует : gyra, Maz

Maz (10-01-2024 10:45): Scan Tailor (часть 3)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие части: Часть 1
Scan Tailor


Задача программы - пост-обработка сырых сканов книг для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса (по сравнению со СканКромсатором).
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ncraun) >>>  последняя версия
Scan Tailor Experimental (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (актуальный форк) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода


Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 12:17 17-02-2010 | Исправлено: Maz, 10:43 10-01-2024
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VidelSamogO
А пример выложить не судьба? И написать что делали.

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4307 | Зарегистр. 18-09-2003 | Отправлено: 06:55 13-05-2011 | Исправлено: slava_kry, 06:55 13-05-2011
VidelSamogO



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вот сколько не пытаюсь возвратиться на кромсатор, а снова и снова прихожу к одному выводу. Scan Tailor на порядок удобнее, логичнее и юзабельнее! Просто лучший! К разработчику - просьба поработать над более широкими возможностями выравнивания яркости и адаптивности в бинаризации. Необходимы ползунки ручных подстроек и усилителей действия параметров практически во всех функциях. (Поясню. Зачастую после первой разрезки в цветном режиме вывода приходится использовать illum_corr, после чего Scan Tailor даже при +99 яркости НЕ ВЫТЯГИВАЕТ детали при бинаризации! Отсюда просьба - расширить рамки возможного до +-300) Это ук уже неплохо реализованному. А к плохо - нужны параметры подстройки - задаваемые пределы - рамки для деворпинга например.  
slava_kry
В режиме цветного вывода, если раньше цвет окаймления можно было задавать - (Цветной/Серый, Белые поля... ) То теперь - когда не выбираем режим белых полей - получаем вместо них - ярко голубое окаймление. Хотя я его конечно потом могу замаскировать, но это снова костыли.

Всего записей: 765 | Зарегистр. 16-08-2008 | Отправлено: 06:40 17-05-2011 | Исправлено: VidelSamogO, 06:54 17-05-2011
Salvatorul



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
После удаления страницы из проекта ST перескакивает на первую страницу. Было бы имхо логичней, если бы переходил на следующую.

Всего записей: 38 | Зарегистр. 30-04-2007 | Отправлено: 11:26 19-05-2011 | Исправлено: Salvatorul, 11:43 19-05-2011
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Изменил логику заливки фона в ST Separator 3.1.  
на приведенном ранее примере
теперь получается такой результат
 
Никак не придумаю надежную логику для заливки внутренней области символов, чтобы она охватывала сложный случай из 0002_.tif. Т.е. если есть одна сплошная черная область, одновременно служащая и фоном для одних букв и основным цветом для других букв. Пока что для заливки содержимого таких черных областей используется цвет фоновой области максимальной площади среди областей, касающихся данной черной области снаружи. Что и привело к белой заливке внутренней части символов ф,о,р.
 
Есть опасение, что здесь уже нужны алгоритмы OCR-уровня, одними клеточными автоматами не обойтись.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 11:35 22-05-2011
VidelSamogO



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
У меня вообще не работала никогда ни одна из версий outliner'а. Может подскажете алгоритм, чтобы я на регулярных выражениях обработчик построил?

Всего записей: 765 | Зарегистр. 16-08-2008 | Отправлено: 18:10 22-05-2011
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VidelSamogO
Исходники вроде как открыты. Но, боюсь, regexp'ами тут не обойтись. Много математики.
И я бы предпочел сделать рабочую и для вас версию аутлайнера. Может, все-таки закинете через личку нерабочий проект и мы вместе как-нибудь победим проблему? На rutracker'е и djvu-scan-forum'е тоже жаловались, но пока молчат, хотя и обещали проект. Может быть, хоть Вы поможете?
 
Кстати, ни у кого на W7x64 c Сепаратором проблем не было (версия 3.0 не в счет - там была ошибка в коде)?

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 18:31 22-05-2011 | Исправлено: StanFreeWare, 18:32 22-05-2011
VidelSamogO



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
# -  под катом - Информация об ошибке, Проект
#
 
 
Добавлено:
StanFreeWare
Сепаратором не пользуюсь. Есть же рабочий ST Split. Если нетрудно, создайте скрин-видео, как полностью работать с тем сепаратором Только на полной книге со смешанным контентом на 500 страниц.  меня были всегда с ним проблемы. Пришлось отказаться.

Всего записей: 765 | Зарегистр. 16-08-2008 | Отправлено: 20:40 22-05-2011
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VidelSamogO
Кажется, понял - похоже, Вы решили, что аутлайнер превращает непрямоугольные ПОЛЬЗОВАТЕЛЬСКИЕ зоны в прямоугольные. А на самом деле он обводит АВТО-зоны прямоугольниками.
 
Если Сплит устраивает, то смысла переходить на Сепаратор нет. Максимум получите экономию места на винте за счет возможности предварительного ужимания картинок (не в Djvu Imager).
Тем не менее, не могу понять какие проблемы на книге со смешанным контентом могут быть. Натравляешь прогу на папку Out и идешь куришь. А дальше все по стандартной схеме, как и со Сплитом...

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 21:02 22-05-2011
VidelSamogO



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
Нет. Это я для примера сделал. На автоопределённых как серые, точках - зонах-картинках, происходит та же самая ошибка. Просто картинку неудачную на этот раз взял, вот и пришлось самому зон наляпать. Я всё правильно понимаю.  
 
Добавлено:
Ну могу сделать то же самое со страничкой, на которой автоопределится зона серого изображения.

Всего записей: 765 | Зарегистр. 16-08-2008 | Отправлено: 21:11 22-05-2011
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ну сделайте
 
Добавлено:
Но предпочтительней через личку.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 21:23 22-05-2011
VidelSamogO



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В личке.

Всего записей: 765 | Зарегистр. 16-08-2008 | Отправлено: 21:43 22-05-2011 | Исправлено: VidelSamogO, 21:44 22-05-2011
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Кто ссылку на git из шапки убрал ?
Верните на место !

Всего записей: 6477 | Зарегистр. 31-08-2008 | Отправлено: 21:51 22-05-2011 | Исправлено: ndch, 22:40 22-05-2011
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Продуктивное общение с VidelSamogO вылилось в новые версии ST Outliner 0.4 и ST Separator 3.1.4.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 00:24 24-05-2011
LonerDergunov



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Программа не может ресайзить сканы?
Например, одна страничка отсканена с разрешением 3000х2000, вторая - 1500х750.
Есть опция Match Size to other Page, но после ее применения получается голая страничка с маленьким сканом посередине. Выглядит, конечно, некрасиво. Логичней если бы картинка просто ресайзилась до ширины или высоты максимальной картинки или до заданного пользователем значения.

Всего записей: 2972 | Зарегистр. 11-07-2007 | Отправлено: 02:25 26-05-2011
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
LonerDergunov
Задайте DPI и все станет логично и красиво.
Странно, что сканер не сохранил эту информацию.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 04:08 26-05-2011 | Исправлено: StanFreeWare, 04:09 26-05-2011
Salvatorul



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
LonerDergunov
Либо перед обработкой сделайте ресайз в какой нибудь сторонней программе, либо задайте dpi для первой странички 300 для второй 150. На выходе получите одинаковый размер картинок.

Всего записей: 38 | Зарегистр. 30-04-2007 | Отправлено: 10:21 26-05-2011
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
У меня возникла такая идея.
 
Как известно, в Book Restorer имеется выравнивание освещённости - которое превосходит по качеству таковое в СТ.
 
А зачем нам вообще нужно выравнивание освещённости?
 
Оно нужно потому, что, считается, что оно улучшает последующую бинаризацию - только для этого оно нужно.
 
А что если пойти другим путём: подобрать или разработать более изощрённый алгоритм бинаризации - такой, который мог бы успешно бинаризировать даже и серые сканы с невыровненной освещённостью?
 
Для сканов с невыровненной освещённостью я пользуюсь Scan Tailor Plus, где ставлю ползунок бинаризации на 50. И всё равно этого мало - на бледных (малоконтрастных) частях (исходного серого скана) получаются тонкие буквы (после бинаризации), зато на нормальных (по контрасту) частях получаются слишком жирные буквы - которые слипаются друг с другом и облеплены грязью.
 
Отсюда получается такой вывод: наличие в СТ только одного вида бинаризации - Otsu - является недостаточным. Для Otsu cколь ни расширяй диапазон бинаризации - 30 - 50 - 100 - ... - всё это будет недостаточной мерой для бинаризации неравномерно-освещённых сканов. Такие сканы ИМХО пока что лучше в Book Restorer бинаризировать - получается гораздо лучше. В Book Restorer имеются тонкие настройки - там можно вручную подобрать оптимальный порог бинаризации.
 
Я делаю так (только для неравномерно-освещённых сканов): ставлю в Book Restorer максимально возможный порог бинаризации, выше которого буквы начинают обрастать грязью. Запускаю бинаризацию. В итоге получаются хорошие достаточно жирные буквы - но сам скан при этом получается довольно замусорен мелкой грязью, которую приходится вручную чистить. И тут деваться некуда - без этой паразитной грязи не обойтись, а вот в СТ она никогда не появляется, и мне кажется, Tulon специально на это пошёл. Tulon'у явно не хотелось появления такой паразитной грязи - тогда нужно было бы предусматривать чистку сканов в СТ. Однако без этих мер страдает качество (но только для случая неравномерно-освещённых сканов).
 
Однако, и в Book Restorer бинаризация далеко не идеальна - для неравномерно-освещённых сканов. Всё равно качество бинаризации для таких сканов получается не очень - хотя и заметно лучше, чем в СТ.
 
Общий вывод таков:
 
В СТ нужно добавить дополнительный алгоритм бинаризации - для неравномерно-освещённых сканов.
 
Добавлено:
Естественным следствием из этого вывода является другой вывод - необходимость опции вывода из СТ передних субсканов в режиме серого. Ведь они тоже могут оказаться неравномерно-освещёнными - и тогда их понадобится бинаризовывать в Book Restorer, а не в СТ. На период, пока в СТ не будет реализована альтернативная вышеуказанная бинаризация.
 
Пока что создавать СТ - передние субсканы в режиме серого умеет единственная программа - ST Split. Но такой функционал надо бы внедрить напрямую в СТ. Без этого никак не обойтись - это жизненная необходимость.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 10:32 30-05-2011 | Исправлено: monday2000, 11:01 30-05-2011
DikBSD

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Естественным следствием из этого вывода является другой вывод - необходимость опции вывода из СТ передних субсканов в режиме серого. Ведь они тоже могут оказаться неравномерно-освещёнными - и тогда их понадобится бинаризовывать в Book Restorer, а не в СТ. На период, пока в СТ не будет реализована альтернативная вышеуказанная бинаризация.  

В планах есть... Нужно только время на все запланированное  

Всего записей: 178 | Зарегистр. 23-11-2009 | Отправлено: 14:34 30-05-2011
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я попробовал опытным путём выяснить, как выравнивание освещённости в Book Restorer (LCBR) влияет на последующую бинаризацию.
 
Сделал несколько образцов одного и того же серого скана до и после LCBR, бинаризовал всё это в СТ Plus на 50.
 
Результат оказался поразительным: оказалось, что LCBR крайне пагубно влияет на последующую бинаризацию! Буквы получаются тонкими и с разрывами.
 
Возникает вопрос: а зачем же тогда вообще нужно LCBR?
 
Видимо, бывают всё же какие-то сканы, где освещённость настолько сильно варьируется по площади скана, что при невозможно подобрать какой-то общий коэффициент бинаризации - поэтому и делается LCBR. Особенно это характерно для снимков со вспышкой на цифровом фотоаппарате.
 
Платой же за выравнивание освещённости является сильное снижение контрастности - что крайне пагубно сказывается на последующей бинаризации.
 
Получается, что LCBR нужно делать в самой крайней ситуации - при наличии особо острой формы невыровненной освещённости. Я предполагаю, что при сканировании книг обычным сканером такой ситуации просто не возникает, а значит, делать LCBR в этом случае вообще не надо.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 18:20 30-05-2011
DikBSD

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Надо будет в будущем опционально сделать отключение/включение выравнивания освещенности (особенно на Смешанном режиме) - многие давно об этом уже просили на форуме.

Всего записей: 178 | Зарегистр. 23-11-2009 | Отправлено: 20:02 30-05-2011
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)
Maz (10-01-2024 10:45): Scan Tailor (часть 3)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru