Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Активные темы » Scan Tailor (часть 2)

Модерирует : gyra, Maz

Maz (10-01-2024 10:45): Scan Tailor (часть 3)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие части: Часть 1
Scan Tailor


Задача программы - пост-обработка сырых сканов книг для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса (по сравнению со СканКромсатором).
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ncraun) >>>  последняя версия
Scan Tailor Experimental (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (актуальный форк) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода


Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 12:17 17-02-2010 | Исправлено: Maz, 10:43 10-01-2024
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys say:

Цитата:
 
Если много картинок (тоновых), то удобнее в старой версии.
 

В STU на этот случай специально "Слой зон иллюстраций" (прямоугольных). А все вопили, что ненужен, мол "зачем нам столько разновидностей ST?".

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 19:28 29-07-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys say:  

Цитата:
 
новые пороги не перевешивают потерю выделения рамкой.  
 

Что то я сразу не понял, за что речь. Что значит "потерю выделения рамкой"? В STA 3 режима выделения: POLYGONAL, RECTANGULAR, LASSO. В режим RECTANGULAR переключается клавишей "C" (подсказка в статусбаре).

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 02:39 03-08-2023
hooddy



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А не подскажете ли, как обрезать контент одинаково на всех страницах? Проблема в том, что часть страниц заполнены текстом не полностью, где то только в центре, где то только сверху. Понятно, что руками рамки подтянуть не проблема, но хотелось бы чтобы было одного размера. Т,е. как-то скопипастить выделение с другой страницы можно?

Всего записей: 2107 | Зарегистр. 08-12-2006 | Отправлено: 16:23 05-08-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hooddy say:

Цитата:
 
А не подскажете ли, как
 

"Применить"->"Ко всем страницам".

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 16:32 05-08-2023
hooddy



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot
это не совсем то, что мне надо. мне надо взять рамочку с выделением и поместить ее на другую страницу но в другом месте, т.е. переместить ее (да хоть мышью вручную, но не менять размер). потому что текст может и располагается правее, левее, выше, ниже, чем на странице, с которой рамочка копируется. а применить ко всем страницам делает рамку ровно там где, где и на исходной странице.
 
кажется, я разобрался. очень крутые приложки.

Всего записей: 2107 | Зарегистр. 08-12-2006 | Отправлено: 17:43 05-08-2023 | Исправлено: hooddy, 17:56 05-08-2023
esys

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В STA 3 режима выделения: POLYGONAL, RECTANGULAR, LASSO. В режим RECTANGULAR переключается клавишей "C" (подсказка в статусбаре).

1. Ранее было через ctrl.
2. Переключился на прямоугольник через C, а как обратно переключится?

Всего записей: 340 | Зарегистр. 22-06-2016 | Отправлено: 09:05 11-08-2023 | Исправлено: esys, 09:06 11-08-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hooddy

Цитата:
мне надо взять рамочку с выделением и поместить ее на другую страницу но в другом месте, т.е. переместить ее
кажется, я разобрался

И как это сделать? И какую версию СТ используете?

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 12:30 11-08-2023 | Исправлено: jourmager, 12:31 11-08-2023
qwaxym



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
2. Переключился на прямоугольник через C, а как обратно переключится?

В подсказке написано С, Z, X. В правом нижнем углу показывается какой режим выделения в данный момент.

Всего записей: 127 | Зарегистр. 19-12-2007 | Отправлено: 12:47 11-08-2023 | Исправлено: qwaxym, 13:44 11-08-2023
yozhic



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys (пост)
Цитата:
а как обратно

Вдобавок: вот тут у меня и скриншот был иллюстрирующий (второй, маленький).

Всего записей: 2773 | Зарегистр. 20-03-2008 | Отправлено: 15:09 11-08-2023
esys

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Понятно. Спасибо!
На русский бы эти подсказки перевести.

Всего записей: 340 | Зарегистр. 22-06-2016 | Отправлено: 17:57 11-08-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
esys say:

Цитата:
 
На русский бы эти подсказки перевести.
 

Переведи. Хуже меня здесь "лингвиста" не сыскать (гугле транслит онли). Такие вот дела, товарищ привереда.
 
 

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 03:18 12-08-2023
Highlander_2



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Доброго времени всем.
Не пойму логику работы сабжа. Пробывал разные форки. Каким образом она определяет границу полезной области. Например, в моем случае, она захватила нумерацию каких-то страниц в нижней части листа, а других напрочь проигнорировала. Из-за этого добрую половину страниц пришлось переставлять вручную, подтягивая вниз границу полезной области для захвата номеров.

Всего записей: 218 | Зарегистр. 19-05-2017 | Отправлено: 10:16 15-08-2023 | Исправлено: Highlander_2, 10:18 15-08-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Highlander_2 say:

Цитата:
 
Не пойму
 

Ничего сложного в принципе в ST (независимо от разновидности) нет и не было никогда. Никакого АИ (и соответственно, логики). Схема определения границ проще не придумаешь: порог Otsu -> грубый despeckle -> обрезка белого до "содержимого". Учитывая, что despeckle в ST реализован через карту связности, то он не то что запятые, а целые слова способен сносить, ежели эти слова удалены от общего контекста. На данный момент ни в одной из разновидностей ST данный набор действий не регулируем.
 
Почему не регулируем? Потому что проще сразу подправить границы ручками, чем долго и упорно подбирать параметры, после чего опять подправлять ручками, но уже другие страницы.

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 13:04 15-08-2023 | Исправлено: zvezdochiot, 13:13 15-08-2023
yozhic



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Highlander_2
Тут ведь ещё может быть и другая сторона дела: систему наших ожиданий стоит правильно настраивать. Автоматика же не всесильна. Ручной работы не избежать, особенно если требуется качественный результат. Лучше, например, сосредоточиться на том, какими др. инструментами в ST можно эту ручную (неизбежную) часть ускорить. Я, например, активно пользуюсь разными способами сортировки страниц (по макс. ширине/высоте/отклонению) — это помогает быстрее обрабатывать огрехи автоматики.

Всего записей: 2773 | Зарегистр. 20-03-2008 | Отправлено: 14:07 15-08-2023
indifirent

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
zvezdochiot
Схема определения границ проще не придумаешь

По поводу "определения границ". Глядя на то как Вы реализуете принцип "если не гора идёт к Магомету то Магомет идёт к горе" есть возможность перенести часть кода из детища 4lex4 (клик на пороге буквы - создание границы) в Вашу реализацию?
Благодарю.

Всего записей: 176 | Зарегистр. 02-06-2018 | Отправлено: 18:26 15-08-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
indifirent say:

Цитата:
 
перенести часть кода из детища 4lex4
 

Посмотрел, как "это" работает в STA. Что то в этом есть. Посмотрю код STA, ежели не очень геморройно, то портирую в STEX. А иначе "умерла так умерла". Такие вот дела.
 

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 19:53 15-08-2023 | Исправлено: zvezdochiot, 19:54 15-08-2023
Highlander_2



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot,
 

Цитата:
Ничего сложного в принципе в ST (независимо от разновидности) нет и не было никогда. Никакого АИ (и соответственно, логики). Схема определения границ проще не придумаешь: порог Otsu -> грубый despeckle -> обрезка белого до "содержимого". Учитывая, что despeckle в ST реализован через карту связности, то он не то что запятые, а целые слова способен сносить, ежели эти слова удалены от общего контекста. На данный момент ни в одной из разновидностей ST данный набор действий не регулируем.
 
Почему не регулируем? Потому что проще сразу подправить границы ручками, чем долго и упорно подбирать параметры, после чего опять подправлять ручками, но уже другие страницы.  

 
Так я и не понимаю. Две одинаковые страницы. На каких-то сабж захватывает корректно область, включая нумерацию, в других игнорит. Я вот и пытался выявиться закономерность от чего подобное выходит.
https://i.postimg.cc/cHTMxYkx/15-08-2023-150555.png
 
 
yozhic, все верно, не спорю. Но, если бы речь допустим о книге объемом 200-300 стр, ладно бы еще. Но когда возникает необходимость обработать книги по 600-900 стр, тут эти нюансы предстают действительно существенными.  
 
 
 

Всего записей: 218 | Зарегистр. 19-05-2017 | Отправлено: 07:29 16-08-2023 | Исправлено: Highlander_2, 07:32 16-08-2023
qwaxym



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Highlander_2, на вашем скане видно что довольно бледный номер страницы, попробуйте подобрать чувствительность поиска(в STA) для таких страниц.  

Всего записей: 127 | Зарегистр. 19-12-2007 | Отправлено: 08:39 16-08-2023 | Исправлено: qwaxym, 08:44 16-08-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Highlander_2 say:

Цитата:
 
если бы речь допустим о книге
 

Сортировка страниц - наше всё. Остальные "причуды" ненужны.
 
PS: Именно 600-900стр. и обрабатываем. А иначе "это" и не книга вовсе.

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 09:07 16-08-2023
Highlander_2



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
qwaxym,  

Цитата:
на вашем скане видно что довольно бледный номер страницы, попробуйте подобрать чувствительность поиска(в STA) для таких страниц.  

Да, согласен, бледный скан. Я просто никогда не обрабатывал четкость в ST, обычно в XnView в пакетном режиме ставлю в уровнях черного 100-150.
 
zvezdochiot,

Цитата:
Сортировка страниц - наше всё. Остальные "причуды" ненужны.
 
PS: Именно 600-900стр. и обрабатываем.

 
Да, я уже наловчился. Кстати, с недавнего времени пришлась по душе ST Universal. Lо этого пользовался Advanced.
 
Подскажите еще, пожалуйста. Можно определить - настоящий ли это скан (т.е. исходник после оцифровки на обычном сканере), или все же фотоскан с хорошим качеством.
https://i.postimg.cc/0v3r5SrR/20230510204635-020.jpg

Всего записей: 218 | Зарегистр. 19-05-2017 | Отправлено: 13:35 16-08-2023 | Исправлено: Highlander_2, 14:29 16-08-2023
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » Активные темы » Scan Tailor (часть 2)
Maz (10-01-2024 10:45): Scan Tailor (часть 3)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru