Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)

Модерирует : gyra, Maz

Maz (10-01-2024 10:45): Scan Tailor (часть 3)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие части: Часть 1
Scan Tailor


Задача программы - пост-обработка сырых сканов книг для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса (по сравнению со СканКромсатором).
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ncraun) >>>  последняя версия
Scan Tailor Experimental (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (актуальный форк) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода


Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 12:17 17-02-2010 | Исправлено: Maz, 10:43 10-01-2024
qwaxym



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Заметил баг в Scan Tailor Featured, после разделения смешанного содержимого, в картинки попадают текстовые файлы(без картинок) в которых правилась кривизна строк, т.е. стр. текста идет в текст и такая же, только очень бледная стр. в картинки.

Всего записей: 127 | Зарегистр. 19-12-2007 | Отправлено: 14:34 26-05-2017
allo04

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
qwaxym  
это давно известно, но вряд-ли кто исправит.

Всего записей: 197 | Зарегистр. 15-10-2009 | Отправлено: 15:55 01-06-2017
Fafy

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Есть страницы в книге с таблицами в которых некоторые ячейки залиты серым фоном.  
Автозона выделяет целую таблицу, и при выводе она вся серая.
А мне нужно выделить только ячейки залитые серым. Все остальное должно быть черно-белым.
Как лучше сделать в данной ситуации? Автозона как-то отключается?

Всего записей: 725 | Зарегистр. 25-10-2010 | Отправлено: 17:53 02-06-2017 | Исправлено: Fafy, 17:54 02-06-2017
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Fafy
Напрямую отключить не получится, (все что соприкасается серого переходит в автозону) возможно потребуется предобработка. Выложите для начала образец скана.

Всего записей: 883 | Зарегистр. 14-12-2005 | Отправлено: 10:38 03-06-2017
Fafy

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Выложите для начала образец скана.

Таких страниц несколько, но вот одна из них.

Всего записей: 725 | Зарегистр. 25-10-2010 | Отправлено: 14:41 03-06-2017 | Исправлено: Fafy, 14:43 03-06-2017
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Fafy
Как самый простой по времени  вариант, можно сделать так: предварительно сделать апсемплинг в 2 раза, увеличить контраст/гамму в редакторе типа Xnview (пакетная обработка).  Затем загрузить обработанный набор в ScanTailor и пометить такие страницы как цветные.  Дальше кодировать в djvu (с сегментацией).  
Получится примерно вот что:  
(в ST не обрабатывал, только Xnview и Djvu Small)
https://files.fm/u/bymcmwnd
продублировал тут http://dropmefiles.com/edAHY

Всего записей: 883 | Зарегистр. 14-12-2005 | Отправлено: 06:48 04-06-2017 | Исправлено: U235, 18:17 06-06-2017
Fafy

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235
По ссылке ничего нет.

Всего записей: 725 | Зарегистр. 25-10-2010 | Отправлено: 12:05 06-06-2017
Hunter23071985

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Поделитесь ссылками на крайние версии Scan Tailor. Нашёл:
2016-02-22 x32 от Tulon
2016-09-24 x64 от 4lex4
Есть лучше/новее?

Всего записей: 2556 | Зарегистр. 19-09-2009 | Отправлено: 01:33 02-07-2017
gmafffff

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Большое спасибо Tulon за такой превосходный продукт. Вы реальный талант!
 
У меня есть идея по развитию ScanTailor. Я конечно понимаю, что ей не суждено осуществиться, но тем не менее вдруг кто-нибудь ей заинтересуется.
 
Предлагаю переделать файл проекта в таблицы базы данных SQLite и интегрировать поддержку SQL в программу. Это позволит
1. в окне эскизов писать SQL-фильтры, выделяющие изображения по определенным критериям (например, все изображения ширина которых больше средней на 10%)
2. в окне обработки изображения писать sql-выражения для группового обновления параметров коррекции выбранных с помощью SQL-фильтра изображений (например, с помощью фильтра выбираем изображения у которых полезная области по ширине меньше 10 см и увеличиваем ширину рабочей области вправо и влево на .5 см)
3. Легко писать сторонние утилиты расширяющие алгоритмы обработки.
 
Знаний для реализации этой идеи у меня нет (да и такого количества времени по большому счету тоже), но поучаствовать в создании БД я готов.
 

Цитата:
Поделитесь ссылками на крайние версии Scan Tailor. Нашёл:  
2016-02-22 x32 от Tulon  
2016-09-24 x64 от 4lex4  
Есть лучше/новее?

Кажется нет
 

Всего записей: 3 | Зарегистр. 29-07-2009 | Отправлено: 21:39 14-08-2017 | Исправлено: gmafffff, 21:42 14-08-2017
renats84



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)  

шапка чахнет

Всего записей: 1629 | Зарегистр. 18-03-2010 | Отправлено: 06:41 31-08-2017
4lex4

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanTailor Advanced v1.0.0 [Pre-release]
 
Версия Scan Tailor, которая объединяет возможности Enhanced и Featured*, а также несет новые возможности и исправления.
 
* "Экспорт" не переносился из-за грязной реализации, и заменен новой реализацией "Раздельный выход" (см. ниже).
 
Изменения:
 
Исправления:
*Исправлено: Резалка страниц влияла на выход только в черно-белом режиме без исправлений искажений.
Теперь работает всегда и во всех режимах. По сути это позволяет отсекать края страниц даже без поиска контента, например, c выключенными белыми полями. (white margins)
*Исправлено: исправление искажений в ручном режиме при включенной бинаризации давало некачественный результат.
Обычно тут выходили вместо ч/б серые изображения. Почему-то было сделано, что поворот происходил после бинаризации, что и давало такой результат. Вторая бинаризация (например, делающаяся в DjVu энкодере) делала бы буквы искаженными. Теперь поворот происходит до бинаризации, и там, где области должны быть черно-белыми, они черно-белые.
* Оптимизировано использование памяти на стадии выхода.
* Исправлено отображение эскизов. Теперь оно более аккуратное.
Теперь эскизы отображаются ровно независимо от ширины страницы и никуда не пропадают, в том числе при растягивании панели (в много-столбцовом режиме).
* Портативность: все настройки теперь хранятся в папке с программой.
 
 
Новое:
* Новая темная и светлая темы.
Выбрать можно в настройках.
* Поддержка многопоточности при пакетной обработке.
Значительно увеличивает скорость обработки. Количесво используемых ядер можно настроить при обработке.
Предупреждение! Большее количество ядер увеличивает потребление памяти. Не допускайте ее переполнения.
* Полный контроль над настройками в режиме выхода.
Добавляет возможность отключать и включать белые поля, нормализацию яркости перед бинаризацией, нормализацию яркости в зонах с картинками, а также сглаживание Савицкого-Голея и морфологическое сглаживание во всех режимах (естественно, те настройки, которые в тех режимах применимы).
Я, например, предпочитаю сглаживать буквы алгоритмом coherence-enhanced anisotropic diffusion (улучшенная анизотропная диффузия, есть в фотошопе, экшены выкладывал здесь)
Плюс выключенное сглаживание позволяет прогонять через скантейлор уже обработанные и бинаризованые сканы, например, поправить поля. Раньше этого делать было нельзя, ибо неотключаемое сглаживание портило уже и так сглаженные буквы, а из-за этого они становились слишком жирными и слипались. Сглаживание лучше не применять более одного раза.
* Адаптивная бинаризация.
Добавлены алгоритмы адаптивной бинаризации Sauvola и Wolf. Могут применяться когда нормализация яркости не помогает.
* Раздельный выход.
Позволяет делить сканы на фореграунд (буквы) и бекграунд (картинки) в смешаном режиме.
Можно выбрать черно-белый или цветной (оригинальный) фореграунд.
Нужно для DjVu кодирования или для применения фильтров для букв и для изображений по отдельности.
По сравнению с экспортом из Featured является чистой реализацией, поддерживает все возможности и настройки, что и стандартный выход, и разделенные сканы являются частью проекта, потому теперь при неправильно обработаной странице не надо запускать весь экспорт заново, достаточно просто поправить эту страничку как при обычном выходе.
Внимание! Раздельный выход не переименовывает сканы к виду 0001, 0002..., для этого есть стороние утилиты, например, Bulk Rename Utility
 
Предупреждение! Файлы проектов из предыдущих версий несовместимы с этой версией программы, будут ошибки. Лучше создавать новые.  
 
>> СКАЧАТЬ <<
(GitHub)

Всего записей: 346 | Зарегистр. 27-01-2016 | Отправлено: 03:00 13-10-2017 | Исправлено: 4lex4, 15:52 15-10-2017
amaid



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
очень интригующе читается! ) спасибо за огромный труд  
к сожалению, мало смыслю в ФШ - не могли бы вы выложить пошаговую инструкцию (свой предпочтительный метод работы) для чайников по обработке среднего качества сканов?  
типа:  
1. проделать в ST то-то
2. сгладить буквы, запустив ФШ и кликнув там то-то, и т.д.

Всего записей: 575 | Зарегистр. 25-01-2006 | Отправлено: 08:53 13-10-2017
Dashout



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Спасибо! Удачи!

Всего записей: 1130 | Зарегистр. 15-01-2005 | Отправлено: 09:19 13-10-2017
amaid



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
"Количество используемых ядер можно настроить при обработке" - не нашел, где это
но бинаризация отрабатывает в 3 раза быстрее
 
Добавлено:
не понял и как отключить сглаживание

Всего записей: 575 | Зарегистр. 25-01-2006 | Отправлено: 09:28 13-10-2017
amaid



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
создает файл настроек рядом с ярлыком зачем-то (у меня это панель quick launch - там появляется папка config)

Всего записей: 575 | Зарегистр. 25-01-2006 | Отправлено: 01:06 14-10-2017
VidelSamogO



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Хотелось бы и для xp обновление.

Всего записей: 765 | Зарегистр. 16-08-2008 | Отправлено: 02:33 14-10-2017
4lex4

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Хотелось бы и для xp обновление.

Щас как раз пишу инструкцию по сборке, будет завтра, кому нужна 32 бит, сами из исходников и соберете, ну или ждите вока кто-нибудь другой соберет.  У мну щас ни времени нет, ни свободного места.
 
amaid, я и так под фотошоп готовые экшены выложил, там уже все сделано, надо просто клацнуть мышкой
 
Настройки сглаживания - галочки в output со словом smoothing

Всего записей: 346 | Зарегистр. 27-01-2016 | Отправлено: 04:05 14-10-2017 | Исправлено: 4lex4, 04:13 14-10-2017
VidelSamogO



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4lex4

Цитата:
Щас как раз пишу инструкцию по сборке

Отлично. Благодарю. Ждём!

Всего записей: 765 | Зарегистр. 16-08-2008 | Отправлено: 11:23 14-10-2017
4lex4

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Инструкия по сборке готова. Кому надо собрать, переходим на гитхаб, скачиваем сорцы из release, переходим в секцию Building и следуем инструкциям.
 
Если возникнут проблемы со сборкой, я готов помочь.

Всего записей: 346 | Зарегистр. 27-01-2016 | Отправлено: 15:02 15-10-2017 | Исправлено: 4lex4, 15:03 15-10-2017
Hunter23071985

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4lex4
А где находится "секция Building"?

Всего записей: 2556 | Зарегистр. 19-09-2009 | Отправлено: 15:19 15-10-2017
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)
Maz (10-01-2024 10:45): Scan Tailor (часть 3)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru