Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)

Модерирует : gyra, Maz

Maz (10-01-2024 10:45): Scan Tailor (часть 3)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие части: Часть 1
Scan Tailor


Задача программы - пост-обработка сырых сканов книг для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса (по сравнению со СканКромсатором).
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ncraun) >>>  последняя версия
Scan Tailor Experimental (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (актуальный форк) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода


Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 12:17 17-02-2010 | Исправлено: Maz, 10:43 10-01-2024
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
 
Остались ли резервы по увеличению быстродействия стадии вывод (кроме подключения GPU)?

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 16:35 12-04-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
Ну можно SSE тут там заюзать, можно обрабатывать несколько страниц одновременно на разных ядрах.  И то и другое тупиковый путь IMHO.
Подождать пару лет, и вычисления на GPU станут поддерживать даже встроенные видюхи.  Как раз к тому времени у меня возможно дойдут до этого руки.

----------
Вопрос: как насчет вот такой фичи для ST?
Ответ: не сейчас, когда - не знаю, и стоит ли вообще?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 22:14 12-04-2010
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Проверил rc1. Маленький веник работает.

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 03:44 13-04-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
А как Вам задача раскраски маски для последующего малоцветного кодирования - чем больше вникаю в нее, (см сканы от VladimirTT в топике сканирования и обработки) тем больше понимаю, что решаться она должна как раз в районе стадии Вывод.  
Т.е. как это вижу я -  
от пользователя требуется задать набор используемых в маске цветов (пусть даже поначалу это будет лишь один цвет) и, (возможно, необязательно) порог поиска цвета при раскраске. Можно, конечно, пойти еще дальше и определять такие цвета на автомате, но для начала хотя бы так.
При бинаризации, для областей с близким данному цветом порог бинаризации либо автоматически, либо вручную подправляется (особенно, если цвет достаточно тусклый).  
Далее, несоприкасающиеся области, в частности, буквы закрашиваются либо требуемым цветом, либо черным, согласно условию - чьих пикселей больше - такого цвета и буква. Это позволит более грубо задавать порог поиска и избежать цветных вкраплений или ореола у черных букв.  
Есть еще контрпример - книга по каллиграфии, для подобных ей возможность неоднотонной заливки букв придется ставить под галочку.
 
Я к тому, что рубеж метода разделенных сканов за мелкими нюансами Скан Тэйлором взят, а метод раскраски маски - нет (хотя, понимаю, что необходимость в нем случается на порядок реже, чем в МРС).
 
Кроме того, по скорости вывода СТ сейчас сильно проигрывает Кромсатору. Для людей, которые делают много книг, это критично.
 
Просто я не сказал бы, что задача кодирования "гуманитариями" в djvu сейчас как-то особо остро стоит.  
Есть очень шустрый комплект от monday2000 (я надеюсь, что он все-таки победит свою фобию перед "вредным универсализмом" и как-нибудь грамотно их объединит).
Есть очень мощный, и, что немаловажно, одноэтапный и не менее шустрый FSD.
Есть некоммерческий Djvu Solo, который можно использовать, как минимум, как кодер битональных сканов.  
И есть крайне медленный minidjvu, хотя, возможно, по сравнению с многочасовым выводом в СТ полчасика на кодирование в  djvu это ерунда (правда, при достаточно большом объеме словаря там уже далеко не полчасика).

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 07:58 13-04-2010 | Исправлено: StanFreeWare, 08:02 13-04-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
iit512

Цитата:
Проверил rc1. Маленький веник работает.

Меня больше интересует то, нужно ли подкручивать параметры веников и стоит ли вернуть средний веник как веник по умолчанию.  Эти вопросы вызваны тем, что после исправления бага c гуляющей аггрессивностью, средняя аггрессивность всех веников понизилась.

----------
Вопрос: как насчет вот такой фичи для ST?
Ответ: не сейчас, когда - не знаю, и стоит ли вообще?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 11:58 13-04-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
 стоит ли вернуть средний веник как веник по умолчанию

Думаю, не стоит, та страница, из-за которой я просил по-умолчанию сделать маленький веник и на последней сборке средним веником слишком грубо подметается. Даже на 30й жирности.
Кстати, на -30 жирности малый веник удаляет целую строчку отточий в середине оглавления. Но почему-то не трогает отточия в первой и последней строчках.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 15:18 13-04-2010 | Исправлено: StanFreeWare, 15:26 13-04-2010
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
стоит ли вернуть средний веник как веник по умолчанию

Не стОит, малый веник для моих многочисленных отточий -- то, что нужно.

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 21:46 13-04-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare

Цитата:
А как Вам задача раскраски маски для последующего малоцветного кодирования

Ответ - в подписи.

----------
Вопрос: как насчет вот такой фичи для ST?
Ответ: не сейчас, когда - не знаю, и стоит ли вообще?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 23:01 13-04-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Попалась еще одна книга, требующая для стадии макета возможности применения настроек выравнивания "К каждой второй выбранной странице".  
Вообще, выравнивание разных половинок страниц разворота по разному краю - это достаточно общее место в оформлении, например, рекламных буклетов.  
В MS Word такие поля называются зеркальными.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 07:02 15-04-2010 | Исправлено: StanFreeWare, 07:08 15-04-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
Знаете, я конкретно устал от фич-реквестов.

----------
Вопрос: как насчет вот такой фичи для ST?
Ответ: не сейчас, когда - не знаю, и стоит ли вообще?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 11:54 15-04-2010
C0USIN



Silver Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Tulon
Отсутствие зеркальных полей это баг

Всего записей: 2739 | Зарегистр. 18-07-2003 | Отправлено: 17:50 15-04-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Считаю целесообразным встроить "Сепаратор" от StanFreeWare в СТ. В смысле, делать прямо в СТ разбиение "Смешанного" выходного скана на 2 субскана - чёрно-белый (передний субскан - текст) и серый (задний субскан - иллюстрация). И выводить получаемые субсканы в отдельные папки - типа подпапки out.
 
Иначе СТ выглядит очевидной недоделкой.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 12:04 16-04-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
Считаю абсолютно некорректным по отношению к U235 ссылаться здесь именно на Сепаратор, а не на LayerTailor.
Также считаю целесообразным включить аналогичную логику все-таки в Djvu Small, а кодирование МРС через Djvu Imager - сделать одним из его профилей.
 
Короче, даешь однокнопочный Djvu-кодер!
 
Кстати, логику LayerTailor неплохо было бы прикрутить также и к FSD - опять же получим однокнопочный кодер, достаточный для большинства применений, не требующих scanned-style профилей коммерческих кодеров.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 14:16 16-04-2010 | Исправлено: StanFreeWare, 14:17 16-04-2010
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
Считаю целесообразным встроить "Сепаратор" от StanFreeWare в СТ.

Ну так и займитесь этим. Сделайте свою сборку ST. Никто же не против, исходники открыты.  
Зачем же указывать автору ST что и как ему делать в свободное от работы время?
StanFreeWare

Цитата:
Попалась еще одна книга, требующая для стадии макета возможности применения настроек выравнивания "К каждой второй выбранной странице".  

Четные и нечетные страницы после вывода из ST легко можно разделить по разным папкам в total commander'e или используя стандартный поиск. Затем можно добавить поля с помощью пакетных программ типа xnview, irfan, imagemagick и т.д.  И вообще, это можно сделать bat-ником из ~10 строк.
StanFreeWare

Цитата:
Считаю абсолютно некорректным по отношению к U235 ссылаться здесь именно на Сепаратор, а не на LayerTailor.  

В чем некорректность? LayerTailor - это больше демонстрационная утилита, а Сепаратор - вполне себе рабочий инструмент.

Всего записей: 884 | Зарегистр. 14-12-2005 | Отправлено: 13:28 17-04-2010 | Исправлено: U235, 13:28 17-04-2010
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
 
Вот ответ Ильи Межирова по поводу того, кому какой код принадлежит в исходниках minidjvu:
 

Цитата:
Большая часть кода (и C, и С++) как-то соотносится с кодом из djvulibre. Наиболее близок zp-кодер и Ваш bzz. Но это не означает, что Bottou/LeCun имеют копирайт на код minidjvu. Например, любой имеет право выпустить копию djvulibre под GPL3 и своим копирайтом, разумеется при условии, что все ссылки проставлены.

 
От себя добавлю, что в первую очередь смотрел бы файлы с расширением cpp (minidjvu написан на C, и вставки на C++ -- именно по причине заимствования из djvulibre). Но код в любом случае подвергся довольно сильной адаптации, так что его ревизия на предмет соответствия именно последней версии едва ли имеет смысл.
 
Что касается моего вклада, то здесь, наверное, проще всего скачать версии 0.7 и 0.8 и обработать diff'ом. Логи SVN не помогут, т. к. заливка в репозитарий была проведена уже после выхода версии 0.8.

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 23:25 18-04-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare

Цитата:
Также считаю целесообразным включить аналогичную логику все-таки в Djvu Small,

Я не хочу этого делать - по той причине, что не хочу добавлять в дистрибутив DjVu Small файл freeimage.dll (это было бы излишнее утяжеление "веса" DjVu Small). Это пусть Tulon вставляет в СТ такие сомнительной нужности вещи, как CrashReporter, ведущие к утяжелению веса программы - кому надо, могли бы отдельно скачивать CrashReporter.

Цитата:
, а кодирование МРС через Djvu Imager - сделать одним из его профилей.

Ни в коем случае. Это было бы опасным безумием. Уподобиться авторам СК и СТ, делающим "гибрид печки, мясорубки, и стиральной машины в одном флаконе"?

Цитата:
Короче, даешь однокнопочный Djvu-кодер!  

Вот этот лозунг мне нравится. Я "за". Но кто сказал, что ради его реализации нужно слить воедино DjVu Small и DjVu Imager? Есть же и другие варианты: можно просто придумать некую схему, упрощающую связку DjVu Small и DjVu Imager.
И потом: допустим, я объединил в одну программу DjVu Small и DjVu Imager. А что, если кому-то захочется кодировать в DjVu при помощи DjVu Solo 3.1 (minidjvu), а иллюстрировать при помощи DjVu Imager? Как обрабатывать такую ситуацию предлагаемым мне "безумным комбайном"?
А, если кто-то хочет, скачав из Интернета произвольный DjVu-файл, вклеить туда иллюстрации - зачем ему объединённый DjVu Small+DjVu Imager?
Но есть и ещё одна важная причина: глюки. Гораздо проще и удобней отлаживать глюки в 2-х раздельных программах - чем в одной объединённой.
 
Да и слишком уж велика концептуальная разница между DjVu Small и DjVu Imager, чтобы их объединить воедино. Отличается и частота использования (популярность), и критерий устоявшаяся/экспериментальная (программа).
 
Нет, объединять DjVu Small и DjVu Imager в единую программу было бы в корне неверно. Это пусть Tulon полностью отнимает у пользователя свободу действий, диктуя "а сейчас ты сделаешь то-то, а затем - то-то, а по-другому - нельзя - потому что я так хочу".
 
Потому и нет настоящего успеха ни у bolega, ни у Tulon, что они оказались неспособны понять такие простейшие элементарные вещи - а погнались за кажущейся химерой.
U235

Цитата:
Ну так и займитесь этим. Сделайте свою сборку ST. Никто же не против, исходники открыты.

Была у меня такая мысль, но я отказался. Риск слишком погрязнуть - СТ уж чересчур концептуально-ошибочен. Целесообразнее начать агитировать-искать желающих сделать альтернативу СТ - чем пытаться его исправлять.  

Цитата:
Зачем же указывать автору ST что и как ему делать в свободное от работы время?

Потому что существует определённая логика здравого смысла, которая хочешь-не хочешь, а диктует именно определённые решения - независимо от того, хотим мы того, или нет.
Разделение "Смешанного" вывода на пары субсканов должно осуществляться именно в СТ - поскольку ВСЕ ныне существующие DjVu-кодёры не в состоянии самостоятельно отделить от "Смешанного" СТ-вывода то, что они смогут закодировать в DjVu. Именно поэтому СТ должен подстроиться под окружающий мир - а не наоборот. Существование LayerTailor и Сепаратора - есть лишь вынужденное извращение, порождённое Tulon.
Конечно, я могу встроить в DjVu Small автоматическое отделение нужного контента (из СТ-вывода) - но это было бы настолько идеологически неверно, что даже и делать этого совсем не хочется (лучше сделаю свой аналог LayerTailor-Сепаратор, и возложу ответственность за появление очередного "костыля" на Tulon).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 00:18 19-04-2010 | Исправлено: monday2000, 00:31 19-04-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Для такого файла порога +30 чуть-чуть не хватает.

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 07:36 19-04-2010
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
StanFreeWare
ST не учитывает при бинаризации цветовую компоненту, т.е. он просто приводит вначале  картинку к оттенкам серого, поэтому получается такой результат. И повышение порога в этом случае тупиковый путь. Скорее всего это не поможет.
Как вариант можно разложить картинку на компоненты и обрабатывать их отдельно (или слить в один файл, бинаризовать, а раскрашивать по цветам потом отдельно).  
Пример (делалось самописной на FreePascale утилитой + XnView, т.к. для синей компоненты получается низкая контрастность, видимо где-то ошибся с коэффициентами):
http://www.onlinedisk.ru/file/410602/
Кстати, Вы случайно не делали программку для извлечения угла поворота и размеров полезной области из ST-проекта в какой-нибудь текстовой файл? Она бы очень помогла при обработке книги такого типа.

Всего записей: 884 | Зарегистр. 14-12-2005 | Отправлено: 13:35 19-04-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235

Цитата:
Скорее всего это не поможет.  

Для этого скана поможет. Он на +30 бинаризуется без грязи. Так что запас есть.
Но в целом, конечно, бинаризация без учета цветовой компоненты для книги VladimirTT дает низкое качество результата - например, на одной из страниц повышение порога до хотя бы минимальной разборчивости синего текста привело к появлению в черных формулах лишних знаков - "проявились" просвечивающие символы с обратной стороны страницы.
Я раньше пытался решить подобную задачу через выделение цветовой компоненты и их отдельной бинаризации с последующей склейкой. Но технология Separator 2.0 мне кажется гораздо "технологичнее" (естественно, там есть куда развиваться - в частности, нужен быстрый алгоритм для выделения отдельных символов для их последующей заливки, да и вместо HSV логики сравнения наверное можно придумать что-нибудь более наукоемкое).

Цитата:
Кстати, Вы случайно не делали программку для извлечения угла поворота и размеров полезной области из ST-проекта в какой-нибудь текстовой файл?

Не совсем понял, а какой в этом смысл - все равно парсить придется, так не все ли равно что парсить - xml-проекта или текстовый файл со вновь придуманной структурой?

Цитата:
Она бы очень помогла при обработке книги такого типа.

Поясните, поподробнее, как именно?

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 14:01 19-04-2010 | Исправлено: StanFreeWare, 14:03 19-04-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
anagnost96

Цитата:
Большая часть кода (и C, и С++) как-то соотносится с кодом из djvulibre. Наиболее близок zp-кодер и Ваш bzz. Но это не означает, что Bottou/LeCun имеют копирайт на код minidjvu. Например, любой имеет право выпустить копию djvulibre под GPL3 и своим копирайтом, разумеется при условии, что все ссылки проставлены.  

Я с большой степенью уверенности считаю, что Bottou/LeCun имеют таки копирайт на тот код, который перешел из djvulibre в minidjvu, даже если он перешел не в чистом виде.  А версию djvulibre под GPL3 выпустить конечно можно, потому что они поменяли лицензию на "GPL2 или выше".  Поменяли с разрешения других держателей копирайта надо сказать.  Свой копирайт добавить тоже можно, но нельзя убирать копирайт других авторов.
 
В общем работа по привидению всего этого в порядок мне предстоит не из легких и не из приятных, ну что поделаешь.
 
Прошу не считать мои возражения придирками.  Кто действительно придирается, так это Линукс дистрибутивы.  К ST например придрались из-за одной иконки под лицензией Creative Commons.  Если бы я иконки держал отдельно от исполнительного файла, тогда проблем бы не было.  А у меня они вкомпилированы прямо в экзешник, в результате чего нарушается GPL, с которой не совместима Creative Commons.

----------
Вопрос: как насчет вот такой фичи для ST?
Ответ: не сейчас, когда - не знаю, и стоит ли вообще?

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 22:40 19-04-2010
   

Страницы

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)
Maz (10-01-2024 10:45): Scan Tailor (часть 3)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru