Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)

Модерирует : gyra, Maz

Maz (10-01-2024 10:45): Scan Tailor (часть 3)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие части: Часть 1
Scan Tailor


Задача программы - пост-обработка сырых сканов книг для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса (по сравнению со СканКромсатором).
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ncraun) >>>  последняя версия
Scan Tailor Experimental (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (актуальный форк) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода


Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 12:17 17-02-2010 | Исправлено: Maz, 10:43 10-01-2024
papaVlad



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4lex4, последний ответ так напомнил сценку Винокура "тут играем, это не играем, а здесь рыбу заворачивали"
 
Отдельная благодарность за слово "повернутый", а то иногда не понимают, что малейшее изменение наклона даёт размытие, потому если вижу в СТ маленькие значения поворота, то правлю на нули.
 

Цитата:
что тут будут споры
какие споры, делимся информацией, пусть читают.
Слушайте, я первый раз вот так в живую наконец увидел правильную обработку скана от другого человека, признайтесь, с моих советов взяли способ затемнять по светлым тонам, чтоб края и перемычки букв затемнить? Вы же фотошопом пользуетесь, а я только на ACDSee показываю, можете в ввиде помощи голодающим записать видео, как в фотошопе это делается. Это было бы самое ценное видео, которым бы смог делиться. Кроме шуток, очень надо, сплошные фотошоперы вокруг, а я им не пользуюсь. И ещё, это ссылка на тиф будет жить или самоудаляемая? Хотя могу и перезалить, если что.
 
Бог с ними, с правилами, с буквами, гладкие или толстые, увеличивать или нет, про комфортно читать и т.д., Вы мне лучше скажите откуда такая инфа """Сохранять тифы несжатыми глупо - они просто дольше будут открываться.""", есть какие доказательства? А то я по-прежнему советую обратное, и есть видеотесты, где ни разу не победил LZW-тиф, хотите ещё нашлёпаю на разной мощности машинах. Я-то эту инфу мимо ушей пропущу, а ведь ещё и народ читает, вдруг поверят.
 
И замените в последнем предложении "НЕСЖАТОЕ" на "СЖАТОЕ БЕЗ ПОТЕРЬ", так правильнее и легче понять смысл фразы.
 
До завтра!

Всего записей: 161 | Зарегистр. 22-04-2012 | Отправлено: 01:14 16-06-2016
hogu77

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
4lex4
Способ для PDF MRC: <...>

Спасибо, буду пробовать.

Цитата:
Для DjVu нужна настройка соответсвующих утилит. Для DjVu много настроек, самое главное - сабсемплинг фона - 2 (600DPI / 2 = 300 DPI), качество фона - 80 (LizardTech, DjVu Small, Caminova) или 32 для Djvu Libre (DjVu Image и др.). Остальное по своему усмотрению, только никаких трансформаций (они должны быть до), естественно сабсемплинг фореграунда >=2 (лучше 12). Главное, что бинарная маска должна получаться 600 DPI, Background - 300 DPI. Получим качественный DjVu с цветным текстом и гладкими буквами, и хорошими картинками.
Есть способ с mask upsample 2 из сканов 300 DPI, тогда бинарная маска тоже будет 600DPI, но текст будет менее качественным и более зубристым, не рекомендую.

Интересно. А можно в виде пикч в настройках DjVu Small Mod'а, для наглядности?)
 

Цитата:
papaVlad
<...> иногда не понимают, что малейшее изменение наклона даёт размытие, потому если вижу в СТ маленькие значения поворота, то правлю на нули.


В конце прошлого века, знакомясь с учебником по Фотошопу, я вычитал что при повороте (впрочем не только при повороте) изображение деформируеться. Математически - да, а визуально оказалось что «не так страшен чёрт ...». Вот читают твоё сообщение неофиты и у них совершенно отпадает желание использовать Тэйлор по причине корёженья первоисточника. Если подходить к вопросу так как артикулируешь ты то правды ради надо выбросить и ACDsee, по причине «корёженья» первоисточников.
Аккуратнее надо со словами быть. Обращаюсь не только к тебе.
 

Цитата:
<...> можете в ввиде помощи голодающим записать видео, как в фотошопе это делается.

Боже, только не говори что сразу же после этого засядешь за фотошоп!

Всего записей: 118 | Зарегистр. 14-02-2012 | Отправлено: 12:42 16-06-2016 | Исправлено: hogu77, 12:47 16-06-2016
NME



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ну и наоффтопили))
раз пошла такая пьянка, выскажусь и я..

Цитата:
В DjVu можно настроить любое качество картинок, хоть исходное без потерь

согласно спецификации в djvu можно вставить jpg (чанки BGjp и FGjp), что и было продемонстрировано на картинке с хлопцами.. в том, что jpg просто вставлен в djvu можно убедиться так - удалить начальные байты djvu, включая BGjp + 4 байта, изменить расширение файла на jpg и открыть в любом просмотрщике картинок.. но т.к. jpg по определению с потерями, то про "без потерь" говорить некорректно, можно сказать, что djvu способен "не испортить испорченное еще сильнее".. есть, конечно, инструменты, способные jpeg2000 в djvu загнать (чанки BG2k и FG2k), вот только ни один просмотрщик не отображает сие и судя по динамике развития формата - этого не произойдет никогда.. что очень печально..

Цитата:
    In addition, the chunk names #"BG2k"# and #"FG2k"# have been reserved for
    encoding the background color image and the foreground color image using
    the forthcoming JPEG-2000 standard.  This capability is not implemented at
    the moment.  The JPEG-2000 standard may even become the preferred encoding
    method for color images in DjVu.

 

Цитата:
Сохранять тифы несжатыми глупо - они просто дольше будут открываться.

это произойдет в том случае, если скорость чтения данных с носителя меньше скорости "распаковки" сжатого изображения.. имхо.. всё зависит от железа..
 

Цитата:
фанаты дежавю переубедили Вас и убили энтузиазм

мне не очень понятен этот батл djvu vs pdf.. СТ предназначен для обработки изображений под последующее изготовление книги - так почему же не делать и pdf, и djvu? у каждого из форматов есть свои преимущества - djvu более шустрый, pdf более универсальный.. я, например, для тех или иных случаев конвертирую как pdf в djvu, так и наоборот.. и, если на выходе сабжа будет материал, из которого можно без особых усилий сделать КАЧЕСТВЕННУЮ книгу как в одном, так и в другом формате - то и не стОит ломать голову над выбором - надо делать и то, и другое! имхо, идеальным бы было создание данных книг из самой программы (как в СК, но чуть попроще)..
з.ы. возможно, всё уже в программе есть, я не знаю, т.к. СТ не пользуюсь, просто высказал свою точку зрения..

----------
DjVu Utils

Всего записей: 1427 | Зарегистр. 26-07-2007 | Отправлено: 12:51 16-06-2016
4lex4

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
NME, все верно.
 
Но прошли те врена ностальгии по JPEG2000 как замене JPEG. Вот смотрите:
http://xooyoozoo.github.io/yolo-octo-bugfixes/#fruits&jpg=s&jp2=s
 
При том же размере BPG дает более качественное изображение, чем даже JPEG2000, и уж тем более устаревшего JPEG. Сравните качество BPG, WebP, JPEG2000 и JPEG при разных степенях сжатия.
 
У JPEG2000 преимущество - у него есть режим сжатия без потерь, у IW44 нет, но в данном случае (для сохранения книг и документов) оно в принципе и не нужно.  
Но разговор был о том, что DjVu обвинялся в порче и размытии изображений - а это неверно, при том же размере IW44 дает почти то же качество, что и PDF с JPEG2000, и лучшее, чем PDF с JPEG. Не нужно юзать стандартные профили DjVu, как делают неопытные пользователи - они устарели, современные мониторы требуют картинок в 300 DPI и с более высоким качеством сжатия - для качественных изданий и документов (для некачественных книг можно и 150), а не 100 DPI, как лет 10 назад.  
Размер для книг в 5Мб уже не имеет такого принципиального значения, как 10 лет назад, сейчас и 30 нормально.
 
DjVu следует использовать исключительно для сохранения книг и документов в растровом формате, тут он обычно эффективнее, а PDF во всем остальном, ибо второй универсален, а первый нет.  
И не надо юзать JPEG, если есть лучший JPEG2000. Например, многие сохраняют журналы в обычный PDF, сжимая JPEG, получаем размытый текст и замусоренный фон из-за артефактов. Ведь можно сделать то же самое и с JPEG2000, который не дает таких артефактов, а при том же размере качество выше.
 

Цитата:
это произойдет в том случае, если скорость чтения данных с носителя меньше скорости "распаковки" сжатого изображения.. имхо.. всё зависит от железа..  

Все верно, но не только. От скорости алгоритма распаковки тоже зависит.
 
Вообще имеет смысл сжимать не только изображения, но даже исполняемые файлы. Операция считывания с жесткого диска занимает в разы больше времени, чем распаковка более менее современным процессором в памяти.
 
Вот цитата из вики про UPX:

Цитата:
Самое весомое и неоспоримое преимущество — ускорение считывания и запуск сжатых файлов с носителей информации, а также высвобождение дополнительного свободного пространства на внешних накопителях. К сожалению, на сегодняшний день все внешние накопители информации по-прежнему остаются самыми медленными узлами современных вычислительных систем, «тормозящими» быстродействие системы в целом, как и на заре вычислительных технологий. Поэтому нельзя не оценить эффект, возникающий при системном применении упаковщиков исполняемых файлов, таких как UPX. Вычислительная система затрачивает значительно меньше времени на считывание и распаковку сжатого файла в оперативной памяти, нежели на простое считывание этого же неупакованного файла (при считывании с внешнего накопителя время, затрачиваемое на операцию, исчисляется миллисекундами, а время на обработку данных в оперативной памяти — микро- и наносекундами).

 
Я лично проверял работу несжатых и сжатых LZW цветных тиффах 600 DPI. (HDD, мобильный Core i5)
Пакетная обработка (одно и тоже простое действие, одни и те же изображения) в фотошопе несжатых изображений заняла более 2х часов, а сжатых LZW 20 минут. Именно операция простого открытия замедляла работу в первом случае, и жесткий диск вертело практически непрерывно.
 
Вы легко можете это проверить. Берете цветной скан 300DPI - апсемплите допустим до 1200 DPI, один сохраняете несжатым, другой сжимаете LZW или ZIP. И смотрите, сколько времени будет открываться первый и второй. Можно накопировать каждый по 10 копий, и открывать разом, чтоб увеличить эффект и снизить погрешность измерений.
 
Это незаметно, если файл маленький, допустим 300 DPI. Но при пакетной обработке, когда таких файлов много, разница в скорости открытия станет заметна и тут.  
Не забывать, что все зависит от железа: на очень старых процессорах разницы может и не быть, а то и наоборот.

Всего записей: 346 | Зарегистр. 27-01-2016 | Отправлено: 13:57 16-06-2016 | Исправлено: 4lex4, 20:34 16-06-2016
4lex4

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
papaVlad, вообще ничего не понял. Объясните понятно и подробно.
hogu77, сделаю и кину сам профиль, пойдет? Главное не забывать апсемплить до 600 дпи перед подачей в инкодер, чтоб буквы были гладкие и ровные.

Всего записей: 346 | Зарегистр. 27-01-2016 | Отправлено: 19:58 16-06-2016
hogu77

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
4lex4
<...> сделаю и кину сам профиль, пойдет?

Спасибо.

Цитата:
Главное не забывать апсемплить до 600 дпи перед подачей в инкодер, чтоб буквы были гладкие и ровные.

Разрешение 600 dpi должно быть в свойствах файлов-сканов идущих в кодирование или так же с учётом какого то «среднего» значения ширины/высоты картинки? Пример.
Т.е. были в оригинале такие значения:

... должны быть такие?

Оригинальный файл:


Всего записей: 118 | Зарегистр. 14-02-2012 | Отправлено: 22:03 16-06-2016
papaVlad



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hogu77, оставлю эту фразу без изменений """малейшее изменение наклона даёт размытие""", относится к любому редактору, в том числе и СТ и ACDSee, и без проблем могу добавить """что «не так страшен чёрт ...»."""

Цитата:
сразу же после этого засядешь за фотошоп!
Пока нет необходимости.
 
NME
Цитата:
это произойдет в том случае, если скорость чтения данных с носителя меньше скорости "распаковки" сжатого изображения.. имхо.. всё зависит от железа..  

4lex4
Цитата:
Все верно, но не только...
Вообще имеет смысл сжимать...  
Вот цитата из вики про UPX:  
Самое весомое и неоспоримое преимущество...  

Что же Вы так сложно пишете? Ну не все тут с образованием, попадаются и """неофиты""". Пытаюсь понять смысл этих фраз, но моя скорость чтения с мозга ниже скорости распаковки этих слов, потому нафик Вашу теорию, перейдём к практике и помучаем железо, благо днём появилось время.
 
В этот раз использовался ноутбук с железом 2014 года:
http://i71.fastpic.ru/big/2016/0617/0a/bf4b2d137047b674f536ef32f786840a.png
- скорость SSD http://i65.fastpic.ru/big/2015/0406/cd/3b012c7322047e801c97b2b8d21b79cd.png
- скорость HDD (5400 об/м) http://i65.fastpic.ru/big/2015/0406/91/be5e27b64af6820be17ae476b76ea991.png
 
В итоге вот такие результаты вывел для себя - ничего из этого """Я лично проверял работу... Вы легко можете это проверить... Это незаметно, если файл маленький... Не забывать, что все зависит от железа...""" в моих тестах не подтвердилось, и хорошо, по-прежнему советую использовать тиф несжатый и сам остаюсь на нём.
Правда пакетную обработку проверял на ACDSee и ещё одну позицию не смог проверить, просто не знаю способа, как открыть 10 файлов разом, какой-то скрытый смысл у этой фразы, возможно тоже из фотошопа, думаю, что я этим не пользуюсь, взамен проверил по другим, неуказанным выше операциям, всегда LZW проиграл.
4lex4, далее Ваше право, можете продолжать сжимать, можете распространять вики-ссылки, я не мешаю, и даже верю, что у Вас всё наоборот, потому и не буду спорить, не имею цели создать в этом топике раздор.
 
Да, я всё записал на видео, но в этот раз пожадничаю, отвечу всем желающим цитатой """Вы легко можете это проверить""" и желаю, чтоб у всех железо не подвело и Ваша дружная команда победила.
 
4lex4
Цитата:
papaVlad, вообще ничего не понял. Объясните понятно и подробно.

Вот и я также, через слово вставляю в поисковик или переводчик, чтоб хотя бы как могу поддержать """этот батл djvu vs pdf""".
Когда появится фотошопер-непоймёнышь, то отошлю его сюда, а мне это и не нужно было, мне всё понятно.

Всего записей: 161 | Зарегистр. 22-04-2012 | Отправлено: 23:57 16-06-2016
4lex4

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
papaVlad, если вы записывали на видео, то заняли процессор -  результаты уже неправильные.
 
Я тоже проверил, в обычных условиях LZW действительно проигрывает в по скорости открытия. Скорее всего у LZW медленный алгоритм распаковки.
Но если жесткий диск занят чем-то посторонним, то LZW открывается намного быстрее - вот в чем дело.
Вообщем да, если много места, лучше юзать несжатые тифы.
 
Добавлено:
hogu77, нет конечно, должно меняться разрешение, и важен алгоритм интерполяции.
 
Допустим есть скан 300 DPI. Переводим его на 600, используя бикубическую (также можно билинейную) интерполяцию. То есть разрешение по вертикали и горизантали увеличится в два раза.

Всего записей: 346 | Зарегистр. 27-01-2016 | Отправлено: 02:16 17-06-2016 | Исправлено: 4lex4, 13:35 17-06-2016
suts2012

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
сделаю и кину сам профиль, пойдет?

 
4lex4, а можно и мне профиль?
 
 

Всего записей: 2 | Зарегистр. 19-08-2014 | Отправлено: 22:21 02-08-2016
4lex4

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hogu77, suts2012 - ваши профили.
 
Для DjVu small mod: Скачиваем Scanned 600 (HQ).conf и кидаем в profiles\personal
Для LizardTech Document Express Enterprise: Скачиваем инструкцию и делаем как написано.
 
Сразу напоминаю, что необходимо как минимум интерполировать (ресемплить) изображение до 600 DPI (лучше использовать бикубическую интерполяцию), чтоб буквы были гладкие, а лучше использовать полноценную предобработку со сложными фильтрами и сглаживанием, но об этом позже, в новости по разработке ST Advanced, я дам ссылки и покажу примеры. Сам исходник может быть и 300, и 200 DPI, сканить в 600 излишне естественно за исключением некоторых случаев.
 
Вот сразу пример работы из жизни:
 
На рутрекере есть раздача одной книженции со сложной версткой:
http://rutracker.org/forum/viewtopic.php?t=4668001
 
Ребята из групп, специализирующихся на книгах не запариваясь вывапливают тот шлак, который вываливают, даже не настроив кодер. Там в коментах собственно кто-то отписал жалобы по сути - потери деталей.  
Собственно такого говно-djvu и навалом, когда дело касается книг со сложной версткой, но виноваты в этом люди.
(Примечание: к ч/б DjVu или ч/б + подклееные картинки после ST/SK это не относится, ибо DjVu кодер не меняет ч/б изображение значительно, потому они получаются такие как есть после обработки, независимо от профиля - но бинаризовывать в ч/б можно только книги с простой версткой без сложных элементов, для сложных, как в примере, все опирается на профиль)
 
Я в коментах к раздаче месяц назад выложил свой вариант, предварительно обработав (подробнее об этом я напишу позже, в новости по поводу разработки ST advanced), естественно юзая выложенный сдесь профиль:
http://rutracker.org/forum/viewtopic.php?p=70959327#70959327
 
Вот наш общий исходник в PDF, а по сути исходные исходные сканы 300 DPI, сжатые JPEG:
http://rutracker.org/forum/viewtopic.php?t=4261149
 
 
*Здесь должна быть новость по разработке ST Advanced, но примеры еще не готовы, так что потом.

Всего записей: 346 | Зарегистр. 27-01-2016 | Отправлено: 03:38 03-08-2016 | Исправлено: 4lex4, 03:50 03-08-2016
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4lex4
"OCR от последней версии FR" - давно не занимался сборкой книг. Как-то решился вопрос со сложностями использования последних версий FR при добавлении OCR в книги через DjvuOCR? Или применяется другой способ? Если можно, хотя бы коротко опишите ваш метод. Остальное найду сам...

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 08:30 03-08-2016
4lex4

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
denver 22,  

Цитата:
Как-то решился вопрос со сложностями использования последних версий FR при добавлении OCR в книги через DjvuOCR?

как бы уже давно, если они вообще были.
 
NME сделал несколько простеньких и полезных утилиток, вам нужен FR11 DjVu Text Layer Crutch, курим описание.
 
Буду краток:
Вот вы сделали свой DjVu.
В FR выбираем режим распознования Ч/Б, чтоб не тратить время, ибо нам нужен только текст; в настройках сохранения DjVu в FR обязательно ставим Source resolution (исходное разрешение); сохраняем в DjVu.
Теперь у нас два DjVu, наш и из FR с текстом. В DjVu Text Layer Crutch выбираем последний и щелкаем сохранить исправленный слой в другой файл, выбираем наш DjVu и готово.
 
Также текст можно редактировать:
 
Качаем DjVuLibre.
1. Вынимаем текстовый слой: djvused myfile.djvu -u -e 'output-all' > myfile.dsed;
2. Редактируем myfile.dsed;
3. Внедряем обратно: djvused myfile.djvu -f myfile.dsed -s;
4. Т. к. DjVuLibre сохраняет концы параграфов с помощью US (Unit Separator), который не всегда корректно обрабатывается ридерами, рекомендую заменить все US символами перевода строки:
FR11 DjVu Text Layer Crutch: под "не ФР11+" ставим Параграф = 0x0A, Строка = Ничего, Страница = Ничего; нажимаем сохранить исправленный слой в редактируемом файле.
 
*Вместо djvused можно юзать djvuxml, результат такой же, но с XML работать удобнее.
 
DjVuOCR можете смело форматировать, устаревшая и более ненужная программа, плюс она не поддерживает деления на параграфы. Простейший случай: если текст в двух столбцах на одной странице - с DjVuOCR вы получаете кашу. Старые версии FR тоже форматируйте.  
Не думал, что есть люди, юзающие такой старый хлам.

Всего записей: 346 | Зарегистр. 27-01-2016 | Отправлено: 16:40 03-08-2016 | Исправлено: 4lex4, 17:17 03-08-2016
LazyKent

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Уважаемые джентльмены.
 
Вы сообщаете относительно интересную информацию, но, как мне кажется, к "Scan Tailor" она не имеет отношения.
Возможно, технические подробности кодирования стоит обсуждать в более подходящей теме.

Всего записей: 174 | Зарегистр. 17-08-2006 | Отправлено: 20:56 03-08-2016
hogu77

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
4lex4
Итак, сердечно благодарю за профиль и наглядный пример, буду пробовать на сложных случаях.
Просьба. Что бы не было испорченного телефона, напишите пожалуйста в эту например тему сообщение о профилях, хоть пару предложений. Необходимость такого поступка думаю не требует излишних слов.
Памятуя про гладкость букв и будущие ссылки и примеры хотел и я сказать пару слов про методы интерполяции но после сообщения LazyKent'а, рука не поднимается. Да и пожалуй подожду ваши примеры, может чего и не знал.

Всего записей: 118 | Зарегистр. 14-02-2012 | Отправлено: 15:43 15-08-2016 | Исправлено: hogu77, 15:49 15-08-2016
henderson



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Возможно это обсуждалось. Столкнулся с тем, что программа не выводит изображения в папку out. Прошел все шаги, запускаю вывод изображений, программа показывает, что работа идет, а в папке out - пусто. При повторном запуске появилось только одно изображение и то не с начала книги. Может быть дело в длинном пути до папки out? Как тогда его сменить? Переносил папку с файлами ближе к корню диска, настройки ковырял, но программа потом жалуется, что не находит обрабатываемые файлы. Система Windows 8.1 64-bit.

Всего записей: 82 | Зарегистр. 18-01-2010 | Отправлено: 11:56 25-08-2016
henderson



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Проблема вроде решилась кликом в путях проекта на путь первого редактируемого изображения. По крайней мере после этого в папке out стали появляться файлы.

Всего записей: 82 | Зарегистр. 18-01-2010 | Отправлено: 19:50 25-08-2016
Fafy

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Только недавно обрел сие чудо.
Программа ОЧЕНЬ нужная, и сделан правильный подход к реализации. Но есть один момент, который может перечеркнуть все преимущества данной программы - частое неправильное распознавание полезной области, на поправление которой может уйти столько времени, сколько требуется на ручную обработку в графических редакторах, например, инструментом кадрирования в ACDSee Pro.
 
Программа много ошибается даже на практически идеальных страницах. Это касается в первую очередь нумерации страниц, и в меньшей степени - ширины колонок.
Бывает даже так, малю-ю-ю-ю-ю-ю-сенькую точечку программа увидит, а нумерацию страниц из несколько цифр выделенных широким тире (например: — 450 —) не хочет видеть. Из почти 500 страниц нумерацию страниц внесло в блок полезной области только 40 страниц. Сканы качественнные и на чистой белой бумаге. Текстовый блок захватывает, а нумерацию очень редко.
 
В FineReader 12 распознавание полезной области работает достаточно качественно, чего, конечно,  не скажешь о выравнивании там страниц. Хотя бы дотянуть до уровня распознавания полезной области FineReader.
Пускай автомат будет немного дольше распознавать полезную область, зато меньше ручной правки,  чем быстрая работа распознавания и долгая работа ручной правки.
 
Качество оригиналов бывают совсем разные, от практически идеальных страниц, до просто ужасного качества сканов или фоток. И применять к таким разным сканам один алгоритм, без каких-либо настроек этой функции было бы не совсем правильно. Ведь есть же критерии, по которым определяется полезная область, значит, и можно, и желательно управлять самим процессом распознавания.  
 
Например, можно было бы через опции программы перед запуском распознавания полезной области вручную уточнить некоторые параметры от которых зависит качество и скорость распознавания. Например, указать ширину большинства колонок, есть ли картинки и выходят ли они за  колонки текста, где располагается и есть ли вообще номерация страниц или другие колонтитулы,и где они расположены, качество сканов и другие параметры, которые повысили бы качество распознавания.
 
Можно попробовать ввести такое понятие как неуверенно распознанные границы и дать возможность сортировки по ним, и конечно, как-то выделять такие контуры другим цветом и управлять ее толщиною для наглядности. Т.е. добавить опцию выбора цвета и толщины таких линий. Это гораздо упростит и ускорит работу над созданием книг.
   
Конечно, говорить это не делать. Но если не повысить качество распознавания полезной области, то теряется главное преимущество этой программы - автоматизация. Функция распознавания полезной области здесь самая важная, и от нее напрямую зависит сколько ты затратишь время на обработку сканированных книг.

Всего записей: 725 | Зарегистр. 25-10-2010 | Отправлено: 16:59 30-08-2016
amaid



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Fafy, чудак, файнридер шлифует толпа программеров на зарплате, а ST - бесплатно сделал одинокий болезненный гений. Полезная область распознается вполне приемлемо, на других книгах увидишь. Добавь поля снизу, где номера страниц, если многие не распознаются.

Всего записей: 575 | Зарегистр. 25-01-2006 | Отправлено: 08:25 31-08-2016
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Fafy
Забавный коммент... Для чего он?
Могу "обосрать" любую прогу OCR.
Например, ни одна из них не понимает выворотку/инверсию... и чО!?
Края изображений распознаются по-серому и потому светлые цветные полутона идут лесом... и чО?!
 
Полная автоматизация ИМХО невозможна, т.к. количество входных параметров практически бесконечно.
 
А так, вы перед тем как сувать сканы в СТ сделайте небольшую краевую резкость - и распознавание улучшится.
 
А конструктив по программе сделайте сами или найдите программиста - и все будут вам благодарны. Тем более, что исходники открыты.

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4307 | Зарегистр. 18-09-2003 | Отправлено: 09:45 31-08-2016
Fafy

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Забавный коммент... Для чего он?  

slava_kry Наверное, чтобы вы могли сделать это:

Цитата:
Могу "обосрать" любую прогу OCR.  

А вы кроме "обосрать" еще что-то умеете?
И да, с этим делом явно не в эту тему!

Цитата:
А так, вы перед тем как сувать сканы в СТ сделайте небольшую краевую резкость - и распознавание улучшится.  

Попробую, но что-то есть большие сомнения.

Цитата:
Полная автоматизация ИМХО невозможна, т.к. количество входных параметров практически бесконечно.  

А никто и не говорит о полной автоматизации, или о супер-пупер распознавании. Хотя бы немного улучшить этот процесс, ведь, повторюсь, от этой функции напрямую зависит затраченное время на обработку книги. Если же скорость АВТОМАТИЗАЦИИ будет равна РУЧНОЙ обработке, то какой вообще смысл в этой автоматизации?

Цитата:
Fafy, чудак, файнридер шлифует толпа программеров на зарплате

amaid Scan Tailor лучше справляется с выравниванием, но по вашей логике должно быть все наоборот.

Цитата:
Полезная область распознается вполне приемлемо

Все что принимаем, все это приемлемо. Да, тут все логично. Но ни о каком развитии программы не будет речи, если будем останавливаться на "приемлемом" и не стремится к "лучшему". И это не зависит от толпы програмеров.

Цитата:
Добавь поля снизу, где номера страниц, если многие не распознаются.

Когда страницы снизу, то это работает, когда же сверху, то не совсем.

Всего записей: 725 | Зарегистр. 25-10-2010 | Отправлено: 11:23 31-08-2016 | Исправлено: Fafy, 11:32 31-08-2016
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)
Maz (10-01-2024 10:45): Scan Tailor (часть 3)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru