Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)

Модерирует : gyra, Maz

Maz (10-01-2024 10:45): Scan Tailor (часть 3)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие части: Часть 1
Scan Tailor


Задача программы - пост-обработка сырых сканов книг для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса (по сравнению со СканКромсатором).
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ncraun) >>>  последняя версия
Scan Tailor Experimental (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (актуальный форк) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода


Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 12:17 17-02-2010 | Исправлено: Maz, 10:43 10-01-2024
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Сборка 2013.05.15
 
http://rghost.ru/46016797
 
Добавлено:
Новая опция:
 
Marginal_Dewarping
 
Я сделал новый вид Dewarping'а. Я назвал его "краевой деворпинг" (marginal dewarping). Его идея очень проста: используется синяя сетка искривления, точнее, её самая верхняя и самая нижняя горизонтальные синие линии.
 
На каждую из этих синих линий программа ставит дополнительные 4 красные точки (в добавок к 2 уже имеющимся крайним слева и справа). Дополнительные точки ставятся с той стороны страницы, где искривление - самое большое (около корешка книги), т.е. для левой страницы точки ставятся с правой стороны, для правой - с левой.
 
Далее эти красные точки просто программно выставляются на верхнюю и нижнюю изогнутую кромку страницы. Т.е. верхняя горизонтальная синяя линия выставляется (по своим красным точкам) по верхней горизонтальной кромке книги, а нижняя - по нижней.
 
Этот метод деворпинга имеет ограничения: он работает, естественно, только для тех сканов, где есть чётко выраженные верхняя и нижняя изогнутые кромки книг - а фон этих кромок должен быть примерно чёрным.
 
Но очень многие сырые сканы удовлетворяют подобному условию.
 
Ещё одно ограничение: для очень крутых искривлений деворпинг пока не совсем точен - видимо, 6 красных точек оказалось маловато. Но никто не мешает доставить вручную ещё 1-2 красные точки и сделать такой деворпинг точнее.
 
Для малоискривленных сканов выпрямление работает очень хорошо.
 
В этой сборке есть одно маленькое чисто техническое ограничение: исходный скан должен быть повёрнут на 90 градусов в человеко-читаемую ориентацию (после отсканирования). Это я исправлю в ближайших сборках.
 
Я оформил новый вид деворпинга просто как ещё один пункт в окошке, где выбирается вид деворпинга.
 
Скорее всего, я потом более подробно расскажу о новом виде деворпинга.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 17:43 15-05-2013
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Экспериментирую с новым деворпингом. Выяснилось, что для очень крутых искривлений он работает плоховато - и это явно его принципиальное ограничение. Зато для относительно небольших искривлений он работает очень неплохо.
 
Добавил в свой деворпинг ещё одну красную точку - это немного улучшило результат.
 
И ещё - в отличие от автоматического деворпинга, этот деворпинг никогда не лажает (разумеется, при условии что на скане есть чёткие верхние и нижние кромки страницы). При использовании Tulon'ского автоматического деворпинга нередко бывает так, что он выдаёт совершенно дикий безумный результат. Но также изредка бывает и такое, что автоматический деворпинг срабатывает хорошо.
 
По крайней мере, теперь у пользователя будет выбор - из двух полностью автоматических деворпингов. Возможно, в дальнейшем, у меня появятся какие-то новые идеи, как усовершенстовать имеющиеся 2 автоматических деворпинга. Мне нужно было с чего-то начать изучение этой сложной темы. Tulon намудрил в своём деворпинге всяких сложностей - я только сейчас начал хотя бы немного смутно ориентироваться что там к чему.
 
В автоматическом деворпинге от Tulon делается анализ кривизны строк и нахождение 2 вертикальных границ контента (по словам Tulon'а, последнее - самое трудное, и поэтому происходят лажания). По верхней и нижней границам кривизны строятся т.н. полилинии - ломаные прямые линии, проходящие через опорные точки кривизны. Затем по этим полилиниям строятся 2 т.н. х-сплайна - исключительно ради того, чтобы дать пользователю возможность подредактировать авто-деворпинг. Затем х-сплайны сэмплируются обратно в полилинии, и по ним уже и делается выпрямление скана. У х-сплайнов - всегда по 5 красных точек (у Tulon'а), а полилинии состоят каждая из десятков опорных точек, поэтому (как я это понимаю сейчас) мой краевой деворпинг даже теоретически всегда будет хуже Tulon'ского авто-деворпинга - если бы последний никогда не лажал. Получается, что именно из-за лажания Tulon'ского авто-деворпинга мой краевой деворпинг приобретает смысл.
 
Мой деворпинг в теоретическом отношении хуже Tulon'ского потому, что я могу ставить красные точки только в узлах синей сетки (поскольку я выражаю искривление в х-сплайнах), а Tulon может ставить опорные точки хоть в каждый пиксель - потому что Tulon выражает искривление в виде полилиний (у которых количество узлов неограниченно, в отличие от х-сплайнов). Может я неправильно всё это понял, но пока что я так понимаю все эти вещи.
 
Пока я не придумал ничего лучшего (чем сделать краевой деворпинг), но теоретически получается, что более выгодно было бы найти способ улучшить авто-деворпинг Tulon'а - чтобы он перестал лажать. Для этого нужно будет ещё долго разбираться в том, как он работает - а получить хотя бы какой-то более-менее приемлемый результат хочется прямо сейчас, да и будет ли у меня когда-нибудь время всерьёз разбираться с Tulon'ским авто-деворпингом?

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 23:03 15-05-2013
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я убрал зависимость краевого деворпинга от исходной ориентации страницы. Теперь новый деворпинг полностью работоспособен. Залил новую исправленную версию на оффсайт:
 
https://sourceforge.net/projects/scantailor/files/scantailor-devel/featured/

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 16:26 17-05-2013 | Исправлено: monday2000, 16:26 17-05-2013
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Продолжаю эксперименты с новым деворпингом. Опыты показали, что краевой деворпинг хорош только для малых искривлений. На больших же искривлениях оказалось, что изогнутый край страницы недостаточно точно отображает искривление страницы. Автоматический деворпинг Tulon'а, если он не ошибается, строит модель искривления как по краю страницы (аналогично краевому), так и по изогнутости строки - что гораздо более точно.
 
Другими словами, при больших искривлениях изогнутость строки (т.е. реальное искривление) и изогнутость кромки книги начинают довольно сильно различаться - и это неустранимый теоретический порок краевого деворпинга (с этим ничего нельзя сделать).
 
Зато на малых искривлениях, изогнутость строки и изогнутость кромки книги - практически тождественны, поэтому для малых искривлений (которые, однако, всё равно выглядят крайне раздражающе, если их оставлять) краевой деворпинг довольно хорош, и при условии наличия четких верхней и нижней кромок скана, никогда не ошибётся (в отличие от автоматического деворпинга от Tulon).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 19:32 17-05-2013 | Исправлено: monday2000, 22:56 17-05-2013
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я сумел выпросить у разработчиков ещё одну реализацию деворпинга - где модель искривления строится по скелетам линий текста. Я назвал его условно "скелетный dewarping":
 
http://www.djvu-scan.ru/forum/index.php?topic=1149.0

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 22:55 17-05-2013
VidelSamogO



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А почему в смешанном выводе нельзя выставить порог бинаризации для чёрно-белых сегментов?

Всего записей: 765 | Зарегистр. 16-08-2008 | Отправлено: 09:03 21-05-2013
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Продолжаю эксперименты с краевым деворпингом. Выяснились закономерности:
 
1. Этот деворпинг хорошо справляется с малыми концевыми изгибами строк. Допустим, вся строка - прямая, и лишь только кончик её - гнутый. Автоматический деворпинг такое искривление просто не замечает (и не выпрямляет, соответственно).
 
2. Не всегда краевой деворпинг точно расставляет красные точки - особенно на круто-изогнутых сканах. Но, во всяком случае, после проработки этого деворпинга довольно нетрудно и быстро можно слегка подправить вручную его результат (т.е. положение выставленных им красных точек) - и при этом соседние красные точки не сбиваются (!) - а это радикально упрощает дело (подгонку красных точек). Т.е. краевой деворпинг в любом случае делает львиную долю работы - по выставлению красных точек - чем достигается солидная экономия ручного труда.
 
3. После проработки краевого деворпинга очень часто сканы нужно опять пропустить через Deskew. Неприятная особенность, конечно, но, видимо, такова уж особенность алгоритма краевого деворпинга - алгоритм выставляет красные точки по линии изгиба кромки, но нам-то нужны не они, а управляемые ими синие узлы сетки - так вот узлы эти немного смещаются вбок (при выставлении красных точек) - поскольку красные точки и (управляемые ими) синие узлы не тождественны по координатам. При автоматическом деворпинге потребности в последующем Deskew я не заметил. Что с этим делать - пока не знаю. Боюсь, что большинство поленятся делать ещё раз Deskew.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 23:44 22-05-2013
amaid



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000, как наиграетесь с деворпингом, сделайте видеоурок для чайников.
Несколько раз пробовал, ковырялся, эффект смехотворный в сравнении с затраченным временем.

Всего записей: 575 | Зарегистр. 25-01-2006 | Отправлено: 00:32 23-05-2013
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
amaid

Цитата:
Несколько раз пробовал

Что пробовали?
 
Добавлено:
Вот образец сырого скана, специально подобранного, чтобы на нём можно было увидеть, что такое "Краевой деворпинг":
 
http://yadi.sk/d/aWon_K-p55gMs  (6,5 МБ)
 
Обработайте его в Scan Tailor Featured, выставив при этом "Распрямление строк" в положение "Краевое". После проработки деворпинга не лишним будет заглянуть на вкладку "Распрямление строк", чтобы увидеть расстановку красных точек синей сетки, сделанную этим деворпингом.
 
Обратите внимание - на скане присутствуют верхняя и нижняя изогнутые кромки страницы - на тёмном фоне. Их наличие на скане, как я уже писал ранее, обязательно - для работы краевого деворпинга.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 13:16 23-05-2013 | Исправлено: monday2000, 14:13 23-05-2013
amaid



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
на пробной картинке результат впечатляет
в fr 11 лучшего трудно добиться даже вручную
при случае попробую (подобные сканы у меня редко)

Всего записей: 575 | Зарегистр. 25-01-2006 | Отправлено: 17:17 23-05-2013
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
на пробной картинке результат впечатляет

Вообще-то на данном скане как раз-таки видно, что результат не идеален. Ближе к центру выпрямленного скана линия текста осталась слегка изогнута вверх слева. Мне попадались такие сырые сканы, где выпрямление достигалось вообще идеальным!

Цитата:
подобные сканы у меня редко

Да, вот в этом-то и главная загвоздка. Не так уж и часто бывают сканы с идеальными горизонтальными кромками. Краевой деворпинг следует рассматривать как первую попытку совладать с деворпингом в СТ. Или как отправную точку для дальнейшего усовершенствования деворпинга в СТ. В СТ так всё запутанно с деворпингом, что потребовалось сделать вот такую простейшую реализацию своего деворпинга, чтобы хоть как-то разобраться в механизме СТ-деворпинга.
 
Мне нужно было лишь выстроить модель искажения - а выпрямление по ней делается само - я понятия не имею, как именно. Модель искажения - это грубо говоря, набор красных точек сверху и снизу.  
 
Любой деворпинг в СТ начинается с того, что за основу берётся область полезного контента, найденная на предыдущих этапах. Если бы не это, то, по словам Tulon'а, деворпинг был бы перенесён на стадию Deskew.
 
В автоматическом деворпинге Tulon'а внутри области полезного контента вверх-вниз делается сканирование строк текста (и кромок страницы - если они есть - как в моем краевом деворпинге). По самой верхней и самой нижней строке текста (кромке страницы) строятся 2 полилинии (просто набор точек) - по опорным точкам этих строк. Всё это можно увидеть в "режиме отладки" в СТ. В идеале, построенные 2 полилинии должны точно повторять изгибы самой верхней и самой нижней строки (кромки страницы). Однако, как уже было сказано ранее, малые концевые изгибы авто-деворпинг Tulon'а не замечает - не хватает точности (а краевой - замечает).  
 
Получив 2 полилинии (т.е. это и есть модель искривления), можно считать задачу выполненной - выпрямление программа делает по этой модели уже как-то сама.
 
Отсюда вывод: можно самому каким угодно способом сформировать эти 2 полилинии, и подсунуть программе. Я для начала попробовал использовать кромки страниц, а теперь уже, я думаю, надо бы попробовать по строкам текста строить полилинии, можно перепробовать теперь разные способы построения кривизны строк текста. Вдруг получится точнее, чем у Tulon'а.
 
У авто-деворпинга Tulon'а есть серьёзная проблема: он часто плохо определяет вертикальные границы блока линий текста. Зачем вообще их определять - я пока не понял. Именно из-за этого получаются дикие результаты авто-деворпинга, которые его давно скомпроментировали ИМХО.
 
Добавлено:
Новая сборка:
 
Scan Tailor Featured 2013.05.23. Залил сразу на оффсайт:
 
https://sourceforge.net/projects/scantailor/files/scantailor-devel/featured/
 
Вводит новую фичу:
 
Auto_Dewarping_Vert_Half_Correction
 
Объясню суть по картинке:
 
   
 
Когда автоматический деворпинг неправильно определяет вертикальные границы контента, то они получаются не-вертикальными - а со значительным углом уклона от вертикали. Это видно по синей сетке всегда. Получается это всегда из-за того, что конец верхней полилинии лежит не над концом нижней (или наоборот). Рисунок иллюстрирует такую ситуацию: красные кривые - это полилинии модели искажения, синие линии - это вертикальные границы. Моё исправление очень простое: оно проверяет угол наклона вертикальных границ. Если он больше некоей эмпирической величины (2,75 градусов я поставил) - то к самой короткой полилинии добавляется ещё одна точка, координаты которой берутся от соседних точек - с таким расчётом, чтобы вертикальная граница стала строго вертикальной. На рисунке добавленная точка показана тёмно-зелёным, а пунктиром - исправленные линии после добавления этой точки.
 
Всё это пока работает только с той стороны синей линии, которая близка к прямой. Та сторона, которая изгибается кривой (около корешка) - её я не трогаю. Потому-то этот патч и носит половинный характер. Причина этого в том, что можно легко "дорастить" прямую до нужной длины - а вот как "дорастить" кривую?
 
Так что пока придётся довольствоваться половинным сокращением случаев ошибок автоматического деворпинга. Впрочем, вторую половину ошибок можно править вручную - надо лишь поставить красные точки кривого конца полилиний строго одну над другой.
 

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 19:04 23-05-2013 | Исправлено: monday2000, 20:37 23-05-2013
Myxb

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
Пробовал собрать версию 2013.05.23 под Debian Wheezy. Выдает:

Код:
[ 72%] Building CXX object filters/output/CMakeFiles/output.dir/Task.cpp.o
In file included from /home/user/scantailor-featured-2013.05.23/filters/output/Task.cpp:55:0:
/home/user/scantailor-featured-2013.05.23/filters/output/OutputGenerator.h:48:25: fatal error: QMessageBox.h: No such file or directory
compilation terminated.
make[2]: *** [filters/output/CMakeFiles/output.dir/Task.cpp.o] Error 1
make[1]: *** [filters/output/CMakeFiles/output.dir/all] Error 2
make: *** [all] Error 2
 
****  Installation failed. Aborting package creation.
 
Cleaning up...OK
 
Bye.

Изменил в соответствующем файле QMessageBox.h на qmessagebox.h. Собралось и работает.

Всего записей: 3 | Зарегистр. 27-02-2006 | Отправлено: 07:46 24-05-2013
LazyKent

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я изменил на QMessageBox.
 

Код:
 
Index: scantailor-featured-2013.05.23/filters/output/OutputGenerator.h
===================================================================
--- scantailor-featured-2013.05.23.orig/filters/output/OutputGenerator.h
+++ scantailor-featured-2013.05.23/filters/output/OutputGenerator.h
@@ -45,7 +45,7 @@
 #include "IntrusivePtr.h"
 #include "Settings.h"
 //Marginal_Dewarping
-#include "QMessageBox.h"
+#include <QMessageBox>
 #include "TiffWriter.h"
 #include <QtCore/qmath.h>
 #include <QFile>
 


Всего записей: 174 | Зарегистр. 17-08-2006 | Отправлено: 08:34 24-05-2013
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Myxb
LazyKent
Точно, не заметил. Да в принципе эту строку вообще можно убрать - я QMessageBox использую там только в отладочных целях.

Цитата:
Я изменил на QMessageBox.

Да, так ИМХО лучше всего.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:55 24-05-2013
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
После краевого деворпинга желательно прогонять обработанный им скан через Deskew. Видимо, это одна из особенностей этого алгоритма, что он порождает небольшой угловой перекос скана. Сейчас я думаю над тем, чтобы добавить автоматический Deskew к результату краевого деворпинга.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 21:29 24-05-2013
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Может быть, в Featured можно реализовать две простые вещи? Их уже тут предлагали несколько раз, но пока безрезультатно...
1) Посадить на цифры (1, 2, 3) горячие клавиши перехода от этапа к этапу обработки. Очень упростит работу на сложных сканах.
2) Сделать так, чтобы выделение страниц сохранялось при переходе на другой этап обработки. Тогда можно будет, например, обработать страницы определенной высоты определенным деспеклом, и т.д. В ранних версиях выделение сохранялось, но потом это куда-то пропало.
И еще одна вещь, я ее уже тут подробно описывал. Нельзя ли как-то заставить СТ не обрабатывать страницы в тот момент, когда пользователь их просто выделяет (чтобы, скажем, поменять им тип вывода)? Это очень сэкономит батарею ноутбука.
Ну и такая мелочь. СТ, завершая обработку, опять переходит на первую страницу. Первая страница -- это обычно обложка, и ее часто требуется обработать дополнительно где-то еще. Так вот, если, пока идет вывод,ее обработать и оставить в папке вывода, СТ ее сотрет А можно как-то ему сказать оставаться на последней странице?

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 06:18 29-05-2013
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
iit512
Одного меня мало - явно нужен ещё один человек, чтобы он также сделал какой-нибудь свой клон СТ.

Цитата:
2) Сделать так, чтобы выделение страниц сохранялось при переходе на другой этап обработки. Тогда можно будет, например, обработать страницы определенной высоты определенным деспеклом, и т.д.

Непонятно.

Цитата:
Ну и такая мелочь.

Мелочами заниматься пока что неинтересно. Времени на реализацию они потребляют столько же, а эффект - мизерный.
 
Добавлено:
Мне тоже можно помочь - если кто-то хочет. Помочь в плане деворпинга. Помочь можно так:
 
1. Возьмите сырой скан (искривленный, требующий деворпинга). Обрежьте до одной страницы, поверните, чтобы строки были горизонтальны, сделайте Deskew (возможно ещё и бинаризацию).
 
2. Обрежьте скан так, как это делает "Полезная область" - т.е. чтобы остался только текст. Примерно, не сильно строго.
 
3. Посмотрите на самую верхнюю и самую нижнюю строку текста. Попробуйте программно автоматически построить полилинию (в виде набора точек), максимально точно повторяющую изгиб самой верхней строки текста. То же самое - для самой нижней строки текста.
 
Что значит "полилиния"? Представьте обычную строку текста. Её ориентацию можно выразить прямой линией. А искривленную строку можно выразить кривой (называется "сплайн"), или полилинией, представляющую из себя отдельные точки сплайна (взятые через одинаковые расстояния), соединенные отрезками прямой. Полилиния - это сэмплированный сплайн.
 
Это будет модель искривления, достаточная для СТ. Т.е. достаточно просто научиться строить такую модель искривления (в виде 2 полилиний) - и проблема деворпинга будет решена. Tulon'ский и мой автоматический деворпинги недостаточно точно (не идеально) строят такие полилинии (автоматически).
 
По запросу "Dewarping" в Яндексе можно найти кучу PDF-описаний разных алгоритмов деворпинга. Их можно почитать, как они строят такие полилинии.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:52 29-05-2013 | Исправлено: monday2000, 10:09 29-05-2013
iit512

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Да, все понимаю. У каждого, кто хоть сколько-нибудь активен, полно своих проектов и очень мало времени. Обычная проблема Open Source. Но Вы этим уже занялись -- вдруг у Вас найдется время и желание помочь другим пользователям?
> ... Непонятно.  
Я имел в виду следующее. Если выделить несколько страниц, то при переходе на другой этап обработки (щелчке на одном из пунктов в верхнем левом углу) выделение пропадает.

Всего записей: 177 | Зарегистр. 18-05-2005 | Отправлено: 19:14 29-05-2013
GameKowal

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor Featured 2013.05.23  почему-то постоянно самопроизвольно закрывается при запуске финальной обработки файлов.
Файлы tiff b/w 300 dpi, размером по 400-600 кб. Из 20 файлов обрабатывается только 4-6, после чего прога падает

Всего записей: 2066 | Зарегистр. 23-11-2004 | Отправлено: 19:38 30-05-2013 | Исправлено: GameKowal, 19:43 30-05-2013
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
GameKowal
Давайте эти файлы вместе с файлом-заданием.
 
Добавлено:
Новая сборка - 2013.05.31
 
https://sourceforge.net/projects/scantailor/files/scantailor-devel/featured/
 
Добавлено автоматическое Deskew, применяемое автоматически к результату краевого и ручного деворпинга. Пока что это сделано не самым оптимальным образом - не различаются разные случаи ручного деворпинга - ручной после авто-деворпинга и ручной после краевого. Но лучше так, чем никак.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 10:41 31-05-2013
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)
Maz (10-01-2024 10:45): Scan Tailor (часть 3)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru