Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
kontiky

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Повертел вашу программу минут 5 и вот что могу сказать...
 
Что совершенно не понравилось, и из-за чего для меня переход с СК, который я уже изучил и который делает, что мне нужно на 90% (хоть часто и через ж)
- совершенно ненужные интерфейсные изыски. К чему это маленькое окошко при старте? Просто сделайте запуск сразу пустого главного окна приложения. Вверху - главное меню, в меню File->New, File->Open, File->Save для проекта, выбор последних открывавшихся проектов. Все остальное задизейблено. Запустите FR - и вы увидите, что я имею ввиду.
- thumbnails страниц должны быть слева, как это сделано во всех программах такого рода - в акробате, windjvu, FR
 
Что понравилось
- thumbnails страниц - в СК мне иногда этого нехватает
- штурвал для ручного поворота страниц, но без гистограммы имхо он не очень полезен
- выделение текстовых зон прямоугольниками, а не резаками как в СК. Могут ли быть эти прямоугольники параллелограммами?
 
Что хотелось бы в перспективе (а я надеюсь, вы будете работать над программой, в отличие от забившего на СК bolega)
- автоопределение областей изображений
- возможность тут же и сканировать
- возможность тут же создавать djvu файлы
Т.е. иметь все необходимое для создания книг "в одном флаконе". Вот такую программу можно было бы сделать и шароварной, и такую программу я бы купил.
 
Мое резюме - я перешел бы на СТ с неразвивающегося СК, если бы программа стала бы похожа на FR, но со специфическими для книгоделания возможностями.

Всего записей: 320 | Зарегистр. 14-09-2003 | Отправлено: 23:06 01-09-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
kontiky
 

Цитата:
К чему это маленькое окошко при старте?

Неужели всем оно не нравится?  Оно ведь реально полезно.  Единственные две вещи, которые можно сделать в пустом главном окне - это как раз открыть проект или создать новый.  А тут тебе как раз эти две опции сразу и предлагают.  Что-то типа Nero Smart Start.  Появится скажем список недавних проектов - тоже попадет в это маленькое окно.  Вы уверены, что вам не нравится сама идея этого окна, а не его внешний вид?
 

Цитата:
thumbnails страниц должны быть слева, как это сделано во всех программах такого рода - в акробате, windjvu, FR  

Хм, я в курсе, что лента предпросмотра обычно слева, а у меня справа, но как-то мне это до сих пор не мешало.  Если уж для многих это окажется проблемой - можно будет поменять ее местами с панелью опций.  Но мне на самом деле так больше нравится.  Справа есть скролбар - вполне логично.  Скролбар посреди окна - нелогично.
 

Цитата:
штурвал для ручного поворота страниц, но без гистограммы имхо он не очень полезен  

Projection profile имеете в виду?  Такая зубастая гистограмма, где зубцы - строки текста?  Вряд-ли в этом есть смысл.  Ручной поворот нужен весьма и весьма редко.
 

Цитата:
выделение текстовых зон прямоугольниками, а не резаками как в СК. Могут ли быть эти прямоугольники параллелограммами?  

Не могут.  Этот этап ведь идет после deskew, зачем там параллелограммы?
 

Цитата:
автоопределение областей изображений  

Будет.  Не знаю правда, насколько хорошо он будет работать.  Алгоритм не мой.
 

Цитата:
возможность тут же и сканировать  

Не планируется.  Кросс-платформенно этого не сделать, а становится Windows only - не хочу.
 

Цитата:
возможность тут же создавать djvu файлы  

Чтобы оправдать затраты времени и усилий на реализацию такой фичи, нужны более веские аргументы чем "чтобы было все в одном флаконе".

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 01:16 02-09-2008 | Исправлено: Tulon, 01:17 02-09-2008
kontiky

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Неужели всем оно не нравится?  Оно ведь реально полезно.

Оно полезно только для новичков. Как минимум, это окно нужно сделать отключаемым при дальнейших запусках программы. btw ключевое слово здесь "всем не нравиться"

Цитата:
Но мне на самом деле так больше нравится.  Справа есть скролбар - вполне логично.  Скролбар посреди окна - нелогично.  

Нет, вполне логично. Вид от общего списка слева, к конкретному листу в центре и к свойствам/операциям над листом - справа.

Цитата:
Ручной поворот нужен весьма и весьма редко.  

Тогда зачем этот штурвал нужен вообще?

Цитата:
Этот этап ведь идет после deskew, зачем там параллелограммы?  

Сам исходинк страницы может быть неровным.

Цитата:
Кросс-платформенно этого не сделать, а становится Windows only - не хочу.  

Что мешает сделать две сборки - одну с twain драйверами для винды, другую - с sane для линукса?

Цитата:
Чтобы оправдать затраты времени и усилий на реализацию такой фичи

Да не нужно ничего реализовывать - просто заюзайте либу djvulibre - где все это уже есть.

Всего записей: 320 | Зарегистр. 14-09-2003 | Отправлено: 01:32 02-09-2008 | Исправлено: kontiky, 09:46 02-09-2008
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
kontiky

Цитата:
Да не нужно ничего реализовывать - просто заюзайте либу djvulibre - где все это уже есть.
Ну да, только потом еще кучу всего придется предусмотреть, к примеру, управление профилями. Потом народ потребует еще и движок ФР туда же вставить до кучи.
Не надо этой маниловщины - тут с одной только обработкой по-хорошему еще поле непаханное....

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 01:51 02-09-2008
kontiky

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty

Цитата:
Ну да, только потом еще кучу всего придется предусмотреть, к примеру, управление профилями.

Ну вот это как раз совсем не обязательно. Я, например, подобными вещами в СК не пользовался ни разу.

Цитата:
Потом народ потребует еще и движок ФР туда же вставить до кучи.  

Нужно различать использование готовой функциональности (доступной, к тому же, в исходниках) и хакерство с нарушением авторских прав. Да и, по большому счету, без ОСР слоя djvu файл вполне себе может прожить.

Всего записей: 320 | Зарегистр. 14-09-2003 | Отправлено: 09:43 02-09-2008 | Исправлено: kontiky, 09:45 02-09-2008
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon, привет. Также работал (сейчас пока отдыхаю) в СК. Ты молодец, просто МОЛОДЕЦ.
Поддерживаю kontiky по поводу и маленького окна при старте, и по thumbnails страниц, чтобы слева были.
По стартовому окну: блин, вот пока не зальешь в неё исходники, не получишь прогу внешне. Да какие там новички? У всех программ команды Новое, Открыть и Сохранить находятся в одном и том же месте. Даже кнопки на панели всегда стандартно расположены. Действительно, не стоит распылять свои усердия на ГУИ-выпендреж. Есть более весомые задачи.
Tulon, ради бога прими это как позитивную критику. Надеюсь скоро я книги буду и с помощью твоей программы делать.

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 21:55 02-09-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ну, скажем аргумент "У всех программ сделано так, значит и тут надо так делать" мне не кажется серьезным.  Если бы все ему следовали, прогресса не было бы совсем.  Не было бы ни табов в броузерах, не вещей типа того же Nero Smart Start.
 
Я сейчас составляю список TODO для сайта, где подробно распишу что я думаю о каждой конкретной предложенной фичи.  Зная мою точку зрения в деталях, будет проще понять друг друга.
 
PS: Не в обиду будет сказано, но словом "выпендреж" я бы как раз охарактеризовал критику незначительных деталей графического интерфейса.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 22:23 02-09-2008
kontiky

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Ну, скажем аргумент "У всех программ сделано так, значит и тут надо так делать" мне не кажется серьезным.

Микрософт и другие крупные фирмы вложили в анализ предпочтений и эргономики пользователей деньги и время, предложили на этой основе стандарты интерфейса. Соответственно, следование им - это в первую очередь забота про удобство работы пользователей. Вот тебе самый главный аргумент.
Вещи же типа "Nero Smart Start" появились после того, как интерфейс программ стал перегружен и сложен для новичков. У тебя, вроди, пока еще это не наблюдается

Всего записей: 320 | Зарегистр. 14-09-2003 | Отправлено: 17:44 03-09-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Микрософт и другие крупные фирмы вложили в анализ предпочтений и эргономики пользователей деньги и время, предложили на этой основе стандарты интерфейса.

Однако табы в броузере они в числе последних реализовали.  К тому же я сильно сомневаюсь что они проводили исследования относительно того, с какой стороны лучше размещать ленту предпросмотра.
 

Цитата:
Вещи же типа "Nero Smart Start" появились после того, как интерфейс программ стал перегружен и сложен для новичков. У тебя, вроди, пока еще это не наблюдается  

То маленькое окно, появляющееся при запуске, появилось по двум причинам.  Во первых, я все-таки считаю его удобным, а во вторых, чтобы показать главное окно и потом уже создавать проект, внутренняя архитектура должна поддерживать добавление файлов в существующий проект, а она этого на данный момент не поддерживает.  В конце концов такая поддержка должна появится, но еще не известно, насколько тяжелым станет интерфейс к тому времени.  К тому же, мне кажется что тем, кого это окно раздражает, просто не нравится его внешний вид.  Выглядит оно действиткльно убого, но это дело поправимо.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 09:38 04-09-2008
kontiky

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Однако табы в броузере они в числе последних реализовали.

Конечно. Гейтс никогда не рассматривал интернет как приоритетное направление для Микрософт. Соответственно IE практически не занимались.  

Цитата:
чтобы показать главное окно и потом уже создавать проект, внутренняя архитектура должна поддерживать добавление файлов в существующий проект, а она этого на данный момент не поддерживает.

Вот это уже теплее

Всего записей: 320 | Зарегистр. 14-09-2003 | Отправлено: 10:14 04-09-2008
Olive77

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
вот загрузил еще необработанных (в продолжении темы по эл. обработке)
 
http:// depositfiles .com/files/7724357
 
проблема та же самая
Обратите внимание на стр. 228
 
Добавлено:
на мой взляд хватило бы возможности скопировать резак на другие страницы (аля СК)
 
Добавлено:
попалась на глаза одна надстройка для работы с Tiffами
_http://artis.imag.fr/Software/TiffIO/
 
насколько полезно, не мне судить

Всего записей: 1271 | Зарегистр. 26-12-2002 | Отправлено: 11:22 05-09-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Olive77
 
OK, спасибо.
Похоже никаких новых опций вводить не придется, потому как я нашел способ автоматически определять, стоит ли искать разделителную линию на скане или нет.  Способ этот работает только с одиночными страницами, но с ними как раз и возникают такие проблемы.
Способ заключается в том, что нужно найти горизонтальные тени и проверить, доходят ли они до левого или правого края страницы.  Если не доходят, то можно ничего не отрезать.  На самом деле эта техника у меня уже используется для определения того, с какой стороны обрезан разворот.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 17:03 05-09-2008
kontiky

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Есть ли у вас алгоритм определения областей изображений на странице?

Всего записей: 320 | Зарегистр. 14-09-2003 | Отправлено: 14:49 09-09-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Есть ли у вас алгоритм определения областей изображений на странице?

U235 предложил вот этот свой алгоритм: http://alexrey036.narod.ru/graylayers.html
Я его начал реализовывать, но возникли вопросы, а U235 не откликается.  В общем пока отложил это дело.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 16:22 09-09-2008
kontiky

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
U235 предложил вот этот свой алгоритм: http://alexrey036.narod.ru/graylayers.html

Спасибо. Это исходник для MathLab?
Я тоже не совсем понял, а что же в результате-то? Некое новое изображение?

Всего записей: 320 | Зарегистр. 14-09-2003 | Отправлено: 16:50 09-09-2008 | Исправлено: kontiky, 16:54 09-09-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Спасибо. Это исходник для MathLab?
Я тоже не совсем понял, а что же в результате-то? Некое новое изображение?

Да, это скрипт для MathLab'а.  В результате должно получиться изображение с черно-белым текстом и серыми (немного размытыми) картинками.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 18:06 09-09-2008
kontiky

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
Да, это скрипт для MathLab'а.  В результате должно получиться изображение с черно-белым текстом и серыми (немного размытыми) картинками.

Т.е. это не определитель зон изображений? Хочется получить именно прямоугольники, включающие в себя изображения. По аналогии с тем, как сделано в FR.

Всего записей: 320 | Зарегистр. 14-09-2003 | Отправлено: 18:14 09-09-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
На промежуточном этапе там получается бинарная маска областей картинок.  Можно в принципе сделать на ней поиск соединенных компонентов и взять их ограничивающие прямоугольники (bounding boxes).

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 19:44 09-09-2008
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
kontiky

Цитата:
Т.е. это не определитель зон изображений?

Нет это не определитель зон, это лучше - сегменттатор на 2 слоя: растровой графики и line-art+ текст (маска-фон, как при кодировании djvu).  
ИМХО, у деления на слои нет такого недостатка, как у определителя зон:  ограничение на форму (чаще всего прямоугольник), расположение и количество растровых рисунков на странице.  Также подразумевается, что окончательный выходной формат - djvu (а у него как раз слои, а не зоны), в случае FR -основной выходной формат - doc (там нет понятия слой, зато есть зоны - рисунки).  
Т.е. по сути скрипт помогает кодировщику djvu определится что есть маска, а что фон в случае DEE, или прямого кодирования с помощью csepdjvu(что правильнее), если не делать слияние слоев.  
 

Всего записей: 884 | Зарегистр. 14-12-2005 | Отправлено: 16:53 16-09-2008
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ну раз U235 объявился, значит скоро будет сделана автосегментация картинок.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 19:25 16-09-2008
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru