Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)

Модерирует : gyra, Maz

Maz (10-01-2024 10:45): Scan Tailor (часть 3)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие части: Часть 1
Scan Tailor


Задача программы - пост-обработка сырых сканов книг для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса (по сравнению со СканКромсатором).
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ncraun) >>>  последняя версия
Scan Tailor Experimental (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (актуальный форк) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода


Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 12:17 17-02-2010 | Исправлено: Maz, 10:43 10-01-2024
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ну что же и за то, что есть большое спасибо в любом случае.

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4307 | Зарегистр. 18-09-2003 | Отправлено: 12:51 02-11-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
LazyKent

Цитата:
Сейчас оригинальный Cuneiform находится в версии 1.0.0.  
https://launchpad.net/cuneiform-linux  

Я его сумел скомпилировать под Windows - т.е. CuneiForm-Linux v1.0.0 с http://launchpad.net/cuneiform-linux  
 
Использованный компилятор - MS VC++ 6.0.
 
То есть я линуксовый клон CuneiForm скомпилировал под Windows.
 
Все подробности тут:  
 
http://www.djvu-scan.ru/forum/index.php?topic=115.0

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 20:50 04-11-2010 | Исправлено: monday2000, 20:53 04-11-2010
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Под влиянием iit512 решился опубликовать собственное решение "всё в одном", на сей раз -- для создания PDF. Утилита называется pdfbeads и написана на Ruby с использованием расширения RMagick. При наличии собственно интерпретатора Ruby и пакетного менеджера RubyGems пакет можно скачать и установить командой
 
$ gem install pdfbeads
 
Идея заключалась в том, чтобы по возможности организовать создание PDF-файлов по модели, привычной по формату DJVU: те же двух- и трехслойные страницы, те же методы "подклейки фона" и "раскраски маски". Кроме того, pdfbeads может играть роль оболочки к jbig2enc -- свободному кодировщику формата JBIG2. Среди возможностей скрипта:
 
-- сжатие маски по технологии JBIG2 (с использованием jbig2enc) или Fax G4;
 
-- различные форматы сжатия для фоновых изображений (jpeg2000, jpeg, deflate);
 
-- корректная обработка малоцветных индексированных изображений (создается маска из нескольких слоев, каждый -- со своим цветом);
 
-- автоматическая сегментация "смешанных" файлов, полученных с помощью ScanTailor, причем для картинок можно задать разрешение, формат сжатия и (при желании) принудительную конвертацию в оттенки серого;
 
-- разбиение полноцветного изображения на фон и передний план по заданной маске (подобно тому, как это делает djvumake при указании опции PPM);
 
-- добавление текстового слоя из hOCR;
 
-- добавление оглавления, метаданных и меток страниц.
 
Имеется также русская страница руководства.
 

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 17:46 08-11-2010
terminat0r



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
anagnost96
интересно. а вот в чем дело, когда я подсовываю многостраничный тифф
pdfbeads amu-o.tiff >amu-o.pdf
, все это кодируется в много одностраничных jbig2 файлов а потом
Page not completed: could not access amu-o.jbig2
Processed amu-o.tiff
Но это понятно так как файла amu-o.jbig2 нет, есть много amu-o_0ххх.jbig2 файлов. Т.е. многостраничные тиффы не поддерживаются?  

Всего записей: 2084 | Зарегистр. 31-03-2002 | Отправлено: 19:29 08-11-2010
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
terminat0r
 
Да, пока что не поддерживаются. Проблема в том, что к каждому скану текстовой страницы может быть привязано несколько вспомогательных файлов, и непонятно, как их учитывать, если базовые файлы все упакованы вместе. Я об этом долго думал, и в итоге счел, что овчинка не стоит выделки.

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 19:36 08-11-2010
LazyKent

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
anagnost96
Я не могу понять, как мне скачать исходники и скомпилировать программу, если RubyGems отсутствует.

Всего записей: 174 | Зарегистр. 17-08-2006 | Отправлено: 20:05 08-11-2010
woodyfon

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
anagnost96, я так понял ваша программа консольная. А будет ли GUI-версия?

Всего записей: 417 | Зарегистр. 03-08-2007 | Отправлено: 20:11 08-11-2010
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
LazyKent
 
Если дело происходит под Windows, то надо брать такой инсталлятор Ruby, в котором RubyGems уже имеется. Если же под Linux, то в репозитарии Вашего дистрибутива должен быть пакет, посредством которого оно устанаваливается. В любом случае задача сводится с предыдущей.
 
На самом деле поставить RubyGems абсолютно никакой проблемы не представляет. Вот подобрать совместимую версию RMagick может оказаться несколько сложнее, особенно под Windows.
 
woodyfon
 
Ну, если только в очень отдаленной перспективе... Честно говоря, меня пока что вполне устраивает консольная версия.

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 20:51 08-11-2010
LazyKent

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
anagnost96
Дело в том, что мне нужно собрать rpm-пакет на OBS (openSUSE Build Service). Для этого я должен закачать туда исходник в tar.bz2. Это можно как-то реализовать?
 
Вообще, описание внушает.
Спасибо.

Всего записей: 174 | Зарегистр. 17-08-2006 | Отправлено: 21:25 08-11-2010
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
LazyKent
 
Ах, вот оно что... Да, OBS -- это серьезно. Ну что ж, получить архив с программой вообще-то не проблема: качаем файл с расширением gem вручную с rubygems.org, открываем в архиваторе -- внутри видим искомый tar.gz. Ну, "исходников" в обычном понимании там, конечно, нет: ruby же интерпретируемый язык.
 
Только у меня тогда вопрос: а rpm-пакет потом будет устанавливать свое содержимое в основной каталог с расширениями ruby, или всё-таки вместе с gem'ами?
 
 

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 22:21 08-11-2010
LazyKent

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
anagnost96
 
Я не знаю пока, куда будет устанавливаться содержимое. Никогда не собирал подобных пакетов. Надо почитать, какая в openSUSE политика насчёт rubygem.
Вот что-то нашёл: http://en.opensuse.org/openSUSE:Packaging_Ruby Ещё могу в рассылке opensuse-packaging поспрашивать.
 
Но не сомневайтесь — всё будет в лучшем виде, когда разберусь.

Всего записей: 174 | Зарегистр. 17-08-2006 | Отправлено: 22:41 08-11-2010 | Исправлено: LazyKent, 23:03 08-11-2010
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
LazyKent
 
Если я правильно понял, то из этого документа следует, что для сборки rpm всё-таки нужно брать за основу gem, а не тарбол. Ну что ж, IMHO это правильно. Жаль, что в Ubuntu не так.

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 22:53 08-11-2010
LazyKent

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Жаль, что в Ubuntu не так.

Ну, есть мнение в сообществе, что openSUSE позиционирует себя как дистрибутив для разработчиков, в отличие от Ubuntu. Оттого и все эти "вкусные плюшки".
 

Цитата:
Никогда не собирал подобных пакетов.
Ошибся. Нашёл такой, и вижу, что скрипты ставятся в %{rb_sitelib}, а скомпилированные библиотеки (если имеются) в %{rb_sitearch}.
Это будет для i586 /usr/lib/ruby/site_ruby/<version> и /usr/lib/ruby/site_ruby/<version>/i586-linux соответственно.

Всего записей: 174 | Зарегистр. 17-08-2006 | Отправлено: 23:23 08-11-2010
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
anagnost96
Эх, хорошая программа и столько мучений для её установки. Как будто разраб специально вносит доп. сложности ))). Даже на Убунту похоже с полпинка не установить ((

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 11:18 09-11-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
anagnost96

Цитата:
решился опубликовать собственное решение "всё в одном", на сей раз -- для создания PDF.

Очень интересно. А почему PDF, а не DjVu? Жаль, что опять надо ставить какой-то очередной интерпретатор на винду.  
 
Хотелось бы ещё со временем увидеть версию под Windows, готовую к применению.
 
Тут у меня была такая идейка одна: есть что-то вроде Файнридера под Linux. От ABBYY. Причём кто-то говорил, что научился получать от него XML-файл с OCR-данными. Нельзя ли это дело как-то под виндой суметь запустить? Потому что наверняка же Файнридер под Linux будет в виде консольного приложения (а не гуёвого как сам Файнридер, что весьма неудобно).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 11:33 09-11-2010
C0USIN



Silver Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору

Цитата:
А почему PDF, а не DjVu?

Для Djvu разве подобных инструментов еще нет?  
А PDF это стандарт. И еще там можно внедрять векторные данные, чего нет в Djvu.
Если это решение позволит делать подклейку фона и раскраску маски в PDF то будет здорово.

----------
Как же я люблю этот сайт! Столько интересных мыслей у людей, каждая обоснованная и аргументированная!

Всего записей: 2739 | Зарегистр. 18-07-2003 | Отправлено: 12:46 09-11-2010
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000

Цитата:
Очень интересно. А почему PDF, а не DjVu?

 
Для DjVu технология и так уже отработана, а с PDF было интересно разобраться.
 
denver 22
 
Дык расскажите, в чем мучения-то. Можно приватом, чтобы топик не засорять.

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 13:00 09-11-2010
C0USIN



Silver Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
anagnost96
Можешь помочь завести pdfbeads под Windows?
А то непонятно ничего (((
 
Я установил Ruby 1.8.6 (более новый не катит, т.к. RMagick есть только для этой версии)  
Установил собственно RMagick
gem install rmagick-2.12.0-x86-mswin32.gem --local
Установил ImageMagick-6.5.6-8-Q8-windows-dll.exe
 
jbig2enc есть только в исходниках. Как его собрать?
 
gem install hpricot выдает ошибку

----------
Как же я люблю этот сайт! Столько интересных мыслей у людей, каждая обоснованная и аргументированная!

Всего записей: 2739 | Зарегистр. 18-07-2003 | Отправлено: 11:57 10-11-2010
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
C0USIN
 
Насчет 1.8.6 -- всё правильно, я тоже брал его.
 
Виндовую версию jbig2enc можно найти по этой ссылке.
 
Насчет hpricot ничего посоветовать не могу: мне самому не удалось его установить под виндой. В принципе, будет работать и без него, но, конечно, без функциональности, связанной с созданием OCR-слоя.

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 15:24 10-11-2010
LazyKent

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
anagnost96
Для создания текстового слоя достаточно иметь в директории HTML-файлы? Никаких особых параметров не нужно задавать?

Всего записей: 174 | Зарегистр. 17-08-2006 | Отправлено: 16:08 10-11-2010
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)
Maz (10-01-2024 10:45): Scan Tailor (часть 3)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru