Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)

Модерирует : gyra, Maz

Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

gyra

Moderator
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.  
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка  
 
Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
 ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:  
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!  
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71  
Подключаемые утилиты и их настройка.
Предыдущая стабильная версия: ScanKromsator 6.00.5  
Устаревшие версии:
Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)
 
Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018)    Включённые в т.ч. материалы: Подробнее...
 

Работа с автоглифами
Как подключить: шаги
Парсер    версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами  (третья из четырех частей про  версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.  
 

Как вставить OCR в PDF
Подробнее... | Иллюстрация алгоритма
 
 

Видеоуроки про ScanKromsator
 
Видео от bolega:
  Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

  Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.
 

Видеоролики других авторов: Подробнее...


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом...  
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Всего записей: 7932 | Зарегистр. 18-02-2006 | Отправлено: 10:34 14-11-2018 | Исправлено: mvk2006, 21:12 04-08-2023
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
И странно вот что:

Я, наверное, наврал, открывал его с диска. Потому что его в списке вообще не было. Точно не скажу уже, список следующими заданиями заполнился.

Всего записей: 3064 | Зарегистр. 15-07-2010 | Отправлено: 14:15 05-08-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega say:

Цитата:
 
А вкратце, что они делают? Что значит выравнивание?
 

Попробую...
 
PS: Откуда взялись эти фильтры? Результаты моих "экспериментов" в GIMP.

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 15:34 05-08-2023 | Исправлено: zvezdochiot, 15:39 05-08-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot
Для удаления фона в СК несколько методов предусмотрено. Действуют по похожему принципу.

Цитата:
coloredSignificanceFilter+coloredDimmingFilter  

а нет ли, наоборот, фильтра, который выделяет именно цветной текст. Т.е. строит например, маску, которая включает только цветной текст. У меня есть фильтр, который выделяет черное, серое или близкое к нему, но иногда захватывает и темный "грязный" цветной текст
Расцвечивать текст любят в словарях:
https://workupload.com/file/dkUmtBXZJY2

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 16:01 05-08-2023 | Исправлено: bolega, 16:13 05-08-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
 
а нет ли, наоборот, фильтра, который выделяет именно цветной текст.
 

Ну так примени порог (любой) к маске "цветности"/"яркости" и получишь заготовку того, что тебе нужно. Останется только отделить именно текст от просто цветных областей (нетекстовых, в твоих примерах таких нет).
 
PS: Как вариант требуется доп. операция: Взять пиксели, попавшие в маску, и применить к ним Otsu либо BiModal. То что станет чёрным - текст, белым - муар вокруг текста.

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 16:22 05-08-2023 | Исправлено: zvezdochiot, 16:38 05-08-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Если у кого будут проблемы с движениями резаков, особенно наклонных, пишите. Мне казалось, что я улучшил скорость. Но по крайней один пользователь говорит, что стало хуже. Возможно, это сильно зависит от размера (разрешения) монитора, но сейчас проверить на высоких разрешениях у меня нет возможности за неимением такого железа.

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 09:10 06-08-2023
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Впервые столкнулся с таким чудом: исходный и обработанный сканы нормальные, а при просмотре в RV выходной файл представлен в инверсном виде.
Проверил на СК от 5.94 до 6.97.

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 19:07 09-08-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
Вы чего-то напутали. Выходной файл не является обработкой входного. Углы и края у доски совсем разные, хотя фигуры те же. Наверно, результат ручных манипуляций с зонами...

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 19:35 09-08-2023
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega

Цитата:
Выходной файл не является обработкой входного.

Естественно.
Я применил эти названия, чтобы различить эти файлы.
Обрабатывая книгу, получаю много зон с неважными диаграммами.
По ним создаю фен-файл, с помощью которого затем получаю приемлемые для книги диаграммы.
Прежде чем вставлять их вместо старых, нужно убедиться в их правильности сравнением с родными.
Наиболее удобно это делать, загрузив старые в новую сессию СК и настроив на показ в RV новых диаграмм. Далее сохраняю это задание, закрываю его, открываю заново и в RV вижу новые диаграммы.
Перехожу в режим сравнения и сравниваю старую диаграмму слева  с новой справа.
До сих пор не имел никаких проблем при таком сравнении, а с инверсией столкнулся впервые.

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 20:06 09-08-2023 | Исправлено: shch_vg, 20:20 09-08-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вы дали задание, которое я запустил и получил выход без всякой инверсии. Что вы еще хотите? Как по тому, что вы дали, можно что-то проверить??? Вы намешали кучу файлов из разных программ, нате, разбирайтесь. Так что-ли? Может вы опцию инверсии включили в зоне, или на странице.

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 20:24 09-08-2023
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Да, я вопрос поставил некорректно, только что сам понял.
У меня другой вопрос.
Загружаю файл diag0001.tif из папки out в СК и вижу его в главном окне в инверсном виде.
Открываю в Ирфане и вижу в нормальном.
У Вас так же или это выбрыки моей системы?

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 20:52 09-08-2023 | Исправлено: shch_vg, 20:54 09-08-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
СК показывает инверсно

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 21:56 09-08-2023
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
Получается, если создать файл тиф с компрессией CCITT Group 4 Fax Encoding, то он будет виден инверсно в СК? Как-то можно его предварительно преобразовать, т.к. этот файл просто создавался на стороне?
 
Проверил, что не все тифы с компрессией CCITT Group 4 Fax Encoding высвечиваются инверсно.

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 22:07 09-08-2023 | Исправлено: shch_vg, 01:23 10-08-2023
Izich

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Здравствуйте, обязательно OCR ( FineReader)  через прогу добавлять в СК? или есть другие методы (проще для восстановления книги глифами). Может лёгкая инструкция?

Всего записей: 8 | Зарегистр. 01-08-2023 | Отправлено: 00:51 10-08-2023
bearjrgm



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Izich
Вы можете использовать OCR из FineReader или Tesseract (в комплекте). Дальше набираете глифы в данной книжке. Наиболее безопасно далее просматривать фрагментами и заменять. Быстро и легко не будет, но результат того стоит.
Качество зависит от качества распознавания. По глифам естественно нужно создать набор для каждого шрифта в книжке.

Всего записей: 784 | Зарегистр. 03-07-2005 | Отправлено: 10:26 10-08-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
Исправил баг. Спасибо!
 
Добавлено:
Я тут кстати недавно глифировал одну полностью убитую страницу. После FR создал список замен, почти все строки в списке замен были без галки из-за сильного отличия букв и глифов (при этом распознавание было практически без ошибок что облегчало проверку), затем шел по всему списку, и кнопками + включал галки, но приходилось каждую букву глазами проверять на соответствие кода начертанию (т.е. что "н" действительно "н", а не "и" например). Помогает конечно маленький preview под списком, т.к. там каждая проверяемая буква подсвечивается желтым (сделал кстати подсветку зеленым, если буква - заглавная). Но все равно приходилось переводить взгляд выше на список чтобы удостовериться что код буквы правильный. В итоге сделал, что при движении по списку, СК в момент отрисовки маленького preview (под списком) проговаривает заменяемую букву голосом. Вроде бы стало полегче, но надо привыкнуть.  
Звуки букв, цифр и знаков препинания на русском нашел в интернете. Для других языков пользователю можно настраивать звуки самому (каждая буква в отдельном wav-файле), имя файла - юникод-код буквы (символа) или сцепка нескольких кодов для диакритических букв.
Не нашел произношение мат. знаков и спец. символов (+, =, *, /, $,% и т.п.). Если кто сможет с этим помочь, будет хорошо.
В инете легко находятся произношения букв на английском и некоторых других языках. С остальными символами туго.

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 10:36 10-08-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega say:

Цитата:
 
Не нашел произношение мат. знаков и спец. символов (+, =, *, /, $,% и т.п.)
 

Может стоит RHVoice пользовать для произношения?:

Код:
 
RHVoice-test -p elena <<< "+"
RHVoice-test -p elena -o plus.wav <<< "+"
RHVoice-test -p elena <<< "$"
RHVoice-test -p elena <<< "%"
 

Или давай список символов и названий файлов. С помощью RHVoice wav-ы нагенерю.

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 12:01 10-08-2023 | Исправлено: zvezdochiot, 12:06 10-08-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Не нашел произношение мат. знаков и спец. символов (+, =, *, /, $,% и т.п.)

Или я что-то не так понял, или:
открываем сайт translate.google.com
в левом окне вводим символы по одному, можно все сразу. но тогда возможны сбои
в левом окне принудительно выставляем нужный язык
в левом окне в нижнем левом углу нажимаем кнопку динамика
слушаем произношение символа

Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 12:16 10-08-2023
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zvezdochiot
спасибо, попробую сгенерить недостающее.
надо еще подумать, чем лучше заменить произношение знаков типа !? а то слишком долго звучат. Типа "ого" вместо "!", "да ну" вместо "?"
 
jourmager

Цитата:
слушаем произношение символа

зачем мне слушать в гугле? мне надо wav-файл для СК.
да и умничает он. Мне надо произнести "тчк" (тэчэка), а он упорно произносит "точка".
 
Добавлено:
zvezdochiot

Цитата:
RHVoice  
не подходит. Она оказывается только для NVDA типа как плагин-синтезатор.
А мне нужен просто готовый exe-синтезатор под windows.
 
 
 
Добавлено:
zvezdochiot
если не сложно, сгенерируйте
Подробнее...

Всего записей: 4444 | Зарегистр. 09-09-2002 | Отправлено: 12:40 10-08-2023 | Исправлено: bolega, 14:05 10-08-2023
zvezdochiot



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega say:

Цитата:
 
А мне нужен просто готовый exe-синтезатор под windows.
 

Govorilka
 
bolega say:

Цитата:
 
сгенерируйте  
 

Щаз сгенерим... Я.диск wavs 583k

Всего записей: 562 | Зарегистр. 18-05-2023 | Отправлено: 14:29 10-08-2023
mvk2006



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Как вариант синтезатора
несколько символов

Всего записей: 515 | Зарегистр. 15-10-2005 | Отправлено: 15:54 10-08-2023 | Исправлено: mvk2006, 15:55 10-08-2023
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator | СканКромсатор (Часть 4)
Maz (14-09-2023 21:57): ScanKromsator | СканКромсатор (Часть 5)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru