monday2000
Silver Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору anagnost96 Цитата: Но ведь это же так и есть. Если текст уже бинаризован, а картинка -- нет, то разделить их никакого труда не составляет. | Я начал диалог с Tulon по поводу вопроса "встраивать - не встраивать" разделение сканов именно прямо в СТ, а не в отдельную утилиту (вроде Сепаратор и т.п.). По мере беседы неожиданно выяснилось, что этот вопрос является следствием более важного вопроса: "всегда или не всегда делать разбиение сканов". Я считаю, что "всегда" (и даже думал, что так считают все, и это само собой очевидно), а Tulon, оказывается, считает, что "не всегда". Что в большинстве случаев "и так сойдёт" (по качеству), а кому "не сойдёт" - тот разделит сканы в сторонней утилите, а зато так, мол, интерфейс проще, и "чайнику не надо заморачиваться с разбиением сканов, а напрямую кодировать СТ-вывод в DjVu Solo 3.1 - чтобы там автосегментёр сам разделил тексты в маску, картинки в задний фон" (это я своими словами пересказываю мысль Tulon'а). Я, пытаясь убедить Tulon в ошибочности его взгляда ("не всегда делать разбиение") привёл ему такие преимущества разбиения "всегда" перед "не всегда": 1. 100% гарантия качества при последующем DjVu-кодировании. Гарантированно полное отсутствие явления "порча картинок". 2. Отсутствие потребности в DjVu-кодировщике, обладающим автосегментацией. Взамен используются 2 гораздо более простых DjVu-кодировщика: чёрно-белый и цветной - которые могут быть даже свободно-бесплатными и с открытыми исходниками (и за этим ИМХО будущее). Из легально-бесплатных DjVu-кодировщиков, обладающих автосегментацией, есть один-единственный DjVu Solo 3.1 - но он и старый, и неудобный, и там нет профилей кодирования, и он создаёт DjVu версии 21 (а последняя - 27), и он сделан под Windows - а на других платформах его надо запускать только через виртуальную машину. 3. Возможность дообработать уже разделённые сканы в любой сторонней программе - перед DjVu-кодированием. А Tulon, получается, уповает на безграничную мощь СТ (что очевидно нереально). 4. Tulon'у обязательно потребуется встроить в СТ ещё и Blur - для размытия картинок. Это чтобы хоть как-то прогарантировать, что при последующей автосегментации вся картинка попадёт именно в фон. Но применение Blur - это лишняя проблема: это и сложнее, и труднее (надо ж размыть точно в меру - больше размоешь - качество хуже, меньше размоешь - не добьёшься хорошей подсказки автосегментёру - куда девается "простота" для чайника!), и время это отнимает. Да ещё и Blur - это, как ни крути, тоже своего рода порча картинок - просто более слабо выраженная. Многие пользователи ведь захотят, чтобы картинки именно вообще никак не портились - при кодировании в DjVu. Им же не объяснишь, что "картинки попортятся - но не очень сильно". Они тогда на PDF переключатся, потому что, мол, "в PDF картинки не портятся". 5. Субъективный довод: на мой взгляд, с разделёнными сканами нагляднее работать. Там сразу видно - как я разбил исходные сканы, правильно ли, и где какие ошибки разбиения имели место. И разбитые сканы можно просмотреть в любом вьювере - а не-разбитые (но логически разделённые на чб текст и серую картинку) сканы можно посмотреть (на предмет правильности логического разбиения) только в СТ - на стадии вывод (т.е. расположение и границы Picture-зон посмотреть). Добавлено: Dashout Цитата: Лучше взгляните на свои прошлые посты. Кстати, к примеру, ScanKromsator делался как раз по правильному принципу "качество в ущерб простоте". Просто у bolega ситуация вышла из под-контроля (в силу недостатка программистской квалификации). Поэтому, получается, что ScanKromsator - это "правильная программа" (просто некачественная), а Scan Tailor - это "неправильная программа" (но зато качественная). | Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 13:13 12-09-2010 | Исправлено: monday2000, 13:24 12-09-2010 |
|