Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)

Модерирует : gyra, Maz

Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

JediMaster_Dragon



Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
ABBYY FineReader
7, 8, 9, 10 (Pro, Corp, Home), 11 (Pro, Corp), 12 (Pro, Corp) и 14 (Pro, Corp, Ent)

 

 
Полный список языков распознавания для FR15
 

Русский интерфейс
 
Ответ на вопрос о сохранении проекта смотрим тут


Если  хотите, чтобы ваша проблема была рассмотрена, (решение не гарантируется), необходимо представить такие сведения:
1. Версия FineReader.
2. Версия Windows, версию пакета обновлений (SP), разрядность (для Vista и выше).
3. Если проблемы со сканированием, то называем ещё и модель сканера. Обновите драйвера своего сканера, до последней версии имеющейся на сайте поддержки вашего сканера.


Как можно получить церковнославянские тексты при помощи сканирования FineReader'ом
Как отключить "искусственный интеллект" FineReader
Как выбрать опции, чтобы FR10 распознавал простейшие формулы
FineReader не распознает сложные формулы и рукописный текст, не задавайте вопросов на эту тему.  
Версии FR для Linux пока не существует, только Engine, который вам явно не нужен.

Для понимания формата XPS программой FineReader нужен Framework 3.0. Только для XP и 2000.
Совет по распознаванию файлов DjVu Читать
Электронные текстовые книги - OCR, вычитка, оформление

Всего записей: 354 | Зарегистр. 18-01-2002 | Отправлено: 09:07 26-01-2003 | Исправлено: Maz, 19:24 26-01-2020
Sjoe



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
cuneiform
 
У меня другие результаты.
Открытие файла Шишкофф Г......2003.djvu (9.5 МБ) в FR11 Pro - 00:12 (НЕ через виртуальный принтер, а сразу в djvu)
Распознавание - 00:17.
Cохранение в пдф/А - 00:05  
Сохранение в дежавю с подложкой - 00:06
---------------------------
Итого: 00:34.  
Размер файла в пдф на диске: 24,2 МБ (25 444 352 байт). Считаю, приемлемо.
Размер файла в дежавю на диске: 17,2 МБ (18 083 840 байт). Считаю, приемлемо  
 

Цитата:
Идея юзать пдф формат в графике вместо дежавю не дает выиграша по времени распознавания и сохранения, на выходе имеем обьемистые файлы с распознанным слоем, в целом - бессмысленная, безрезультативная затея.  

 
Так это очевидно, вообще-то, если результаты именно такие, какие получились у вас. Другое дело, что формат PDF/A (из распознанногого дежавю) с текстовой подложкой даёт возможность полнотекстового поиска, что и нужно для словарей (в том числе этого), энциклопедий, справочников и т.п.: их не читают подряд с начала и до конца, а wahllos браузят в поисках определенной статьи (определения, перевода и т.д.).  
(В свете чего замечу, что тот, кто конвертировал выложенный на трекере бумажный Философский словарь в дежавю чисто в графике без подложки и возможности поиска, во-первых, пожлобился, а во-вторых, вообще не имел представления, чем он, собственно, в данный момент занимается и для чего это нужно (что есть первый признак непрофессионализма.)
 
В свете сказанного, в описании "реальной жизненной ситуации" вы, похоже, чего-то не договорили, да и, собственно, задачу/проблему не поставили. По времени и по размеру pdf файла с подложкой и возможностью полнотекстового поиска результат вполне терпим. Если, конечно, не заниматься этим в промышленных масштабах, как Гугл или Гутенберг или пираты, и не сканировать и распознавать фонды национальных библиотек и библиотек конгрессов начиная с инкунабул и изданий 17 века до только что вышедших бестселлеров.  
 
А что до Гугла, доселе юзающего "восьмёрку", так здесь несколько соображений/подозрений. Или они халтурщики, которым всё пофиг -- что и подтверждается бездарным распознаванием без предварительной обработки, без настроек и  без последующией вычитки и правки, множеством пустых и лишних страниц, на которых к тому же в pdf видны руки, клипсы и прочий мусор, а также дикие ошибки распознавания в выложенных форматах txt, djvu, fb2, epub (отчего я с archive.org, например, вообще что-нибудь кроме как pdf, зарёкся когда-либо брать), или просто жлобы и не хотят платить деньги за апгрейд (тем более, что "восьмерку", ЕМНИП, Аббии как-то выкладывали в свободный доступ в порядке рекламной акции, уже когда "десятка" была в продаже).  Или они следуют первому закону ремонта.  
 
А так-то да: "восьмерка" и "девятка" хороши тем, что хорошо работают на плохих и неконтрастных сканах, причем чем хуже скан, тем больше сказывается это преимущество.

Всего записей: 676 | Зарегистр. 09-07-2009 | Отправлено: 12:20 07-03-2018 | Исправлено: Sjoe, 17:36 07-03-2018
cuneiform

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
вы, похоже, чего-то не договорили, да и, собственно, задачу/проблему не поставили. По времени и по размеру pdf файла с подложкой и возможностью полнотекстового поиска результат вполне терпим. Если, конечно, не заниматься этим в промышленных масштабах, как Гугл или Гутенберг или пираты, и не сканировать и распознавать фонды национальных библиотек и библиотек конгрессов начиная с инкунабул и изданий 17 века до только что вышедших бестселлеров.  
 

 
на старом нотбуке с проц. Centrino Pro  совсем другой расклад по времени, ваша многословность не компенсирует разницы в использовании новых и старых процессоров и их машинных кодов - здесь эти экзерсизы неприемлемы,
a у вас получается от процессора, RAM и компа вообще ничего не зависит  
а я значт "задачу/проблему не поставил"!
 
 
Гугла видно и FR-8 устраивает, и ХР, как впрочем и меня, ну а ваш авангард юзает канешна тока 10-ку и "Всегда!" все самые последние версии софта: Здесь главное слово "Всегда!".  
 

Всего записей: 2062 | Зарегистр. 27-04-2006 | Отправлено: 17:49 08-03-2018 | Исправлено: cuneiform, 18:32 08-03-2018
Alex Dragon



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А зачем печатать дежавю на виртуальный принтер, когда проще уж конвертировать тот дежавю в bmp, tiff или png? Мне чего-то так думается, что открыть напрямую графический формат Файнридеру (да и любой другой софтине, работающей с конверсией форматов графики) будет проще и быстрее, чем выцеживать его же из обёртки pdf, который в данном случае выступает просто контейнером. К тому же, для вывода в pdf надо с настройками виртуального принтера поколдовать, а то по умолчанию они как правило всю растровую графику пытаются в какой-нить там jpeg пожать с низким разрешением. То есть это надо предварительно кучу вкладок и опций в том же Адоб Акробате открыть и выбрать, которые надо к тому же знать и которые совершенно неинтуитивны, если ты не полиграфист. Так какой смысл столько кнопками клацать?

Всего записей: 422 | Зарегистр. 05-01-2002 | Отправлено: 18:28 08-03-2018 | Исправлено: Alex Dragon, 18:29 08-03-2018
VIP9N



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Alex Dragon
 

Цитата:
когда проще уж конвертировать тот дежавю в bmp, tiff или png

И получить 750 (или сколько там страниц) файлов вместо одного?  Неплохое решение
 

Цитата:
То есть это надо предварительно кучу вкладок и опций в том же Адоб Акробате открыть и выбрать,

Проще сначала изучить Акробат и знать, что все его десятки настроек сгруппированы по 2-5 профилям: стандарт, экранка, офисная печать, типографская печать.  Достаточно просто указать профиль и всё

Всего записей: 639 | Зарегистр. 13-12-2002 | Отправлено: 18:55 08-03-2018
Sjoe



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
cuneiform

Цитата:
на старом нотбуке с проц. Centrino Pro  совсем другой расклад по времени

Заведите новый, всего и делов-то. И расклад будет другой.

Цитата:
a у вас получается от процессора, RAM и компа вообще ничего не зависит

Зависит. Но Я от процессора, RAM и компа не зависю. Или не завишу (как правильно?). У меня времени - вся жизнь, и "подвесной" памяти на 10 гиг.  

Цитата:
 ваша многословность

Лекторская привычка, извините. Зато вопрос исчерпан и закрыт.(Мои студенты ценят.) Добавить нечего.  

Цитата:
а я значт "задачу/проблему не поставил"!  

Нет. Но я догадливый.

Цитата:
Гугла видно и FR-8 устраивает, и ХР, как впрочем и меня, ну а ваш авангард юзает канешна тока 10-ку и "Всегда!" все самые последние версии софта: Здесь главное слово "Всегда!".  

Вот здесь вы не угадали. Cлово "авангард" ко мне неприменимо. Я ещё тот луддит. У меня стоят FR8, 9 и 11. На Вин7 и на ХР. Меня они доселе устраивали. Зачем от добра добра искать? Опять же, первый закон ремонта.  
 
PS. Да не реагируйте вы так нервно, дружище. Вы лучше скажите, вам этот словарь в suchbare вариантах (пдф и/или дежавю) выложить куда-нибудь, или вам удалось более компактный получить?  

Всего записей: 676 | Зарегистр. 09-07-2009 | Отправлено: 19:43 08-03-2018 | Исправлено: Sjoe, 20:11 08-03-2018
Alex Dragon



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
И получить 750 (или сколько там страниц) файлов вместо одного?

 
А какая вам разница? Это же промежуточные, по сути временные файлы. После того, как вы их скормите Файнридеру, они вам уже будут не нужны, кладёте во временную директорию и после использования — delete. И уж не сомневайтесь: 750 бмпшек откроются гораздо быстрее пдфа. Ну, а кроме того, знатоки и гурманы вообще-то должны быть в курсе, что TIFF поддерживает многостраничность.
 
Это более прямой и разумный подход. Зачем совершать лишние телодвижения, грузить комп лишними вычислениями и расходом памяти? С точки зрения оптимизации процесса виртуальный принтер совершает слишком много ненужных для поставленной задачи операций. Не, ну конечно это копейки по сравнению с самим временем распознавания, но тем не менее, зачем делать криво то, что можно делать прямо?
 

Цитата:
Проще сначала изучить Акробат и знать

 
Да вот я потому и пишу, что в курсе того как это работает и на собственном опыте знаю, что нужно создавать свои профили под конкретные задачи, а не довольствоваться стандартными — ну кроме случаев, когда для конечной задачи пофигу. Но как раз для Файнридера лучше самому подготовить профиль. Что несложно, но всё-таки дольше и требует большего внимания, чем просто задать гораздо меньшее число параметров конвертеру.
 

Всего записей: 422 | Зарегистр. 05-01-2002 | Отправлено: 20:36 08-03-2018
VIP9N



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А какая вам разница? Это же промежуточные, по сути временные файлы

 
Т.е. у меня (предположим) есть файл в 750 стр и взамен него я получаю 750 (по барабану каких) файлов (постраничных), которые я должен сидеть склеивать, чтобы получить распознанный файл?  И это проще, чем просто кинуть на печать 1 файл и через несколько секунд/минут получить 1 файл книги?  Поистине я что-то пропустил в этой логике...
 

Цитата:
Зачем совершать лишние телодвижения

Прошу Вас, расскажите, что делать с 750 распознанными файлами, чтобы сложить их (в соответствующем порядке) в 1 книгу.  Честно интересно.  Это быстрее, чем одним движением мышки кинуть дежавю-файл на пдф-принтер?
 

Цитата:
грузить комп лишними вычислениями и расходом памяти

Вы знаете, конвертация 1 дежавю-файла в 750 файлов, распознавание, обратная склейка 750 файлов в 1 файл книги мне всё-таки представляется гораздо большей работой как компьютера, так и, самое главное, меня.  И для чего такие потуги?  В чём соль?
 

Цитата:
но тем не менее, зачем делать криво то, что можно делать прямо?

Вот и я думаю, зачем изобретать велосипед, если всё и так у меня работает с пдф-ами с года, этак, 1999-го (когда мак в доступе появился).  
 

Цитата:
я потому и пишу, что в курсе того как это работает и на собственном опыте знаю

Я рад, что Вы это знаете и понимаете.  Единственно, пока не догоняю логики этих обходных телодвижений с конвертациями сотен файлов, когда Адоби-дистиллер делает это сам и за считанные секунды.

Всего записей: 639 | Зарегистр. 13-12-2002 | Отправлено: 21:00 08-03-2018
cuneiform

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Философский словарь в дежавю чисто в графике без подложки и возможности поиска, во-первых, пожлобился, а во-вторых, вообще не имел представления, чем он, собственно, в данный момент занимается и для чего это нужно (что есть первый признак непрофессионализма.)  

 
Как посмотреть. Видно, что это не сканы прямо со сканера, а обработаны софтом по жирности и контрасту. Качественно обработаны. - Это не деваха делала.
 
Почему он его не распознал? - Ну, может, софта не было, какого ему хотелось. Типо, "дай найду вот FR14, тогда и распознаю". - Лучшее - враг хорошего. Ну, так это ж и ваша философия тоже - о лучшем (в мире).
Будете его осуждать за это?
 
 
 
 
 
Добавлено:

Цитата:
Вы лучше скажите, вам этот словарь в suchbare вариантах (пдф и/или дежавю) выложить куда-нибудь, или вам удалось более компактный получить?  

 
Nein. Waere dankbar fuers Hochladen der djvu-Datei anderswo , Herr Kollege. Auch die im fb2-Format fuer meine Studenten. Danke im voraus. (Umlaute kommen hier nicht durch!)
NS. Als Gegenleistung kann ich die dt. Version (djvu + OCR) des W-buchs verschenken.
 
 

Всего записей: 2062 | Зарегистр. 27-04-2006 | Отправлено: 21:56 08-03-2018 | Исправлено: cuneiform, 22:40 08-03-2018
Alex Dragon



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Т.е. у меня (предположим) есть файл в 750 стр и взамен него я получаю 750 (по барабану каких) файлов (постраничных), которые я должен сидеть склеивать, чтобы получить распознанный файл?

 
Что-то я вашей логики не понимаю. Что склеивать, зачем? Файлы вообще-то нумерованные идут, конвертер их выдаст ровно в той последовательности, в какой у вас страницы в дежавю. И Файнридер их ровно так же и съест. Вообще-то это для Файнридера как раз совершенно родная и стандартная процедура — импорт последовательности графических файлов, импорты же всяких там пдф и прочих — это скорее дополнительная опция, приятный прибамбас.
 
А почему я думаю что это может быть лучше: ну банально, тот же bmp — это максимально близкий к сырому потоку данных формат,  в то время как pdf — это вообще говоря язык описания страниц, причём векторного описания, в котором хранение растровой графики — не более чем дополнительная возможность, при этом вариантов этого хранения там достаточно много — с разной глубиной цветности, с разными алгоритмами сжатия или без оного, при этом куча фич в структуре файла рассчитанных именно на задачи, которые обычно решают при помощи пдф и совершенно безразличных для OCR, но на упаковку которых тоже тратится процессорное время — при выводе на виртуальный принтер, а потом то же самое в обратной последовательности при распаковке во время импорта пдфа в прикладную программу. При этом сильно будет влиять пресет — скажем, если там стоит что-нибудь типа zip-сжатия, то скорость может совсем неприятно удивить. На небольших проектах это может быть вообще незаметно, а вот что-то серьёзное, типа тех же семисот страниц да какого-нибудь издания приличного формата а-ля какой-нибудь иллюстрированной энциклопедии — каждая копейка начинает сказываться.
 
Так что удобство тут сугубо только в том, что файлов одна штука. Как по мне, много файлов геморрой доставляют только когда это множество прилинковано к проекту типа html-страницы или файлу вёрстки какого-нить Пижамкера, когда проект приходится таскать туда-сюда — тогда файло имеет свойство теряться. А когда они чисто для промежуточного хранения — никаких проблем.
 
 
Граждане коллеги, а вот кто-бы меня просветил вот на такой счёт: всё-таки Файнридер (у меня 12-й стоит), когда распознаёт pdf, если исходник чисто векторный (ну там статьи какие-нибудь) — он всё равно его растрирует для анализа и распознаёт уже растр, или всё-таки пытается сперва извлечь текст изнутри, как это делает тот же Акробат при экспорте в текст/ртф? Я когда-то вроде читал что-то про это, вроде как начиная с какой-то версии ФР это делает, но потом позабыл и ничего внятного на этот счёт не нашёл. Кто-нибудь может пальцем ткнуть в описание алгоритма работы ФР с пдфками? А то меня сильно смущает качество распознавания: вроде бы чистый векторный pdf с текстом должен быть идеален для распознавания, лучше всякого скана априори, а ФР ухитряется лажать (типа путать буквы со схожим рисунком). При этом глядя на файл возникает мысль, что логично было бы заглянуть сперва внутрь и сравнить то что там найдено с тем, что он думает.

Всего записей: 422 | Зарегистр. 05-01-2002 | Отправлено: 03:05 09-03-2018 | Исправлено: Alex Dragon, 03:15 09-03-2018
Sjoe



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
cuneiform

Цитата:
Лучшее - враг хорошего. Ну, так это ж и ваша философия тоже - о лучшем (в мире).  

Touché.

Цитата:
Будете его осуждать за это?  

Буду. Повторю, что словари, энциклопедии, справочники читают не подряд, листая страницу за страницей, как какую-нибудь "Анжелику" или "Преступление и наказание", а браузят, и в электронной форме без thumbnails или как минимум полнотекстового поиска от такого ресурса толку МЕНЬШЕ, чем от бумажной книги; книгу можно хотя бы на глазок близко к искомой статье раскрыть; а в электронной версии без прямого обращения или поиска вертикльным ползунком не наездишься. Особенно на ноутбуках с тачпадом или этой неуклюжей пипкой-мышью в середине клавиатуры (как она правильно называется?). Да и на планшетах, как я себе представляю, тоже 576 страниц не погоняешь. Т.е. ИМХО, такая оцифровка словаря (как жанра литературы) оказывается контрпродуктивной. И на месте того цифровизатора я бы выложил в трекер хороший пдф, из которого умельцы сами бы себе смастерили подходящий инструмент.

Цитата:
Nein. Waere dankbar fuers Hochladen der djvu-Datei anderswo , Herr Kollege. Auch die im fb2-Format fuer meine Studenten. Danke im voraus. (Umlaute kommen hier nicht durch!)  
NS. Als Gegenleistung kann ich die dt. Version (djvu + OCR) des W-buchs verschenken.

Большое спасибо. Отправил вам ПМ.  
 
 
 

Всего записей: 676 | Зарегистр. 09-07-2009 | Отправлено: 03:38 09-03-2018
cuneiform

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Цитата:
Будете его осуждать за это?  
 
Буду.  

 
Ну, есть и другие решения для мобильных устройств кроме OCR.
 
т.е. софт для оптимизации графики на малых экранах, без OCR
 


Всего записей: 2062 | Зарегистр. 27-04-2006 | Отправлено: 07:57 09-03-2018 | Исправлено: cuneiform, 07:58 09-03-2018
VIP9N



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Что-то я вашей логики не понимаю. Что склеивать, зачем?

 
Логика моя простая: есть книга в 1 файле.  Мне нужна она же в файле другого формата с распознанным слоем (например).  Я кидаю этот файл на пдф-принтер и получаю результат.  Всё.
 
Но тут приходите Вы и начинаете рассказывать, что пдф - это отстой, что хорошо бы этот файл разложить на сотни отдельных, что надо экономить мощности процессора и памяти и прочие... слова
 
И на прямо поставленный вопрос «зачем?» Вы, почему-то, не отвечаете, а начинаете выяснять мою логику . Не выясняйте, я Вам свою задачу объяснил.  Теперь Вы объясните «зачем Володька сбрил усы» (с), т.е., зачем для моей задачи мне надо выполнять все описанные Вами действия?  

Всего записей: 639 | Зарегистр. 13-12-2002 | Отправлено: 10:24 09-03-2018
cuneiform

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Alex Dragon
 
да оставьте упертый "спор ради спора" - гроша медного не стоит
раз уж разговор про "750 отдельных файлов" для ФР пошел на ветке, то спорить тут не о чем, забавно тока
 
 

Всего записей: 2062 | Зарегистр. 27-04-2006 | Отправлено: 13:08 09-03-2018 | Исправлено: cuneiform, 18:04 10-03-2018
Alex Dragon



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
А-а-а, я наконец понял чего VIP9N хочет. То есть типа юзверь на «Рабочем столе» кидает свой файл книги на иконку — и рядом вылазит такой же, только уже с текстовым слоем. «Вы нажимаете кнопку, мы делаем всё остальное!», как завещал Кодак. Теперь я понял, откуда в сети берутся эти грязные серые сканы с наполовину распознанными страницами и русскими буквами вместо латинских в непонятых ФР формулах и листингах кода.
 
Я-то, старый консервативный дурак, себе подготовку книги к электронной публикации, её цели и задачи несколько по иному представляю — главным полагаю отделение текста от носителя, причём из опыта знаю, что для качественного и верного распознавания, которое надо будет только проверять, а не набирать руками наново после килотонн зюкв, сканы обычно требуют существенной чистки и коррекции, прогона через какой-нить Скан Кромсатор или по крайней мере конвертер с возможностью обработки типа Xnview. А если стоит ещё и задача сохранить оригинальный вид — так тем более файло обычно требует обработки, подгонки под единый формат, разрешение и всё такое. То есть не разобрать книгу на куски при таком подходе просто не получится и глядя с этой колокольни промежуточная сборка в PDF действительно как телеге пятая нога. Простите-с, не учёл-с, что есть категория пользователей, которым надо «по-быстренькому», как-нибудь, на тяп-ляп, абы гордо отчитаться об очередной сотне вываленных на файлопомойки типа книжек.
 
Добавлено:
Да, коллеги,  а таки кто-нибудь имеет что сказать по поводу моего вопроса о том, как ФР pdf'ы распознаёт?

Всего записей: 422 | Зарегистр. 05-01-2002 | Отправлено: 22:12 09-03-2018 | Исправлено: Alex Dragon, 22:22 09-03-2018
VIP9N



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Alex Dragon
 
Ну вот видите, не прошло и 2-х дней и до Вас дошёл смысл простейших действий на компьютере, мои поздравления!  То, что Вы слили - я внимания заострять не буду.  Главное, что Вы хотя бы сделали вид, что ответить Вам нечего  
 
Поток сознания про некие публикации сотен книг давайте оставим в стороне.  Я не знаю откуда Вы это высосали и для чего.  Я нигде этого не писал.  Вы, безусловно, всегда можете обсудить волнующие Вас проблемы кошерно-халяльных подходов к распознаванию файлов с другим местным ярким представителем и генератором неконтролируемых потоков сознания, пасущимся на этой ветке.  
 
Но я искренне надеюсь, что прежде чем хаять что-либо, Вы, для начала, хотя бы разберётесь для чего это и почему  
 
Чтобы не потерять Вас, уважаемый Alex, ещё раз по пунктам:
 
1. Я не делаю электронных книжек и вообще работаю в другой сфере и сканирую исключительно для распознавания документов, идущих на перевод.  У меня нет ни желания, ни времени на описанные Вами конвертации и действия и подходы.  Процесс давно отработан и ничего нового или революционного Вы мне так и не сообщили.
 
2. Делать электронные книжки, хорошо или плохо, мне не интересно. Вообще. Чтобы Вас абсолютно успокоить - я вообще никогда их не делал, ОК?
 
3. Метод с выпуском в пдф нераспознаваемого факридером файла я подсказал в этой ветке искренне полагая, что её читают адекватные люди, которым просто надо по быстрому решить возникшую проблему.  То, что это вылилось для меня в предупреждение - признаю, я поддался на провокацию местного тролля.  Сейчас у меня много заказов, а форум я проглядываю по-быстрому, если приходят уведомления, чтобы отвлечься.  Поэтому увидев вместо конструктивных речей какой-то бред с намёками ниже пояса я, малёхо, вспылил. Впредь, конечно, надо смотреть, перед кем бисер метать
 
Всего хорошего Вам, Alex.  Peace!  

Всего записей: 639 | Зарегистр. 13-12-2002 | Отправлено: 22:46 09-03-2018
Alex Dragon



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Проблемка в том, что ваш подход не только для переводов используется.

Всего записей: 422 | Зарегистр. 05-01-2002 | Отправлено: 00:05 10-03-2018
fozzie

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Alex Dragon

Цитата:
Файнридер ..., когда распознаёт pdf, если исходник чисто векторный

Надеюсь, что Вы не гуманитарий-разморозок и речь идёт не о чистом векторе, а о встроенных в pdf шрифтах.
 
Для такого файла Finereader просто выполняет re-mapping кодировки шрифтов.  
Никакого растра и распознавания, в его обычном смысле, не делается.
 

Всего записей: 143 | Зарегистр. 03-09-2001 | Отправлено: 09:56 10-03-2018 | Исправлено: fozzie, 10:08 10-03-2018
Alex Dragon



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
и речь идёт не о чистом векторе, а о встроенных в pdf шрифтах.

 
Разумеется.
 

Цитата:
Для такого файла Finereader просто выполняет re-mapping кодировки шрифтов.

 
Ага. Всё-таки делает. Ну вот и интересно, почему он ухитряется лажать, делая ошибки, характерные именно для распознавания растра, и почему он так долго думает — как будто именно что растрирует.
Или это где-то в настройках специально надо указывать?
 

Всего записей: 422 | Зарегистр. 05-01-2002 | Отправлено: 10:45 10-03-2018
fozzie

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Или это где-то в настройках специально надо указывать?

В FR14 это выглядит так:
 
https://yadi.sk/i/hKEhmXr93TCnUX
 
И, выходит, я Вас обманул - поскольку Finereader принимает решение на автомате, то может быть и так, и так. Мне просто повезло.

Всего записей: 143 | Зарегистр. 03-09-2001 | Отправлено: 11:14 10-03-2018 | Исправлено: fozzie, 11:15 10-03-2018
Alex Dragon



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
У вас 14-й. У меня 12-й. Интересно, с какой версии по идее это должно работать? во всяком случае у себя никаких опций на этот счёт не вижу.

Всего записей: 422 | Зарегистр. 05-01-2002 | Отправлено: 11:35 10-03-2018
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)
Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru