Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)

Модерирует : gyra, Maz

Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

JediMaster_Dragon



Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
ABBYY FineReader
7, 8, 9, 10 (Pro, Corp, Home), 11 (Pro, Corp), 12 (Pro, Corp) и 14 (Pro, Corp, Ent)

 

 
Полный список языков распознавания для FR15
 

Русский интерфейс
 
Ответ на вопрос о сохранении проекта смотрим тут


Если  хотите, чтобы ваша проблема была рассмотрена, (решение не гарантируется), необходимо представить такие сведения:
1. Версия FineReader.
2. Версия Windows, версию пакета обновлений (SP), разрядность (для Vista и выше).
3. Если проблемы со сканированием, то называем ещё и модель сканера. Обновите драйвера своего сканера, до последней версии имеющейся на сайте поддержки вашего сканера.


Как можно получить церковнославянские тексты при помощи сканирования FineReader'ом
Как отключить "искусственный интеллект" FineReader
Как выбрать опции, чтобы FR10 распознавал простейшие формулы
FineReader не распознает сложные формулы и рукописный текст, не задавайте вопросов на эту тему.  
Версии FR для Linux пока не существует, только Engine, который вам явно не нужен.

Для понимания формата XPS программой FineReader нужен Framework 3.0. Только для XP и 2000.
Совет по распознаванию файлов DjVu Читать
Электронные текстовые книги - OCR, вычитка, оформление

Всего записей: 354 | Зарегистр. 18-01-2002 | Отправлено: 09:07 26-01-2003 | Исправлено: Maz, 19:24 26-01-2020
Stranger_Y2K



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolvanchik, спасибо!
Успокоили. мне до предела ещё далеко.

Всего записей: 243 | Зарегистр. 20-07-2003 | Отправлено: 18:55 27-01-2013
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolvanchik

Цитата:
... первоначально дается до 10 активаций,  

"До десяти активаций" - это точно?
Мне приходилось слышать о другой цифре "до пяти активаций".

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 12:35 28-01-2013
ALEX666999



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Если легальные юзеры — что мешает написать/позвонить/почитать лицензионное соглашение?
Такие вопросы должны быть прописаны явным образом.

Всего записей: 6652 | Зарегистр. 20-05-2004 | Отправлено: 13:33 28-01-2013
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ALEX666999
В лицензионном соглашении о количестве разрешенных переносов с компа на комп ничего найти не удалось. Много юридической словесности "это разрешено", "это запрещено" и не более.
Можно конечно и позвонить, но были уже случаи, когда в разных частях этой конторы на один и тот же вопрос давали разные ответы. В отделе продаж было свое мнение, в техподдержке - свое, сиди потом и думай - кто из них больше прав?
 
Поэтому если кто-то уже этот вопрос выяснил да еще проверил ответ на практике, то естественно любопытно.

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 15:19 28-01-2013
Stranger_Y2K



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
короче ясно.... файл лицензии лучше сохранить, и в случаи чего думать как его прикрутить.

Всего записей: 243 | Зарегистр. 20-07-2003 | Отправлено: 16:16 28-01-2013
ALEX666999



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Shangry
Очень странно. Хотя ничего странного: их главная работа — впарить,
а вы потом разбирайтесь что к чему.
 
Stranger_Y2K
Как я уже говорил, FR младше 10-11 версии жрут поменьше памяти,
так что можете рассмотреть вариант с портабелизацией [прога].
Не знаю как этот момент оговорен в лицензии, но работать должно, по идее.
 
Только учтите привязку к железу. Для перестановок Windows номер должен пройти,
а вот если глобально проапгрейдитесь, то уже потребуется новая активация.

Всего записей: 6652 | Зарегистр. 20-05-2004 | Отправлено: 19:32 28-01-2013 | Исправлено: ALEX666999, 19:36 28-01-2013
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ALEX666999

Цитата:
... так что можете рассмотреть вариант с портабелизацией [прога [?]].
Не знаю как этот момент оговорен в лицензии, но работать должно, по идее.  

Оговорен очень просто и вполне ожидаемо - "нэзаконно всё это".
 

Цитата:
Как я уже говорил, FR младше 10-11 версии жрут поменьше памяти,  

Ресурсов требует побольше, но зато сложные сканы (сложная структура страница, хреновое качество оригинала, аналогичное качество сканирования) отрабатывают не в пример лучше.
Так что сначала надо смотреть что на вход FineReader пойдет, а потом уже выбирать версию.
 

Цитата:
Только учтите привязку к железу. Для перестановок Windows номер должен пройти, а вот если глобально проапгрейдитесь, то уже потребуется новая активация.

Встречал portable 11-й версии, которым активация похоже была до лампочки . Где запустишь, там  и работают.

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 12:29 29-01-2013 | Исправлено: Shangry, 12:30 29-01-2013
ALEX666999



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Shangry: Оговорен очень просто и вполне ожидаемо - "нэзаконно всё это".  

Ну ты смотри ж! Портабелизация оговорена, а число активаций — нет.

Цитата:
Shangry: \Так что сначала надо смотреть\
Встречал portable 11-й версии,

Мы же говорим о конкретном случае.
У человека 9-ка и варезные варианты в Программах сразу идут мимо.

Всего записей: 6652 | Зарегистр. 20-05-2004 | Отправлено: 14:27 29-01-2013
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ALEX666999

Цитата:
Ну ты смотри ж! Портабелизация оговорена, а число активаций — нет.

Именно про portable там ничего нет. Но если просуммировать тамошнюю юридическую словесность, то сказано, что для установки FineReader вы должны проделать то-то и то-то. А если вы всего перечисленного не сделали, то ваша инсталляция считается нелегальной (читай, незаконной).
 

Цитата:
Мы же говорим о конкретном случае.  

Звиняйте, не сообразил. Думал разговор идет про все версии.  

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 15:31 29-01-2013 | Исправлено: Shangry, 15:33 29-01-2013
Larry



Moderator
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Такой вопрос: FineReader 11 Professional Edition (лицензия). Есть серия изображений (отсканированных им же), которые мне нужно засунуть в PDF без распознавания. Пробовал разные вариации, но FineReader упорно лезет распознавать страницы.
 
Имеется ли возможность сделать то, что мне нужно, с помощью FineReader без ручной пометки области картинки у каждого изображения?
 
Спасибо.

----------
Never put off till tomorrow what can be put off till day after tomorrow just as well

Всего записей: 3118 | Зарегистр. 20-07-2005 | Отправлено: 22:35 31-01-2013
unreal666



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Larry

Цитата:
Имеется ли возможность сделать то, что мне нужно, с помощью FineReader без ручной пометки области картинки у каждого изображения?

сделай авторазметку области картинки за счет сохранения области в файл и последующей загрузки этой области с применением ее ко всем страницам. Это если размеры страниц одинаковые.

Всего записей: 6637 | Зарегистр. 14-02-2005 | Отправлено: 22:40 31-01-2013
Larry



Moderator
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
unreal666, ага, спасибо, получилось. Размер разный, поэтому пришлось чуть-чуть растягивать область у каждой страницы. Но это все равно быстрее, чем добавлять область вручную у каждой страницы.  


----------
Never put off till tomorrow what can be put off till day after tomorrow just as well

Всего записей: 3118 | Зарегистр. 20-07-2005 | Отправлено: 23:11 31-01-2013
unreal666



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Larry
можно было просто создать временное изображение, которое по ширине и высоте точно не меньше любого из других изображений. И область создать именно по нему. Просто потом при импорте такой области прога поматерится, что области у некоторых картинок больше самих картинок, но на нормальное распознавание это не повлияет.

Всего записей: 6637 | Зарегистр. 14-02-2005 | Отправлено: 00:58 01-02-2013
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Larry
А можно и совсем просто - открыть пакет со сканами, скомандовать "Сохранить изображения" и в открывшемся окошке форматом выбрать PDF.  
Только не забудьте поставить галочку "Сохранить страницы в один файл".

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 11:47 01-02-2013
Larry



Moderator
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
unreal666,

Цитата:
можно было просто создать временное изображение ...

Ага, тоже догадался.
 
Shangry, точно! Буду знать, спасибо!

----------
Never put off till tomorrow what can be put off till day after tomorrow just as well

Всего записей: 3118 | Зарегистр. 20-07-2005 | Отправлено: 11:59 01-02-2013
BarHan



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Почему-то FineReader ставит гиганские поля страниц
     
          Это в FR                                                                               Это в Word
 
при передаче материала в Word. В установках создал пользовательский формат страниц со своими полями
     
но в результирующем документе вся страница тесница в центр и большие поля во краям, при этом поля страницы в ворде вовсе нулевые, формат А4. Видно, что все содержимое страницы помещено в области (ну это понятно, при выборе результата "точный") но и есть область на весь лист, зачем не понятно.
Как это побороть?
ЗЫ. WinXPSP3, FR11Pro (121), Word2003SP3

Всего записей: 762 | Зарегистр. 30-01-2004 | Отправлено: 16:55 01-02-2013 | Исправлено: BarHan, 17:37 01-02-2013
bolvanchik

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
BarHan
в некоторых случаях спасает выставление параметра  Размер бумаги по умолчанию - A4
 в остальных случаях у меня в Worde  размер листа получается больше. приходится вручную менять.  и я не передаю в режиме Точная копия. У меня FR10

Всего записей: 277 | Зарегистр. 10-12-2002 | Отправлено: 22:17 01-02-2013
corrector

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Имеется: Windows 7 Макс SP1 x64, FineReader CE 11.0.110.122
Чем можно объяснить следующее:
На входе - 640 страниц tiff-ов (600 dpi, b/w, сжатие: Group 4 Fax Encoding в терминах IrfanView), весьма качественных сканов, общим размером 64,8 Мб.
1) в FR11 сохраняю изображения в pdf - получаю файл1 размером в 1315 Мб;
2) распознаю, сохраняю документ как pdf (опции: Размер бумаги по умолчанию - Использовать размер оригинала; Режим сохранения - Текст под изображением страницы; Разрешить теги PDF; Качество изображения - Сбалансированное; Шрифты - Использовать предопределенные шрифты), правлю OCR минимально (лишь первые 18 стр) - получаю файл2 размером в 16,13 Мб.
Откуда такая разница в размере файлов?
Отмечу, те же манипуляции в FR8 (FineReader Pro 8.0.0.1126) дают файл1 в 68,8 Мб и файл2 в 22,4 Мб.

Всего записей: 218 | Зарегистр. 15-05-2006 | Отправлено: 18:31 03-02-2013 | Исправлено: corrector, 20:45 03-02-2013
Frantishek



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ребят, подскажите обывателю решение )
Есть задача пробежаться по архивам документов (форматы pdf, djvu, jpg и пр.), разной степени качества (большая часть получена и Интернет-помоек) и распознать, насколько можно, текстовый слой, там, где его нет, выдав результат в виде каких то оптимальных п/фабрикатов, с целью последующего поедания программами индексации типа Архивариус 3000. Отсюда вопросы:
1. Какую версию FR для этого использовать, является ли он вообще лучшим решением из возможных на рынке OCR для этих целей, можно ли это выполнять на автомате (подсунул папку и ушел курить)?
2. Какой оптимальный выходной формат должен быть для распознанных документов (djvu ?), какие настройки следует произвести для более качественного распознавания (если скорость не критична), допускается ли унификация всего процесса (может ли программа пробежаться по входному каталогу с данными и выдать на экспорт аналогичный каталог с уже распознанными документами, может ли она различать и не заниматься распознаванием тех документов, где это не требуется и пр.)?
3. И наконец, можно ли по результату выдать отчет - что получилось, а что нет, и насколько?
Биг тхенкс.)

Всего записей: 1221 | Зарегистр. 02-05-2006 | Отправлено: 09:34 04-02-2013
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
corrector

Цитата:
На входе - 640 страниц tiff-ов (600 dpi, b/w, сжатие: Group 4 Fax Encoding в терминах IrfanView), весьма качественных сканов, общим размером 64,8 Мб.
1) в FR11 сохраняю изображения в pdf - получаю файл1 размером в 1315 Мб;  

Скорее всего дело в том, что FineReader сохраняет ч/б сканы в PDF вообще без сжатия (только не спрашивайте меня зачем здесь нужен такой идиотизм  ). Тогда как раз примерно столько и должно набежать.
 
Проверить достаточно просто - посмотрите этот PDF в Акробатовском Preflight. Там где-то есть пункт, позволяющий увидеть характеристики упакованных в PDF изображений.
 
Frantishek

Цитата:
1. Какую версию FR для этого использовать, является ли он вообще лучшим решением из возможных на рынке OCR для этих целей?  

Для произвольной смеси из файловых форматов на непредсказуемо каких языках пока что наиболее оптимален FineReader. Старый русский (до 1920-го) знает только он, за толковую работу с DjVu других универсальных распознавашек ( в смысле, ориентированных на любые форматы) пока что слышать не приходилось.
Из версий, в смысле качества разметки на блоки и качества распознавания, предпочтительнее 11-я.
 

Цитата:
можно ли это выполнять на автомате (подсунул папку и ушел курить)?  

С тех пор, как с 10-й версии в FineReader ввели пакетную обработку (тамошний HotFolder), засовывать целой папкой стало вполне решаемой задачей.
Но если нужен легальный софт, то 10-ю версию уже нигде не купишь (разве что по случаю), а в 11-й на пакетную обработку навешали кучу ограничений. Теперь там осталась не более чем демонстрашка пакетника.
 

Цитата:
Какой оптимальный выходной формат должен быть для распознанных документов (djvu ?),

А это в зависимости от:
а)для чего они дальше нужны (в смысле на какое дело пойдут);
б)из чего состоит исходная куча - сплошные сканы в ч/б или же смесь ч/б и цветных;
в)надо ли делать выходной объем как можно меньше или же это не очень критично.
 

Цитата:
какие настройки следует произвести для более качественного распознавания

Включить предобработку изображений (кроме ориентации страниц), языком распознавания выставить комплект из всего, что там в принципе может оказаться. Ну и разумеется галочка на "Тщательном распознавании" (оно и так по умолчанию стоит, но все-таки проверить).
 

Цитата:
допускается ли унификация всего процесса  

Обработка всех файлов из входной папки происходит по одному и тому же комплекту настроек.
 

Цитата:
может ли программа пробежаться по входному каталогу с данными и выдать на экспорт аналогичный каталог с уже распознанными документами,

Поставить галочку на "Обрабатывать подпапки".  
Тогда можете давать на вход не одну единственную папку, а хоть целое дерево, а на выходе получать копию этого дерева
 

Цитата:
может ли она различать и не заниматься распознаванием тех документов, где это не требуется

В обработку идут или файлы заданного в настройках формата, или любые файлы с изображениями (соответствующий пункт в списке форматов). Все форматы, которые по своим спецификациям не могут содержать изображения, пропускаются, в обработку не идут.
 

Цитата:
И наконец, можно ли по результату выдать отчет - что получилось, а что нет, и насколько?  

Вроде бы нет, но твердо не уверен (пока ни разу не возникало такой потребности).

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 12:08 04-02-2013 | Исправлено: Shangry, 13:45 04-02-2013
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)
Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru