Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)

Модерирует : gyra, Maz

Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

JediMaster_Dragon



Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
ABBYY FineReader
7, 8, 9, 10 (Pro, Corp, Home), 11 (Pro, Corp), 12 (Pro, Corp) и 14 (Pro, Corp, Ent)

 

 
Полный список языков распознавания для FR15
 

Русский интерфейс
 
Ответ на вопрос о сохранении проекта смотрим тут


Если  хотите, чтобы ваша проблема была рассмотрена, (решение не гарантируется), необходимо представить такие сведения:
1. Версия FineReader.
2. Версия Windows, версию пакета обновлений (SP), разрядность (для Vista и выше).
3. Если проблемы со сканированием, то называем ещё и модель сканера. Обновите драйвера своего сканера, до последней версии имеющейся на сайте поддержки вашего сканера.


Как можно получить церковнославянские тексты при помощи сканирования FineReader'ом
Как отключить "искусственный интеллект" FineReader
Как выбрать опции, чтобы FR10 распознавал простейшие формулы
FineReader не распознает сложные формулы и рукописный текст, не задавайте вопросов на эту тему.  
Версии FR для Linux пока не существует, только Engine, который вам явно не нужен.

Для понимания формата XPS программой FineReader нужен Framework 3.0. Только для XP и 2000.
Совет по распознаванию файлов DjVu Читать
Электронные текстовые книги - OCR, вычитка, оформление

Всего записей: 354 | Зарегистр. 18-01-2002 | Отправлено: 09:07 26-01-2003 | Исправлено: Maz, 19:24 26-01-2020
Maikl65

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Userrr

Цитата:
как добиться подобного эффекта

Если требуется только черно-белое изображение, то перед сканированием в настройках FineReader достаточно включить опцию "приводить цветное/серое изображение к черно-белому" - тогда любой фон (не только желтый) исчезнет. Правда рисунки и фотографии, если они есть, превратятся в подобие гравюр.
Ну а если используется FineReader 11, то там есть встроенный редактор изображений, который позволит за счет изменения яркости/контрастности/уровней убрать желтизну фона даже с цветных изображений.

Всего записей: 1988 | Зарегистр. 01-11-2004 | Отправлено: 09:09 19-10-2013
Userrr



BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Maikl65 09:09 19-10-2013
Цитата:
перед сканированием

я не сканировал, уже готовые фотографии документов, надо распечатать, хотел бы запихнуть в сабж сотню фоток, а он вывел бы мне их на печать, в 'чистом' виде (жутко много расходуется тонера в принтере)

Всего записей: 10821 | Зарегистр. 21-03-2006 | Отправлено: 09:27 19-10-2013
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Userrr

Цитата:
задача - распечатать сфотографированную страницу, не распознавая, на белый лист

Если не надо распознавать, то нет и необходимости печатать именно через FineReader.
А если просто распечатать, убрав при этом фон, то такое умеет делать делать любой граф. редактор. Хоть через бинаризацию, хоть через снижение уровня яркости фона до почти невидимого.

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 12:06 21-10-2013
Maikl65

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Userrr

Цитата:
я не сканировал, уже готовые фотографии документов, надо распечатать, хотел бы запихнуть в сабж сотню фоток, а он вывел бы мне их на печать, в 'чистом' виде (жутко много расходуется тонера в принтере)

Тогда вместо сканирования надо использовать пункт "Открыть изображение" , в диалоговом окне выбрать все нужные файлы изображений и загрузить в программу (вроде можно до 999 изображений за раз). При опциях для преобразования к ч/б изображению из моего предыдущего поста произойдет очистка от фона точно так же, как если бы изображения сканировались.

Всего записей: 1988 | Зарегистр. 01-11-2004 | Отправлено: 13:04 21-10-2013
inapht

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Какая последняя версия, которая без проблем распознает текст?
До смешного доходит, не может распознать почти идеальные для распознавания скриншоты с основным шрифтом винды. То слова как картинку определяет, разбивка на области, то делает ошибки на ровном месте.

Всего записей: 1513 | Зарегистр. 07-08-2007 | Отправлено: 22:44 31-10-2013
ALEX666999



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
inapht
9-ка и 11-я одинаково, по мне. 11-я просто жрёт больше ресурсов, и так, вроде,
и не исправили появившееся в 10-ке замедление сохранения группы результатов распознавания.
Ну хоть косяк с буфером обмена в SR пофикшен + субъективно стабильней рабтать стало, и то ладно.
 
Насчёт разбивки на области — это же машина. У меня тоже бывает, что текст,
вполне себе читабельный человеком, помечается как изображение.

Всего записей: 6652 | Зарегистр. 20-05-2004 | Отправлено: 07:44 01-11-2013 | Исправлено: ALEX666999, 07:47 01-11-2013
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
inapht

Цитата:
... не может распознать почти идеальные для распознавания скриншоты с основным шрифтом винды.  

Дык, скриншоты же. С ними при распознавании всегда головная боль.  
Разрешение 72 точки, фон - сплошные цветные заливки (вместо обычного нейтрально-незаметного). Вот и проблемы вроде бы на пустом месте.
У меня даже, когда они из книжных иллюстраций (с разрешением все нормально) и то сплошь да рядом ошибки разметки сыплются - хоть какую версию ставь.

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 11:59 01-11-2013 | Исправлено: Shangry, 12:02 01-11-2013
inapht

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Shangry

Цитата:
Дык, скриншоты же. С ними при распознавании всегда головная боль.  
Разрешение 72 точки, фон - сплошные цветные заливки (вместо обычного нейтрально-незаметного). Вот и проблемы вроде бы на пустом месте.

 
Фон как раз нейтральный, это скрины удаленных столов. Почему-то в AFR 11 pro, процент правильно распознанных файлов больше, когда отключена предобработка и включен режим быстрого распознавания вместо тщательного. Вот пример, где текст в центре распознается как картинка:

У этой в любом случае не распознает как текст - имя пользователя Logged on.

Всего записей: 1513 | Зарегистр. 07-08-2007 | Отправлено: 13:30 01-11-2013 | Исправлено: inapht, 13:37 01-11-2013
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
inapht
Что касается снимка Рабочего стола приведенного вами.  
ABBYY ScreenReader 8.1126 распознал всё и без ошибок.
ABBYY FineReader 8.1126 распознал всё с двумя ошибками в слове Business
ABBYY FineReader 11.0.110.122 CE + Screenshot Reader, в данном случае, уступает восьмёрке.

Всего записей: 2794 | Зарегистр. 31-05-2010 | Отправлено: 16:39 01-11-2013
antz13



Full Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
FR 11 и SR 11 распознал все без ошибок

Всего записей: 438 | Зарегистр. 28-03-2005 | Отправлено: 18:13 01-11-2013
Maikl65

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Какая последняя версия, которая без проблем распознает текст?  

Последняя версия ABBYY FineReader, в которой качество распознавания обеспечивалось именно за счет фирменной "фонтанной" технологии от ABBYY была 8.1126.  
В дальнейших же версиях процесс повышения качества распознавания стали проводить за счет анализа строки уже распознанного текста и частичной автоматической замены неправильно распознанных слов на слова из постоянно увеличивающегося словаря (как это делают орфографические модули программ, предлагая заменить неправильно набранный текст).  
Именно поэтому качество распознавания различных текстов на разных версиях OCR варьирует очень сильно - для текстов со стандартным набором типовых слов и фраз даже при невысоком качестве картинки лидируют новые версии программы, а вот на сложных специализированных текстах с большим количеством слов, отсутствующих в словаре (или на коротких текстах, где недостаточно информации для семантического анализа) лидирует 8.1126.

Всего записей: 1988 | Зарегистр. 01-11-2004 | Отправлено: 18:46 01-11-2013
VitRom

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Однако ЕМНИП для желающих работать с иероглифами особого выбора нет: часть языков поддержана только начиная с 10 и ещё часть только с 11. Поправьте, если не прав (или появился способ подключения языков и словарей из 11 в 8).

Всего записей: 3098 | Зарегистр. 18-06-2006 | Отправлено: 21:04 01-11-2013
o4frb

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ABBYY забила на FineReader? 11 версии уже 2 года как.

Всего записей: 304 | Зарегистр. 01-01-2007 | Отправлено: 22:07 01-11-2013
inapht

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В интернете нагуглил мнение, что для массового распознавания, как раз мой случай, лучше подходит версия 7.0. Придется пробовать разные версии.

Всего записей: 1513 | Зарегистр. 07-08-2007 | Отправлено: 00:03 02-11-2013
ALEX666999



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Maikl65
У меня как раз упомянутый билд «чудил»: вроде махом обработал,
а потом смотришь текст — вместо «рыба» — «селёдка», то есть совершенно «левое» слово.

Цитата:
VitRom: Поправьте, если не прав

В 9-ке китайский/японский, 10-ке — корейский, 11-й — арабский, навскидку.
Насчёт подключения языков ничего не слышал.
 
o4frb
В качестве развития — хз, но обновлённые билды клепают.
Последний — за 7 месяц этого года.

Цитата:
inapht: лучше подходит версия 7.0

Можно, конечно, затестить, чем чёрт не шутит.
Только если машина с несколькоядерным процем, процесс будет идти медленней,
так их как поддержку добавили только начиная с 9-ки.
Ну и к гугломнениям нужно с отсторожностью относиться, там, чтобы по их тубобитовой
ссылке скачали и не такое понапишут...

Всего записей: 6652 | Зарегистр. 20-05-2004 | Отправлено: 00:22 02-11-2013
Dunkeshu

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
ABBYY забила на FineReader? 11 версии уже 2 года как
Не забила, так как даже на 9-й Sprint выпустила обновление, от 25 апреля 2013, а ему уже 4 года как
 
Программа обновлений для ABBYY Finereader 9 Sprint содержит следующие изменения:
Обновлены технологии распознавания;
-Исправлена проблема совместимости 32битных ОС Windows с MS Office 2010 и 2013;
-Исправлена ошибка в определении ориентации страницы для документов с выбранными языками распознавания "английский, китайский";
-Исправлена ошибка, возникающая при сканировании в серый цвет (greyscale).

Всего записей: 621 | Зарегистр. 25-01-2010 | Отправлено: 22:49 02-11-2013 | Исправлено: Dunkeshu, 22:51 02-11-2013
Uraanfgh56



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Доброго.
 
1).Как научить распознавать рукописный текст ?
2).Как игнорировать распознование круглый печатей т.е мне не нужно чтобы печать распозновалась , а нужно чтобы вставлялась на том же самом месте как картинка - круглая печать.
 
также интересует как сделать так чтобы при распозновании некоторые области оставились как есть - без распознавания ?
 
3). Можно ли научить программу не распозновать всякие чёрточки, галки и т.п артефакты на изображении (особенно это касается ксерокопии) , т.е грубо говоря игнорировать и не включать в распознанный текст ?

Всего записей: 3567 | Зарегистр. 03-11-2007 | Отправлено: 17:21 09-11-2013 | Исправлено: Uraanfgh56, 17:24 09-11-2013
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Uraanfgh56

Цитата:
1).Как научить распознавать рукописный текст ?  

На данный момент - никак. И вряд ли здесь что-то изменится в ближайшие лет 10.
 
Единственное, что хоть как-то может быть пропущено через обучение - рукопись с хорошим каллиграфическим почерком, где буквы прорисованы более или менее одинаково и не сливаются друг с другом, а идут каждая в отдельности. Плюс строчки д.б. ровные, без изгибов и перекосов.
 

Цитата:
2).Как игнорировать распознование круглый печатей т.е мне не нужно чтобы печать распозновалась , а нужно чтобы вставлялась на том же самом месте как картинка - круглая печать.  

Только ручная переразметка блоков после разметки автоматической.
 

Цитата:
3). Можно ли научить программу не распозновать всякие чёрточки, галки и т.п артефакты на изображении (особенно это касается ксерокопии) , т.е грубо говоря игнорировать и не включать в распознанный текст ?  

Опять же только ручная переразметка.

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 12:22 11-11-2013 | Исправлено: Shangry, 12:23 11-11-2013
sti2008



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Здравствуйте! У меня такой вопрос:  
после распознавания в FineReader и передачи текста в MS Word неуверенно распознанные символы отображаются голубым цветом. А вот как снять этот голубой цвет в MS Word не знаю. Прошу помощи форумчан.

Всего записей: 945 | Зарегистр. 13-08-2008 | Отправлено: 17:33 14-11-2013
smersh2012



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
sti2008
выдели текст и жми эту кнопку - очистить форматирование

Всего записей: 2472 | Зарегистр. 30-01-2012 | Отправлено: 18:13 14-11-2013
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)
Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru