Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)

Модерирует : gyra, Maz

Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

JediMaster_Dragon



Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
ABBYY FineReader
7, 8, 9, 10 (Pro, Corp, Home), 11 (Pro, Corp), 12 (Pro, Corp) и 14 (Pro, Corp, Ent)

 

 
Полный список языков распознавания для FR15
 

Русский интерфейс
 
Ответ на вопрос о сохранении проекта смотрим тут


Если  хотите, чтобы ваша проблема была рассмотрена, (решение не гарантируется), необходимо представить такие сведения:
1. Версия FineReader.
2. Версия Windows, версию пакета обновлений (SP), разрядность (для Vista и выше).
3. Если проблемы со сканированием, то называем ещё и модель сканера. Обновите драйвера своего сканера, до последней версии имеющейся на сайте поддержки вашего сканера.


Как можно получить церковнославянские тексты при помощи сканирования FineReader'ом
Как отключить "искусственный интеллект" FineReader
Как выбрать опции, чтобы FR10 распознавал простейшие формулы
FineReader не распознает сложные формулы и рукописный текст, не задавайте вопросов на эту тему.  
Версии FR для Linux пока не существует, только Engine, который вам явно не нужен.

Для понимания формата XPS программой FineReader нужен Framework 3.0. Только для XP и 2000.
Совет по распознаванию файлов DjVu Читать
Электронные текстовые книги - OCR, вычитка, оформление

Всего записей: 354 | Зарегистр. 18-01-2002 | Отправлено: 09:07 26-01-2003 | Исправлено: Maz, 19:24 26-01-2020
Finereader14

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Где я могу скачать портативную версию FR15?
Извините, я не могу найти правильный форум

Всего записей: 99 | Зарегистр. 18-12-2018 | Отправлено: 00:10 18-01-2020
adada

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Думаю Вы ее скачаете -- но попозже, когда она появится. Сам жду.
 
И попутно отвечу на пост в варезнике:
%%FR12 Portable занимает меньше места, запускается быстрее и, может быть, работает шустрее, чем FR14 Portable.%%
 
Не раз замечал, что FR12 в выходных данных книг  в выражении "Усл. печ. листов" норовил вставить "Уел".  
Когда появился FR14,  этот дефект распознавания исчез.
 
Не знаю, может, это глюк имеющейся у меня комплектации, но оптимистически рассчитываю, что FR15 будет еще внимательнее к букве, слову и делу. ™)
Например, сможет различать в старых немецких текстах букву f и почти такую же лигатуру, только без перекладины, буквы s.

Всего записей: 102 | Зарегистр. 11-12-2003 | Отправлено: 12:11 18-01-2020
Finereader14

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
%%FR12 Portable занимает меньше места, запускается быстрее и, может быть, работает шустрее, чем FR14 Portable.%%

Я надеюсь, что FR15 лучше с арабскими и китайскими шрифтами. Я хотел бы также, чтобы OCR пиньинь правильно. Вот почему я хочу попробовать FR15

Всего записей: 99 | Зарегистр. 18-12-2018 | Отправлено: 13:51 18-01-2020
adada

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я почему-то думаю, что каких-то прорывных изменений в алгоритме распознавания вряд ли будет, что дело ограничится рутинным обновлением библиотек.
Предположение подтверждается тем, что развитие сейчас заметно пошло по пути агрегатирования, присоединения побочных функций, превращения FineReader в FineSuite.
По пути фиоритур или, говоря по-китайски, хуабяни. ™)

Всего записей: 102 | Зарегистр. 11-12-2003 | Отправлено: 14:07 18-01-2020
logmaster



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите, пожалуйста, как в 12й версии избавиться от подсветки (маркировки) неуверенно распознанных символов в  вордовском тексте (pdf -> MS  Word). Я сдуру отметил эту опцию, увидел испещренный салатного цвета пятнами текст и тут же снял галку.  
Не помогло, теперь все вновь распознанные тексты сплошь в пятнах, штук по полтора десятка отметок на каждой странице и я не знаю, что делать.
Неужели сносить файнридер и ставить заново?  
Может быть, как-то удастся удалить эту маркировку в вордовском документе?
 
Вопрос снят. Там в двух местах стояли галки на опциях про отметку неуверенно распознанных символов: на закладке Посмотр и на закладке Сохранить. Я отмечал только в Просмотре, а галка в Сохранить появилась сама и после убирания галки в закладке Просмотр  в Сохранить эта галка преспокойно оставалась. Убрал ее в Сохранить и все пришло в норму.

Всего записей: 647 | Зарегистр. 22-04-2002 | Отправлено: 09:09 29-01-2020 | Исправлено: logmaster, 09:29 29-01-2020
callidus



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Я надеюсь, что FR15 лучше с арабскими и китайскими шрифтами. Я хотел бы также, чтобы OCR пиньинь правильно. Вот почему я хочу попробовать FR15

 
У меня тоже была надежда на китайский, но изменений нет. Я думал что ИИ реально, что-то изменит, но опять же, в сравнении с https://github.com/RimeOCRLIB/OCRLib и https://www.buddism.ru/ocrlib/documentation/OCRLib_documentation2018_rus.pdf у файнридера ИИ это детский лепет .. Мало того, они вероятно применяют только на буквы ИИ, а на структуру нет, таким образом на одинаковой странице могут быть артефакты, которые не должны быть даже на самом простом ИИ .. Если посмотреть на объем работы, который нужно сделать ABBYY, то в ближайшем будущем нормального решения для ИИ не будет, хоть в других программах, вроде как они сделали структурный и шрифтовой ИИ, но мне кажется они не хотят интегрировать эту технологию в десктопный вариант.

Всего записей: 545 | Зарегистр. 04-02-2006 | Отправлено: 13:04 29-01-2020 | Исправлено: callidus, 13:07 29-01-2020
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ABBYY FineReader Corp 15.0.112.2130.
 
Похоже на баг.
При сохранении в PDF с бинаризацией (ч.б.), внутри документа картинки пожаты в CCITT Group 3, а должно быть JBIG2 (без потерь). Соответственно размер PDF с CCITT G3 получается больше, чем с JBIG2.
 
Кто в танке, подтвердите или опровергните.

Всего записей: 2794 | Зарегистр. 31-05-2010 | Отправлено: 15:11 29-01-2020 | Исправлено: ComboFZ, 10:04 31-01-2020
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Я надеюсь, что FR15 лучше с арабскими и китайскими шрифтами.

Надейтесь. По тому, что вижу - нынешняя когорта программеров Абби, работающих над продуктом, не знает профессионально ни сам продукт, ни код, написанный предшественниками в то время, когда FR еще развивался, и может программировать только свистоперделки.

Всего записей: 3673 | Зарегистр. 17-09-2001 | Отправлено: 15:26 29-01-2020
Vadim39



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Похоже на баг.
При сохранении в PDF с бинаризацией (ч.б.), внутри документа картинки пожаты в CCITT Group 3, а должно быть JBIG2. Соответственно размер PDF получается больше, чем с JBIG2.  

Подтверждаю. Кроме того, начиная с 14.107 изменились настройки формата: для сравнения два файла: https://cloud.mail.ru/public/2Vj3/2guNRQnoq
Как видно, при перелистывании v15 сначала появляется текст, затем изображение. И то же самое с версией 14.107. Поэтому вынужден пользоваться 14.105
 

Всего записей: 1117 | Зарегистр. 11-04-2002 | Отправлено: 15:30 30-01-2020
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Vadim39

Цитата:
Как видно, при перелистывании v15 сначала появляется текст, затем изображение

У вас просто железо/графическая плата слабая, либо вьювер тормозной.
 
Что касается текстовых объектов (шрифтов).
Заливка шрифтов во всех версиях FR всегда было включена по умолчанию и то что в FR 14.0.105 она стала вдруг отключена, то это был баг этой версии. Я об этом писал ранее:
http://forum.ru-board.com/topic.cgi?forum=5&topic=6373&start=3360#13
ещё:
http://forum.ru-board.com/topic.cgi?forum=5&topic=6373&start=3340#19
 
Кстати, в ваших обеих PDF шрифты (их подмножество) не встроены, это не есть хорошо. Хотя для шрифтов Base 14 это и не обязательно, но, всё таки, их надо встраивать в документ. Для этого в FR при сохранении ставьте PDF/A, тогда шрифты будут встраиваться.
При открывании документов PDF/A во многих PDF-редакторах выскакивает предупреждение, что редактирование отключено - "Разрешить редактирование", соглашайтесь и пересохраните PDF, чтобы информация о PDF/A затёрлась.
 
Если вам не нравится включенная заливка в шрифтах, её можно отключить за раз во всём документе в PDF-XChange Editor 7.0/8.0 или в других редакторах PDF.
Можно поступить по другому, сделать общую векторную белую заливку между шрифтами и картинками/сканами, тогда шрифты с включенными заливками тоже не будут видны при перелистывании страниц на слабом железе или в тормозных PDF-вьюверах.  
http://forum.ru-board.com/topic.cgi?forum=5&topic=17599&start=1500#21
 
добавлено
цитата
Заливка шрифтов во всех версиях FR всегда было включена по умолчанию

 
Проверил, в некоторых ранних версиях она была отключена.
 

Всего записей: 2794 | Зарегистр. 31-05-2010 | Отправлено: 19:37 30-01-2020 | Исправлено: ComboFZ, 00:53 02-08-2020
Vadim39



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ComboFZ

Цитата:
Кстати, в ваших обеих PDF шрифты (их подмножество) не встроены, это не есть хорошо
 
Будьте так добры, подскажите, чем именно нехорошо.

Цитата:
Если вам не нравится включенная заливка в шрифтах, её можно отключить за раз во всём документе в PDF-XChange Editor 7.0/8.0 или в других редакторах PDF.  

Вы имеете в виду, отрыть в XChange Editor, выбрать весь текст и указать цвет заливки как прозрачный? А в Acrobat Pro DC это можно как-то сделать?
ЗарСпасБол!
 
 

Всего записей: 1117 | Зарегистр. 11-04-2002 | Отправлено: 05:33 31-01-2020 | Исправлено: Vadim39, 05:51 31-01-2020
Narak_zempo

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ошибка "Src\CaptionHelper.cpp. 158" при сохранении PDF с возможностью поиска.
Версия 14.0.107.212. Пробовал открывать сохранённый проект на 2 разных компах с одним и тем же результатом. Проекты, созданные в этой же проге раньше, сохраняются без проблем.
Скачал и установил 15.0.112.2130, сконвертировал проект, пробую сохранить PDF с текстом - та же фигня. Без текста норм.
WTF?

Всего записей: 159 | Зарегистр. 16-09-2008 | Отправлено: 22:32 10-02-2020
D1D1D1D

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Друзья, что если дружно начать писать им насчёт добавки возможности поиска и замен по регулярным выражениям в соответствующем диалоговом окне, что сильно бы облегчило предварительную вычитку? Имеется в виду не простой поиск, а именно с регулярными выражениями, какая функция присутствует даже в простых текстовых редакторах. Кроме того, пригодилась бы возможность в том же диалоговом окне поиска и замен по пакету, искать и заменять текст с форматированием: например, находить единицу с курсивом и заменять на единицу в верхней позиции (в виде сноски) и тп. Это бы позволило автоматизировать бОльшую часть предварительной правки.

Всего записей: 1367 | Зарегистр. 05-04-2010 | Отправлено: 05:17 29-02-2020 | Исправлено: D1D1D1D, 05:18 29-02-2020
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
15 версия при распознавании словарей с тильдами половину (примерно) тильд не распознаёт
 
В обработке изображений исчезла опция - Очистить изображение от мусора...
 
Очередной шаг вперёд - два назад...

Всего записей: 3673 | Зарегистр. 17-09-2001 | Отправлено: 11:30 01-04-2020
Sjoe



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo
Опция Очистить изображение от мусора всегда была глючная (по крайней мере, у меня)-- вместе с мусором она очищала текст от точек, запятых, двоеточий и точек с запятой, особенно если текст был сканирован (а не конвертирован, допустим, в pdf).

Всего записей: 676 | Зарегистр. 09-07-2009 | Отправлено: 12:36 01-04-2020
Vadim39



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
ABBYY FineReader Corp 15.0.112.2130.
 
Похоже на баг.
При сохранении в PDF с бинаризацией (ч.б.), внутри документа картинки пожаты в CCITT Group 3, а должно быть JBIG2 (без потерь). Соответственно размер PDF с CCITT G3 получается больше, чем с JBIG2.
 

Хотелось бы вернуться к вопросу. В самой программе выбор формата, похоже, недоступен. В принципе, можно сжать в JBIG2  сторонним софтом, но как сохранить распознанный текст?

Всего записей: 1117 | Зарегистр. 11-04-2002 | Отправлено: 15:54 05-04-2020
asfasd

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Зашёл вот в редактор исходного изображения, хотел переместить определённый кусок картинки в другое место - и потом снова распознать полностью. И не нашёл как это сделать, и охненел, куча каких то заумных\ненужных штук\фишек - а вот элементарно переместить\подвинуть\подправить кусок в исходной картинке на другое место нельзя.

Всего записей: 162 | Зарегистр. 04-12-2017 | Отправлено: 19:45 05-04-2020 | Исправлено: asfasd, 19:49 05-04-2020
Maikl65

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asfasd
FineReader создавался в первую очередь как система OCR, с помощью которой можно было превращать документ-картинку в редактируемый документ. И с этой функцией программа вполне справляется. Что же касается "...каких то заумных\ненужных штук\фишек", то они разработаны как раз для того, что бы в автоматическом или ручном режиме дать возможность пользователю сделать изображение как можно более качественным именно для распознавания, что бы потом меньше пришлось править распознанный документ. И, если вас это не устраивает, то это ваши проблемы, а не разработчиков. Ведь если разработчики начнут пихать в свою программу все подряд, дабы угодить каждому, то возникнет ситуация, как в басне С. Михалкова "Слон-живописец" и нормальный программный продукт превратится в огромного неповоротливого "монстра" с огромной кучей ошибок и ненужных функций, которые будут нужны разве что 0,001% пользователей...

Всего записей: 1987 | Зарегистр. 01-11-2004 | Отправлено: 20:30 05-04-2020
asfasd

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Maikl65
-куча бла-бла, с баснями.
-перевернул смысл моего поста с ног на голову: это как раз сейчас, о чём я и указал, редактор картинки - это "монстр" с огромным набором ненужных функций - а вот, повторяю ещё раз, элементарно чтобы передвинуть кусочек исходной картинки на другое место - надо использовать внешний редактор изображений - это ты считаешь удобным? разумным? Во внешних редакторах изображений это делатся за 2-3 клика мышкой.
 
А с твоей логикой: "FineReader создавался в первую очередь как система OCR" - зачем тогда вообще нужен редактор изображения в этой программе? - убрать редактор изображений, и удвоить усилия для улучшать модуль разпознавания - по твоей логике, так? А раз редактор картинки есть в комплекте - я указал на отсутствие в этом редакторе элементарной функции - твои бла-бла философские вообще не к месту.
 
А теперь ещё раз, чтобы ты подумал и понял, как бы это было удобно: в редакторе изображения, передвинул определённый кусок картинки на другое место - а потом распознал.

Всего записей: 162 | Зарегистр. 04-12-2017 | Отправлено: 20:49 05-04-2020 | Исправлено: asfasd, 20:54 05-04-2020
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Vadim39

Цитата:
Цитата:
ABBYY FineReader Corp 15.0.112.2130.  
   
Похоже на баг.  
При сохранении в PDF с бинаризацией (ч.б.), внутри документа картинки пожаты в CCITT Group 3, а должно быть JBIG2 (без потерь). Соответственно размер PDF с CCITT G3 получается больше, чем с JBIG2.  
 
 
Хотелось бы вернуться к вопросу. В самой программе выбор формата, похоже, недоступен. В принципе, можно сжать в JBIG2  сторонним софтом, но как сохранить распознанный текст?

 
Конверсия монохромных ч/б изображений (zip/flate, ccitt fax 3/4) в JBIG2 не затрагивая остальные объекты в PDF файле.
 
PDF-XChange Editor 7.0/8.0 > Файл > Сохранить оптимизированную копию
В левой колонке поставить галку в чекбоксе на Изображения, все остальные сняты.
В цветных, полутоновых, индексированных изображениях выставить:
Без уменьшения числа пикселей
Сжатие: Оставить как есть.
В Монохроме выставить:
Без уменьшения числа пикселей
Сжатие: JBIG2.
Галку в "Оптимизировать изображения только при уменьшении размера файла" оставить включенной.
OK
 

 
Acrobat Pro 11.0 > Файл > Сохранить как другой > Оптимизированный файл PDF
В левой колонке поставить галку в чекбоксе на Изображения, все остальные сняты.
В цветных и серых изображениях выставить:
Даунсамплинг: Выключено
Сжатие: Сохранить существующее
В монохромных изображениях выставить:
Даунсамплинг: Выключено
Сжатие: JBIG2

Галку в "Оптимизировать изображения только при уменьшении размера" оставить включенной.
OK
 

Всего записей: 2794 | Зарегистр. 31-05-2010 | Отправлено: 04:31 06-04-2020 | Исправлено: ComboFZ, 07:41 06-04-2020
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)
Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru