Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)

Модерирует : gyra, Maz

Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

JediMaster_Dragon



Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
ABBYY FineReader
7, 8, 9, 10 (Pro, Corp, Home), 11 (Pro, Corp), 12 (Pro, Corp) и 14 (Pro, Corp, Ent)

 

 
Полный список языков распознавания для FR15
 

Русский интерфейс
 
Ответ на вопрос о сохранении проекта смотрим тут


Если  хотите, чтобы ваша проблема была рассмотрена, (решение не гарантируется), необходимо представить такие сведения:
1. Версия FineReader.
2. Версия Windows, версию пакета обновлений (SP), разрядность (для Vista и выше).
3. Если проблемы со сканированием, то называем ещё и модель сканера. Обновите драйвера своего сканера, до последней версии имеющейся на сайте поддержки вашего сканера.


Как можно получить церковнославянские тексты при помощи сканирования FineReader'ом
Как отключить "искусственный интеллект" FineReader
Как выбрать опции, чтобы FR10 распознавал простейшие формулы
FineReader не распознает сложные формулы и рукописный текст, не задавайте вопросов на эту тему.  
Версии FR для Linux пока не существует, только Engine, который вам явно не нужен.

Для понимания формата XPS программой FineReader нужен Framework 3.0. Только для XP и 2000.
Совет по распознаванию файлов DjVu Читать
Электронные текстовые книги - OCR, вычитка, оформление

Всего записей: 354 | Зарегистр. 18-01-2002 | Отправлено: 09:07 26-01-2003 | Исправлено: Maz, 19:24 26-01-2020
Maikl65

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
asfasd
Цитата:
это как раз сейчас, о чём я и указал, редактор картинки - это "монстр" с огромным набором ненужных функций
Если этот "огромный набор ненужных функций" не нужен лично вам, то это не значит, что он не нужен никому. Данные функции в обсуждаемой системе ОПТИЧЕСКОГО РАСПОЗНАВАНИЯ СИМВОЛОВ (ОCR) (а это ее основное назначение) появились в основном для того, что бы попытаться УЛУЧШИТЬ КАЧЕСТВО РАСПОЗНАВАНИЯ ТЕКСТА для изображений самого отвратительного качества, полученных "однокнопочными" пользователями мобильных телефонов, смартфонов, планшетов и прочих "гаджетов" (перекошенных, слабо сфокусированных, с отвратительной экспозицией...). Так что это на полноценный редактор изображений, а просто "костыль" для исправления качества картинки для OCR (насколько это возможно) для тех, кто в этом нуждается.  
Так что если вам программный продукт не нравится, то поищите альтернативу, где есть нужные вам функции - или создайте свою программу, которая будет удовлетворять всем вашим пожеланиям.
Дальнейшую дискуссию вести не хочу, поскольку не люблю обсуждать без особой необходимости что-либо с тем, с кем обращаешься на "вы", а он к тебе - на "ты".

Всего записей: 1986 | Зарегистр. 01-11-2004 | Отправлено: 05:52 06-04-2020
asfasd

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Maikl65
Нечего было вообще и начинать словоблудить. Вот опять воды налил. Ты похоже просто не понимаешь суть, про что тебе говорят. И ты не "дискуссию" затеял, а нападки на (разумное) предложение пользователя.
 
А с твоей логикой: "FineReader создавался в первую очередь как система OCR" - зачем тогда вообще нужен редактор изображения в этой программе? - убрать редактор изображений, и удвоить усилия для улучшения модуля разпознавания - по твоей логике, так? Ну, а раз редактор картинки всё же есть в комплекте - я указал на отсутствие в этом редакторе элементарной функции - и твои бла-бла философские вообще не к месту.
 
А теперь ещё раз, чтобы ты подумал и понял, как бы это было удобно: в редакторе изображения, передвинул определённый кусок картинки на другое место - а потом распознал. В данный момент, эта элементарная функция не реализована - на что я просто и обратил внимание, и это совсем не нуждается как бы в чьём то (бестолковом) комментарии.

Всего записей: 162 | Зарегистр. 04-12-2017 | Отправлено: 09:46 06-04-2020 | Исправлено: asfasd, 09:54 06-04-2020
Vadim39



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ComboFZ
Ровно то, что нужно, спасибо большое!
Да, еще хотел спросить, можно ли средствами акробата "перекрасить" весь текст в бесцветный (подобно тому, как это делается в PDF-XChange Editor)?

Всего записей: 1117 | Зарегистр. 11-04-2002 | Отправлено: 21:24 12-04-2020 | Исправлено: Vadim39, 21:25 12-04-2020
maxvlas



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Может кто подсказать что не так?
ABBYY FineReader 15 v15.0.112.2130 Corporate
При нажатии открыть или конвертировать вылазит, Путь не найден. (Windows 10 Pro 64bit)

На ABBYY FineReader 14 тоже самое
На ABBYY FineReader 12 работает много лет нормально.  


Решено
С системой видать что то, на другой такой же нормально работает

Всего записей: 7934 | Зарегистр. 08-02-2011 | Отправлено: 08:20 22-04-2020 | Исправлено: maxvlas, 16:57 11-05-2020
Stasx

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
? Как сохранить распознанный pdf в исходном качестве? Документ представляет из собой сканы листы формата А4. Надо сделать такой же. но с распознанным слоем, чтобы переконвертации самих изображений страниц не было (типа ка в формате djvu - cсоздается текстовый слой, или входящая в комплект MS Office 2007|2010 MODI - Document Imaging - pзакидывает текст в tif без его изменения, т.е. получаем сам исходный файл, только "распухший" на величину внедренного текста)
Использую FR 12. Перепробовал все возможности сохранения в PDF и PDF-A - все равно перекодирует, причем невозможно настроить уровень формата выходного pdf (исходники - сканы с внедренными фалйами формата jpg - Версия PDF 1.3 или 1.4),, а на выходе поулчаются версии 1.5, т.е. со всякими jbig и jpeg2000)
Если FR этого делать до сих пор не умеет (а для корпоративных документов) нужен именно такой подход, особенно для плохих сканов, то какая софитна, пусть и  схудшими способносятми в распознавании, но так чтобы сохраняла ИСХОДНОЕ КАЧЕСТВО, для этого подходит?
 
Разобрался С помощью PDX-XChange Editor в несколько кликов в распознанном документе удаляются картинки и заменяются из исходника. Было бы здорово, если бы FR сам позволял сохранять такие документы.

Всего записей: 121 | Зарегистр. 10-10-2007 | Отправлено: 13:50 11-05-2020 | Исправлено: Stasx, 19:07 11-05-2020
corrector

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Stasx
Другой софтины нет, но можно с помощью дополнительных утилит и телодвижений добиться нужного результата.
1. Распознайте исходный pdf-файл в FR (если нужно, подредактируйте его там же), сохраните результат в некий выходной pdf-файл.
2. Отделите слой OCR от выходного файла в файл (назовем его, например, txt.pdf). Для этого нужна утилита Callas PDF Toolbox.
3. Подложите txt.pdf (как слой) в исходный файл. Для этого нужна утилита PDF-Tools из комплекта PDF-XChange Editor Pro.

Всего записей: 218 | Зарегистр. 15-05-2006 | Отправлено: 19:09 11-05-2020 | Исправлено: corrector, 22:13 11-05-2020
Meonom



Full Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Привет. Установил finereader 12 sprint 12.0.106.210. Не получается обновить автоматически: нажимаю проверить обновления, появляется надпись, что готово обновление, нажимаю скачать выходит окно с ошибкой поддержки безопасных каналов. Скачал вручную эти два файлика из ошибки (https://finereader-updates.abbyy.com/f90e6f46-42d5-4a80-a54a-2e043012f049.cab и https://finereader-updates.abbyy.com/4f0cc932-4edb-4f77-8d99-5f5a59a3baeb.msp), но ничего с ними сделать не могу. Поможете?

Всего записей: 515 | Зарегистр. 05-05-2009 | Отправлено: 09:13 28-05-2020
Bf109L



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Есть ли у кого опыт распознавания фортрановских программ? Я пока не смог добиться от FR приемлемого качества, особенно в части разметки. Пробовал версии 12 и 15, 15я как ни странно чуть получше распознает, по крайней мере, не чудит с астерисками ("звездочками"). Исходное изображение ч/б, 600dpi. Язык распознавания устанавливался только Fortran.
Ежели кто подскажет, как можно добиться приемлемых результатов с помощью FR, то буду очень признателен. Ну, или если есть альтернативные решения (OmniPage 19 пробовал, если что, не устраивает).

Всего записей: 310 | Зарегистр. 21-10-2002 | Отправлено: 17:23 30-05-2020
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Есть ли у кого опыт распознавания фортрановских программ? Я пока не смог добиться от FR приемлемого качества, особенно в части разметки. Пробовал версии 12 и 15, 15я как ни странно  чуть получше распознает, по крайней мере, не чудит с астерисками ("звездочками"). Исходное изображение ч/б, 600dpi. Язык распознавания устанавливался только Fortran.
Ежели кто подскажет, как можно добиться приемлемых результатов с помощью FR, то буду очень признателен. Ну, или если есть альтернативные решения (OmniPage 19 пробовал, если что, не устраивает).

 
Попробуйте 8 и выбирайте искусственные языки (в них есть языки программирования)

Всего записей: 3670 | Зарегистр. 17-09-2001 | Отправлено: 13:03 03-07-2020
Bf109L



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
niccolo
Спасибо, но я именно и распознавал, как фортрановский текст, выбирая соотв. язык из списка "искусственных", что и указал в исходном сообщении. Основная проблема - именно разметка, в фортране она очень важна, по крайней мере, в старых версиях. Мне нужно, чтобы ФР воспроизводил отступ пробелами, шрифт листинга моноширинный.

Всего записей: 310 | Зарегистр. 21-10-2002 | Отправлено: 13:24 03-07-2020
VIP9N



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Мне нужно, чтобы ФР воспроизводил отступ пробелами

 
Кажется, вы слишком хорошего мнения о возможностях программ OCR в целом и об этой в частности.  
 
Все ухищрения этих изделий, направленные на то, чтобы подогнать общий вид текста под некую похожесть на оригинал на практике выливаются потом в абсолютную непригодность для дальнейшей работы с таким прилизанным текстом, ибо в реальности он содержит в себе тонны скрытых управляющих кодов, которые не позволяют, например, стать в середину какой-либо строки и начать добавлять текст.  Вся страница вдруг начинает куда-то ползти, части её начинают то исчезают, то куда-то уезжают или перемещаются не туда, куда следует, и тому подобные фокусы.
 
Лично для меня весь этот распознавательный софт служит чисто для автоматизации выковыривания чистого текста (ТХТ), т.е., содержания, форму которому я уже придаю сам.  

Всего записей: 638 | Зарегистр. 13-12-2002 | Отправлено: 15:07 03-07-2020
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Спасибо, но я именно и распознавал, как фортрановский текст, выбирая соотв. язык из списка "искусственных", что и указал в исходном сообщении. Основная проблема - именно разметка, в фортране она очень важна, по крайней мере, в старых версиях. Мне нужно, чтобы ФР воспроизводил отступ пробелами, шрифт листинга моноширинный.

 
8-ка именно так и делает - пробелами. Она не экспортирует табуляции
 
Добавлено:
Кстати в теме в варезнике, куда я выложил пример работы FR15 в сравнении с FR8 в очередной раз было озвучено предложение проанализировать разные версии FR на разных типах документов
 
Я думаю, если каждый подготовит и проанализирует хотя бы 5 страничек типичных своих документов, вполне можно будет получить наглядное представление о работе разных версий, а дальше, если что, пусть юристы разбираются.....
 
Кстати у кого есть 8-ка не ОЕМ (из комплекта со сканером) можете обратиться в Абби — у них есть билд 2543 (вроде) в котором нет бага с подстановкой моноширинного шрифта в ПДФ, после чего буквы начинают налазить друг на друга.....
 
Тем, кто работает с 8-кой знайте следующий баг
При распознавании старых книг с табличками с отбивкой значений точками, типа
 
печение........................ 25
конфеты........................35
кондитерские изде-
лия................................55
 
и разбивке таблицы
 
печение........................| 25
_________________________
конфеты.......................| 35
__________________________
кондитерские изде-      |
лия...............................| 55
___________________________
 
 
слова печенье и конфеты не будут распознаваться вообще, лия...... могут распознаваться или нет (принцип не понял).... Решение проблемы - подтереть точки ластиком......

Всего записей: 3670 | Зарегистр. 17-09-2001 | Отправлено: 16:41 03-07-2020
aleakakorwin

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
background process was terminated with code 0xc0000005

Та же история с сабжем версий 15.0.058.1496, 15.0.110.1875 и 15.0.112.2130, даже на только что установленной Microsoft Windows 10.0.19041.329. Докопались до первопричин?

Всего записей: 6 | Зарегистр. 17-01-2012 | Отправлено: 19:43 06-07-2020
asku



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добрый день.
Подскажите пожалуйста, как можно использовать регулярные выражения в поиске в FineReader?
Не могу в интернете ничего путного по этой теме найти. (

Всего записей: 525 | Зарегистр. 04-05-2016 | Отправлено: 13:08 09-07-2020
xanxan

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Есть ли возможность распознавать различные части страницы на отдельных языках по отдельности?

Всего записей: 269 | Зарегистр. 15-12-2007 | Отправлено: 19:11 19-07-2020
Maikl65

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xanxan
Да. Создаешь на изображении текстовые блоки в нужных местах, на соответствующем блоке с помощью ПКМ (правая кнопка мыши) активируешь пункт меню Свойства, после чего указываешь для данного блока нужный язык (или набор языков) и распознаешь. Там же можно для данного блока указать и другие особые параметры для распознавания.

Всего записей: 1986 | Зарегистр. 01-11-2004 | Отправлено: 06:25 20-07-2020
xanxan

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Maikl65
Спасибо получилось, но если в автоматическом режиме все уже распознано как текст, сначала выделял как картинку и разпознавал, но текст накладывался друг на друга, тогда сдвигал вручную границы,и каждый кусок разпознавал отдельно, но если скажем текст в середине, сдвинул границы зеленого поля до середины, разпознал кусочек текста, выше уже разпознанный текст слетел, надо и его отдельно выделять и разпознавать. А если на странице 3 вставки с языками, то каждый раз редактировать геморно, можно как-то выделить нужные куски из уже разпознананного в автоматическом режиме?

Всего записей: 269 | Зарегистр. 15-12-2007 | Отправлено: 18:11 20-07-2020
Maikl65

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
xanxan
Полностью автоматизировать вряд ли получится. Но если у вас на странице есть тексты на разных языках, то кто вам мешает в настройках программы вручную указать перечень всех возможных языков, которые встречаются в тексте, отметив их "галочками" (скажем, русский, латинский, французский), после чего при распознавании блока в большинстве случаев при распознавании программа сама разберется, на каком языке из перечисленного списка написано распознанное слово.

Всего записей: 1986 | Зарегистр. 01-11-2004 | Отправлено: 21:38 20-07-2020 | Исправлено: Maikl65, 21:41 20-07-2020
sanatoliy



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
тут на пьедистал ставят 8
http://forum.ru-board.com/topic.cgi?forum=35&topic=54060&start=1900#12

Цитата:
Небольшое сравнение качества распознавания FR8 и FR15 простом файле
Это какой-то треш.....

а тутова 7
http://nnmclub.to/forum/viewtopic.php?t=191776#pagestart

Цитата:
Самая известная в Мире система распознавания графических текстов.
Только, начиная с 8-й версии программа начала заметно деградировать в смысле тонкой функциональности, необходимой для её профессионального использования. Уже с этой 8-ой версия начала генерировать tif-файла собственной шифровки, которые невозможно ни просмотреть - ни использовать в собственных нуждах (дело в том, что FR6 и 7 сохраняли в своей рабочей папке уже прилично выравненныё изображения после сканирования не ровно устанавливаемых в сканер текстов)
Мало того, FR начал хуже распознавать! Для сравнения в скриншотах я специально поместил 2 файла один - от десятки, другой от семёрки. Разница очевидна!
Мало того FR начал компоновать текст и картинки сикось-накось! И никакой перенумерацией блоков, или их изменением правильного взаиморасположения не добиться! Кого угодно, кто уже работал с 6 и 7 версиями такое "нововведение" выведет из себя (когда знаешь, что такого глюка ранее вообще не было).
Так кому такая дрянь нужна?
Если когда-то я купил шестёрку за 150 зелёных, то за все вместе (8-ку,9-ку и 10-ку) я не дал бы ни гроша, а потребовал компенсацию за моральный ущерб. Настолько ничтожны эти последние версии.
Семёрка, конечно имеет ряд недостатков. Но в более свежих версиях они практически ни один не устранён! А только добавилась куча новых и ещё более противных.
По крайней мере летает семёрка гораздо быстрее всех кто "свежее" её.
Подумал и решил - лучшее должно быть в раздаче.
да-уж, Профи, облагораживают неразумных хазар, а ты Федя пили гирю.  
 
Может таки придёте к какому-то конценсусу, а то работать дятлом и долбать все версии не хотца.

Всего записей: 1851 | Зарегистр. 08-06-2003 | Отправлено: 03:33 22-07-2020
niccolo

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
тут на пьедистал ставят 8

 
Не ставят - а только сравнивают с последней версией....
 
Я давно предлагаю создать хотя небольшой набор разнотипных файлов и проверить в разных версиях FR.

Всего записей: 3670 | Зарегистр. 17-09-2001 | Отправлено: 14:51 22-07-2020
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)
Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru