Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)

Модерирует : gyra, Maz

Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

JediMaster_Dragon



Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
ABBYY FineReader
7, 8, 9, 10 (Pro, Corp, Home), 11 (Pro, Corp), 12 (Pro, Corp) и 14 (Pro, Corp, Ent)

 

 
Полный список языков распознавания для FR15
 

Русский интерфейс
 
Ответ на вопрос о сохранении проекта смотрим тут


Если  хотите, чтобы ваша проблема была рассмотрена, (решение не гарантируется), необходимо представить такие сведения:
1. Версия FineReader.
2. Версия Windows, версию пакета обновлений (SP), разрядность (для Vista и выше).
3. Если проблемы со сканированием, то называем ещё и модель сканера. Обновите драйвера своего сканера, до последней версии имеющейся на сайте поддержки вашего сканера.


Как можно получить церковнославянские тексты при помощи сканирования FineReader'ом
Как отключить "искусственный интеллект" FineReader
Как выбрать опции, чтобы FR10 распознавал простейшие формулы
FineReader не распознает сложные формулы и рукописный текст, не задавайте вопросов на эту тему.  
Версии FR для Linux пока не существует, только Engine, который вам явно не нужен.

Для понимания формата XPS программой FineReader нужен Framework 3.0. Только для XP и 2000.
Совет по распознаванию файлов DjVu Читать
Электронные текстовые книги - OCR, вычитка, оформление

Всего записей: 354 | Зарегистр. 18-01-2002 | Отправлено: 09:07 26-01-2003 | Исправлено: Maz, 19:24 26-01-2020
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Shangry
У меня на компе есть от 7-ки до 11-й версии, и Pro, и CE, и любые другие варианты. При желании могу добавить начиная с 4-ки Разумеется, все портабельное.

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 19:22 06-09-2011
Fafy

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Спасибо Shangry за информацию.
Но я никак не могу найти AfterScan Antiqua. Если у вас есть, то выложите пожалуйста куда-нибудь или подскажите где можно скачать. Из AfterScan Antiqua можно как-то вытянуть словарь старой орфографии? Хочу залить его в 11_ю версию FineReader, со словарной поддержкой намного качественнее распознает.

Всего записей: 727 | Зарегистр. 25-10-2010 | Отправлено: 19:42 06-09-2011
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Fafy

Цитата:
Из AfterScan Antiqua можно как-то вытянуть словарь старой орфографии?

Не думаю. Ни новой, ни старой. Там все слова идут подряд, без каких-либо разделителей. Править вручную - проще рехнуться.

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 20:24 06-09-2011
zhe_zho



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В 10 Professional Edition последнем билде не работает выравнивание страниц, в 9 работает, имею ввиду редактор изображений.
У 9 в опциях есть ещё автоматическое выравнивание, и оно по умолчанию включено, у 10 в опциях не нашёл.

----------
Мысли они искривляют мозг, а соображение выпрямляет и способствует кровообращению.
Фридрихсен, учёный
"Убить дракона"

Всего записей: 2916 | Зарегистр. 24-04-2008 | Отправлено: 01:10 07-09-2011 | Исправлено: zhe_zho, 01:13 07-09-2011
Pafnutiy761



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zhe_zho
Может это..
из справки FineReader

Цитата:
Автоматическая предобработка изображений
 
На качество распознавания могут отрицательно влиять искажение строк, перекос, наличие шумов и другие дефекты, которые свойственны отсканированным изображениям и цифровым снимкам.
 
Для устранения подобных дефектов в программе предусмотрена опция автоматической предобработки изображений. Если она включена, то, в зависимости от типа входного изображения, программа сама определит, какая корректировка необходима, и выполнит её: удалит шумы с цифровых фотографий, выровняет изображение при перекосе, выровняет документ по линиям текста, исправит искажение перспективы.

 

Всего записей: 518 | Зарегистр. 13-02-2007 | Отправлено: 07:43 07-09-2011
Fafy

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Написал Сергею Виницкому и он мне прислал словарик дореволюционной орфографии в кодировке utf-8. При импорте в ФайнРидер получилась абра-кадабра, а при сохранении словаря в кодировке 1251 теряются некоторые символы, заметил на букве ЯТЬ. Причем заметил, если скопировать одно слово и вставить через кнопку Добавить, то оно нормально отображается, а через импорт - абра-кадабра.
 
Посоветуйте пожалуйста что-нибудь!!!  
 
Делал я так. Создал новый язык распознавания на основе Русский (старая орфография) и в него импортировал присланный словарик.
 
А словарик получился увесистый - 19 МБ - 821728 словоформ.

Всего записей: 727 | Зарегистр. 25-10-2010 | Отправлено: 14:25 07-09-2011 | Исправлено: Fafy, 15:18 07-09-2011
unreal666



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Fafy

Цитата:
в кодировке utf-8

может там utf-16 нужен?

----------
MSI PRO B650-P WIFI / Ryzen 5 7600X / RAM 32Gib / 4 HDD = 10Tib + 1 NVME 2Tib / Radeon RX 560 2Gib / Win 10 x64 // POB, PVD

Всего записей: 6637 | Зарегистр. 14-02-2005 | Отправлено: 16:31 07-09-2011
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55

Цитата:
У меня на компе есть от 7-ки до 11-й версии, и Pro, и CE, и любые другие варианты. При желании могу добавить начиная с 4-ки Разумеется, все портабельное.

В том-то и прелесть, что работать будет не только portable, но и нормально инсталлированная программа. Я как-то держал на машине четыре версии одновременно (надо было их сравнить) - работало без проблем.
 
Fafy

Цитата:
Если у вас есть, то выложите пожалуйста куда-нибудь или подскажите где можно скачать.

Выложить не могу, так что вам придется самому искать. Это должна быть версия 6.1, выпущенная не раньше августа.
 

Цитата:
Из AfterScan Antiqua можно как-то вытянуть словарь старой орфографии?  

Можно - он живет там в отдельном файле, но смысла в том никакого. Скомпилировано непонятно в каком формате и скорее всего кроме самой AfterScan ни к чему не подключаемо.
 

Цитата:
Хочу залить его в 11_ю версию FineReader, со словарной поддержкой намного качественнее распознает.

А чем компилировать собираетесь? У FineReader свой собственный формат словарей.
 

Цитата:
Написал Сергею Виницкому и он мне прислал словарик дореволюционной орфографии в кодировке utf-8.

Уже готовый словарь или комплект словоформ?
 

Цитата:
При импорте в ФайнРидер получилась абра-кадабра, а при сохранении словаря в кодировке 1251 теряются некоторые символы, заметил на букве ЯТЬ.  

Как я понимаю, это будет словарь в формате .DIC, а не полноценный FineReader-словарь. Работает соответственно - где-то да, а где-то нет.

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 17:36 07-09-2011 | Исправлено: Shangry, 17:38 07-09-2011
Fafy

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Открыл словарик в Notepad++  5.6.3, в меню Кодировки стояло Кодировать в UTF-8 без (BOM). Я попробовал поставить просто Кодировать в UTF-8 и о, счастье - словарик импортировался нормально!!!
 
Кстати, а что такое UTF-8 без (BOM)?
 
 
Кому надо, Русский словарик (Старой орфографии) берём здесь
 
 
Shangry
 
На оф. сайте самая последняя верси 6.0. Где вы взяли 6.1 если не секрет?
 
 

Цитата:
Как я понимаю, это будет словарь в формате .DIC, а не полноценный FineReader-словарь. Работает соответственно - где-то да, а где-то нет.

Да, там только словоформы.  
 
А есть кто из спецов чтобы из него сделать у родном FineReader_у формате???

Всего записей: 727 | Зарегистр. 25-10-2010 | Отправлено: 17:59 07-09-2011 | Исправлено: Fafy, 18:11 07-09-2011
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Fafy

Цитата:
 Кстати, а что такое UTF-8 без (BOM)?  

BOM три байта в начале файла, определяющие порядок следования байт. Соответственно UTF-8 файл может быть и без этих трех байтов.  
http://ru.wikipedia.org/wiki/UTF-8

Всего записей: 884 | Зарегистр. 14-12-2005 | Отправлено: 18:25 07-09-2011
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Fafy

Цитата:
На оф. сайте самая последняя верси 6.0.  

Странновато. Автор программы сказал, что после замены старого словаря на Виницкого он собирается сменить версию на 6.1. Инсталлятор у меня тоже пишет "ставлю 6.1.".
Тогда остается только критерий даты. То, что до конца июля, начала августа, д.б. со старым словарем.  А то, что после - с новым.
 

Цитата:
Где вы взяли 6.1 если не секрет?  

Уболтал начальство купить AfterScan . У нас много вычитки по "старым" текстам, так что вполне себя оправдывает.
 

Цитата:
Кому надо, Русский словарик (Старой орфографии) берём здесь

Интересная вещь получается - то, что лежит у меня (юникодированный комплект словоформ), заметно отличается от того, что вы получили от Виницкого (разница примерно в 4 Мб). При том, что оба комплекта делались из его словаря и кроме текста ничего не содержат.
 
Fafy

Цитата:
А есть кто из спецов чтобы из него сделать у родном FineReader_у формате???

Увы, компилятор словарей есть только в ABBYY . Я сейчас пытаюсь их сагитировать, чтобы они заменили свой словарь на Виницкого, но пока особых успехов нет.

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 18:53 07-09-2011 | Исправлено: Shangry, 18:57 07-09-2011
Fafy

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Я сейчас пытаюсь их сагитировать, чтобы они заменили свой словарь на Виницкого, но пока особых успехов нет.

А что, у ABBYY есть словарь старой орфографии??? Первый раз такое слышу. В новой версии FineReader нет словарной поддержки вообще!
 
Может как-то помочь с агитацией? Жаль смайлик почему-то не могу вставить, что за беда?  
 
Может кто подскажет, к какой программе можно и лучше всего прикрутить словарь старой орфографии что бы потом пополнить для FineReader, потому что добавление слов при проверке правописания происходит почему-то очень долго и винчестер серьезно шуршит. Он что при добавлении одного слова перезаписывает полностью словарь???

Всего записей: 727 | Зарегистр. 25-10-2010 | Отправлено: 19:34 07-09-2011 | Исправлено: Fafy, 19:47 07-09-2011
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А что, у ABBYY есть словарь старой орфографии???  

Виноват, имелось в виду - вместо сегодняшнего словаря, который поддерживает только современный русский, поставят поддержку обоих вариантов.
 
Сейчас у меня идет вяло-неспешная переписка с этой конторой (лето, однако  ), которая может к чему-то да приведет. А если ничего не выйдет, то попытаюсь прицепить Виницкого к OpenOfice - там более открытая логика, да и базовый словарь русского более капитальный, чем в FineReader.

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 19:46 07-09-2011
Fafy

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
попытаюсь прицепить Виницкого к OpenOfice

А в OpenOfice можно как-то добавить новый язык (Русский (старая орфография)) и прикрутить к нему словарик? Или там такой язык уже существует?

Всего записей: 727 | Зарегистр. 25-10-2010 | Отправлено: 19:53 07-09-2011
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А в OpenOfice можно как-то добавить новый язык (Русский (старая орфография)) и прикрутить к нему словарик?  

В перечне функциональности такое вроде бы числится - и новый язык, и подключение словаря.  
Но, как это часто бывает, внятно процесс добавления не документирован, а описание, которое есть на сайте, относится к старой версии. В новой (в смысле сегодняшней) версии инструкция уже не срабатывает. В общем надо садиться и разбираться самому.

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 14:24 08-09-2011
zhe_zho



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Pafnutiy761
Я проверял так, поставил обе версии, положил на сканер с небольшим перекосом книгу, изгибов на развороте не было, больше её не трогал.
Сначала сканировал одной потом второй версией. В 9 версии автоматически устраняло перекос, при отключении автоматического выравнивания, перекос убирается в редакторе изображений. В 10 перекос не устраняется ни автоматически ни в редакторе изображений.

Цитата:
Если она включена

Не могу её найти, в том месте где она у 9 её нет. Где в опциях находится эта функция и включена ли она по умолчанию?
 
Shangry
Fafy

Цитата:
Русский (старая орфография)

Может я вас неправильно понял, но в версиях 8, 9, 10 есть такой словарь, находится в дополнительных языках а не в основных. Или вы имеете ввиду что он слабый?

----------
Мысли они искривляют мозг, а соображение выпрямляет и способствует кровообращению.
Фридрихсен, учёный
"Убить дракона"

Всего записей: 2916 | Зарегистр. 24-04-2008 | Отправлено: 21:30 08-09-2011 | Исправлено: zhe_zho, 21:38 08-09-2011
Fafy

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zhe_zho
Там есть только сам язык распознавания, но без словарной поддержки.
В новой версии заметил, добавили словарную поддержку Латинского языка. В предыдущих версиях ее не было.

Всего записей: 727 | Зарегистр. 25-10-2010 | Отправлено: 09:15 09-09-2011
Pafnutiy761



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
zhe_zho

Цитата:
Не могу её найти, в том месте где она у 9 её нет. Где в опциях находится эта функция и включена ли она по умолчанию?

по моему тут (скрины настроек) 1 2

Всего записей: 518 | Зарегистр. 13-02-2007 | Отправлено: 09:16 09-09-2011 | Исправлено: Pafnutiy761, 09:25 09-09-2011
vvvvv2



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
По версии 11.0.102.481 Corporate Edition хочу поделиться как у меня в ней работает HotFolder...
Как и предыдущих версиях запустил для HotFolder задачу по папке с файлами. Раньше последовательно обрабатывались каждый файл по отдельности. А теперь найдено 284 файла и в папку "C:\Documents and Settings\....\Local Settings\Temp" HotFolder сейчас у меня начал кидать сразу более 90 тысяч страниц сразу всех файлов, хотя в опциях поставил "отдельный документ для каждого файла"...
В общем, чувствуется разработчики здорово намудрили...

Всего записей: 107 | Зарегистр. 16-07-2007 | Отправлено: 23:56 09-09-2011
KireevSasha



Advanced Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Интересует - только у меня проблема с ластиком в редакторе изображений?
 
Заметил, что из версии в версию Finereader передается беда инструмента "Ластик" в редакторе изображений.
При удалении части изображения в ч/б серых или цветных изображениях, в удаленной области цвет заменяется не на 255-255-255 (RGB), как следовало ожидать при работе с большинством документов (текст, смешанные документы текст/графика), а на цвет 254-254-254.  
Это в дальнейшем приводит к тому, что при печати документа на ч/б принтере (в моем случае лазерный canon mf4150 и hp laserjet 3392), удаленные области "проступают" в виде прямоугольников с четко видной сеткой точек.
Принтер эту область считает не чисто белой, а градацией серого и печатает как область из редко посаженных точек.
В общем все это сразу портит картину. Вместо того, что бы удалить скажем точку или штрих на документе я после печати документа получаю область из точек, там где поработал ластик.
Может можно что-то поправить в настройках?  

Всего записей: 840 | Зарегистр. 03-03-2006 | Отправлено: 16:44 10-09-2011
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)
Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru