Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)

Модерирует : gyra, Maz

Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

JediMaster_Dragon



Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
ABBYY FineReader
7, 8, 9, 10 (Pro, Corp, Home), 11 (Pro, Corp), 12 (Pro, Corp) и 14 (Pro, Corp, Ent)

 

 
Полный список языков распознавания для FR15
 

Русский интерфейс
 
Ответ на вопрос о сохранении проекта смотрим тут


Если  хотите, чтобы ваша проблема была рассмотрена, (решение не гарантируется), необходимо представить такие сведения:
1. Версия FineReader.
2. Версия Windows, версию пакета обновлений (SP), разрядность (для Vista и выше).
3. Если проблемы со сканированием, то называем ещё и модель сканера. Обновите драйвера своего сканера, до последней версии имеющейся на сайте поддержки вашего сканера.


Как можно получить церковнославянские тексты при помощи сканирования FineReader'ом
Как отключить "искусственный интеллект" FineReader
Как выбрать опции, чтобы FR10 распознавал простейшие формулы
FineReader не распознает сложные формулы и рукописный текст, не задавайте вопросов на эту тему.  
Версии FR для Linux пока не существует, только Engine, который вам явно не нужен.

Для понимания формата XPS программой FineReader нужен Framework 3.0. Только для XP и 2000.
Совет по распознаванию файлов DjVu Читать
Электронные текстовые книги - OCR, вычитка, оформление

Всего записей: 354 | Зарегистр. 18-01-2002 | Отправлено: 09:07 26-01-2003 | Исправлено: Maz, 19:24 26-01-2020
XATAXAMA

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Shangry

Цитата:
Головная боль, которая как есть IMHO решения не имеет. Из всего, что я перебрал, наименее трудоемкий вариант это снести полностью всю свалку стилей от FineReader и расставить везде свои собственные.  

Это было реально осуществлено? Снос свалки и т.д. В какой версии, каким способом?
Если нет, то, заранее извиняясь за крамолу и
Кто-нибудь знает другие OCR продукты, которые можно заставить присваивать распознанному тексту пользовательские стили?
 
 
Добавлено:
ComboFZ

Цитата:
Цитата:
Это начиная с какой-то версии, или во всех?
ABBYY FineReader 9.0/10.0 Professional и Corporate Edition, в версия ниже не знаю.  

Спасибо, поставил 10-ку, что-то такое вижу, появилась надежда...

Всего записей: 251 | Зарегистр. 27-01-2003 | Отправлено: 02:18 23-07-2010
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
XATAXAMA

Цитата:
Кто-нибудь знает другие OCR продукты, которые можно заставить присваивать распознанному тексту пользовательские стили?  

MS Word + VBA можно попробовать для для работы с зоопарком стилей.

Всего записей: 884 | Зарегистр. 14-12-2005 | Отправлено: 02:32 23-07-2010
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
XATAXAMA

Цитата:
Это было реально осуществлено? Снос свалки и т.д. В какой версии, каким способом?  

Берем Word, открываем в нем продукт работы FineReader, подбираем необходимые настройки стиля "Основной" (или как он у вас называется), накладываем этот стиль на весь документ, для надежности прибиваем свалку стилей доставшуюся от распознавания, делаем стили необходимого вида для структурных элементов текста (заголовки, цитаты, подписи под рисунками и т.д.), форматируем ими в нужных местах.
 
Геморрой конечно изрядный, но другие варианты съедают еще больше времени и сил.

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 15:55 23-07-2010
boy999



BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ставить и осваивать сабж ради 3х страничек - считаю чрезмерным.
Надо перегнать в текст 3 странички из хэлпа в виде фоток.
http://sderni.ru/12918
 
ПЛЗ!

Всего записей: 2030 | Зарегистр. 19-05-2008 | Отправлено: 18:03 28-07-2010
ALEX666999



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
boy999
страница-1 | страница-2 | страница-3
 
Как видишь, результат неутешительный. Нужно лучше снимать...
(лапшу с ушей, которую ABBYY про цифровые снимки вешает)
 
На будущее: http://finereaderonline.ru

Всего записей: 6652 | Зарегистр. 20-05-2004 | Отправлено: 18:29 28-07-2010
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
boy999
В том виде, в котором это сделано, IMHO проще (и быстрее) набрать вручную, чем пытаться вычитать полученную абракадабру.
 
ALEX666999

Цитата:
Нужно лучше снимать... (лапшу с ушей, которую ABBYY про цифровые снимки вешает)

А что, существуют программы, которые способны выжать из этого кошмара ходячего заметно больше чем FineReader?
 
Изображения из разряда "посмотреть и выкинуть" (не удивлюсь если их на мобильнике снимали  ).

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 18:46 28-07-2010
ALEX666999



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Shangry: А что, существуют программы, которые способны выжать из этого кошмара ходячего заметно больше чем FineReader?

Я о том, что они (пиарщики ABBYY) ещё с 8-й версии баснями про оптимизацию для изображений, сделанных с цифровых фотиков, кормят. А на практике, как вы говорите "посмотреть и выкинуть", не более...

Всего записей: 6652 | Зарегистр. 20-05-2004 | Отправлено: 18:58 28-07-2010
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ALEX666999
"Оне преувеличивают, но не врут-с".
Попробуйте подсунуть это на вход кому угодно другому и я изрядно удивлюсь, если правильно распознается хотя бы четверть символов. А FineReader на первой, относительно сносной, страничке выдал процентов где-то 40 с хвостиком.
 
А то, что из изображений подобного качества в принципе нельзя получить ничего вменяемого, так это классика: "Мусор на входе - мусор на выходе".  Если уж оценивать работу, то на чем-нибудь более съедобном.

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 19:16 28-07-2010 | Исправлено: Shangry, 19:20 28-07-2010
JekaKot



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
boy999
Цитата:
Надо перегнать в текст 3 странички из хэлпа в виде фоток.  
Да там и визуально фиг прочитаешь, а OCR и подавно не справится... Проще напечатать самому будет...
 
ALEX666999
Цитата:
Я о том, что они (пиарщики ABBYY) ещё с 8-й версии баснями про оптимизацию для изображений, сделанных с цифровых фотиков, кормят. А на практике, как вы говорите "посмотреть и выкинуть", не более...
Угу... Условия съемки должны очень хорошими и качество (четкость, тип бумаги) источника как минимум выше среднего. Если есть возможность - лучше сканировать (причем в серых тонах и с разрешением не менее 300 dpi) - тогда еще что-то можно "вменяемое" получить...
 
Из личного опыта - только простейший текст (научный, с формулами - можно тушить свет) на 10 MPx-камеру в светлом помещении и распознавать только 8-кой...
 
Shangry
Цитата:
А то, что из изображений подобного качества в принципе нельзя получить ничего вменяемого, так это классика: "Мусор на входе - мусор на выходе".
Всегда можно попробовать "подкорректировать" полученное в графических редакторах (от Paint до Photoshop) - но это еще тот геморрой...

Всего записей: 2697 | Зарегистр. 10-03-2006 | Отправлено: 20:22 28-07-2010 | Исправлено: JekaKot, 20:24 28-07-2010
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Shangry

Цитата:
не удивлюсь если их на мобильнике снимали  ).

Nokia N73 если судить по по EXIF

Всего записей: 884 | Зарегистр. 14-12-2005 | Отправлено: 21:13 28-07-2010
boy999



BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ALEX666999
 
Увы и ах.....

Всего записей: 2030 | Зарегистр. 19-05-2008 | Отправлено: 00:11 29-07-2010
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
JekaKot
Может вы знаете, где можно разжиться образчиками книг, журналов и т.д., сделанных на ЦФК? Так чтобы на материалах различного рода, с отсъемкой разного качества (и хорошей, и не очень) - в общем представительная подборка для анапиза.
 
Давно хочется прикинуть конкретику - где и на чем валится фотосъемка, сравнительно со сканированием и сделать сопоставление. Но сам я фото не занимаюсь, поэтому рабочего материала почти что нет.
 

Цитата:
Всегда можно попробовать "подкорректировать" полученное в графических редакторах (от Paint до Photoshop) - но это еще тот геморрой...  

Тогда уж стоит брать специализированный софт для зачистки подобных вывихов.  
Хотя чем можно спасти представленные здесь сканы - это очень сильно пофантазировать надо.

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 14:34 29-07-2010 | Исправлено: Shangry, 14:37 29-07-2010
paspas



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Есть pdf файл на 10 страниц размером 300 кб.  
 
Открываю его fineReader 9, он минут 10 полностью грузит компьютер.  
 
Когда наконец, файл открыт - сохраняю Save as FineReader document.  Размер 1 гб.  
 
 
Что это такое и как с этим бороться?  
При любом действии тормоза, естественно, такими размерами ворочать. Но откуда этот размер появляется?

Всего записей: 98 | Зарегистр. 25-09-2004 | Отправлено: 17:32 31-07-2010
ALEX666999



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
paspas: Но откуда этот размер появляется?

Залей куда-нибудь, проверим...
Скорей всего какой-то программный локальный глюк, не связанный с FR.
 
Добавлено:

Цитата:
Shangry: Хотя чем можно спасти представленные здесь сканы

Я и разворачивать пробовал и с контрастом играть, всё равно результат - Г...

Всего записей: 6652 | Зарегистр. 20-05-2004 | Отправлено: 17:40 31-07-2010
paspas



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Сам пдф файл - http://bkrs.info/tmp/61_yufa.pdf
Результат залить сейчас не получится.  
 
Может его как-то проанализировать можно, что там место столько занимает?

Всего записей: 98 | Зарегистр. 25-09-2004 | Отправлено: 17:47 31-07-2010
ALEX666999



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
paspas: Результат залить сейчас не получится.

И не нужно.

Цитата:
paspas: Может его как-то проанализировать можно, что там место столько занимает?

Потому что изображение одной страницы 5100 x 7300, сохраняет в формат сжатия без потерь tif, одна страница выходит около 100 МБ, от этого и такой разбухший проект получается.

Всего записей: 6652 | Зарегистр. 20-05-2004 | Отправлено: 18:13 31-07-2010
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ALEX666999

Цитата:
Потому что изображение одной страницы 5100 x 7300

А такие пиксельные размеры получаются из-за того, что физические размеры страницы в pdf  43x61 см.

Всего записей: 884 | Зарегистр. 14-12-2005 | Отправлено: 18:34 31-07-2010
paspas



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Почему же тогда pdf такой небольшой? Где он эти пикселы хранит?
 
 
Но для распознования это, наверное, хорошо. Трогать не буду, пусть лучше компьютер поработает, чем я потом править буду.

Всего записей: 98 | Зарегистр. 25-09-2004 | Отправлено: 20:08 31-07-2010 | Исправлено: paspas, 20:09 31-07-2010
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Почему же тогда pdf такой небольшой?

В pdf ч/б картинка вставлена  с разрешением 96 dpi + G4 Fax сжатие.
Самое простое: извлекайте tiff  из pdf  и распознавайте.

Всего записей: 884 | Зарегистр. 14-12-2005 | Отправлено: 20:16 31-07-2010
AntonVII

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Кто - нибудь знает, на windows7 можно поставить fine reader 10 с русским интерфейсом?

Всего записей: 19 | Зарегистр. 30-07-2010 | Отправлено: 22:31 31-07-2010
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)
Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru