Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)

Модерирует : gyra, Maz

Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

JediMaster_Dragon



Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
ABBYY FineReader
7, 8, 9, 10 (Pro, Corp, Home), 11 (Pro, Corp), 12 (Pro, Corp) и 14 (Pro, Corp, Ent)

 

 
Полный список языков распознавания для FR15
 

Русский интерфейс
 
Ответ на вопрос о сохранении проекта смотрим тут


Если  хотите, чтобы ваша проблема была рассмотрена, (решение не гарантируется), необходимо представить такие сведения:
1. Версия FineReader.
2. Версия Windows, версию пакета обновлений (SP), разрядность (для Vista и выше).
3. Если проблемы со сканированием, то называем ещё и модель сканера. Обновите драйвера своего сканера, до последней версии имеющейся на сайте поддержки вашего сканера.


Как можно получить церковнославянские тексты при помощи сканирования FineReader'ом
Как отключить "искусственный интеллект" FineReader
Как выбрать опции, чтобы FR10 распознавал простейшие формулы
FineReader не распознает сложные формулы и рукописный текст, не задавайте вопросов на эту тему.  
Версии FR для Linux пока не существует, только Engine, который вам явно не нужен.

Для понимания формата XPS программой FineReader нужен Framework 3.0. Только для XP и 2000.
Совет по распознаванию файлов DjVu Читать
Электронные текстовые книги - OCR, вычитка, оформление

Всего записей: 354 | Зарегистр. 18-01-2002 | Отправлено: 09:07 26-01-2003 | Исправлено: Maz, 19:24 26-01-2020
zhe_zho



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
FR9PE при сканировании документов обрезает  низ страницы, что делать куда копать?

Только из FineReader? А из других программ пробовали, например просмотрщиков, обработчиков, редакторов графики?

----------
Мысли они искривляют мозг, а соображение выпрямляет и способствует кровообращению.
Фридрихсен, учёный
"Убить дракона"

Всего записей: 2916 | Зарегистр. 24-04-2008 | Отправлено: 00:29 23-04-2011
coherent

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Этот вопрос в той или иной форме уже задавался, но реального ответа я так и не нашел. Если я не прав, ткните, пожалуйста, в нужное место!
Итак, имеются физические тексты на английском (или русском), которые содержат греческие символы типа лямбда, сигма и т.п. При распознавании заданы соответственно английский (или русский) и греческий. Греческие символы прекрасно распознаются, но при сохранении в doc (rtf)-формат превращаются в русские! Как с этим бороться?
Версия 8.0.0.1126 Pro (все ссылки с форума), греческий язык доустанавливал как книжка пишет, скачал экзешник и запустил.
Здесь малюсенький (6 строчек) тестовый текст, англ.+греческий. У кого есть желание и время, попробуйте. Может я что-то не так делаю, может какие-то настройки или еще что-то...

Всего записей: 3881 | Зарегистр. 20-02-2007 | Отправлено: 21:31 29-04-2011
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
coherent
Все отлично распознается (само собой, после экспорта в растровую графику) и сохраняется в rtf - http://narod.ru/disk/11493095001/OCRed.rtf.html . Как английский, так и греческий. В опциях сохранение шрифтов включили? Фонт выбрали? Ну хоть немножко мышкой потыкайте внутри FR.

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 22:52 29-04-2011 | Исправлено: Astra55, 19:04 30-04-2011
coherent

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55
Если можно, по-подробней. Сделайте скидку на то, что я этой программой до этого момента не пользовался. Просто не возникало необходимости.
Что означает

Цитата:
само собой, после экспорта в растровую графику

что именно, когда и как надо экспортировать?
Я делал так:
1. Файл-Открыть pdf/изображение
2. Распознать
3. Сохранить страницы. Выбираю doc или rtf.

Цитата:
Фонт выбрали?

В Опциях-Сохранить заданы шрифты
С засечками - Times New Roman
Без засечек - Arial
Моноширинный - Courier New
Похоже, что надо зать какие-то другие шрифты. Только какие?

Цитата:
В опциях сохранение шрифтов включили?

Что-то такой опции не вижу у себя.
Ваш файл скачать почему-то не могу, выдает ошибку "404. Нет такой страницы"!

Всего записей: 3881 | Зарегистр. 20-02-2007 | Отправлено: 18:28 30-04-2011 | Исправлено: coherent, 18:30 30-04-2011
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
coherent
Вы выложили векторный pdf, его распознать FR/PT напрямую невозможно, только если включить опцию растризации, она была до 8-й версии включительно. В ссылку на файл добавилась точка в конце, исправил. Пока не будет примера из нескольких страниц оригнального файла, с которым у Вас проблемы, говорить не о чем.

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 19:07 30-04-2011 | Исправлено: Astra55, 19:09 30-04-2011
coherent

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55
Открыл Ваш файл у себя в Ворде (оффис ХР Prof), а там вместо греческих символов - русские!? Вот скрин. Похоже, что у меня нет каких-то шрифтов или шрифта. Может в этом причина?

Всего записей: 3881 | Зарегистр. 20-02-2007 | Отправлено: 19:43 30-04-2011 | Исправлено: coherent, 19:46 30-04-2011
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
coherent
Тогда разбирайтесь со своей системой. У меня WinXP SP3  Word 2003, все софты портабельные, включая Ворд и ФайнРидер, поэтому ни единого лишнего фонта нет, только виндовые. Все показывает правильно, и английский и греческий.

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 20:21 30-04-2011
coherent

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55
Спасибо, что нашли и время и желание помочь! Теперь понятно, что проблема где-то у меня с оффисом ХР. Но никак не могу понять где. Самое интересное, что если распознаный текст из моего примера сохранить в буфер обмена и  вставить в блокнот, то символы будут греческими, а если в Ворд - то русскими?! Понимаю, что это как-бы с FR уже не связано, но может подскажете, куда копать?

Всего записей: 3881 | Зарегистр. 20-02-2007 | Отправлено: 18:16 02-05-2011
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
coherent
Попробуйте для начала портабельный Ворд 2003 или 2007 и поглядите что будет. Если все было стандартное, фонты не менялись, то не знаю, трудно сказать, никогда нужды в греческом не испытывал.

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 19:31 02-05-2011
coherent

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55
С портабельными версиями (Ворд 2003, 2007 и FineReader 8) ситуация следующая. На реальной системе греческие символы отображаются как русские, а вот на виртуальной (только Виндоус ХР сп3 без оффиса) все прекрасно работает. В том числе и в Вашем файле греческие символы отображаются правильно. Проблема где-то в моей реальной системе. Полазил по Интернету, вроде и все шрифты на месте, и записи в реестре те, что должны быть. Просто не могу понять, где собака зарыта!

Всего записей: 3881 | Зарегистр. 20-02-2007 | Отправлено: 21:49 02-05-2011
coherent

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55
Таки разобрался в чем была проблема. Оказалось в реестре. В HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Nls\CodePage некоторые значения отличались от дефолтных. Восстановил их и все заработало!

Всего записей: 3881 | Зарегистр. 20-02-2007 | Отправлено: 16:27 03-05-2011
vladlen666



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ABBYY FineReader 7.0 отказывается открывать файлы в формате Tiff сжатый LZV.  
Совет установите FR9 или 10 не подходит, так как мне нужен проект распознавания именно в формате FR7 для дальнейшего внесения распознанного текста в DJVU книгу.  
Пересохранение файлов в несжатый тифф выход но не лучший, так как файлов очень много и комп слабый, поэтому прогнозирую проблемы при обработке.
 
То есть есть ли диллки для FR7 чтобы он понимал сжатый тифф
 
Можно установить конечно FR8, так как программа DjVuOCR корректно работает с проектами FR8 и FR8 кажется по умолчанию понимает сжатые тиффы.  
 
Отчасти ПРОБЛЕМУ решил использованием патча для FR9 который исправил порядок перепутанных страниц в проекте FR9
И все таки есть ли возможность повысить функциональность FR7

Всего записей: 271 | Зарегистр. 20-11-2008 | Отправлено: 22:34 04-05-2011 | Исправлено: vladlen666, 23:41 04-05-2011
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
vladlen666

Цитата:
ABBYY FineReader 7.0 отказывается открывать файлы в формате Tiff сжатый LZV.

Конвертируйте их в JPEG с небольшим сжатием. Качество изображения будет примерно то же самое, обрабатываться будут немного быстрее.
 

Цитата:
программа DjVuOCR корректно работает с проектами FR8

Она и девятую версию вполне понимает.
 

Цитата:
мне нужен проект распознавания именно в формате FR7 для дальнейшего внесения распознанного текста в DJVU книгу.  

Если у вас материал изначально живет в DjVu, так сбросьте его в более удобный для вас вариант TIFF.
 
 
 
 

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 17:11 10-05-2011
amaid



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
нашел dll, благодаря которой файн 9 умеет импортировать djvu.
а нет ли в природе такой же dll'ки для файна 8?
 

Цитата:
Она и девятую версию вполне понимает.

бетка, брошена на полдороге
мало-мальски сложное форматирование вообще не понимает, плюс на многоядерных процессорах номера страниц в пакете путаются, поэтому OCR вставляется не туда
патч тот пробовал, толку не было пока ни разу

Всего записей: 575 | Зарегистр. 25-01-2006 | Отправлено: 13:44 16-05-2011 | Исправлено: amaid, 13:46 16-05-2011
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
а нет ли в природе такой же dll'ки для файна 8?  

Который по своей конструкции даже и не подозревает о существовании такого формата?..

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 14:53 16-05-2011
ALEX666999



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
amaid: а нет ли в природе такой же dll'ки для файна 8?

НЕТ. Для 9-ки подошло лишь потому, что там билды близкие и dll'ка подхватилась. Могу посоветовать раздербанить djvu и распознать полученные изображения. Меньше времени и нервов, чем искать несуществующее решение
 
2 all а применение стиля для текста на горячие клавиши в 9-й/10-й версии подвесить нельзя?

Всего записей: 6652 | Зарегистр. 20-05-2004 | Отправлено: 14:56 16-05-2011
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
раздербанить djvu

Программка DjVuToy вроде бы умеет разбирать DjVu на отдельные страницы.

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 15:18 17-05-2011
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Shangry

Цитата:
Программка DjVuToy вроде бы умеет разбирать DjVu на отдельные страницы.  

Она умеет, но на кой это нужно в данном случае? Для более быстрого OCR нужны растровые tif/jpg, а не одностраничные djvu, поэтому применяется не разборка, а конвертирование.

----------
Per warez ad scientiam

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 17:05 17-05-2011
v kornev

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Установил 10-ю версию, и она почему-то не работает с моим сканером Mustek 1200UB.
Выдает ошибку  - Timeout starting and initializing server. - Неустранимая ошибка сканера.
Установил рядом сней 7-ю версию, всё работает.
Может кто подскажет чем 10-ке мой сканер не нравится?

Всего записей: 2 | Зарегистр. 18-05-2011 | Отправлено: 09:25 18-05-2011
Sish



Platinum Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
v kornev
А в настройках 10-го сабжа стоит использование фейса сканера или сабжа?

Всего записей: 25337 | Зарегистр. 09-06-2004 | Отправлено: 11:21 18-05-2011
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)
Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru