Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)

Модерирует : gyra, Maz

Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

JediMaster_Dragon



Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
ABBYY FineReader
7, 8, 9, 10 (Pro, Corp, Home), 11 (Pro, Corp), 12 (Pro, Corp) и 14 (Pro, Corp, Ent)

 

 
Полный список языков распознавания для FR15
 

Русский интерфейс
 
Ответ на вопрос о сохранении проекта смотрим тут


Если  хотите, чтобы ваша проблема была рассмотрена, (решение не гарантируется), необходимо представить такие сведения:
1. Версия FineReader.
2. Версия Windows, версию пакета обновлений (SP), разрядность (для Vista и выше).
3. Если проблемы со сканированием, то называем ещё и модель сканера. Обновите драйвера своего сканера, до последней версии имеющейся на сайте поддержки вашего сканера.


Как можно получить церковнославянские тексты при помощи сканирования FineReader'ом
Как отключить "искусственный интеллект" FineReader
Как выбрать опции, чтобы FR10 распознавал простейшие формулы
FineReader не распознает сложные формулы и рукописный текст, не задавайте вопросов на эту тему.  
Версии FR для Linux пока не существует, только Engine, который вам явно не нужен.

Для понимания формата XPS программой FineReader нужен Framework 3.0. Только для XP и 2000.
Совет по распознаванию файлов DjVu Читать
Электронные текстовые книги - OCR, вычитка, оформление

Всего записей: 354 | Зарегистр. 18-01-2002 | Отправлено: 09:07 26-01-2003 | Исправлено: Maz, 19:24 26-01-2020
hogu77

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Shangry
Вообще-то встроенный словарь для распознавания дореволюционной лексики в FineReader появился только в последней, 12-й версии. До этого все, что могло быть - это какие-то "самостийности" и на них вряд ли могут быть ссылки именно у ABBYY.

Не совсем так, не знаю/не помню насчёт 9-ой и 10-ой версий но в одинадцатку словарь ставиться на-ура, без всяких делений и резаний. Ну а в 12-ой и в самом деле прикрутили орфографию-проверку, отсюда видимо и автор словаря (я так понимаю речь идёт о Павле Черникове aka Чароплёт) убрал его со страницы.
 

Цитата:
Не подскажете, какой программой такое генерится - чтобы ТХТ-файл произвольного объема, а в нем отсортированная лексика в UNICODE-кодировке.

Забыл добавить что файлик в формате *.pmd, где в алфавитном порядке слова идут.
А вообще пользуюсь  EmEditor'ом, там много вкусного да и с большими файлами он отлично работает.
Открываете в EmE набор слов колонкой -> ПКМ -> Separated Values/Sort -> Sort A to Z
Если же речь идёт о дореформке как таковой то для перевода с/на гражданский русский я использовал Hieroglyph 3.7 и алгоритм замены для него.

Всего записей: 118 | Зарегистр. 14-02-2012 | Отправлено: 15:50 20-05-2015 | Исправлено: hogu77, 16:11 20-05-2015
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
hogu77

Цитата:
автор словаря (я так понимаю речь идёт о Павле Черникове aka Чароплёт) убрал его со страницы.  

Я так понимаю, что он его соорудил на базе словаря Виницкого? По какому адресу словарь лежал, не подскажете - может там еще что-то интересное обнаружится.
 

Цитата:
Забыл добавить что файлик в формате *.pmd, где в алфавитном порядке слова идут.  

Ну да, просто переименованная TXT-шка. Я его в Far посмотрел, сразу все понятно стало. Только вот никак не соображу - там кодировка UNICODE или что-то другое?
 

Цитата:
Если же речь идёт о дореформке как таковой то для перевода с/на гражданский русский я использовал Hieroglyph 3.7 и алгоритм замены для него.

Если вам попадался и другой инструментарий для работы с дореформенным, то нет ли там чего-нибудь пригодного для генерации словоформ?  
У меня скоро как раз эта проблема и будет - хочу пополнить словарь Виницкого, но весь материал, как обычно только в именительном падеже. А надо бы полный комплект словоформ сделать.

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 18:22 21-05-2015 | Исправлено: Shangry, 12:56 22-05-2015
hogu77

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Shangry
Я так понимаю, что он его соорудил на базе словаря Виницкого?

История процесса.
 

Цитата:
По какому адресу словарь лежал, не подскажете - может там еще что-то интересное обнаружится.

Скачал из ветки выше.
 

Цитата:
Ну да, просто переименованная TXT-шка.

Ничего подобного, родной *.pmd из Abbyy после загрузки туда словаря.
 

Цитата:
Если вам попадался и другой инструментарий для работы с дореформенным, то нет ли там чего-нибудь пригодного для генерации словоформ?

К сожалению, помочь в этом не могу.

Всего записей: 118 | Зарегистр. 14-02-2012 | Отправлено: 19:25 22-05-2015
corrector

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Помогите, кто знает как, пожалуйста!
Распознал в FR8 книгу. Вычитал. Использовал шрифт Antiqua. Для приближения к оригиналу во всех словах курсивом использовал шрифт Cambria, кроме буквы "т": для нее использовал шрифт Karelia. В паре мест использовал шрифт "Literaturnaya". Все упомянутые шрифты зарегистрированы в Windows.
При попытке сохранить как pdf (параметры сохранения: Формат сохранения - Только текст и картинки; Шрифт - использовать системные шрифты, Встраивать шрифты) возникли две такие две проблемы:
а) на одной из страниц вылезло: "Шрифт Literaturnaya не содержит всех необходимых символов. Некоторые символы не будут показываться на экране. Продолжить сохранение в PDF?". Отвечаю - Да; процесс идет дальше.  
Здесь вопрос сформулирую так: меня просто предупреждают, что (возможно) в тексте встретится (а может и не встретиться) символ в шрифте Literaturnaya, который не будет отображаться при просмотре pdf-файла (поскольку в этом шрифте представлены не все символы), или же FR в процессе формирования pdf-файла наткнулся на такой неотображаемый символ? При втором варианте: что FR ставит в тексте (когда натыкается на такой символ) в случае ответа "Да" на предупреждение?
б) когда FR натыкается на букву "т" (шрифт Karelia, курсив) вылезает сообщение "Встраивание шрифта "Karelia" запрещено. Сохранение отменено". Естественно, pdf-файл не создается. Вопросы:
Почему? Кем запрещено? Можно ли снять этот запрет?
Конечно, можно отказаться от этого шрифта. Но опять искать другой подходящий шрифт и заменять шрифт во всех вхождениях буквы "т" в "Karelia" (сотни слов на 600 стр.) - жуткий гемморой (мне становится плохо).
Примечание: Все эти проблемы всплывают лишь при сохранении в pdf со встраиванием шрифтов;  
при отказе от встраивания шрифтов - проблем нет;
при сохранении в doc, rtf, xml, html, lit - никаких сообщений, все сохраняется.
Среда: Win 7 Ent SP1 x64: FineReader 8.0.0.1126 port
UPD: проверил на Win Vista Home Basic SP2 (ноутбук) + FineReader 8.0.0.1126 port - все то же самое.

Всего записей: 218 | Зарегистр. 15-05-2006 | Отправлено: 14:39 25-05-2015
robofob



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
corrector

Цитата:
Среда: Win 7 Ent SP1 x64: FineReader 8.0.0.1126 port
UPD: проверил на Win Vista Home Basic SP2 (ноутбук) + FineReader 8.0.0.1126 port - все то же самое.

Ежики плакали, кололись, но продолжали любить кактус... Версию FR более новую не пробовали использовать, или Заратустра не позволяет использовать современный софт?

Всего записей: 40 | Зарегистр. 25-12-2014 | Отправлено: 16:09 25-05-2015
corrector

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Ежики плакали, кололись, но продолжали любить кактус... Версию FR более новую не пробовали использовать, или Заратустра не позволяет использовать современный софт?  

Не надо ерничать, robofob. Есть у меня и последние версии FR. Если я пользую FR8, значит на то есть причины.  
По существу проблем есть что сказать?

Всего записей: 218 | Зарегистр. 15-05-2006 | Отправлено: 19:09 25-05-2015
robofob



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
corrector

Цитата:
Цитата:
Ежики плакали, кололись, но продолжали любить кактус... Версию FR более новую не пробовали использовать, или Заратустра не позволяет использовать современный софт?  
 
Не надо ерничать, robofob. Есть у меня и последние версии FR. Если я пользую FR8, значит на то есть причины.  
По существу проблем есть что сказать?

Я не ёрничаю. В ваших вопросах и ответ содержится. Если сохраняется в другие форматы, сохраните в них, а потом из них создайте pdf любым способом. Из doc, например, с сохранением шрифтов.
 

Всего записей: 40 | Зарегистр. 25-12-2014 | Отправлено: 13:22 26-05-2015
corrector

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Если сохраняется в другие форматы, сохраните в них, а потом из них создайте pdf любым способом. Из doc, например, с сохранением шрифтов.  

 
При сохранении в doc, rtf, html к черту летит форматирование страниц (FR8 плохо вычисляет размеры страниц даже при выставленных параметрах Оформление - "Оформление оригинала", размер бумаги - "Executive", "сохранять деление на строки"): текст страницы часто не вписывается в габариты станицы, строки не вписываются в ширину и появляются новые переносы. Как ни странно, в pdf картина обратная - геометрия страницы держится железно. Но вот кто-то не любит отдельно взятые шрифты.

Всего записей: 218 | Зарегистр. 15-05-2006 | Отправлено: 14:57 26-05-2015
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
corrector

Цитата:
Здесь вопрос сформулирую так: меня просто предупреждают, что (возможно) в тексте встретится (а может и не встретиться) символ в шрифте Literaturnaya, который не будет отображаться при просмотре pdf-файла (поскольку в этом шрифте представлены не все символы), или же FR в процессе формирования pdf-файла наткнулся на такой неотображаемый символ?  

Сообщение надо понимать в его буквальном смысле - для отображения данного куска распознанного текста используется шрифт такой-то, в тексте есть символы, которые в этом шрифте отсутствуют, ergo отобразить их будет невозможно.
При подобных сообщениях имеет смысл использовать UNICODE-комплектные шрифты - там уж точно все найдется. Или же разбираться, чего именно у вас нет в используемом шрифте и подбирать другой, более комплектный шрифт.
 

Цитата:
При втором варианте: что FR ставит в тексте (когда натыкается на такой символ) в случае ответа "Да" на предупреждение?  

Вроде бы "квадратик", но точно не помню.
 

Цитата:
когда FR натыкается на букву "т" (шрифт Karelia, курсив) вылезает сообщение "Встраивание шрифта "Karelia" запрещено. Сохранение отменено". Естественно, pdf-файл не создается. Вопросы:
Почему? Кем запрещено? Можно ли снять этот запрет?  

Почему и кем - скорее всего создателем шрифта, по каким-то своим соображениям. Можно ли снять - в пределах FineReader это вряд ли получится.
 

Цитата:
Все эти проблемы всплывают лишь при сохранении в pdf со встраиванием шрифтов;  
при отказе от встраивания шрифтов - проблем нет;

Значит берет необходимые символы из других шрифтов, которые есть в системе.
 

Цитата:
при сохранении в doc, rtf, xml, html, lit - никаких сообщений, все сохраняется.  

Все они при отсутствии именно требуемого шрифта (нужного символа в нем) тут же подыскивают что-нибудь подходящее на замену (из имеющегося в системе).
 
robofob

Цитата:
Версию FR более новую не пробовали использовать, или Заратустра не позволяет использовать современный софт?  

Заменой версий все это по не определению лечится.

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 16:59 26-05-2015 | Исправлено: Shangry, 17:01 26-05-2015
Dracula



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Всем привет!
На работе в одном месте стоит МФУ - 4 в одном (+факс).
 
На него я так понимаю 12 версия встанет спокойно?  
 
И там будет только через ABBYY FineReader 12 доступен сканер я так понимаю?

----------
+=._.=++=._.=++=._.=++=._.=++=._.=++=._.=++=._.=+

Всего записей: 3535 | Зарегистр. 22-12-2003 | Отправлено: 17:42 26-05-2015
robofob



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
corrector

Цитата:
Но вот кто-то не любит отдельно взятые шрифты.

Ну, что тут скажешь... Жаль, конечно, 600 страниц... Я бы перед распознанием задал либо только адобовские родные шрифты, либо только системные, не перемешивая их.

Всего записей: 40 | Зарегистр. 25-12-2014 | Отправлено: 19:34 26-05-2015 | Исправлено: robofob, 19:36 26-05-2015
krserv



BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
а последняя версия Sprint - 9 или есть еще новее?

Всего записей: 3728 | Зарегистр. 21-11-2006 | Отправлено: 22:31 26-05-2015
robofob



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Правда ли, нет, что FR Pro грузит процессор меньше Corp?

Всего записей: 40 | Зарегистр. 25-12-2014 | Отправлено: 12:40 27-05-2015 | Исправлено: robofob, 12:57 27-05-2015
Shangry

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Dracula

Цитата:
На работе в одном месте стоит МФУ - 4 в одном (+факс).  
 
На него я так понимаю 12 версия встанет спокойно?  

А что уже появились МФУ, на которые можно софт устанавливать ? Или речь все-таки о компе, который при МФУ?
 

Цитата:
И там будет только через ABBYY FineReader 12 доступен сканер я так понимаю?

Если поставлен TWAIN-драйвер сканера, то будет доступно через любой софт, который с этим сканером умеет работать.
 
robofob

Цитата:
Ну, что тут скажешь... Жаль, конечно, 600 страниц...

Распознать с использованием других шрифтов - вот собственно и вся проблема. Но если надо именно эти и никакие другие - тогда действительно не лечится.
 

Цитата:
Правда ли, нет, что FR Pro грузит процессор меньше Corp?

Если скормить им одно и то же, то и грузить будут одинаково.
 
 
 

Всего записей: 474 | Зарегистр. 27-10-2006 | Отправлено: 14:50 27-05-2015 | Исправлено: Shangry, 14:58 27-05-2015
corrector

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Решил свои проблемы. Сначала сохранил страницы в pdf без внедрения шрифтов. Затем внедрил используемые шрифты связкой Adobe Acrobat + Adobe Acrobat Distiller. Спасибо всем, кто попытался помочь.

Всего записей: 218 | Зарегистр. 15-05-2006 | Отправлено: 20:34 28-05-2015 | Исправлено: corrector, 20:55 28-05-2015
robofob



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
corrector

Цитата:
Сначала сохранил страницы в pdf без внедрения шрифтов. Затем внедрил используемые шрифты связкой Adobe Acrobat + Adobe Acrobat Distiller

А можно в двух словах (по пунктам) как? Похоже, мне тоже надо

Всего записей: 40 | Зарегистр. 25-12-2014 | Отправлено: 12:50 31-05-2015
corrector

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
robofob
В 2-х словах.
1. Сохраняются страницы (FR8) в pdf со следующими параметрами сохранения: Формат сохранения - Только текст и картинки; Шрифт - использовать системные шрифты; Встраивать шрифты - галочка снята. Предполагается, что шрифты используемые в документе, зарегистрированы в Windows.
 
2. С помощью Adobe Acrobat документ преобразуется в формат ps (Файл -> Сохранить как другой -> Другое -> PostScript). При сохранении необходимо выставить некоторые настройки (кнопка Настройки в окне сохранения), связанные со шрифтами (В пункте "Основные" я выставил: Включение шрифтов - отсутствует; включил галку "Преобразовать шрифты TrueType в Type 1").
 
3. С помощью Adobe Acrobat Distiller ps-документ преобразуется в формат pdf. В программе перед открытием ps-документа я выставил следующие настройки (меню -> Настройки -> Изменить параметры Adobe PDF... -> Шрифты): указал список шрифтов, которые нужно встраивать, выставил галку "Сократить знаковый состав..." и указал 100% в окошке рядом. Далее открыть созданный в п.2 ps-документ - он преобразуется в pdf-документ и сохранится в той же папке и под тем же именем.
 
Наверное, полезной будет ссылка Встраивание и подстановка шрифтов из хелпа по Adobe Acrobat.

Всего записей: 218 | Зарегистр. 15-05-2006 | Отправлено: 19:59 31-05-2015 | Исправлено: corrector, 20:34 31-05-2015
robofob



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
corrector

Цитата:
В 2-х словах.

Спасибо. Буду использовать.

Всего записей: 40 | Зарегистр. 25-12-2014 | Отправлено: 10:03 01-06-2015
ComboFZ

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Так же в Акробате шрифты можно встраивать с помошью встроенного модуля Preflight (Предпечатная проверка) > Embed fonts > Analyze and fix.
http://s017.radikal.ru/i401/1506/f2/d783bc48cd32.jpg
 
Либо монструазным акробатовским плагином Enfocus PitStop (Rus) > Глобальные изменения > Шрифт > Встроить шрифт
 
При пересохранении в PDF/A шрифты автоматом встраиваются в документ.
 
Enfocus PitStop (ИМХО) предпочтительней других плагинов и программ, т.к. корректней встраивает недостающие фонты.

Всего записей: 2796 | Зарегистр. 31-05-2010 | Отправлено: 21:08 01-06-2015 | Исправлено: ComboFZ, 21:12 01-06-2015
corrector

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Enfocus PitStop (ИМХО) предпочтительней других плагинов и программ, т.к. корректней встраивает недостающие фонты.

 
К сожалению, у меня Акробат - portable, безо всяких плагинов, а как их в такой Акробат вставлять - не знаю.
 

Всего записей: 218 | Зарегистр. 15-05-2006 | Отправлено: 23:40 01-06-2015 | Исправлено: corrector, 23:41 01-06-2015
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)
Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru