Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)

Модерирует : gyra, Maz

Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

JediMaster_Dragon



Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
ABBYY FineReader
7, 8, 9, 10 (Pro, Corp, Home), 11 (Pro, Corp), 12 (Pro, Corp) и 14 (Pro, Corp, Ent)

 

 
Полный список языков распознавания для FR15
 

Русский интерфейс
 
Ответ на вопрос о сохранении проекта смотрим тут


Если  хотите, чтобы ваша проблема была рассмотрена, (решение не гарантируется), необходимо представить такие сведения:
1. Версия FineReader.
2. Версия Windows, версию пакета обновлений (SP), разрядность (для Vista и выше).
3. Если проблемы со сканированием, то называем ещё и модель сканера. Обновите драйвера своего сканера, до последней версии имеющейся на сайте поддержки вашего сканера.


Как можно получить церковнославянские тексты при помощи сканирования FineReader'ом
Как отключить "искусственный интеллект" FineReader
Как выбрать опции, чтобы FR10 распознавал простейшие формулы
FineReader не распознает сложные формулы и рукописный текст, не задавайте вопросов на эту тему.  
Версии FR для Linux пока не существует, только Engine, который вам явно не нужен.

Для понимания формата XPS программой FineReader нужен Framework 3.0. Только для XP и 2000.
Совет по распознаванию файлов DjVu Читать
Электронные текстовые книги - OCR, вычитка, оформление

Всего записей: 354 | Зарегистр. 18-01-2002 | Отправлено: 09:07 26-01-2003 | Исправлено: Maz, 19:24 26-01-2020
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Для юмора попробовал ту же страничку, что пользовал для беты, а вчера прогнал через 9-й релиз. Страничка самая обычная, три колонки текста и два фото в самом низу. Те же самые косяки и в бете, и в релизе. Либо текст из верхней части страницы уходит в самый низ, либо нередактируемый doc, Третьего не дано. Номер страницы не воспринят как текст, зато картинка стала текстом. Две фотографии выделены не полностью. В ФР8 все нормально, кроме небольшого куска изображения, который выделен как текст, потребовалось пара щелчков мышкой, чтобы копия стала похожа на оригинал. То есть, по сравнению с 8-й стало хуже, а не лучше. И длинный список недостатков может быть продолжен. Совершенно согласен с названием темы на форуме ABBYY - "  А может вы поторопились с релизом?". Явно поторопились, может денег за новую версию сильно захотелось. Иначе трудно объяснить обилие косяков.  Поэтому не торопитесь выбрасывать восторженные лозунги, на них выльют ушат холодной воды. Без голого свиста, со скриншотами и подтверждающими файлами

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 12:01 04-11-2007
VitRom

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
manuilov, "юридически" -- да, проверяльщик нужен на "следующем этапе". Но проверка внутри распознавалки гораздо удобнее (по тем же "неуверенно распознанным" пробежаться, скажем)... Да и просто как-то так сложилось, спасибо школе, что я нигде, кроме Файна, спеллчеком не пользуюсь...

Всего записей: 3109 | Зарегистр. 18-06-2006 | Отправлено: 10:25 06-11-2007
manuilov



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55

Цитата:
Простите, а Вы случаем не из девелоперов ABBYY будете? И с каких пор критика софта стала считаться "обливанием грязью"? Если у Вас лично 9-я версия вызывает дикий восторг, причем доказательств этому Вы не приводите, (тот же "голый свист" по Вашему же выражению), то почему все остальные должны безоговорочно разделять Вашу "кочку зрения"?  

Увы, должен вас разочаровать - я не получаю зарплату на abbyy
Я занимаюсь своим делом, в котором не последнее место занимает сканирование и обработка большого количества материалов, содержащих текст, графику, таблицы и т.п. И именно исходя из этого я делаю вывод, что 9-я версия - шаг вперед.
Теперь о вас. Вы подбираете документ, с которым 9-ка справляется явно хуже, чем 8-ка и на основании этого объявляете версию сырой и глючной?
Я могу вам предоставить ворох документов, которые 8-ка обрабатывает гораздо хуже 9-ки. И по вашей логике я должен объявить все предыдущие версии сырыми?
 
Судя по всему, вы никогда не сталкивались в жизни с разработкой реальных коммерческих программ - в лучшем случае ваш опыт программирования сводится к выводу на экране строчки "Привет, морячок!"
 
Что ж изменилось в 9-ке? И почему?
Уровень распознавания текста в последних версиях практически не меняется и это неудивительно - он уже очень высок и дальнейшее совершенствование алгоритма распознавания текста не имеет смысла. Это все достаточно дорого, а, учитывая процветающий раздел "варезник" на этом форуме, то это вовсе может не случиться.
Не забудем и все более высокое качество попадающих на сканер документов - современная техника не сопоставима с тем, что было лет 10 назад.
Поэтому логично стремление компании сосредоточиться на том, чтобы сделать работу с документами более комфортной и быстрой.
У меня, например, при обработке сложных документов, основное время уходит на корректировку разметки страницы - как в восьмерке, так и в девятке. Имеется в виду исправление положения границ рисунков, переразбивка таблиц (в которых не выделены строки) и т.п.  
И только возможность использовать Ctrl, Alt, Shift для практически мгновенного изменения размеров блоков, добавления и убирания строк в таблицах позволяет мне обрабатывать страницу на порядок быстрее. Напомню, что в предыдущей версии за всем нужно было лазить в меню, на панельки и т.п.  
Плюс возможность настройки горячих клавиш под себя, что тоже сокращает время работы над документом.  
Еще раз повторюсь, это IMHO, IMAO.  
У меня к девятке много претензий - прежде всего по работе со сканером (самое спорное нововведение), но то, что сделано - уже огромный шаг вперед, особенно если учесть наплевательское отношение к юзабилити интерфейса в предыдущих версиях.
В конце концов, каждый может скачать и попробовать FR9 и решить - стоит она перехода или нет!

Всего записей: 58 | Зарегистр. 21-08-2003 | Отправлено: 05:05 07-11-2007 | Исправлено: manuilov, 05:06 07-11-2007
tukktukk

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Как я уже говорил в другой ветке, 9 меня не устраивает.  Сравнил распознование одного и того же текста (никаких фото и сложного форматирования) над которым работал в 8 и 9.  Ошибок в 9 намного больше (особенно со скобками и распознаванием жирного и курсива).  Так что вполне согласен с Astra55.

Всего записей: 1023 | Зарегистр. 11-01-2006 | Отправлено: 07:25 07-11-2007 | Исправлено: tukktukk, 07:26 07-11-2007
pom205

BANNED
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подтверждаю изменения только в худшую сторону. И если фирма не пересмотрит свои нововведения (размер, портабельность, кач-во распозн-я...), программа,считай, завяла.

Всего записей: 555 | Зарегистр. 03-06-2006 | Отправлено: 07:51 07-11-2007 | Исправлено: pom205, 07:52 07-11-2007
Nadeyew

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
manuilov

Цитата:
...дальнейшее совершенствование алгоритма распознавания текста не имеет смысла.

 
Позвольте с Вами не согласиться. Если разработчики прислушаются к этому Вашему мнению, что любимой программе действительно осталось недолго жить. Ведь это же просто безобразие, когда 9-ка неуверенно распознает идеальный текстовый PDF (я не говорю сейчас про сохранение форматирования, для большинства пользователей это дело десятое), а должна давать 99.9% если не все 100! С форматом "дежавю" тоже должно быть почти 100%, их нет. А как быть с разрешениями меньше 300 точек, экранками, чересчур светлыми или темными копиями, сделанными на убитых "ксероксах", которые Вам (опять за деньги!) выдадут, например, в библиотеке? Это же именно тот материал, который в большинстве случаев людям и надо распознавать. А если у человека есть доступ к идеальному исходнику, то скорее всего ему Файнридер будет не нужен, он сможет воспользоваться другими утилитами, такими как PDF2Word. И Вы говорите, что не имеет смысла работать над алгоритмом? Странно...

Всего записей: 206 | Зарегистр. 11-02-2006 | Отправлено: 12:50 07-11-2007
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Думаю, Astra55 со мной согласится, если я предположу, что разработчики в ABBYY скорее похожи на этаких продвинутых юзеров: у них есть некий движок с кучей настроек, который они модифицировать уже боятся (т.к. создатели движка в ABBYY, скорее всего, уже не работают), а могут лишь его "настраивать". В основном для того, чтобы создать видимость, что движок работает как-то немного по-другому

----------
пропадет-растает

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 13:10 07-11-2007
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Соглашусь, тем более, что была непроверенная инфа насчет слиняния мозгов в очень другое государство И Nadeyew совершено прав: на форуме ABBYY были дебаты насчет эталонного текста, который ФР распознает с вероятностью 100%. Аргументы контра выглядели крайне неубедительно. Если бы у девелоперов была возможность улучшать алгоритм OCR в ФР, то такой текст обязан был бы существовать в природе. А его нет. Что косвенно подтверждает нестабильность OCR и неумение (?) девелоперов устранить ее на идеальных текстах. Ну нет у меня сейчас времени на широкое тестирование всех версий ФР и конкурирующего софта. Скорее всего, к Новому году смогу что-то сделать в этом отношении. Мне самому жутко любопытно получить результаты такого сравнения.
Кстати, идеальный PDF, то бишь, вектор, категорически не рекомендуется прогонять через ФР или Трансформер. Сразу внесете элемент непредсказуемости в отличие от хороших pdf конвертеров, где некорректность в каких-либо знаках будет 100% повторяема и можно всегда ее устранить. А элемент OCR может дать такие ошибки, что только человек при тщательной вычитке их заметит. Благо, конвертеров сейчас хватает. Из последних поступлений Able2Doc/Able2Extract, с русским работает очень неплохо. Про конвертацию в Excel не говорю, для этого тоже хватает софта.

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 15:48 07-11-2007
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В компьютерре козлонка про девятку, старый стрекозел, не смотря на неистребимую любовь к халяве, разнес новинку.

Всего записей: 3284 | Зарегистр. 22-03-2005 | Отправлено: 23:39 07-11-2007
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VadimirTT
Эмм, может быть, объяснитесь?

----------
пропадет-растает

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 23:58 07-11-2007
Nep



Moderator
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
VadimirTT
по русски пиши
ghosty
он сказал что Козловский не хвалил новую версию в газете

Всего записей: 41940 | Зарегистр. 24-06-2001 | Отправлено: 00:25 08-11-2007
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Вот
http://webfile.ru/1586057
надеюсь читаемо.
Меня порадовал ответ от абби, что он фотографировать не умеет , не в бровь, а в глаз!

Всего записей: 3284 | Зарегистр. 22-03-2005 | Отправлено: 00:43 08-11-2007
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Весьма читаемо, спасибо. Особенно меня тронул коммент Липича. Так и хочется сказать ему, лучше лично: "Дяденька, ну кому ты арапа заправляешь? Ведь не одни же чайники юзают ФайнРидер, мы, чай, не первый год замужем!" С другой стороны, в Инете выложили книгу "Красные уши", снятую фотиком, причем, весьма похабно, 310 метров на 163 страницы!!! Просто недостижимый рекорд объема и мерзкого качества. Я еще детально не исследовал, но вроде как ФР 8-й  явно лучше справляется, нежели расхваливаемая 9-ка. Надо будет еще конкурентами пройтись, что они на этот счет скажут. В выходные попробую и доложу общественности.

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 16:55 08-11-2007
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Более внимательно сравнивал ФР8 и ФР9. Увы, но выводы печальны для новинки. Она стала слепая, тупая, с дурацкими инициативами, которые приходится давить вручную, с почти полным набором багов из беты, словом, даже если и есть некое улучшение распознавания, то имеющиеся недостатки полностью замазывают черной краской миф о якобы шаге вперед. Тут уже не шаг вперед, два назад, а бодрая рысь вспять Я берусь утверждать, что выход ФР9 был продиктован чем угодно, но не готовностью софта к продаже, как это должно быть. Одна чахлая бета не может расцениваться как серьезная работа над недостатками. Увы, но ABBYY начала работать по известному принципу - пипл и так схавает, незачем стараться, когда на российском рынке нет конкуры и можно смело заряжать новые деньги за комплект старых недостатков и новых косяков. Dixi.

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 18:32 10-11-2007
softes

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Девятка все текстовые блоки передает в Вёрд (2007) как текстовые боксы (text box).
Можно как-то настроить так, чтобы текст был обычным? В настройках ничего подобного не обнаружил.

Всего записей: 878 | Зарегистр. 22-10-2003 | Отправлено: 21:15 10-11-2007
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Про 2007-й не скажу, на 2003-м такая картина будет при выборе "Точная копия", поэтому для последующего редактирования нужно выбирать в опциях сохранения в Ворд - "Редактируемая копия" или что-то в этом роде.

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 21:59 10-11-2007
softes

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55
Спасибо, помогло. До этого выставлял "Редактируемую копию", но все равно были боксы. Видимо, это случается из-за сложной топографии текста.
 
А что, в 9-ой версии экспорт в Ворд с окошком Zoom Window убрали?
 
Добавлено:
 
Заметил такую вещь - случайным образом пропадает/появляется распознавание сносок. Сначала открыл-распознал демо-файл из папки программы - в Ворде появилась сноска (!). Там где ей и положено быть (все-таки распознавание структуры документа - это здорово). Экспортировал то же распознавание повторно - нету сноски...  
Никто не сталкивался с подобным? Если да, то просьба подсказать, как правильно настроить программу.

Всего записей: 878 | Зарегистр. 22-10-2003 | Отправлено: 23:06 10-11-2007
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Со сносками может быть такой прикол: они считаются колонтитулами . Поэтому проверить галочку в настройках по этому поводу, она там есть.  

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 06:34 11-11-2007
softes

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Astra55
С колонтитулов галку не снимал (соответственно они и распознавались во всех случаях - в демо-файле есть и колонтитул, и сноска, и гиперссылка, и номер страницы). Сбоила только сноска. Впрочем, после перераспознавания все выправилось.

Всего записей: 878 | Зарегистр. 22-10-2003 | Отправлено: 15:31 11-11-2007
Astra55



Platinum Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Вот я и говорю - совершенно сырой софт впаривают за новые деньги. Что уж тут лукавить, пора бы ABBYY признаться в грехе мздоимства и публично покаяться, да не дождемся мы этого. И что-то никто опровергать наезды на ФР9 не рвется, хотя были попытки. И это, товарищи - правильно! Не надо защищать откровенную халтуру. Разумеется, если вы не работаете в ABBYY

Всего записей: 11717 | Зарегистр. 16-05-2003 | Отправлено: 19:23 11-11-2007
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » ABBYY FineReader (Часть 1)
Maz (20-12-2023 09:13): ABBYY FineReader (Часть 2)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru