x_Stalker_x
Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Rucha Цитата: Мне OCR нужен не для получения текстового документа, а для получения возможности поиска текста внутри pdf-а (большая книга). FineReader исковеркает мне книгу до неузнаваемости, да и возни с ним будет ого-го! | Если вам нужен только поиска текста внутри pdf-а, то FineReader вам подойдет наилучшим образом. Дело в том, что FineReader позволяет распознавать текст автоматически и сохранять потом как pdf без потери качества изображения + сохранять распознанный текст под исходным изображением. Порядок действий такой: проверьте чтоб в опция были нужные вам настройки (обязательно поставьте галочку "приводить цв./сер. изобр. к ч.-б." на вкладке скан./открытие , а остальные можно убрать)->открываете pdf целиком в FineReader->жмете "распознать все" (больше ничего жать не надо при условии, что в опциях все выставлено правильно). FineReader все сделает автоматически (для конечного результата - полнотекстового поиска- этого достаточно) ->ждете (процесс распознания будет длиться быстрее, чем это делает акробат и значительно лучше + есть все языки в отличие от акробата)->далее для вас самое актуальное - сохранение - жмете сохранить в файл все страницы. выбираете тип файла-пдф. жмете "Формат" и указываете - "текст под изображением страницы" качество и разрешение картинок советую выставить на максимум->жмете сохранить и получаете ПДФ на вид такой же как исходный, однако с распознанным текстом. можно выделять, искать, менять. исходная картинка при этом останется неизменная. И замечу абсолютно автоматически и без искажений исходного отображения страниц. А вообще рекомендую перегнать в джв после распознавания в FineReader |