Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов (часть 1)

Модерирует : gyra, Maz

Maz (05-04-2025 09:00): Редактирование PDF файлов (часть 2)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

Skyer

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Редактирование PDF файлов

В этой теме обсуждается редактирование (обработка) PDF файлов, которые бывают трех типов:
- "True" or Real PDF - "настоящий" PDF с векторными текстом и графикой, возможны вставки растра
- Scanned PDF - растровая графика (скан или фото), помещенная в контейнер PDF
- Searchable PDF - растровая (скан или фото) графика с текстовым слоем
Подробнее о типах PDF: Types of PDFs, The 3 Types of PDFs You Need to Know About




Решение типичных задач по редактированию PDF

Обрезать страницы - Acrobat Pro (main app), QIP*/Imposal(plugins), VeryPDF Advanced PDF Page Cut
Разрезать страницы на части - VeryPDF Advanced PDF Page Crop, A-PDF Cut
Склеить страницы между собой - VeryPDF PDF Stitch, Acrobat Pro + QIP* or Imposal
Удалить или редактировать метаданные - BeCyPDFMetaEdit, Adept PDF Layout Changer
Изменить размеры страницы - Acrobat Pro + Evermap AutoPagex , A-PDF Page Master, Neevia PDFtoolbox,  
Измененить/исправить размер страниц с масштабированием содержимого [?]
Изменить размеры страницы, изменить масштаб контента, сдвинуть контент, замаскировать часть страницы и многое другое - Acrobat Pro + Evermap AutoPagex
Исправить наклон страниц -  Acrobat Pro + Evermap AutoPagex/ISI Toolbox, A-PDF Deskew, A-PDF Scan Optimizer  
Наложить PDF на PDF, страницу поверх страницы (Overlay) [?]
О технологии MRC с примерами - 1, 2 [?]
Работа с изображениями (подрезка, масштаб, сжать/растянуть) - Inkscape
Преобразование изображений, текста в оттенки серого или в ч/б - A-PDF to Black White или Acrobat Pro + Quite A Box Of Tricks/ISI Toolbox
Извлечение растровых изображений из PDF [?]
Заменить/удалить текст (batch есть), в т.ч. кириллицу (не панацея!) - PDF Replacer
Удалить текст без замены, в т.ч. кириллицу - PDF Text Deleter
Удалить растровые ватермарки - PDF Watermark Remover или PDF Logo Remover, в сложных случаях - Foxit PDF Editor с макросом, Acrobat Pro + Preflight, CallasPDF Toolbox
Удаление любых ватермарков - We PDF Watermark Remover
Как/чем узнать Свойства растровых изображений в PDF: битность, цвет, dpi/ppi, разрешение px, формат сжатия, размер mm, наличие маски и т.д. - 1 [?], 2 [?]
Редактировать текст - PDF-XChange Editor [?], Acrobat Pro, FineReader 14 (не OCR-модуль) и новее, Infix PDF Editor, SoftMaker FlexiPDF, Foxit PDF Editor, PixelPlanet PdfEditor
Удалить или заменить часть текста или текстовые ватермарки - Acrobat Pro, A-PDF Text Replace
Конвертация PDF таблиц в Excel - PDF2XL (da best!)
Заменить цветное векторное изображение на серое - Acrobat Pro + Preflight
Растровый редактор и манипуляции с изображениями в PDF - Foxit PDF Editor и Acrobat Pro + ImageWorks из Crackerjack
Удалить/заменить/создать текстовый слой в PDF файле с помощью Acrobat Pro [?]
Растеризовать pdf - Digitzone PDF Converters
Один из вариантов решения проблем с кракозябрами: видео (зеркало)
* - Quite Imposing Plus
 
 
Если вы задаете вопрос по поводу проблем с PDF файлами, обязательно выкладывайте небольшой пример (только не сотни метров!) такого файла. Это упростит задачу для желающих вам помочь и сделает обсуждение предметным.

Всего записей: 122 | Зарегистр. 01-06-2002 | Отправлено: 03:40 13-11-2005 | Исправлено: 73, 07:30 20-03-2025
luxor



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
slava_kry
Благодарю! Но я не совсем понял связку:
редактировать через Акробат -> Фотошоп, меню "Редактировать PDF"
 
если отдельно: Фотошоп, меню "Редактировать PDF" - это понятно.
Спасибо.

Всего записей: 1819 | Зарегистр. 19-10-2004 | Отправлено: 16:45 03-02-2025
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
luxor
В Акробате выбираете "Редактировать", выбираете в меню "стрелочку", тыкаете на рисунок, нажимаете правую клавишу, идёте в меню вниз до "Редактировать с помощью..." и выбираете Шоп. Рисунок открывается в Шопе. После редактирования записываете, закрываете Шоп и в Акробате получаете обновлённый рисунок.

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4323 | Зарегистр. 18-09-2003 | Отправлено: 19:35 04-02-2025
luxor



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
slava_kry
Спасибо большое! Разобрался. Теперь получилось.  
 
Проблема была в том, что Шоп у меня порташка и его не было в "Редактировать с помощью"
А если выставить его в установках "Редакторы по умолчанию" всё равно результат 0.
 

Всего записей: 1819 | Зарегистр. 19-10-2004 | Отправлено: 23:23 04-02-2025
snch

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Пробовал разный софт для конвертации SVG в PDF. Исходником взял книжку "Коломиец А. В., Сафонов А. А. Концепции современного естествознания. Астрономия (2021, Юрайт)", которая качается с Libgen в виде россыпи SVG-файлов. Часть из них, как стало понятно в дальнейшем, какая-то кривая/битая.
 
Помимо Orpalis PDF Reducer, советованного ранее [?], который выдает хороший результат, для Windows имеется еще одна программа с GUI — Yeslogic Prince (https://www.princexml.com/download/). Но у нее качество работы ниже: спотыкается на многих изображениях внтури SVG, и страницу конвертирует не полностью.
 
Та же проблема у CLI-утилиты RSVG-Convert. ChatGPT объясняет это двумя возможными причинами: "Один или несколько файлов повреждены или содержат неправильный синтаксис" и "В одном из файлов есть незакрытые теги или другие ошибки XML". Вероятно, действительно так.
 
Софтина Win2PDF с условно GUI-интефейсом (виртуальный принтер) проблемные файлы понимает гораздо лучше, но, будучи платной и недоступной через "Варезник", для меня не годится =) И неизвестно, можно ли ей скормить всю россыпь файлов сразу.
 
С ImageMagick дружбы не вышло: сначала после конвертации происходила растеризация, причем с низким разрешением, потом программа вовсе перестала создавать PDF-файлы (ну, тут согласен, у автора сего поста кривые руки).
 
BAT-файл для пакетной обработки всей кучи файлов в Inkscape создать не получилось. Зато ChatGPT сочинил Python-скрипт, который, в свою очередь, создал BAT-файл с 277 вызовами inkscape.exe — по одному на каждый SVG-файл. Качество результата конвертации, как кажется, наилучшее из опробованного. Явно не хуже Orpalis.
 
PDF24 SVG-файлы вроде бы понимает (выводит на миниатюрах содержимое страниц), но PDF создать не может, сыплет ошибками "Не удалось конвертировать файл в PDF".
 
В общем, задача — арифмомоид (c), даже непонятно, почему такие сложности, ведь PDF-редакторы принимают "на вход" множество разнообразных форматов.

Всего записей: 87 | Зарегистр. 11-08-2006 | Отправлено: 22:59 19-02-2025 | Исправлено: snch, 23:01 19-02-2025
esys

Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Почему SVG после перевода в PDF тяжелые, хотя это вроде бы вектор?
 
Добавлено:

Цитата:
Зато ChatGPT сочинил Python-скрипт, который, в свою очередь, создал BAT-файл с 277 вызовами inkscape.exe  

Каждый СВГ-файл открывается инет-эксплорером и печатается в на ПДФ принтере, нельзя ли аналогично 277 файлов напечатать?

Всего записей: 562 | Зарегистр. 22-06-2016 | Отправлено: 23:29 19-02-2025 | Исправлено: esys, 23:33 19-02-2025
snch

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
2esys
 
Хотелось бы, чтобы железный болван хотя бы немного помогал в работе, а не издевался над пользователем =))

Всего записей: 87 | Зарегистр. 11-08-2006 | Отправлено: 23:37 19-02-2025 | Исправлено: snch, 23:37 19-02-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
snch
почему такие сложности

свежий формат.
 
побаловался с конверсией этой книги. да, пять файлов настолько кривые что их никакая прога не жует. из тех что я попробовал. зато их можно руками править.

Всего записей: 3514 | Зарегистр. 15-07-2010 | Отправлено: 09:08 20-02-2025
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral
А можно мне кривых файлов!?
Тоже побалуюсь.
 
Добавлено:

Цитата:
Почему SVG после перевода в PDF тяжелые, хотя это вроде бы вектор?

Потому что текст и формат такой.
Через иллюстратор конвертил - ПДФ больше в 6 раз.

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4323 | Зарегистр. 18-09-2003 | Отправлено: 09:12 20-02-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
slava_kry
А можно мне кривых файлов!?

на фтп кину.
 
upd
кинул.
судя по ошибке в MSEdge, и просмотру в notepad++, просто заголовка нет. но попытка втупую взять заголовок от соседнего файла не привела к успеху, шрифт криво размещает или картинку не показывает.
 
upd2
 
оффтоп
в вышеупомянутой книге Коломийца нет вкладки с рисунками.

Всего записей: 3514 | Зарегистр. 15-07-2010 | Отправлено: 10:14 20-02-2025 | Исправлено: TelecomUral, 12:16 20-02-2025
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Orpalis PDF Reducer, как и другие программы этой компании, больше не выпускается. Вместо них теперь комбайн Aquaforest Autobahn DX, с размером архива 987 МБ [?]. Возможно, будет другой вариант [?].
Цитата: Convert 100+ document types to PDF and unlock data with an OCR engine powered by heuristics, mathematics, and AI.
Может среди этих 100+ форматов есть и svg.

Всего записей: 967 | Зарегистр. 04-11-2019 | Отправлено: 12:57 20-02-2025 | Исправлено: jourmager, 13:07 20-02-2025
sharlatanat



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите пожалуйста самое лучшее решение по сжатию с сохранением качества PDF.

----------
©

Всего записей: 1311 | Зарегистр. 24-02-2006 | Отправлено: 17:42 20-02-2025
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
sharlatanat
PDF - это просто контейнер.
Ваш вопрос не понятен.
Опишите подробно какая задача у вас стоит.

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4323 | Зарегистр. 18-09-2003 | Отправлено: 17:46 20-02-2025
sharlatanat



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
slava_kry

Цитата:
Опишите подробно какая задача у вас стоит.

Есть документы PDF на сотни страниц фотокопий с газет, журналов, и книг. В основном текст, хотя попадаются и ч/б рисунки. При сборке PDF-XChange этих страниц в один документ получается огромный размер, до нескольких гигабайт. При сжатии Orpalis PDF Reducer (особенно при включении опции MRC) иногда на некоторых страницах появляются не читаемые места, как будто смазанные, хотя сжимает очень хорошо, и те страницы, которые не портятся — приемлемого качества. Задача — читаемые текст и не слишком покорёженные изображения, при как можно меньшем размере файла.

----------
©

Всего записей: 1311 | Зарегистр. 24-02-2006 | Отправлено: 17:52 20-02-2025 | Исправлено: sharlatanat, 17:53 20-02-2025
slava_kry

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В таком ключе нужно понять каковы оригиналы.
 
Дайте, пожалуйста, страниц по 10 или сканов или PDF'ок условно "хорошего" и условно "плохого" качества и на какой размер вы рассчитываете.
 
Конечно, мы подразумеваем, что предварительная обработка оригиналов не предусмотрена - сжимаем "как есть"... так?
 
Добавлено:

Цитата:
При сжатии Orpalis PDF Reducer (особенно при включении опции MRC) иногда на некоторых страницах появляются не читаемые места, как будто смазанные, хотя сжимает очень хорошо, и те страницы, которые не портятся — приемлемого качества

Может просто уменьшить сжатие?!

----------
Вы выказываете себя праведниками пред людьми, но Бог знает сердца ваши, ибо что высоко у людей, то мерзость пред Богом

Всего записей: 4323 | Зарегистр. 18-09-2003 | Отправлено: 18:03 20-02-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
sharlatanat
Задача — читаемые текст и не слишком покорёженные изображения, при как можно меньшем размере файла.

ни одна программа не сумеет определить приемлемое именно вам максимальное качество сжатия. Не бывает таких настроек в софте: "сделай мне хорошо".
 
Поэтому вам придется глазами отсматривать результат и циклически повышать индивидуальные параметры компрессии каждой страницы. Типа, всё начать с 25% условного параметра качества, а те фотокопии, что оказались чрезмерно плохи, повторно пережимать с 26,27 и так далее.
 
ИМХО. Нахрен никому не нужная задача. Занимался подобным в районе 2000го года, когда ж.Моделист-Конструктор сканировал и запихивал на болванки. Одурел через полтора месяца ночных посиделок. А выигрыш - полтора CD.

Всего записей: 3514 | Зарегистр. 15-07-2010 | Отправлено: 18:28 20-02-2025
MBK2

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
sharlatanat
Вы, фактически, сами ответили на свой вопрос. При разносортном содержимом (разные параметры сканирования, сжатия, распознавания и т.д.) жать скопом все под одни настройки - значит гарантированно угробить определенную часть информации. А разбираться индивидуально с каждым источником - задача муторная и совершенно безблагодатная, особенно, в наш век быстрых носителей информации огромного обьема.

Всего записей: 5279 | Зарегистр. 18-09-2018 | Отправлено: 18:39 20-02-2025
TelecomUral

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
а нельзя, кстати, сочинить математику, сравнивающую результат и оригинал на отклонение? какой-нибудь интегральный параметр утрат рассчитать. (я те официальные доки-стандарты про оцифровку так и не изучил.)

Всего записей: 3514 | Зарегистр. 15-07-2010 | Отправлено: 19:21 20-02-2025
MBK2

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
результат и оригинал на отклонение?

Внутри pdf дохрена разнотипных обьектов и оптимизация их корежит по разному. Самое простое - необратимое пережатие JPEG с бОльшими потерями, и то сложно поддается качественному анализу. А там используются приемчики похлеще - скажем, конвертация изображения в меньшую битность, indexed или, вообще, разбиение растра на фрагменты разной цветности, вплоть до нарезки прозрачностей на полоски. Ну и вектора легко может "оптимизировать" до потери узлов или вообще растрирования. Такое анализировать - очень сообразительный ИИ нужен, как минимум.

Всего записей: 5279 | Зарегистр. 18-09-2018 | Отправлено: 20:49 20-02-2025
zvezdochiot



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
MBK2 say:
Цитата:
Такое анализировать - очень сообразительный ИИ нужен, как минимум.

Или использовать естественный интеллект,  а в качестве инструмента  для него Diffpdf.
 

Всего записей: 879 | Зарегистр. 18-05-2023 | Отправлено: 20:59 20-02-2025
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
TelecomUral

Цитата:
а нельзя, кстати, сочинить математику, сравнивающую результат и оригинал на отклонение? какой-нибудь интегральный параметр утрат рассчитать

Уже. Ключевые слова SNR, PSNR, SSIM, VIFP1. Смотреть для начала jpeg-recompress, я ещё наткнулся на такую статью. Материалов по этой теме я видел множество, но за давностью лет уже не помню что и как. Т.к. оказалось практически бесполезным для меня. Суета всё это. Как вы написали "выигрыш - полтора CD"
 
sharlatanat

Цитата:
При сборке PDF-XChange этих страниц в один документ получается огромный размер, до нескольких гигабайт.

По моему опыту такое бывает в 2 случаях: когда этих страниц несколько тысяч или когда исходные страницы (например в tiff, png) внутри pdf преобразуются в беспотерьную картинку типа zip. Какой случай у вас?

Цитата:
Задача — читаемые текст и не слишком покорёженные изображения, при как можно меньшем размере файла.

jpg, medium quality, 300 dpi. Если оригиналы посредственные, то high 600 dpi.
Ваших-то оригиналов никто не видел, поэтому давать точные рекомендации нельзя.
И ещё - без MRC.
И ещё - PDF-XChange Editor всё это делает автоматом при сборке.
 

Всего записей: 967 | Зарегистр. 04-11-2019 | Отправлено: 01:32 21-02-2025
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » Редактирование PDF файлов (часть 1)
Maz (05-04-2025 09:00): Редактирование PDF файлов (часть 2)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2025

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru