Найбільш часта завдання, з якою доводиться стикатися - витягнути з документа в форматі pdf одну або кілька сторінок. Іноді зустрічаються і більш складні завдання. Для вирішення більшості з них добре підходить програма pdftk. the PDF toolkit, що працює з консолі в майже у всіх поширених операційних системах.
Наведу кілька прикладів використання. Для об'єднання декількох файлів в один можна використовувати команди виду
pdftk a.pdf b.pdf c.pdf cat output combined.pdf
pdftk * .pdf cat output combined.pdf
Вирізати задані сторінки з документа:
pdftk A = one.pdf B = two.pdf cat A1-7 B1-5 A8 output combined.pdf
Або розрізати посторінково
pdftk mydoc.pdf burst
Більше прикладів на офсайті.
Share this:
Сподобалося це:
Навігація по публікаціям
Саша, дуже до речі, а то я тут недавно промучилася з однією цікавою книженцію, Естессно, безрезультатно, тепер буду знати. І заодно ще одне питання. Мені книгу (ту) треба зберегти в pdf, підкажи, як це простіше зробити (в розрахунку на чайника), а то мені якось не пріходілось.Зараннее вдячна.
Є кілька способів, чесних і не дуже. Наприклад, поставити Adobe Reader Pro (заплативши під $ 500 або вкравши) або встановити програму ПДФ-принтер. ПДФ-принтер Primo PDF безкоштовний. Просто встановіть програму, і в списку принтерів у вас з'явиться новий пристрій. Тепер просто відправляєте книгу на друк вибираючи не справжній принтер, а PrimoPDF. Вискочить діалогове вікно з пропозицією зробити деякі настройки ПДФ документа (їх можна не чіпати) і зберегти файл. Іноді він подглючівает, але перевстановлення глюки лікує.
Спасибі, про pyPdf не знав! У моєму випадку інтерес був саме в консолі, бо обробити треба було багато однотипних ПДФ і хотілося робити це не руками 🙂
А це там теж можна в python інтерпретаторі робити, idle або ipython, в самий раз; або програму невелику збагнути для масової обробки документів.