Премахване на метаданни от PDF

премахване

Тук, изглежда, е тривиална задача - премахване на метаданни от документ. Хиляди пъти експертите по параноя по информационна сигурност са давали този вид препоръка: „не забравяйте да премахнете излишната метаинформация от документи преди публикуване“. И те обясниха защо може да е необходимо (пример). В мрежата има много инструкции как да направите това за различни формати на изображения и документи, но в същото време има доста разбираема информация за такъв общ формат като PDF.

Направих малък експеримент и въз основа на резултатите съставих малка верига от инструменти и безплатни помощни програми. Това е всичко, което искам да споделя. И така, първото нещо, което беше направено, беше опит за изтриване на данни с помощта на самия Adobe Acrobat според съответните инструкции. Резултат има, но той по никакъв начин не може да се нарече задоволителен, т.к. първо, това е стрелба по врабчета от оръдие, и второ, обемът на изходния файл по някаква причина се увеличи с почти порядък.

След това сред купищата глупости беше намерена прекрасната помощна програма за Windows BeCyPDFMetaEdit, но тя уверено се справя с PDF v 1.6 и по-ниски и резултатът не е гарантиран за по-нови ревизии на формата.

Най-доброто решение, както обикновено, дойде от света на *nix и общността с отворен код. Това е пакет от помощни програми ExifTool, QPDF и Xpdf, всички от които са налични и под Windows. защото лицензите на тези помощни програми не забраняват да се разпространяват свободно без промени, тогава смело ги събрах в един архив (WINx64) със скрипт и елементарни инструкции за употреба. Накратко, разопаковате архива, поставяте pdf файла за почистване в получената папка и след това го плъзнете върху DEMETA.bat. Скриптът ще работи и вашият файл ще стане непокътнат.

Можете да помогнете и да преведетемалко средства за развитие на сайта