Автор Тема: Идентификатор пользователя внутри PDF  (Прочитано 5493 раз)

Оффлайн stranger573

  • Мастер
  • ***
  • Сообщений: 1 567
Это и есть те самые стеги - просто смещения текста относительно друг друга по горизонтали и вертикали?
Графическим редактором это не исправить, только OCR?
Стеги — стеганография.
Не только смещения, но и межбуквенные/межстрочные интервалы, ширина символов, цвет, яркость — да и вариации любых других параметров. Хотя, больше похоже на артефакты jpg (а в png выводить и сравнивать не пробовали?).

Любой непустой дифф, особенно входных файлов уже даёт 50% вероятности. А остальные 50% могут быть просто огрехи convert, других преобразований, артефакты jpg и прочие случайные искажения. Так что — где-то 50/50. Подтвержением 100% наличия может быть только успешное декодирование (сами понимаете, задачка крайне сложная и не всегда решаемая). А вот подтверждения 100% отсутствия — априори быть не может, кроме разве что, вы сами создадите с нуля файл с похожим содержимым, т.е. наберёте руками текст, добавите похожие (нарисованные самостоятельно, а не копированные из) изображения.

Mожно в графическом редакторе с фильтрами поиграться — это повысит вероятность того, что вы что-нибудь таким образом затрёте. После OCR (или если наберёте руками), текст заново выстроится, но уже без скрытой информации. Но ведь ещё остаются графические элементы.
« Последнее редактирование: 20.03.2014 03:33:23 от stranger573 »

Оффлайн rotkart

  • Участник
  • *
  • Сообщений: 661
Хотя, больше похоже на артефакты jpg (а в png выводить и сравнивать не пробовали?).
Пробовал png, очень похоже. Дело в том, что из 15-ти страничного документа эти смещения повторяются в одинаковых местах разных вариантов, поэтому я и решил, что нашел искомое.
Я даже сделал наложение в гимпе друг на друга - нет там артефактов, четкие края, но разное геометрическое положение. Забавная гифка получилась  :-)
Подтвержением 100% наличия может быть только успешное декодирование (сами понимаете, задачка крайне сложная и не всегда решаемая).
Понимаю, но задачи такой себе не ставлю - чисто академический интерес, для общего развития.
А вот подтверждения 100% отсутствия — априори быть не может, кроме разве что, вы сами создадите с нуля файл с похожим содержимым, т.е. наберёте руками текст, добавите похожие (нарисованные самостоятельно, а не копированные из) изображения.
Теперь хотя бы понятнее стало, что угрозы о том, что даже по фотографиям КИМов можно определить, чей это КИМ - не сказка-ужастик для лохов, а возможная реальность. Даже учащимся можно показать - пусть лучше к экзаменам готовятся  ;-)
Научить нельзя, научиться можно.

Оффлайн stranger573

  • Мастер
  • ***
  • Сообщений: 1 567
...Дело в том, что из 15-ти страничного документа эти смещения повторяются в одинаковых местах разных вариантов, поэтому я и решил, что нашел искомое.
В таком случае, да, вероятность очень большая. Помимо того, то что удалось найти наверняка не всё, что-нибудь при простом сравнении можно и пропустить.

Даже учащимся можно показать - пусть лучше к экзаменам готовятся  ;-)
Тем более, что подготовка к экзаменам намного проще, чем исследование документов на наличие скрытой информации. :-)