Пикселизация больше не защитит информацию на изображениях — появился алгоритм, способный восстановить картинку
Многие пользователи в интернете для скрытия конфиденциальной информации на видеороликах и фотографиях пользуются пикселизацией (сильное снижение разрешения). Однако теперь этот способ будет малоэффективен — в сети появился алгоритм, который восстанавливает пиксилизированный текст на изображениях.
Разработчик с ником Beurtschipper опубликовал на GitHub утилиту дешифровки изображений под названием Depix, написанную на Python.
Фильтр пикселизации работает следующим образом: изображение делится на блоки нужного размера, в каждом из них определяется основной цвет (среднее значение от всех оттенков блока), после чего квадрат заливается сплошным цветом. Что очень важно, одинаковые элементы даже на разных изображениях будут пикселизироваться одинаково.
Алгоритм Depix использует как раз этот принцип — в программу загружается пикселизированное изображение (пока, это работает только с текстом) и алфавит в виде Последовательности де Брёйна с теми же настройками шрифта, что и в пикселизированном фрагменте. К настройкам шрифта относится размер, цвет, сам шрифт, а также цветовая модель HSL (тон, насыщенность и светлота).
После этого алгоритм разбивает на пиксели загруженный в него алфавит и начинает искать совпадения в блоках первоначального пикселизированного изображения, чтобы найти подходящий символ.
Подбор будет завершён, только когда не останется совпадений между двумя картинками. Результат будет экспортирован в формате изображения в «output.png».
Для того, чтобы воспользоваться алгоритмом, необходимо скачать на компьютер Python, загрузить Depix с GitHub, сделать скриншот пикселизированного элемента, который нужно расшифровать. Сгенерировать Последовательность де Брёйна на специальном сайте и создать из неё текстовый файл с настройками шрифта, которые могут соответствовать пикселизированному изображению. После этого сделать скриншот текстового документа с Последовательностью де Брёйна и запустить в Python соответствующий код.
В своей статье, где разработчик подробно разобрал работу алгоритма, он отмечает, что ранее подобных утилит в свободном доступе не существовало. А для безопасности стоит полностью удалять конфиденциальную информацию с изображений и видеороликов, так как алгоритмы не стоят на месте.