Анонимные данные могут идентифицировать пользователя

Стандартной политикой компаний, занимающихся обработкой статистических данных, является анонимность пользователей, но как оказалось, эти анонимные данные позволяют легко идентифицировать личность.

Исследователи из Стэндфордского и Принцетонского университетов успешно идентифицировали более 70% интернет-пользователей, сравнивая их веб-историю с открытой информацией из социальных сетей. Это исследование прекрасно демонстрирует простоту установления привязки данных к конкретному человеку.

Big Data

Исследование получило название «Деанонимизация данных интернет сёрфинга с помощью социальных сетей». В нём показано, что 374 набора историй браузеров удалось привязать к их владельцам. Для этого учёные просто устанавливали связи и ссылки в Twitter и анализировали личные предпочтения пользователей, сравнивая их с историей браузера.

Установлено, что пропуская через программу деанонимизации 15 лучших результатов в выборках, удалось повторно идентифицировать 81% пользователей. При первом проходе программой удалось идентифицировать 72% людей, для чего потребовалось лишь воспользоваться Twitter. Если пользователи используют псевдонимы, то программе потребуется несколько проходов и более глубокий анализ для установления личности, но это не является большой проблемой.