ИИ научился раскрывать анонимность авторов в сети с точностью 67%

Новое исследование компании Энтропик и института ETH выявило критическую уязвимость интернет-анонимности. С помощью нейросетей учёные смогли сопоставлять анонимные посты с реальными профилями в LinkedIn, используя лишь стилистический анализ.

Исследователи из компании Энтропик и швейцарского института ETH применили метод перекрестного анализа текстов с платформы Hacker News и данных из социальной сети LinkedIn. Нейросеть оценивает стилистические особенности сообщений для автоматического выявления демографических признаков пользователя. На основе лингвистических паттернов система формирует цифровой портрет автора, который включает его профессию, регион проживания и круг личных интересов.

Алгоритм сопоставляет полученные характеристики с миллионами существующих аккаунтов. Ранее для идентификации автора требовались значительные временные затраты и экспертный анализ, однако развитие технологий искусственного интеллекта позволило автоматизировать процесс поиска совпадений между анонимными публикациями и профессиональными профилями.

Технология позволяет определить личность автора с точностью до 67 процентов. Высокий показатель эффективности сопровождается низкой стоимостью проведения процедур. По данным исследователей, себестоимость одной операции по идентификации пользователя варьируется от 1 до 4 долларов США.

Такой уровень затрат делает масштабный мониторинг пользователей экономически выгодным. Низкая себестоимость позволяет заинтересованным сторонам проводить массовую проверку сообщений и сопоставлять их с реальными личностями без привлечения дорогостоящих специалистов по кибербезопасности.

Автоматизация процесса снижает стоимость раскрытия личных данных до минимума, что ставит под угрозу традиционные способы сохранения анонимности. Эксперты предупреждают, что использование псевдонимов в цифровом пространстве становится бесполезным против продвинутых моделей искусственного интеллекта. Исследователи выделяют следующие ключевые угрозы и меры защиты:

  • Использование псевдонимов не обеспечивает защиту от стилистического анализа нейросетями;
  • Личные данные могут быть раскрыты в автоматическом режиме без ведома пользователя;
  • Специалисты рекомендуют пользователям пересмотреть подход к формированию цифрового следа для минимизации рисков деанонимизации.

Развитие нейросетей позволяет идентифицировать человека по косвенным признакам даже в отсутствие прямых биографических данных в тексте.

TOP

Экономика

Tags