Псевдонимизация vs анонимизация: в чём разница и что выбрать

Обезличивание персональных данных — это не одно действие, а два разных режима с разными правовыми последствиями. Разбираем, когда нужна необратимая анонимизация, а когда — обратимая псевдонимизация ПДн, и как обезличить документы перед отправкой в нейросеть.

Псевдонимизация vs анонимизация: в чём разница и что выбрать

Когда говорят «обезличили документ перед отправкой в ИИ», за этой фразой скрываются два принципиально разных действия. Одно из них необратимо и выводит данные из-под закона о персональных данных. Другое обратимо, сохраняет связь с человеком и оставляет вас в роли оператора ПДн. Перепутать их — значит либо потерять возможность работать с результатом, либо нарушить требования регулятора.

Разберём, чем псевдонимизация ПДн отличается от анонимизации документов, какие правовые последствия у каждого режима и что выбрать конкретно под вашу задачу — особенно если данные уходят в нейросеть.

Обезличивание персональных данных — это что

Обезличивание персональных данных — это действия, после которых становится невозможно определить, к какому именно человеку относятся данные, без использования дополнительной информации. Ключевое слово здесь — «без дополнительной информации». От того, существует эта дополнительная информация или нет, зависит, к какому из двух режимов относится результат.

Закон выделяет два уровня глубины обработки:

  • Анонимизация (полное обезличивание) — связь с человеком разрывается необратимо. Дополнительной информации, которая позволила бы восстановить личность, не существует.
  • Псевдонимизация — связь с человеком разрывается в самом документе, но сохраняется отдельно — в виде ключа или таблицы соответствий. Зная этот ключ, личность можно восстановить.

Внешне оба документа выглядят одинаково: вместо «Иванов Иван Иванович» стоит «Лицо 1», вместо ИНН — «номер скрыт». Разница не в тексте, который видит читатель, а в том, существует ли где-то ключ для обратной операции.

Анонимизация: необратимо, данные перестают быть ПДн

Анонимизация — это обезличивание без возможности восстановления. Вы заменяете или удаляете все идентифицирующие сведения и не сохраняете таблицу соответствий. Восстановить исходные значения после этого нельзя — ни вам, ни кому-либо ещё.

Главное правовое следствие: после корректной анонимизации данные перестают быть персональными. К ним больше не применяются требования 152-ФЗ — потому что закон регулирует обработку информации, относящейся к конкретному человеку, а здесь такой связи уже нет.

Когда нужна именно анонимизация:

  • Публикация документа — выкладываете решение, отчёт, кейс или образец договора в открытый доступ.
  • Передача третьим лицам, которые не должны знать персоналии: подрядчику, аудитору, в обучающие материалы.
  • Аналитика и статистика — вам важны агрегаты и закономерности, а не конкретные люди.
  • Долгое хранение обезличенных копий, когда исходные ПДн вам больше не понадобятся.

Риск анонимизации зеркален её достоинству: операция необратима. Если вы анонимизировали договор, а потом выяснилось, что нужно вернуть реальные имена, — сделать это уже невозможно. Поэтому анонимизацию применяют там, где обратный путь точно не понадобится.

Псевдонимизация ПДн: обратимо по ключу, риск снижен

Псевдонимизация ПДн — это замена идентифицирующих сведений на условные обозначения с сохранением таблицы соответствий. В документе — «Сторона 1», «ООО А», «счёт №…», а отдельно хранится ключ: «Сторона 1 = Петров П. П.», «ООО А = ООО „Ромашка"» и так далее.

Что это даёт и чего не даёт:

  • Риск утечки снижается. Тот, кто получит псевдонимизированный документ без ключа, не узнает персоналии.
  • Операция обратима. По таблице соответствий вы в любой момент вернёте исходные значения.
  • Данные остаются персональными. Раз существует ключ, личность теоретически восстановима — значит, формально это всё ещё ПДн, и требования 152-ФЗ к ним применяются.

Последний пункт — самый важный и чаще всего упускаемый. Псевдонимизация не выводит данные из-под закона. Она снижает риск и упрощает безопасную работу, но вы остаётесь оператором персональных данных и обязаны защищать сам ключ не менее тщательно, чем исходный документ.

Псевдонимизация незаменима ровно в одном сценарии: когда обезличенный результат нужно потом снова связать с реальными людьми. И самый массовый такой сценарий сегодня — работа с искусственным интеллектом.

Анонимизация vs псевдонимизация: сравнение

flowchart TD
  D["Персональные данные"] --> P["Псевдонимизация"]
  D --> A["Анонимизация"]
  P --> P1["Замена на псевдонимы
+ таблица ключа"] P1 --> PR["Обратимо · пока ключ есть → остаются ПДн"] A --> A1["Необратимое удаление / обобщение"] A1 --> AR["Восстановить нельзя → перестают быть ПДн"]
Критерий Анонимизация Псевдонимизация
Обратимость Необратима Обратима по ключу
Таблица соответствий Не сохраняется Сохраняется
Статус данных после Перестают быть ПДн Остаются ПДн
Требования 152-ФЗ Не применяются Применяются
Можно вернуть оригинал Нет Да
Типичная задача Публикация, передача, статистика Работа с ИИ, обмен внутри процесса

Простое правило выбора: нужен ли вам исходный текст обратно? Если да — псевдонимизация. Если нет и не понадобится — анонимизация.

Что выбрать для работы с ИИ

Когда вы отправляете договор, претензию или финансовый отчёт в нейросеть, перед вами встаёт противоречие. С одной стороны, нельзя передавать в сторонний сервис персональные данные, коммерческую тайну и реквизиты. С другой — если вырезать всё подчистую, нейросеть не поймёт документ: «удалите всё» превращает связный текст в набор пропусков.

Здесь и работает псевдонимизация. Вы заменяете чувствительные данные на устойчивые метки — «Лицо 1», «Организация А», «Дата 1» — и отправляете в ИИ именно такой текст. Структура и логика документа сохраняются: нейросеть видит, что «Лицо 1» заключает договор с «Организацией А», и корректно его анализирует. А реальные имена, ИНН и суммы в сервис не попадают.

Когда ответ получен, вы делаете обратную подстановку по таблице соответствий — и в итоговом тексте снова стоят настоящие данные. Это и есть восстановление по ключу: оно возможно только потому, что таблица соответствий была сохранена при псевдонимизации.

Для разовой публикации обезличенного текста хватит анонимизации. Но для рабочего цикла с ИИ — отправил, получил, вернул реальные данные — нужна именно обратимая псевдонимизация.

Режимы обезличивания в Анонимизаторе tirCoWork

Анонимизатор — встроенная функция tirCoWork, которая работает прямо на вашем компьютере. Документ не уходит ни на какой сервер: точное распознавание содержимого и замена чувствительных данных происходят локально. Это снимает базовый риск ещё до того, как вы решаете, что делать с текстом дальше.

В Анонимизаторе доступны оба режима под разные задачи:

  • Обезличивание с таблицей соответствий (псевдонимизация) — для работы с ИИ. Анонимизатор находит в документе персональные данные, реквизиты и другие чувствительные фрагменты, заменяет их на устойчивые метки и сохраняет таблицу соответствий локально. Вы отправляете в нейросеть безопасный текст, а после получения ответа возвращаете реальные данные обратно — восстановление идёт по этой таблице.
  • Обезличивание без сохранения ключа (анонимизация) — для публикации и передачи. Если результат нужно отдать наружу необратимо, таблица соответствий не сохраняется, и восстановить исходные значения нельзя.

Важно, как именно работает восстановление по ключу. Таблица соответствий — это локальный файл, который остаётся у вас на устройстве и не передаётся вместе с обезличенным документом. Отправляете вы только текст с метками; ключ для обратной подстановки нейросеть и любой получатель документа никогда не видят. Поэтому даже при псевдонимизации, где данные формально остаются ПДн, фактический риск их раскрытия минимален: всё, что связывает метки с реальными людьми, физически не покидает ваш компьютер.

Практический вывод

  • Обезличивание персональных данных — это два разных режима, а не одно действие. Путать их нельзя.
  • Анонимизация необратима, данные перестают быть ПДн, требования 152-ФЗ снимаются. Подходит для публикации, передачи третьим лицам и статистики.
  • Псевдонимизация ПДн обратима по ключу, данные остаются персональными, риск снижен. Подходит для работы с ИИ и процессов, где нужен исходный текст обратно.
  • Для нейросетей выбирайте псевдонимизацию с таблицей соответствий: смысл документа сохраняется, реальные данные не уходят в сервис, а ответ можно вернуть к нормальному виду.
  • В tirCoWork оба режима работают локально. Таблица соответствий хранится только на вашем устройстве — это и обеспечивает безопасное восстановление по ключу.

Анонимизация документов и псевдонимизация ПДн — инструменты под разные цели. Выберите режим по простому вопросу «нужен ли мне оригинал обратно» — и работайте с ИИ, не нарушая требований к персональным данным.

Читайте также

Частые вопросы

Псевдонимизация — это обезличивание персональных данных?

Частично. Псевдонимизация снижает риск, но данные формально остаются персональными, потому что их можно восстановить по ключу. Полное обезличивание (анонимизация) необратимо: данные перестают быть ПДн, потому что связать их с человеком уже нельзя.

Что выбрать для работы с ИИ — псевдонимизацию или анонимизацию?

Для работы с ИИ обычно нужна псевдонимизация с таблицей соответствий: вы отправляете в нейросеть текст с заменами вроде «Лицо 1» и «ООО А», получаете ответ и подставляете реальные данные обратно. Так смысл документа сохраняется, а исходные ПДн не покидают ваш компьютер.

Что значит «восстановление по ключу»?

Это значит, что при обезличивании сохраняется таблица соответствий «реальное значение → замена». По ней можно вернуть исходный текст в ответ нейросети. Без таблицы восстановление невозможно — поэтому она хранится только локально, на вашем устройстве.

Анонимизация документов обратима?

Нет. Если вы анонимизируете документ без сохранения таблицы соответствий, восстановить исходные значения нельзя в принципе. Это нужно, когда документ публикуется, передаётся третьим лицам или используется в обезличенной статистике.

Хватит ли псевдонимизации, чтобы не нарушить 152-ФЗ?

Псевдонимизация снижает риски, но не выводит данные из-под 152-ФЗ: вы по-прежнему обрабатываете ПДн и должны соблюдать требования к их защите. Из-под закона выводит только полное обезличивание, после которого восстановить личность невозможно.

Скачать tirCoWork и обезличить документ за минуту

Обезличивание работает локально, на вашем компьютере: файлы остаются у вас. 30 дней бесплатно, карта не нужна. Тарифы от 500 ₽/мес.

Скачать tirCoWork и обезличить документ за минуту

Читайте также