Псевдонимизация vs анонимизация: в чём разница и что выбрать
Обезличивание персональных данных — это не одно действие, а два разных режима с разными правовыми последствиями. Разбираем, когда нужна необратимая анонимизация, а когда — обратимая псевдонимизация ПДн, и как обезличить документы перед отправкой в нейросеть.
Когда говорят «обезличили документ перед отправкой в ИИ», за этой фразой скрываются два принципиально разных действия. Одно из них необратимо и выводит данные из-под закона о персональных данных. Другое обратимо, сохраняет связь с человеком и оставляет вас в роли оператора ПДн. Перепутать их — значит либо потерять возможность работать с результатом, либо нарушить требования регулятора.
Разберём, чем псевдонимизация ПДн отличается от анонимизации документов, какие правовые последствия у каждого режима и что выбрать конкретно под вашу задачу — особенно если данные уходят в нейросеть.
Обезличивание персональных данных — это что
Обезличивание персональных данных — это действия, после которых становится невозможно определить, к какому именно человеку относятся данные, без использования дополнительной информации. Ключевое слово здесь — «без дополнительной информации». От того, существует эта дополнительная информация или нет, зависит, к какому из двух режимов относится результат.
Закон выделяет два уровня глубины обработки:
- Анонимизация (полное обезличивание) — связь с человеком разрывается необратимо. Дополнительной информации, которая позволила бы восстановить личность, не существует.
- Псевдонимизация — связь с человеком разрывается в самом документе, но сохраняется отдельно — в виде ключа или таблицы соответствий. Зная этот ключ, личность можно восстановить.
Внешне оба документа выглядят одинаково: вместо «Иванов Иван Иванович» стоит «Лицо 1», вместо ИНН — «номер скрыт». Разница не в тексте, который видит читатель, а в том, существует ли где-то ключ для обратной операции.
Анонимизация: необратимо, данные перестают быть ПДн
Анонимизация — это обезличивание без возможности восстановления. Вы заменяете или удаляете все идентифицирующие сведения и не сохраняете таблицу соответствий. Восстановить исходные значения после этого нельзя — ни вам, ни кому-либо ещё.
Главное правовое следствие: после корректной анонимизации данные перестают быть персональными. К ним больше не применяются требования 152-ФЗ — потому что закон регулирует обработку информации, относящейся к конкретному человеку, а здесь такой связи уже нет.
Когда нужна именно анонимизация:
- Публикация документа — выкладываете решение, отчёт, кейс или образец договора в открытый доступ.
- Передача третьим лицам, которые не должны знать персоналии: подрядчику, аудитору, в обучающие материалы.
- Аналитика и статистика — вам важны агрегаты и закономерности, а не конкретные люди.
- Долгое хранение обезличенных копий, когда исходные ПДн вам больше не понадобятся.
Риск анонимизации зеркален её достоинству: операция необратима. Если вы анонимизировали договор, а потом выяснилось, что нужно вернуть реальные имена, — сделать это уже невозможно. Поэтому анонимизацию применяют там, где обратный путь точно не понадобится.
Псевдонимизация ПДн: обратимо по ключу, риск снижен
Псевдонимизация ПДн — это замена идентифицирующих сведений на условные обозначения с сохранением таблицы соответствий. В документе — «Сторона 1», «ООО А», «счёт №…», а отдельно хранится ключ: «Сторона 1 = Петров П. П.», «ООО А = ООО „Ромашка"» и так далее.
Что это даёт и чего не даёт:
- Риск утечки снижается. Тот, кто получит псевдонимизированный документ без ключа, не узнает персоналии.
- Операция обратима. По таблице соответствий вы в любой момент вернёте исходные значения.
- Данные остаются персональными. Раз существует ключ, личность теоретически восстановима — значит, формально это всё ещё ПДн, и требования 152-ФЗ к ним применяются.
Последний пункт — самый важный и чаще всего упускаемый. Псевдонимизация не выводит данные из-под закона. Она снижает риск и упрощает безопасную работу, но вы остаётесь оператором персональных данных и обязаны защищать сам ключ не менее тщательно, чем исходный документ.
Псевдонимизация незаменима ровно в одном сценарии: когда обезличенный результат нужно потом снова связать с реальными людьми. И самый массовый такой сценарий сегодня — работа с искусственным интеллектом.
Анонимизация vs псевдонимизация: сравнение
flowchart TD D["Персональные данные"] --> P["Псевдонимизация"] D --> A["Анонимизация"] P --> P1["Замена на псевдонимы
+ таблица ключа"] P1 --> PR["Обратимо · пока ключ есть → остаются ПДн"] A --> A1["Необратимое удаление / обобщение"] A1 --> AR["Восстановить нельзя → перестают быть ПДн"]
| Критерий | Анонимизация | Псевдонимизация |
|---|---|---|
| Обратимость | Необратима | Обратима по ключу |
| Таблица соответствий | Не сохраняется | Сохраняется |
| Статус данных после | Перестают быть ПДн | Остаются ПДн |
| Требования 152-ФЗ | Не применяются | Применяются |
| Можно вернуть оригинал | Нет | Да |
| Типичная задача | Публикация, передача, статистика | Работа с ИИ, обмен внутри процесса |
Простое правило выбора: нужен ли вам исходный текст обратно? Если да — псевдонимизация. Если нет и не понадобится — анонимизация.
Что выбрать для работы с ИИ
Когда вы отправляете договор, претензию или финансовый отчёт в нейросеть, перед вами встаёт противоречие. С одной стороны, нельзя передавать в сторонний сервис персональные данные, коммерческую тайну и реквизиты. С другой — если вырезать всё подчистую, нейросеть не поймёт документ: «удалите всё» превращает связный текст в набор пропусков.
Здесь и работает псевдонимизация. Вы заменяете чувствительные данные на устойчивые метки — «Лицо 1», «Организация А», «Дата 1» — и отправляете в ИИ именно такой текст. Структура и логика документа сохраняются: нейросеть видит, что «Лицо 1» заключает договор с «Организацией А», и корректно его анализирует. А реальные имена, ИНН и суммы в сервис не попадают.
Когда ответ получен, вы делаете обратную подстановку по таблице соответствий — и в итоговом тексте снова стоят настоящие данные. Это и есть восстановление по ключу: оно возможно только потому, что таблица соответствий была сохранена при псевдонимизации.
Для разовой публикации обезличенного текста хватит анонимизации. Но для рабочего цикла с ИИ — отправил, получил, вернул реальные данные — нужна именно обратимая псевдонимизация.
Режимы обезличивания в Анонимизаторе tirCoWork
Анонимизатор — встроенная функция tirCoWork, которая работает прямо на вашем компьютере. Документ не уходит ни на какой сервер: точное распознавание содержимого и замена чувствительных данных происходят локально. Это снимает базовый риск ещё до того, как вы решаете, что делать с текстом дальше.
В Анонимизаторе доступны оба режима под разные задачи:
- Обезличивание с таблицей соответствий (псевдонимизация) — для работы с ИИ. Анонимизатор находит в документе персональные данные, реквизиты и другие чувствительные фрагменты, заменяет их на устойчивые метки и сохраняет таблицу соответствий локально. Вы отправляете в нейросеть безопасный текст, а после получения ответа возвращаете реальные данные обратно — восстановление идёт по этой таблице.
- Обезличивание без сохранения ключа (анонимизация) — для публикации и передачи. Если результат нужно отдать наружу необратимо, таблица соответствий не сохраняется, и восстановить исходные значения нельзя.
Важно, как именно работает восстановление по ключу. Таблица соответствий — это локальный файл, который остаётся у вас на устройстве и не передаётся вместе с обезличенным документом. Отправляете вы только текст с метками; ключ для обратной подстановки нейросеть и любой получатель документа никогда не видят. Поэтому даже при псевдонимизации, где данные формально остаются ПДн, фактический риск их раскрытия минимален: всё, что связывает метки с реальными людьми, физически не покидает ваш компьютер.
Практический вывод
- Обезличивание персональных данных — это два разных режима, а не одно действие. Путать их нельзя.
- Анонимизация необратима, данные перестают быть ПДн, требования 152-ФЗ снимаются. Подходит для публикации, передачи третьим лицам и статистики.
- Псевдонимизация ПДн обратима по ключу, данные остаются персональными, риск снижен. Подходит для работы с ИИ и процессов, где нужен исходный текст обратно.
- Для нейросетей выбирайте псевдонимизацию с таблицей соответствий: смысл документа сохраняется, реальные данные не уходят в сервис, а ответ можно вернуть к нормальному виду.
- В tirCoWork оба режима работают локально. Таблица соответствий хранится только на вашем устройстве — это и обеспечивает безопасное восстановление по ключу.
Анонимизация документов и псевдонимизация ПДн — инструменты под разные цели. Выберите режим по простому вопросу «нужен ли мне оригинал обратно» — и работайте с ИИ, не нарушая требований к персональным данным.
Читайте также
- Чек-лист обезличивания перед загрузкой в ИИ — практический список, что убрать.
- Акт обезличивания персональных данных: образец — как зафиксировать применённый метод.
- Термины: псевдонимизация vs анонимизация, обезличивание, персональные данные.
Частые вопросы
Псевдонимизация — это обезличивание персональных данных?
Частично. Псевдонимизация снижает риск, но данные формально остаются персональными, потому что их можно восстановить по ключу. Полное обезличивание (анонимизация) необратимо: данные перестают быть ПДн, потому что связать их с человеком уже нельзя.
Что выбрать для работы с ИИ — псевдонимизацию или анонимизацию?
Для работы с ИИ обычно нужна псевдонимизация с таблицей соответствий: вы отправляете в нейросеть текст с заменами вроде «Лицо 1» и «ООО А», получаете ответ и подставляете реальные данные обратно. Так смысл документа сохраняется, а исходные ПДн не покидают ваш компьютер.
Что значит «восстановление по ключу»?
Это значит, что при обезличивании сохраняется таблица соответствий «реальное значение → замена». По ней можно вернуть исходный текст в ответ нейросети. Без таблицы восстановление невозможно — поэтому она хранится только локально, на вашем устройстве.
Анонимизация документов обратима?
Нет. Если вы анонимизируете документ без сохранения таблицы соответствий, восстановить исходные значения нельзя в принципе. Это нужно, когда документ публикуется, передаётся третьим лицам или используется в обезличенной статистике.
Хватит ли псевдонимизации, чтобы не нарушить 152-ФЗ?
Псевдонимизация снижает риски, но не выводит данные из-под 152-ФЗ: вы по-прежнему обрабатываете ПДн и должны соблюдать требования к их защите. Из-под закона выводит только полное обезличивание, после которого восстановить личность невозможно.
Скачать tirCoWork и обезличить документ за минуту
Обезличивание работает локально, на вашем компьютере: файлы остаются у вас. 30 дней бесплатно, карта не нужна. Тарифы от 500 ₽/мес.
Скачать tirCoWork и обезличить документ за минуту