From b1023afbf6a77029f91c6deb01674e178cda525d Mon Sep 17 00:00:00 2001 From: Guilherme Carbonari Boneti <gcboneti@inf.ufpr.br> Date: Tue, 6 May 2025 14:15:03 +0000 Subject: [PATCH] Add new file --- .../anonimizacao.md" | 28 +++++++++++++++++++ 1 file changed, 28 insertions(+) create mode 100644 "docs/source/pages/Anonimiza\303\247\303\243o/anonimizacao.md" diff --git "a/docs/source/pages/Anonimiza\303\247\303\243o/anonimizacao.md" "b/docs/source/pages/Anonimiza\303\247\303\243o/anonimizacao.md" new file mode 100644 index 0000000..e40c426 --- /dev/null +++ "b/docs/source/pages/Anonimiza\303\247\303\243o/anonimizacao.md" @@ -0,0 +1,28 @@ +# Anonimização + +A **anonimização de dados** é o processo de proteger informações privadas ou sensÃveis ao apagar ou criptografar identificadores que conectam um indivÃduo aos dados armazenados. Por exemplo, você pode aplicar um processo de anonimização em Informações Pessoais Identificáveis (PII), como nomes, CPF e endereços, de forma que os dados sejam preservados, mas sua origem permaneça anônima. + +No entanto, mesmo após a remoção dos identificadores, invasores podem utilizar métodos de **desanonimização** para reconstituir o processo de anonimização. Como os dados geralmente passam por múltiplas fontes — algumas públicas — técnicas de desanonimização podem cruzar essas fontes e revelar informações pessoais. + +## Técnicas de Anonimização de Dados + +- **Data masking** + Oculta os dados por meio de valores alterados. É possÃvel criar uma versão espelhada do banco de dados e aplicar técnicas como embaralhamento de caracteres, criptografia e substituição de palavras ou caracteres. Por exemplo, você pode substituir um caractere por um sÃmbolo como “*†ou “xâ€. O mascaramento torna a engenharia reversa ou detecção impossÃvel. + +- **Pseudonimização** + Método de gerenciamento e desidentificação de dados que substitui identificadores privados por identificadores falsos ou pseudônimos, como substituir “João Silva†por “Carlos Souzaâ€. A pseudonimização preserva a precisão estatÃstica e a integridade dos dados, permitindo seu uso em treinamento, desenvolvimento, testes e análises, protegendo a privacidade. + +- **Generalização** + Remove deliberadamente partes dos dados para torná-los menos identificáveis. Os dados podem ser transformados em intervalos ou áreas amplas com limites apropriados. Por exemplo, pode-se remover o número da casa em um endereço, mas manter o nome da rua. O objetivo é eliminar identificadores enquanto se mantém certa precisão. + +- **Data swapping** + Também chamada de embaralhamento ou permutação, essa técnica reorganiza os valores dos atributos do conjunto de dados de forma que não correspondam aos registros originais. Trocar atributos como data de nascimento, por exemplo, pode ter maior impacto na anonimização do que trocar valores como tipo de associação. + +- **Data perturbation** + Modifica ligeiramente o conjunto de dados original com técnicas como arredondamento de números e adição de ruÃdo aleatório. O intervalo de valores deve estar proporcional à perturbação. Um valor muito pequeno pode resultar em anonimização fraca, enquanto um valor muito alto pode reduzir a utilidade dos dados. Por exemplo, usar base 5 para arredondar idades ou números de casa pode ser eficaz, mas usar base 15 pode gerar idades irreais. + +- **Dados sintéticos** + Informações geradas algoritmicamente sem conexão com eventos reais. São usados para criar conjuntos de dados artificiais ao invés de alterar ou expor o conjunto original. O processo envolve a criação de modelos estatÃsticos com base em padrões encontrados no conjunto original, utilizando desvio padrão, medianas, regressão linear ou outras técnicas estatÃsticas. + +## Referências +[1] https://www.imperva.com/learn/data-security/anonymization/ \ No newline at end of file -- GitLab