A anonimização é uma técnica de processamento de dados a qual remove ou modifica informações que possam identificar uma pessoa e cujo resultado são dados que não podem ser associados a nenhum indivíduo específico. A estratégia tem por objetivo oferecer mais proteção ao sigilo das informações pessoais e está alinhada à Lei Geral de Proteção de Dados Pessoais (LGPD). 

A tecnologia, chamada Masker e implementada na Europa para proteger os dados das administrações públicas da União Europeia, já está no Brasil.  “O sistema usa inteligência artificial e aprendizagem de máquinas para anonimizar dados estruturados e não estruturados. Para dados estruturados, a plataforma é compatível com todos os bancos comercialmente disponíveis. O diferencial dessa solução é oferecer anonimato personalizado de dados não estruturados (docx, pdf, xlsx, pptx). Ou seja, textos nos quais a tecnologia precisa encontrar nomes de pessoas, endereços, posições escondidas, nomes de departamento, entre outros, para que as informações compartilhadas pelas empresas sobre pessoas sejam completamente confidenciais”, explica Manuel Herranz, CEO da empresa responsável pela tecnologia.

Ele revela também que ela fornece soluções que permitem às administrações públicas e empresas aproveitar o potencial de seus dados completos para criar os específicos de treinamento voltados a sistemas de inteligência artificial, extrair informações quando entidades nomeadas são identificadas, entre outras ações relevantes. “Alguns dos clientes utilizam a anonimização não apenas para cumprir as normas de segurança, mas também como filtros de verificação a fim de garantir que certas entidades ou pessoas sejam mencionadas em documentos (ou não mencionadas de forma alguma), para obter estatísticas sobre pessoas, lugares, números e departamentos ou organizações discriminadas, entre outras informações importantes”, afirma Herranz.

Ele informa também que a utilidade da anonimização pelo sistema é dupla. “Cito como primeira o fato de que são identificadas informações úteis para a extração de conhecimento com classificação de dados subsequentes ou apenas para a obtenção de informações. A segunda é uma plataforma de anonimização multilíngue, de código aberto e segura para o benefício de organizações financeiras, instituições de saúde e instituições públicas”, finaliza Herranz.