Testes de Software

Como Usar Dados Fictícios em Testes de Software

Usar dados reais de CPF, CNPJ ou cartão de crédito em ambientes de desenvolvimento e homologação é um risco jurídico e ético. Entenda como dados fictícios matematicamente válidos tornam os testes mais seguros, reproduzíveis e conformes com a LGPD.

Por que dados fictícios são indispensáveis em testes

Todo sistema que coleta dados de usuários — seja um e-commerce, um sistema bancário, um app de RH ou uma plataforma de saúde — precisa ser testado extensivamente antes de ir para produção. A tentação de usar dados reais é grande: eles são convenientes e representam situações verdadeiras. Mas essa prática cria riscos sérios. A LGPD (Lei 13.709/2018) proíbe o uso de dados pessoais para finalidades incompatíveis com a coleta original. Um ambiente de desenvolvimento com dados reais de clientes pode resultar em multas de até 2% do faturamento anual da empresa, limitadas a R$ 50 milhões por infração.

Além do risco jurídico, há o risco operacional: dados reais em ambientes de teste são frequentemente acessados por desenvolvedores, prestadores de serviço e ferramentas de CI/CD que não deveriam ter contato com informações pessoais. Uma vez que esses dados vazam, o dano à reputação da empresa é irreparável. Dados fictícios eliminam esses riscos: você testa com a mesma estrutura e complexidade dos dados reais, sem nenhuma exposição de pessoas físicas ou jurídicas.

O que significa 'matematicamente válido'?

Não basta gerar qualquer sequência numérica — ela precisa passar nas mesmas validações que o sistema aplica. O CPF, por exemplo, tem dois dígitos verificadores calculados pelo algoritmo de módulo 11. Se você inserir um CPF com dígitos aleatórios, o sistema de validação vai rejeitá-lo antes mesmo de você chegar ao fluxo que quer testar. O mesmo vale para CNPJ, CNH, RENAVAM, Título de Eleitor e outros documentos brasileiros.

O Help4Dev gera dados que passam por todas essas verificações algorítmicas. Um CPF gerado aqui tem a estrutura correta e dígitos verificadores válidos — ele vai passar pela camada de validação da sua aplicação, permitindo que você teste o comportamento real do sistema: persistência no banco de dados, integração com APIs externas, geração de relatórios e todos os fluxos de negócio.

Estratégias para organizar dados fictícios em projetos

Uma boa prática é criar um arquivo de fixtures ou seeds com dados fictícios fixos para os cenários mais comuns do seu sistema. Por exemplo: um CPF de pessoa física padrão, um CNPJ de empresa ativa, um cartão de crédito de cada bandeira principal. Esses dados ficam versionados no repositório e são usados de forma consistente por toda a equipe e pelos pipelines de CI/CD.

Para testes que exigem variação — como verificar se o sistema lida corretamente com múltiplos cadastros — use geradores programáticos que criem dados fictícios válidos sob demanda. Bibliotecas como Faker (disponível para Python, JavaScript, Java, Ruby) oferecem geradores de CPF e CNPJ em algumas implementações. Complementar com as ferramentas do Help4Dev para validar os dados gerados é sempre uma boa verificação adicional.

Casos de uso mais comuns

Registro de usuários: formulários que exigem CPF, RG ou CNH precisam ser testados com documentos válidos de diferentes estados. E-commerce: fluxos de checkout que validam CPF do comprador e CNPJ da empresa emissora da nota fiscal. Sistemas de RH: cadastro de colaboradores com PIS/PASEP, CPF e dados de carteira de trabalho. Saúde: plataformas que emitem AIH (Autorização de Internação Hospitalar) precisam de números válidos para testar integrações com o DATASUS.

Em todos esses casos, o Help4Dev oferece geradores específicos para cada tipo de documento, com opções de máscara (com ou sem pontos e traços) e rotação automática para gerar múltiplos valores rapidamente durante sessões de teste manual.

Integrando dados fictícios em pipelines de automação

Frameworks de teste como Cypress, Playwright, Selenium e JUnit permitem parametrizar casos de teste com múltiplos conjuntos de dados. Uma abordagem eficiente é manter um arquivo JSON ou CSV com 10 a 20 CPFs e CNPJs fictícios válidos e iterar sobre eles nos testes de cadastro e validação. Isso aumenta a cobertura sem aumentar a complexidade dos scripts.

Para automações mais sofisticadas, considere criar um microsserviço interno ou uma função utilitária que implemente os algoritmos de geração de CPF e CNPJ na linguagem do seu projeto. Os algoritmos são públicos e de fácil implementação — nosso artigo sobre o algoritmo do CPF e CNPJ explica o passo a passo completo.