Definindo qualidade de dados
Qualidade de dados mede o quão bem seus dados cumprem o propósito para o qual existem. Não se trata de serem “corretos” em termos absolutos. É sobre serem adequados ao uso em decisões, operações e analytics.
Um endereço de cliente é de alta qualidade se chega até o cliente. Um código de produto é de alta qualidade se seus sistemas o reconhecem. Qualidade depende do contexto.
O princípio do “adequado ao propósito”
Qualidade de dados é contextual. Um endereço de entrega precisa de precisão de rua. Uma região de marketing precisa apenas de país ou estado. Ambos podem ser “de alta qualidade” em níveis de precisão diferentes.
Ao avaliar qualidade de dados, pergunte: o que esses dados precisam fazer? Depois meça se conseguem fazer isso.
O framework das cinco dimensões
Qualidade de dados é medida em cinco dimensões principais. Esse framework foi adotado em diversos setores e é a base dos padrões ISO 8000 e DAMA.
| Dimensão | O que mede | Exemplo |
|---|---|---|
| Completude | Os dados obrigatórios estão presentes | Todos os campos obrigatórios preenchidos |
| Validade | Os dados seguem os formatos | E-mails têm formato válido |
| Unicidade | Sem registros duplicados | Um registro por cliente |
| Atualidade | Os dados estão atualizados | Informações de contato atualizadas nos últimos 90 dias |
| Consistência | Os dados são uniformes | ”USA” usado de forma consistente, não “US” ou “United States” |
Cada dimensão responde a uma pergunta específica sobre seus dados. Juntas, fornecem uma imagem completa da saúde dos dados.
Para orientação detalhada sobre cada dimensão, veja:
Padrões e frameworks do setor
ISO 8000
O padrão ISO 8000 define requisitos de qualidade de dados para a troca de master data. Estabelece princípios para precisão, completude e consistência dos dados entre organizações.
DAMA-DMBOK
O Body of Knowledge da Data Management Association (DAMA-DMBOK) define qualidade de dados como uma das onze áreas de conhecimento em gestão de dados. Ele orienta sobre medição, monitoramento e processos de melhoria.
A regra 1-10-100
Este princípio ilustra o custo crescente da baixa qualidade de dados:
| Estágio | Custo | Exemplo |
|---|---|---|
| Prevenção | US$ 1 | Validação no ponto de entrada |
| Correção | US$ 10 | Limpeza dos dados após a entrada |
| Falha | US$ 100 | Impacto de negócio de dados ruins |
Investir em qualidade de dados na origem economiza muito custo downstream.
Qualidade de dados vs conceitos relacionados
Qualidade de dados vs gestão de dados
Gestão de dados é a prática mais ampla de coletar, armazenar e manter dados. Qualidade de dados é um componente da gestão de dados, focado especificamente em adequação ao uso.
| Conceito | Escopo | Foco |
|---|---|---|
| Gestão de dados | Todas as práticas de dados | Armazenamento, acesso, segurança, ciclo de vida |
| Qualidade de dados | Adequação ao propósito | Completude, validade, unicidade, atualidade, consistência |
| Governança de dados | Políticas e propriedade | Quem é dono dos dados, quem pode alterá-los, quais regras se aplicam |
Qualidade de dados vs precisão dos dados
Precisão pergunta: este valor reflete a realidade? Qualidade pergunta: estes dados funcionam para o propósito deles?
Um endereço de e-mail pode ser válido (formato correto) mas impreciso (a pessoa não o usa mais). O DQS mede qualidade porque formato e completude podem ser automatizados. Precisão normalmente exige verificação externa.
Como a qualidade de dados é medida
Métricas quantitativas
Qualidade de dados é expressa por indicadores mensuráveis:
| Tipo de métrica | Exemplo | Cálculo |
|---|---|---|
| Percentual | Fill Rate | (Registros preenchidos / Total de registros) x 100 |
| Contagem | Duplicate Count | Número de registros com valores correspondentes |
| Pontuação | Validity Score | Média ponderada entre as validation rules |
| Proporção | Conformance Rate | Valores conformes / Total de valores |
Limites e metas
Organizações definem limites com base em requisitos de negócio:
| Nível | Limite | Caso de uso |
|---|---|---|
| Crítico | 99%+ | Campos de reporting regulatório |
| Alto | 95%+ | Dados voltados ao cliente |
| Padrão | 85%+ | Dados operacionais |
| Baixo | 70%+ | Dados históricos ou de arquivo |
Medição contínua vs pontual
A medição pontual oferece um snapshot. A medição contínua acompanha tendências e detecta a degradação cedo.
O DQS suporta as duas abordagens:
- Rode scans ad-hoc para avaliação imediata
- Agende scans recorrentes para monitoramento contínuo
Por que as organizações têm dificuldade
1. Silos de dados
Quando os dados vivem em sistemas desconectados, inconsistências surgem naturalmente. O time de vendas tem uma versão do registro do cliente. O suporte tem outra. Nenhum sabe qual está correta.
2. Erros de entrada manual
A entrada manual é propensa a erros de digitação, formatação inconsistente e informações faltando. Sem validation rules, esses erros se acumulam.
3. Sem dono claro
Quando ninguém é responsável pela qualidade de dados, ela vira problema de todos e prioridade de ninguém. A data stewardship exige atribuição explícita.
4. Falta de medição
Você não pode melhorar o que não mede. Muitas organizações assumem que seus dados são “bons o suficiente” sem estabelecer baselines ou acompanhar métricas.
5. Projetos pontuais de limpeza
Tratar qualidade de dados como projeto em vez de processo leva a melhorias temporárias que se degradam com o tempo.
O impacto no negócio
Baixa qualidade de dados afeta todas as funções:
| Função | Impacto |
|---|---|
| Marketing | Campanhas enviadas para endereços errados, gasto desperdiçado |
| Vendas | Tempo perdido com Leads duplicados, contexto perdido |
| Financeiro | Relatórios imprecisos, riscos de compliance |
| Operações | Decisões baseadas em dados defeituosos |
| AI/ML | Modelos treinados com dados ruins produzem saídas ruins |
Quantificando o custo
Pesquisas do MIT Sloan e de estudos de mercado mostram:
- Organizações perdem 15-25% da receita anual por baixa qualidade de dados
- Mais de 25% das organizações perdem mais de US$ 5 milhões por ano em problemas de dados (IBM 2025)
- Funcionários gastam até 27% do tempo corrigindo dados ruins
Conexão com prontidão para IA
A qualidade de dados tradicional (as cinco dimensões) prepara seus dados para relatórios e automação. Aplicações de IA como o Agentforce dependem dos mesmos fundamentos: registros completos, formatos válidos, valores consistentes, dados atuais e sem duplicatas.
Sobre essas cinco dimensões, o deployment de IA adiciona uma preocupação: exposição de dados sensíveis. Antes de conectar agentes de IA aos seus dados do Salesforce, você precisa saber onde vive o PII para mascará-lo ou excluí-lo.
O DQS mede tanto qualidade de dados tradicional quanto prontidão para IA em uma única plataforma:
- Cinco dimensões de qualidade de dados: Completude, Validade, Unicidade, Atualidade, Consistência
- PII Detection: Varre campos de texto em busca de dados sensíveis (SSNs, cartões de crédito, informações pessoais) antes da exposição à IA
Construindo uma prática de qualidade de dados
Uma prática eficaz exige três elementos:
1. Medição
Estabeleça baselines antes de melhorar. Saiba onde você está em cada dimensão e campo.
2. Processo
Defina fluxos para manutenção contínua dos dados:
- Validation rules no ponto de entrada
- Agendas regulares de limpeza
- Procedimentos de escalação de problemas
- Protocolos de change management
3. Cultura
Construa comprometimento em toda a organização:
- Atribua data stewards para cada domínio
- Inclua qualidade de dados em métricas de desempenho
- Comemore melhorias e compartilhe vitórias
- Torne a qualidade visível em dashboards
Começando com o DQS
O DQS oferece a base de medição para sua prática de qualidade de dados:
- Selecione as capabilities: Escolha quais dimensões medir
- Defina o escopo: Escolha os objetos e campos a analisar
- Configure os limites: Defina seus padrões de qualidade
- Rode scans: Execute a análise sobre seus dados
- Revise os resultados: Identifique problemas e priorize correções
O primeiro passo é entender seu estado atual. Faça a AI Readiness Assessment para avaliar sua maturidade em qualidade de dados em 3 minutos.
Próximos passos
- Aprofunde-se em Completude, a primeira dimensão
- Leia sobre As cinco dimensões para uma visão completa
- Aprenda sobre Preparação para Agentforce para requisitos específicos de IA
- Faça a AI Readiness Assessment para ver suas pontuações atuais