Skip to main content

O que é qualidade de dados?

Aprenda o que significa qualidade de dados, como medi-la e por que ela determina o sucesso dos seus relatórios, automação e iniciativas de IA.

Definindo qualidade de dados

Qualidade de dados mede o quão bem seus dados cumprem o propósito para o qual existem. Não se trata de serem “corretos” em termos absolutos. É sobre serem adequados ao uso em decisões, operações e analytics.

Um endereço de cliente é de alta qualidade se chega até o cliente. Um código de produto é de alta qualidade se seus sistemas o reconhecem. Qualidade depende do contexto.

O princípio do “adequado ao propósito”

Qualidade de dados é contextual. Um endereço de entrega precisa de precisão de rua. Uma região de marketing precisa apenas de país ou estado. Ambos podem ser “de alta qualidade” em níveis de precisão diferentes.

Ao avaliar qualidade de dados, pergunte: o que esses dados precisam fazer? Depois meça se conseguem fazer isso.

O framework das cinco dimensões

Qualidade de dados é medida em cinco dimensões principais. Esse framework foi adotado em diversos setores e é a base dos padrões ISO 8000 e DAMA.

DimensãoO que medeExemplo
CompletudeOs dados obrigatórios estão presentesTodos os campos obrigatórios preenchidos
ValidadeOs dados seguem os formatosE-mails têm formato válido
UnicidadeSem registros duplicadosUm registro por cliente
AtualidadeOs dados estão atualizadosInformações de contato atualizadas nos últimos 90 dias
ConsistênciaOs dados são uniformes”USA” usado de forma consistente, não “US” ou “United States”

Cada dimensão responde a uma pergunta específica sobre seus dados. Juntas, fornecem uma imagem completa da saúde dos dados.

Para orientação detalhada sobre cada dimensão, veja:

Padrões e frameworks do setor

ISO 8000

O padrão ISO 8000 define requisitos de qualidade de dados para a troca de master data. Estabelece princípios para precisão, completude e consistência dos dados entre organizações.

DAMA-DMBOK

O Body of Knowledge da Data Management Association (DAMA-DMBOK) define qualidade de dados como uma das onze áreas de conhecimento em gestão de dados. Ele orienta sobre medição, monitoramento e processos de melhoria.

A regra 1-10-100

Este princípio ilustra o custo crescente da baixa qualidade de dados:

EstágioCustoExemplo
PrevençãoUS$ 1Validação no ponto de entrada
CorreçãoUS$ 10Limpeza dos dados após a entrada
FalhaUS$ 100Impacto de negócio de dados ruins

Investir em qualidade de dados na origem economiza muito custo downstream.

Qualidade de dados vs conceitos relacionados

Qualidade de dados vs gestão de dados

Gestão de dados é a prática mais ampla de coletar, armazenar e manter dados. Qualidade de dados é um componente da gestão de dados, focado especificamente em adequação ao uso.

ConceitoEscopoFoco
Gestão de dadosTodas as práticas de dadosArmazenamento, acesso, segurança, ciclo de vida
Qualidade de dadosAdequação ao propósitoCompletude, validade, unicidade, atualidade, consistência
Governança de dadosPolíticas e propriedadeQuem é dono dos dados, quem pode alterá-los, quais regras se aplicam

Qualidade de dados vs precisão dos dados

Precisão pergunta: este valor reflete a realidade? Qualidade pergunta: estes dados funcionam para o propósito deles?

Um endereço de e-mail pode ser válido (formato correto) mas impreciso (a pessoa não o usa mais). O DQS mede qualidade porque formato e completude podem ser automatizados. Precisão normalmente exige verificação externa.

Como a qualidade de dados é medida

Métricas quantitativas

Qualidade de dados é expressa por indicadores mensuráveis:

Tipo de métricaExemploCálculo
PercentualFill Rate(Registros preenchidos / Total de registros) x 100
ContagemDuplicate CountNúmero de registros com valores correspondentes
PontuaçãoValidity ScoreMédia ponderada entre as validation rules
ProporçãoConformance RateValores conformes / Total de valores

Limites e metas

Organizações definem limites com base em requisitos de negócio:

NívelLimiteCaso de uso
Crítico99%+Campos de reporting regulatório
Alto95%+Dados voltados ao cliente
Padrão85%+Dados operacionais
Baixo70%+Dados históricos ou de arquivo

Medição contínua vs pontual

A medição pontual oferece um snapshot. A medição contínua acompanha tendências e detecta a degradação cedo.

O DQS suporta as duas abordagens:

  • Rode scans ad-hoc para avaliação imediata
  • Agende scans recorrentes para monitoramento contínuo

Por que as organizações têm dificuldade

1. Silos de dados

Quando os dados vivem em sistemas desconectados, inconsistências surgem naturalmente. O time de vendas tem uma versão do registro do cliente. O suporte tem outra. Nenhum sabe qual está correta.

2. Erros de entrada manual

A entrada manual é propensa a erros de digitação, formatação inconsistente e informações faltando. Sem validation rules, esses erros se acumulam.

3. Sem dono claro

Quando ninguém é responsável pela qualidade de dados, ela vira problema de todos e prioridade de ninguém. A data stewardship exige atribuição explícita.

4. Falta de medição

Você não pode melhorar o que não mede. Muitas organizações assumem que seus dados são “bons o suficiente” sem estabelecer baselines ou acompanhar métricas.

5. Projetos pontuais de limpeza

Tratar qualidade de dados como projeto em vez de processo leva a melhorias temporárias que se degradam com o tempo.

O impacto no negócio

Baixa qualidade de dados afeta todas as funções:

FunçãoImpacto
MarketingCampanhas enviadas para endereços errados, gasto desperdiçado
VendasTempo perdido com Leads duplicados, contexto perdido
FinanceiroRelatórios imprecisos, riscos de compliance
OperaçõesDecisões baseadas em dados defeituosos
AI/MLModelos treinados com dados ruins produzem saídas ruins

Quantificando o custo

Pesquisas do MIT Sloan e de estudos de mercado mostram:

  • Organizações perdem 15-25% da receita anual por baixa qualidade de dados
  • Mais de 25% das organizações perdem mais de US$ 5 milhões por ano em problemas de dados (IBM 2025)
  • Funcionários gastam até 27% do tempo corrigindo dados ruins

Conexão com prontidão para IA

A qualidade de dados tradicional (as cinco dimensões) prepara seus dados para relatórios e automação. Aplicações de IA como o Agentforce dependem dos mesmos fundamentos: registros completos, formatos válidos, valores consistentes, dados atuais e sem duplicatas.

Sobre essas cinco dimensões, o deployment de IA adiciona uma preocupação: exposição de dados sensíveis. Antes de conectar agentes de IA aos seus dados do Salesforce, você precisa saber onde vive o PII para mascará-lo ou excluí-lo.

O DQS mede tanto qualidade de dados tradicional quanto prontidão para IA em uma única plataforma:

  • Cinco dimensões de qualidade de dados: Completude, Validade, Unicidade, Atualidade, Consistência
  • PII Detection: Varre campos de texto em busca de dados sensíveis (SSNs, cartões de crédito, informações pessoais) antes da exposição à IA

Construindo uma prática de qualidade de dados

Uma prática eficaz exige três elementos:

1. Medição

Estabeleça baselines antes de melhorar. Saiba onde você está em cada dimensão e campo.

2. Processo

Defina fluxos para manutenção contínua dos dados:

  • Validation rules no ponto de entrada
  • Agendas regulares de limpeza
  • Procedimentos de escalação de problemas
  • Protocolos de change management

3. Cultura

Construa comprometimento em toda a organização:

  • Atribua data stewards para cada domínio
  • Inclua qualidade de dados em métricas de desempenho
  • Comemore melhorias e compartilhe vitórias
  • Torne a qualidade visível em dashboards

Começando com o DQS

O DQS oferece a base de medição para sua prática de qualidade de dados:

  1. Selecione as capabilities: Escolha quais dimensões medir
  2. Defina o escopo: Escolha os objetos e campos a analisar
  3. Configure os limites: Defina seus padrões de qualidade
  4. Rode scans: Execute a análise sobre seus dados
  5. Revise os resultados: Identifique problemas e priorize correções

O primeiro passo é entender seu estado atual. Faça a AI Readiness Assessment para avaliar sua maturidade em qualidade de dados em 3 minutos.

Próximos passos