Skip to main content

As cinco dimensões da qualidade de dados

Conheça as cinco dimensões que o DQS mede: Completude, Validade, Unicidade, Atualidade e Consistência.

Entendendo as cinco dimensões

Qualidade de dados é medida em cinco dimensões principais. Cada uma responde a uma pergunta específica sobre seus dados, e juntas determinam se os dados estão aptos ao propósito.

O DQS mede as cinco dimensões nativamente dentro do Salesforce.

DimensãoPergunta centralProblema exemplo
CompletudeOs dados estão presentes?Endereços de e-mail faltando
ValidadeO formato está correto?Números de telefone malformados
UnicidadeCada registro é único?Contacts duplicados
AtualidadeOs dados estão atuais?Close dates desatualizadas em Opportunities
ConsistênciaOs dados são uniformes?”USA” vs “United States”

1. Completude

Completude mede se os valores de dados obrigatórios estão presentes e não faltando.

O que o DQS mede

  • Fill Rate: Percentual de registros com valores não vazios
  • Blank Detection: Strings vazias e valores só com espaços
  • Placeholder Detection: Valores como “N/A”, “TBD” ou “Unknown”

Por que completude importa

Dados incompletos quebram automação. Quando um workflow exige um endereço de e-mail que não existe, ele falha. Quando um relatório filtra por Industry e metade dos registros não têm valor em Industry, os analytics mostram só parte do retrato.

Problemas comuns de completude

ProblemaExemploImpacto
Campos em brancoPhone vazio em ContactNão dá para ligar para os prospects
Valores placeholder”TBD” em Company NameInválido para reporting
Só espaços em branco” ” em DescriptionParece preenchido, mas não está

Dica: Comece pelos seus campos mais críticos. Você não precisa de 100% de completude em todo campo, só naqueles que importam para o seu caso de uso.

2. Validade

Validade mede se os valores seguem formatos e padrões esperados.

O que o DQS mede

  • Format Validation: Padrões de e-mail, telefone, URL
  • Pattern Matching: Padrões regex customizados
  • Domain Validation: Listas de valores permitidos

Validade vs precisão

Validade e precisão são coisas diferentes. Um e-mail pode ser válido (formato correto), mas impreciso (pessoa errada). O DQS mede validade porque a validação de formato pode ser automatizada. Precisão exige verificação externa.

VerificaçãoVálido?Preciso?
[email protected]SimDesconhecido sem verificação
john@companyNãoN/A (formato errado)
[email protected]SimNão (a pessoa saiu da empresa)

Problemas comuns de validade no Salesforce

  • Endereços de e-mail sem ”@” ou domínio
  • Números de telefone com contagem de dígitos errada
  • URLs sem protocolo (http/https)
  • Texto livre onde são esperados valores de picklist

3. Unicidade

Unicidade mede se os valores são distintos e não duplicados.

O que o DQS mede

  • Duplicate Detection: Correspondências exatas entre registros
  • Distinct Count: Total de valores únicos por campo
  • Entropy Analysis: Diversidade e distribuição de valores

O custo das duplicatas

Registros duplicados desperdiçam armazenamento, confundem usuários e produzem métricas infladas. Quando vendas tem dois registros para a mesma empresa, perde contexto e corre o risco de fazer outreach duplicado.

Pesquisas mostram:

  • Bases B2B contêm 10-30% de registros duplicados em média
  • Cada duplicata custa às organizações em envios de e-mail desperdiçados, reporting confuso e histórico fragmentado do cliente

Prevenção vs detecção de duplicatas

O DQS foca em detecção, que ajuda a identificar duplicatas que já existem. A prevenção (barrar duplicatas na criação) requer validation rules e matching rules na configuração do Salesforce.

4. Atualidade

Atualidade mede se os dados estão suficientemente atuais para o uso pretendido.

O que o DQS mede

  • Freshness Rate: Percentual de registros dentro da janela de atualidade
  • Staleness Detection: Registros que excedem seu limite
  • Average Age: Idade média dos valores de campos de data
  • Future Date Detection: Datas inválidas no futuro

Definindo limites de atualidade

Tipos de dados diferentes têm requisitos diferentes de atualidade:

Tipo de dadoLimite típicoPor quê
Lead Last Activity30 diasLeads frios perdem valor
Informações de Contact90 diasPessoas mudam de emprego
Opportunity Close DateTrimestre atualPrecisão da previsão
Account Annual Revenue1 anoAtualizações anuais esperadas

Por que atualidade importa para IA

Modelos de IA e machine learning aprendem com seus dados. Quando os dados estão desatualizados, a IA aprende padrões defasados. O Agentforce, por exemplo, usa seus dados do Salesforce para fundamentar respostas. Informações de contato desatualizadas levam a recomendações erradas.

5. Consistência

Consistência mede se os valores são uniformes e padronizados.

O que o DQS mede

  • Conformance Rate: Percentual que corresponde aos padrões esperados
  • Variant Detection: Diferentes representações do mesmo valor
  • Dominant Value Analysis: Valor mais comum por campo

Tipos de inconsistência

TipoExemploProblema
Variação de formato”USA” vs “United States” vs “US”Quebra filtro e agrupamento
Variação de escrita”Acme Corp” vs “ACME Corporation”Cria falsas duplicatas
Variação de caixa”new york” vs “New York”Parece pouco profissional em relatórios

Por que consistência importa para IA

Modelos de IA tratam “USA” e “United States” como valores diferentes. Se seus registros usam os dois, a IA não consegue agrupá-los corretamente. Dados inconsistentes fragmentam o entendimento da sua IA e produzem saídas pouco confiáveis.

Alcançando consistência

  • Use picklists em vez de texto livre sempre que possível
  • Padronize um único formato para cada campo
  • Importe valores do campo ao configurar as verificações de consistência no DQS

Balanceando as dimensões

Nem toda dimensão é igualmente importante para todo caso de uso. Considere o que você precisa:

Caso de usoDimensões prioritárias
Campanhas de marketingCompletude, Validade (para entregabilidade)
Previsão de vendasAtualidade, Completude
Atendimento ao clienteUnicidade (uma única fonte de verdade)
AI/AgentforceAs cinco, mais verificações de AI Readiness

Cobertura de dimensões no DQS

O DQS mede as cinco dimensões com capacidades abrangentes:

DimensãoO que o DQS mede
CompletudeFill rate, detecção de nulls, blank, placeholder, lógica contextual
ValidadeValidação de formato, padrões regex custom, identificação de registros inválidos
UnicidadeDetecção de duplicatas, análise de entropia, distribuição de frequência
AtualidadeFreshness rate, detecção de staleness, idade média, detecção de datas futuras
ConsistênciaVerificação de conformance, descoberta de variantes, análise de valores dominantes

Próximos passos

Agora que você entende as cinco dimensões:

  1. Faça a AI Readiness Assessment para ver suas pontuações atuais
  2. Leia sobre Preparação para Agentforce para verificações adicionais além da qualidade de dados básica
  3. Aprenda a usar o Definition Builder para configurar seu primeiro scan