Skip to main content

Completude

Todas as 10 métricas de completude que o DQS mede, o funil diagnóstico para encontrar dados faltando e como configurar a análise de completude.

O que é completude?

Completude mede se seus dados estão de fato lá. Um campo é completo quando contém dados significativos. É incompleto quando está null, em branco ou preenchido com um placeholder como “N/A” ou “TBD”.

Completude é a dimensão mais fundamental. Sem dados, não há nada para validar, deduplicar ou analisar.

Completeness Rate = (Registros com dados / Total de registros) x 100

Se 850 de 1.000 registros de Contact têm valor em Email, sua taxa de completude de Email é 85%. Essa métrica (às vezes chamada de fill rate) é o número de destaque para qualquer campo.

Por que completude importa

Relatórios

Dados incompletos distorcem seus analytics. Quando 40% dos registros de Account não têm valor em Industry, qualquer relatório agrupado por Industry mostra apenas parte da verdade. Dashboards ficam pouco confiáveis. Decisões executivas se apoiam em uma fração do quadro.

Automação

A automação do Salesforce depende dos valores dos campos. Um workflow que envia e-mails falha quando Email está em branco. Um process que atualiza o Account Owner falha quando o lookup é null. Cada valor faltando é uma falha potencial.

IA e Agentforce

Modelos de IA aprendem com seus dados. Quando os campos estão vazios, o modelo não tem de onde aprender. O Agentforce usa seus dados do Salesforce para gerar respostas e executar ações. Dados faltando significam contexto incompleto e saídas menos úteis.

SistemaImpacto da completude
RelatóriosDados parciais geram métricas distorcidas
WorkflowsValores faltando causam falhas de processo
Duplicate RulesRegistros incompletos são mais difíceis de correlacionar
AgentforceLacunas de contexto reduzem a precisão da IA

Como o DQS mede completude

O DQS produz 10 métricas de completude organizadas em torno de uma pergunta diagnóstica: “Onde os dados estão faltando, por quê, e os dados que existem são realmente úteis?”

Pense nessas métricas como um funil diagnóstico. Cada passo se apoia no anterior.

Passo 1: Quão completo está?

Completeness Rate é a métrica principal. Ela calcula o percentual de registros em que o campo contém um valor não vazio e não null. Esse é o número que vai para o dashboard.

Você roda um scan no objeto Account. O campo Industry mostra Completeness Rate de 62%. Isso significa que 38% dos seus Accounts não têm valor em Industry, o que significa que os relatórios de segmentação, as regras de territory e as campanhas de marketing que filtram por industry estão todos trabalhando com dados incompletos.

Toda outra métrica de completude existe para explicar por que esse número não é 100%.

Passo 2: Qual é a escala?

Taxas dizem severidade. Contagens dizem volume de trabalho. Populated Count responde à questão de escala: quantos registros de fato têm valor. Use para reporting de cobertura e para dimensionar a lacuna em relação ao total de registros — a diferença entre o total e o Populated Count é o backlog de limpeza.

Exemplo: Sua data steward precisa montar uma campanha de limpeza. Com 50.000 Contacts e um Populated Count de 35.800 em Phone, ela sabe que 14.200 registros precisam ser enriquecidos, consegue estimar o custo com um fornecedor de dados e pode definir um cronograma realista.

Passo 3: Por que está incompleto?

Três métricas destrincham a causa da incompletude. Cada uma aponta para uma raiz diferente.

Null Count e Null Rate medem os registros em que o campo tem um null verdadeiro no banco de dados, ou seja, o campo nunca foi populado. No Salesforce, null e string vazia são estados diferentes. Um campo que nunca foi tocado é null. Um campo que foi explicitamente limpo é uma string vazia. Essa distinção diz se os dados nunca foram capturados ou foram removidos deliberadamente.

Exemplo: Após uma migração de dados, o campo Fax em Accounts mostra Null Rate de 45%. Os dados de fax nunca foram migrados do sistema legado (null = nunca existiu), em vez de terem sido capturados e depois limpos. Um Null Rate alto aponta para o sistema de origem, não para o comportamento do usuário.

Placeholder Count e Placeholder Rate medem os registros que contêm valores placeholder conhecidos como “N/A”, “TBD”, “Unknown” ou quaisquer valores customizados que você definir. Esses valores parecem com dados, mas não carregam informação real.

Exemplo: Seus dados globais de Account mostram Completeness Rate de 94% em Industry. Parece ótimo no papel. Mas Placeholder Rate revela que 18% desses valores “populados” são, na verdade, “N/A”, “Other” ou “Unknown”. A completude real é mais próxima de 76%. Essa é a métrica que transforma um dashboard verde em vermelho.

Passo 4: Os dados “completos” são úteis?

Os três primeiros passos identificam o que está faltando. O passo 4 faz uma pergunta mais difícil: os dados que estão lá valem alguma coisa?

Incompleted Count é a medida mais abrangente de dados faltando. Ela combina todas as formas de incompletude: nulls, blanks e valores placeholder. Quando a detecção de placeholders está ativa, Incompleted Count é sempre maior ou igual ao Null Count sozinho, porque também captura entradas só-espaços e placeholder.

Exemplo: Seu campo Description em Opportunities mostra Null Count de 500, mas Incompleted Count de 1.800. A diferença? 1.300 registros têm descrições como “TBD”, “N/A” ou ”---”. Esses registros estão tecnicamente preenchidos, mas praticamente inúteis. Sem essa métrica, você pensaria ter apenas 500 registros para corrigir em vez de 1.800.

Rich Text Ratio mede o percentual de registros de campo de texto que contêm conteúdo substancial acima de um limite de caracteres. Separa campos com prosa significativa de campos com poucas palavras. Um campo Description está “populado” tanto se contiver “Bom cliente” quanto se tiver um plano de conta de três parágrafos. Para prontidão para IA, a profundidade do conteúdo importa tanto quanto sua presença.

Exemplo: Sua empresa está avaliando uma ferramenta de IA que resume descrições de Cases. Você varre o campo Description em Cases: Completeness Rate de 88%, mas Rich Text Ratio de apenas 31%. Somente 31% das descrições de caso têm substância suficiente para a IA usar. O resto são entradas como “retornar ligação”, “ver e-mail” ou “problema reportado”. O projeto de IA precisa de uma fase de enriquecimento de dados antes de entregar valor.

Text Field Utilization mede quanto da capacidade de caracteres disponível de um campo de texto é usada. Um Long Text Area com capacidade de 32.000 caracteres em que as entradas têm em média 45 caracteres tem utilização muito baixa.

Average Utilization fornece a média de comprimento usado em todos os registros. Junto com Text Field Utilization, pinta um quadro completo sobre se os campos de texto estão dimensionados corretamente.

Exemplo: Durante uma avaliação de org, Text Field Utilization revela que Notes__c (Long Text Area, 131.072 caracteres) tem em média 3,2% de utilização, com a maioria das entradas com menos de 200 caracteres. Enquanto isso, Short_Description__c (Text, 255 caracteres) mostra 94% de utilização com problemas frequentes de truncamento. O schema precisa de ajuste: o Long Text Area é exagerado e o Text é pequeno demais.

Observação: Text Field Utilization e Average Utilization aplicam-se apenas a campos String e TextArea, porque esses são os tipos com capacidade de caracteres definida para comparar.

Por que taxas e contagens vêm em pares

A maioria das métricas aparece como taxa (percentual) e contagem (número absoluto). Isso é intencional:

  • Taxas são para dashboards, reporting executivo e acompanhamento de tendências. “A completude melhorou de 72% para 89% neste trimestre.”
  • Contagens são para planejamento de projetos, estimativa de esforço e escopo de limpeza. “Temos 14.200 registros para corrigir.”

Use taxas para comunicar progresso. Use contagens para planejar o trabalho.

Referência de métricas

Métricas de base

Essas 5 métricas formam a base de qualquer análise de completude. Funcionam em praticamente todos os tipos de campo.

MétricaTipoAplica-se a
Completeness RatePercentualTodos os tipos
Populated CountContagemTodos os tipos
Incompleted CountContagemTodos os tipos
Null RatePercentualTodos os tipos
Null CountContagemTodos os tipos

Métricas contextuais

Essas 5 métricas vão além de “está preenchido?” para perguntar “faz sentido?”. Exigem o modo Contextual Completeness.

MétricaTipoAplica-se a
Placeholder RatePercentualApenas campos de texto
Placeholder CountContagemApenas campos de texto
Rich Text RatioPercentualApenas campos de texto
Text Field UtilizationPercentualApenas String e TextArea
Average UtilizationPercentualApenas String e TextArea

Cobertura de tipos de campo

O DQS suporta verificações de completude em todos os tipos de campo padrão do Salesforce:

Grupo de coberturaTipos de campoMétricas disponíveis
Todos os tipos (20)String, TextArea, LongTextArea, Html, EncryptedText, Picklist, Multipicklist, Email, Phone, URL, Reference (Lookup), Date, DateTime, Double, Integer, Currency, Percent, Boolean, Combobox, IdCompleteness Rate, Populated/Incompleted Count, Null Rate/Count
Campos de texto (8)Text, TextArea, LongTextArea, Html, EncryptedText, Email, Phone, URLAcima + Placeholder Rate/Count, Rich Text Ratio
String e TextArea (2)String, TextAreaAcima + Text Field Utilization, Average Utilization

Dois modos de análise

O DQS oferece dois modos de análise de completude:

Basic Completeness responde à pergunta: “Os campos estão preenchidos?” Produz as 5 métricas de base e cobre o essencial para qualquer org que faz uma checagem de higiene ou auditoria rápida.

Contextual Completeness vai mais fundo. Produz todas as 10 métricas, incluindo detecção de placeholders, análise de texto rico e utilização de campo. Use este modo quando precisar distinguir entre dados presentes e dados úteis.

Necessidade de negócioModo recomendado
Checagem de higiene ou auditoria baseBasic Completeness
Avaliação de migração de dadosContextual (detecção de placeholder pega dados falsos de sistemas legados)
Avaliação de prontidão para IAContextual (Rich Text Ratio e métricas de utilização avaliam profundidade do conteúdo)
Governança contínuaComece com Basic, mude para Contextual quando estiver pronto para análise mais profunda

Configurando completude

O DQS oferece quatro inputs de configuração para completude. Cada um pode ser definido no nível global (aplica-se a todos os campos) e sobrescrito no nível do campo.

ConfiguraçãoO que controla
Blank As IncompleteQuando habilitada, o DQS trata strings vazias e só-espaços como incompletas. Padrão: habilitada.
Placeholders As IncompleteQuando habilitada, o DQS trata valores placeholder (como “N/A” ou “TBD”) como incompletos. Padrão: desabilitada.
Placeholder ValuesA lista de strings que o DQS trata como placeholders. Você define com base nos padrões de entrada da sua org (por exemplo, N/A, TBD, Unknown, --, 000-000-0000).
Case-Sensitive PlaceholdersControla se a correspondência de placeholders é sensível a maiúsculas. Quando habilitada, “tbd” e “TBD” são tratados como valores diferentes. Padrão: sensível a maiúsculas.

Dica: Comece pelos placeholders comuns (“N/A”, “TBD”, “Unknown”, ”—”) e adicione valores específicos da org à medida que os descobre nos resultados dos scans.

Problemas comuns de completude

Campos opcionais nunca preenchidos

Quando os campos são opcionais, os usuários pulam. Com o tempo, campos valiosos como Company Description ou LinkedIn URL ficam com taxas de completude próximas de zero.

Correção: Torne os campos críticos obrigatórios ou crie prompts durante a edição do registro.

Importações em massa com lacunas

Migrações e importações de listas costumam não ter valores para certos campos. Uma lista comprada não tem associação com Account. Um export de sistema legado não tem valores padronizados de Industry.

Correção: Audite as importações antes de carregar. Use o DQS para estabelecer baselines e acompanhar a melhoria após cada importação.

Abuso de placeholder

Usuários digitam “N/A” ou “TBD” para passar das validation rules. O campo parece completo, mas não tem dado útil. Relatórios padrão contam isso como populado.

Correção: Habilite a detecção de placeholders e defina sua lista de valores. Revise e atualize essa lista durante a manutenção regular dos dados.

Preenchimento só com espaços

Algumas integrações ou entradas manuais deixam os campos só com espaços. O Salesforce conta como “preenchido”, mas não contêm nada útil.

Correção: Habilite a detecção de blanks para pegar valores só-espaços.

Melhores práticas

Priorize por impacto de negócio

Nem todo campo precisa de alta completude. Foque em campos que alimentam automação, aparecem em dashboards executivos, alimentam IA e Agentforce ou sustentam compliance.

Acompanhe tendências ao longo do tempo

Uma pontuação isolada é um snapshot. Acompanhe as pontuações ao longo de vários scans para detectar a degradação cedo, medir iniciativas de melhoria e identificar fontes problemáticas.

Ataque as causas-raiz

Baixa completude sinaliza um problema de processo. Investigue se os usuários estão pulando campos, se as importações estão vindo sem dados ou se integrações estão falhando silenciosamente. Conserte a origem, não só o sintoma.

Use o funil diagnóstico

Não pare no Completeness Rate. Percorra o funil: confira a escala (Populated Count), identifique a causa (Null vs Placeholder) e avalie a qualidade do conteúdo (Rich Text Ratio, Utilization). Cada passo revela um tipo diferente de problema, com correção diferente.

Próximos passos

Você agora entende como medir e melhorar completude. Continue aprendendo sobre a próxima dimensão: