¿Qué es la completitud?
La completitud mide si sus datos están realmente ahí. Un campo es completo cuando contiene datos significativos. Un campo es incompleto cuando es null, está en blanco o contiene un placeholder como «N/A» o «TBD».
La completitud es la dimensión de calidad de datos más fundamental. Sin datos, no hay nada que validar, deduplicar o analizar.
Completeness Rate = (Registros con datos / Registros totales) x 100
Si 850 de 1000 registros de Contact tienen un valor de Email, su tasa de completitud de Email es del 85 %. Esta métrica (a veces llamada fill rate) es la cifra principal para cualquier campo.
Por qué importa la completitud
Informes
Los datos incompletos distorsionan su analítica. Cuando el 40 % de los registros de Account carece de valor en Industry, cualquier informe agrupado por Industry muestra solo una verdad parcial. Los paneles se vuelven poco fiables. Las decisiones ejecutivas se basan en una fracción de la imagen.
Automatización
La automatización de Salesforce depende de los valores de los campos. Un flujo que envía correos falla cuando Email está en blanco. Un proceso que actualiza Account Owner falla cuando el lookup es null. Cada valor faltante es un posible fallo de automatización.
IA y Agentforce
Los modelos de IA aprenden de sus datos. Cuando los campos están vacíos, el modelo no tiene nada de lo que aprender. Agentforce utiliza sus datos de Salesforce para generar respuestas y llevar a cabo acciones. Los datos faltantes significan contexto incompleto y resultados de IA menos útiles.
| Sistema | Impacto de la completitud |
|---|---|
| Informes | Los datos parciales producen métricas sesgadas |
| Flujos de trabajo | Los valores faltantes provocan fallos en los procesos |
| Duplicate Rules | Los registros incompletos son más difíciles de emparejar |
| Agentforce | Las lagunas de contexto reducen la precisión de la IA |
Cómo mide DQS la completitud
DQS produce 10 métricas de completitud organizadas en torno a una pregunta de diagnóstico: «¿Dónde faltan los datos, por qué, y los datos que existen son realmente útiles?»
Piense en estas métricas como un embudo de diagnóstico. Cada paso se apoya en el anterior.
Paso 1: ¿qué nivel de completitud tiene?
Completeness Rate es la métrica principal. Calcula el porcentaje de registros en los que el campo contiene un valor no vacío y no null. Es la cifra que pondrá en un panel.
Ejecuta un análisis sobre el objeto Account. El campo Industry muestra una Completeness Rate del 62 %. Eso significa que el 38 % de sus Accounts no tiene valor de industria, lo que significa que sus informes de segmentación, reglas de territorio y campañas de marketing que filtran por industria funcionan todos con datos incompletos.
Todas las demás métricas de completitud existen para explicar por qué esta cifra no es del 100 %.
Paso 2: ¿cuál es la escala?
Las tasas indican la gravedad. Los recuentos indican la carga de trabajo. Populated Count responde a la pregunta de escala: cuántos registros sí tienen un valor. Úsela para informes de cobertura y para dimensionar la laguna frente a su recuento total de registros: la diferencia entre su total y el Populated Count es el trabajo pendiente de limpieza.
Ejemplo: su data steward necesita construir una campaña de limpieza. Con 50 000 Contacts y un Populated Count de 35 800 en Phone, sabe que 14 200 registros requieren enriquecimiento, puede estimar el coste con un proveedor de datos y puede fijar un calendario realista.
Paso 3: ¿por qué es incompleto?
Tres métricas desglosan la causa de la incompletitud. Cada una apunta a un problema de raíz distinto.
Null Count y Null Rate miden los registros en los que el campo tiene un null real de base de datos, lo que significa que el campo nunca se rellenó. En Salesforce, null y cadena vacía son estados distintos. Un campo que nunca se ha tocado es null. Un campo que se ha borrado explícitamente es una cadena vacía. Esta distinción le indica si los datos nunca se capturaron o se eliminaron deliberadamente.
Ejemplo: tras una migración de datos, el campo Fax en Accounts muestra un Null Rate del 45 %. Los datos de fax nunca se migraron desde el sistema heredado (null = nunca existió), en lugar de haberse capturado y borrado más tarde. Un Null Rate alto le apunta al sistema de origen, no al comportamiento de los usuarios.
Placeholder Count y Placeholder Rate miden los registros que contienen valores placeholder conocidos como «N/A», «TBD», «Unknown» o cualquier valor personalizado que usted defina. Estos valores parecen datos pero no aportan información real.
Ejemplo: los datos de Account globales muestran una Completeness Rate del 94 % en Industry. Parece estupendo sobre el papel. Pero Placeholder Rate revela que el 18 % de esos valores «cumplimentados» son en realidad «N/A», «Other» o «Unknown». La completitud real ronda el 76 %. Esta es la métrica que convierte un panel verde en rojo.
Paso 4: ¿son útiles los datos «completos»?
Los tres primeros pasos identifican lo que falta. El paso 4 plantea una pregunta más difícil: ¿los datos que sí están realmente merecen la pena?
Incompleted Count es la medida más amplia de datos faltantes. Combina todas las formas de incompletitud: nulls, blanks y valores placeholder. Cuando la detección de placeholders está activa, Incompleted Count es siempre mayor o igual que el Null Count por sí solo, porque también captura las entradas de solo espacios y los placeholders.
Ejemplo: su campo Description en Opportunities muestra un Null Count de 500, pero un Incompleted Count de 1800. ¿La diferencia? 1300 registros tienen descripciones como «TBD», «N/A» o «---». Esos registros están técnicamente cumplimentados, pero son prácticamente inútiles. Sin esta métrica, pensaría que solo tiene 500 registros que corregir en lugar de 1800.
Rich Text Ratio mide el porcentaje de registros de campos de texto que contienen contenido sustancial por encima de un umbral de caracteres. Separa los campos con prosa significativa de los campos con unas pocas palabras. Un campo Description está «cumplimentado» tanto si contiene «Buen cliente» como si contiene un plan de cuenta de tres párrafos. Para la preparación para la IA, la profundidad del contenido importa tanto como su presencia.
Ejemplo: su empresa está evaluando una herramienta de IA que resume las descripciones de Case. Analiza el campo Description en Cases: Completeness Rate del 88 %, pero solo un 31 % de Rich Text Ratio. Solo el 31 % de las descripciones de los casos tiene sustancia suficiente con la que la IA pueda trabajar. El resto son entradas como «devolver llamada», «ver correo» o «incidencia reportada». El proyecto de IA necesita una fase de enriquecimiento de datos antes de poder aportar valor.
Text Field Utilization mide cuánta de la capacidad de caracteres disponible de un campo de texto se está utilizando. Un Long Text Area con capacidad de 32 000 caracteres en el que la entrada media es de 45 caracteres tiene una utilización muy baja.
Average Utilization le proporciona el porcentaje medio de longitud de campo utilizado en todos los registros. Junto con Text Field Utilization, ofrece una imagen completa de si sus campos de texto tienen el tamaño adecuado.
Ejemplo: durante una evaluación de org, Text Field Utilization revela que Notes__c (un Long Text Area de 131 072 caracteres) promedia un 3,2 % de utilización, con la mayoría de las entradas por debajo de 200 caracteres. Mientras tanto, Short_Description__c (Text, 255 caracteres) muestra un 94 % de utilización con problemas frecuentes de truncamiento. El esquema necesita redimensionarse: el Long Text Area es excesivo y el campo Text es demasiado pequeño.
Nota: Text Field Utilization y Average Utilization se aplican solo a los campos String y TextArea, porque son los tipos de campo con una capacidad de caracteres definida con la que comparar.
Por qué las tasas y los recuentos vienen en pares
La mayoría de las métricas se presentan como tasa (porcentaje) y recuento (número absoluto). Es intencional:
- Las tasas son para paneles, informes ejecutivos y seguimiento de tendencias. «La completitud mejoró del 72 % al 89 % este trimestre».
- Los recuentos son para la planificación de proyectos, la estimación de la carga de trabajo y la delimitación de la limpieza. «Tenemos 14 200 registros que corregir».
Use las tasas para comunicar el progreso. Use los recuentos para planificar el trabajo.
Referencia de métricas
Métricas base
Estas 5 métricas forman la base de todo análisis de completitud. Funcionan en prácticamente todos los tipos de campo.
| Métrica | Tipo | Se aplica a |
|---|---|---|
| Completeness Rate | Porcentaje | Todos los tipos de campo |
| Populated Count | Recuento | Todos los tipos de campo |
| Incompleted Count | Recuento | Todos los tipos de campo |
| Null Rate | Porcentaje | Todos los tipos de campo |
| Null Count | Recuento | Todos los tipos de campo |
Métricas contextuales
Estas 5 métricas van más allá del «¿está ahí?» para preguntar «¿es significativo?». Requieren el modo de análisis Contextual Completeness.
| Métrica | Tipo | Se aplica a |
|---|---|---|
| Placeholder Rate | Porcentaje | Solo campos de texto |
| Placeholder Count | Recuento | Solo campos de texto |
| Rich Text Ratio | Porcentaje | Solo campos de texto |
| Text Field Utilization | Porcentaje | Solo String y TextArea |
| Average Utilization | Porcentaje | Solo String y TextArea |
Cobertura por tipo de campo
DQS admite comprobaciones de completitud en todos los tipos de campo estándar de Salesforce:
| Grupo de cobertura | Tipos de campo | Métricas disponibles |
|---|---|---|
| Todos los tipos (20) | String, TextArea, LongTextArea, Html, EncryptedText, Picklist, Multipicklist, Email, Phone, URL, Reference (Lookup), Date, DateTime, Double, Integer, Currency, Percent, Boolean, Combobox, Id | Completeness Rate, Populated/Incompleted Count, Null Rate/Count |
| Campos de texto (8) | Text, TextArea, LongTextArea, Html, EncryptedText, Email, Phone, URL | Lo anterior + Placeholder Rate/Count, Rich Text Ratio |
| String y TextArea (2) | String, TextArea | Lo anterior + Text Field Utilization, Average Utilization |
Dos modos de análisis
DQS ofrece dos modos de análisis de completitud:
Basic Completeness responde a la pregunta: «¿están cumplimentados los campos?». Produce las 5 métricas base y cubre lo esencial que cualquier org necesita para una comprobación de higiene de datos o una auditoría rápida.
Contextual Completeness va más allá. Produce las 10 métricas, incluyendo la detección de placeholders, el análisis de texto enriquecido y la utilización de campos. Utilice este modo cuando necesite distinguir entre datos presentes y datos útiles.
| Necesidad de negocio | Modo recomendado |
|---|---|
| Comprobación rápida de higiene o auditoría de línea base | Basic Completeness |
| Evaluación de migración de datos | Contextual (la detección de placeholders captura datos falsos de sistemas heredados) |
| Evaluación de preparación para la IA | Contextual (Rich Text Ratio y las métricas de utilización evalúan la profundidad del contenido) |
| Gobernanza de datos continua | Empiece con Basic y pase a Contextual cuando esté listo para un análisis más profundo |
Configurar la completitud
DQS ofrece cuatro entradas de configuración para la completitud. Cada una puede establecerse a nivel global (se aplica a todos los campos) y sobrescribirse a nivel de campo individual.
| Ajuste | Qué controla |
|---|---|
| Blank As Incomplete | Cuando está activada, DQS trata las cadenas vacías y los valores de solo espacios en blanco como incompletos. Por defecto: activada. |
| Placeholders As Incomplete | Cuando está activada, DQS trata los valores placeholder (como «N/A» o «TBD») como incompletos. Por defecto: desactivada. |
| Placeholder Values | La lista de cadenas que DQS trata como placeholders. Usted las define en función de los patrones de entrada de datos de su org (p. ej., N/A, TBD, Unknown, --, 000-000-0000). |
| Case-Sensitive Placeholders | Controla si la coincidencia de placeholders distingue entre mayúsculas y minúsculas. Cuando está activada, «tbd» y «TBD» se tratan como valores distintos. Por defecto: sensible a mayúsculas. |
Consejo: empiece con los placeholders habituales («N/A», «TBD», «Unknown», «—») y añada valores específicos de la org a medida que los descubra en los resultados del análisis.
Incidencias habituales de completitud
Campos opcionales nunca cumplimentados
Cuando los campos son opcionales, los usuarios los omiten. Con el tiempo, campos valiosos como Company Description o LinkedIn URL tienen tasas de completitud cercanas a cero.
Solución: haga obligatorios los campos críticos o cree avisos durante la edición del registro.
Importaciones masivas con lagunas
Las migraciones de datos y las importaciones de listas suelen carecer de valores para ciertos campos. Una lista de contactos comprada no tiene asociación a Account. Una exportación de un sistema heredado carece de valores de Industry estandarizados.
Solución: audite las importaciones antes de cargarlas. Utilice DQS para establecer líneas base y hacer seguimiento de la mejora tras cada importación.
Abuso de placeholders
Los usuarios introducen «N/A» o «TBD» para superar las reglas de validación. El campo parece completo pero no contiene datos utilizables. Los informes estándar los cuentan como cumplimentados.
Solución: active la detección de placeholders y defina su lista de valores placeholder. Revise y actualice los valores placeholder durante el mantenimiento regular de datos.
Espacios en blanco de relleno
Algunas integraciones o la entrada manual dejan campos con solo espacios en blanco. Salesforce los cuenta como «cumplimentados», pero no contienen nada útil.
Solución: active la detección de blancos para detectar los valores de solo espacios.
Buenas prácticas
Priorice por impacto en el negocio
No todos los campos necesitan una completitud elevada. Céntrese en los campos que impulsan la automatización, aparecen en paneles ejecutivos, alimentan la IA y Agentforce o respaldan los requisitos de cumplimiento.
Haga seguimiento de las tendencias
Una única puntuación de completitud es una instantánea. Haga seguimiento de las puntuaciones a lo largo de varios análisis para detectar la degradación pronto, medir las iniciativas de mejora e identificar las fuentes de datos problemáticas.
Aborde las causas raíz
Una baja completitud señala un problema de proceso. Investigue si los usuarios se saltan los campos, si las importaciones pierden datos o si las integraciones fallan en silencio. Arregle el origen, no solo el síntoma.
Utilice el embudo de diagnóstico
No se detenga en Completeness Rate. Recorra el embudo: compruebe la escala (Populated Count), identifique la causa (Null frente a Placeholder) y después evalúe la calidad del contenido (Rich Text Ratio, utilización). Cada paso revela un tipo de problema distinto con una corrección distinta.
Próximos pasos
Ya comprende cómo medir y mejorar la completitud. Continúe aprendiendo sobre la siguiente dimensión:
- En Salesforce: La calidad de datos en Salesforce - mida la completitud de sus registros de CRM
- Siguiente: Validez - asegúrese de que sus datos se ajusten a los formatos esperados
- Relacionado: Las cinco dimensiones - visión general de todas las dimensiones
- Acción: Evaluación de preparación para la IA - vea sus puntuaciones actuales de completitud