¿Qué es la consistencia?
La consistencia mide si los valores de sus datos se ajustan a un estándar acordado. Un campo es consistente cuando cada registro utiliza el mismo término para el mismo concepto. Un campo es inconsistente cuando existen variaciones que significan lo mismo pero se expresan de forma distinta.
«USA», «United States» y «US» se refieren al mismo país. Para Salesforce son tres valores distintos. Un informe agrupado por Country produce tres filas en lugar de una. Una automatización que filtra por «USA» pasa por alto 230 registros que contienen «United States».
Conformance Rate = (Registros conformes / Registros totales) x 100
Si 850 de 1000 registros de Account tienen un valor de Country que coincide con su lista de valores permitidos, su tasa de conformance de Country es del 85 %. El 15 % restante contiene variaciones que requieren estandarización.
Por qué importa la consistencia
Informes
Los datos inconsistentes fragmentan sus informes. Cuando su campo Country contiene cinco grafías distintas del mismo país, un informe agrupado por Country muestra cinco filas en lugar de una. El total es correcto, pero la agrupación es incorrecta. Los paneles ejecutivos basados en estos informes cuentan una historia engañosa.
Automatización
La automatización de Salesforce depende de coincidencias exactas de valor. Un flujo de trabajo que filtra por Country = "USA" pasa por alto los registros con «United States» y «US». La automatización se ejecuta correctamente sobre los registros coincidentes, pero se salta en silencio todo lo demás.
IA y Agentforce
Los modelos de IA tratan cada variación como un concepto distinto. «USA» y «United States» se convierten en dos países distintos a ojos del modelo. Agentforce genera respuestas a partir de los valores de sus campos. Los valores inconsistentes producen resultados de IA inconsistentes.
| Sistema | Impacto de la consistencia |
|---|---|
| Informes | Agrupaciones fragmentadas, totales engañosos |
| Flujos de trabajo | Los filtros pasan por alto las variaciones no coincidentes |
| Duplicate Rules | Las variaciones impiden una coincidencia correcta |
| Agentforce | Los valores de campo inconsistentes producen respuestas de IA poco fiables |
Cómo mide DQS la consistencia
DQS produce 6 métricas de consistencia organizadas en torno a una pregunta de diagnóstico: «¿Se ajustan los valores de sus campos a un estándar y, si no, qué están haciendo en su lugar?»
Piense en estas métricas como un flujo de diagnóstico. Cada paso revela una capa distinta del problema.
Paso 1: ¿cuán consistente es?
Conformance Rate es la métrica principal. Calcula el porcentaje de registros en los que el valor del campo coincide con uno de sus valores permitidos definidos. Es la cifra que pondrá en un panel.
Ejecuta un análisis sobre el objeto Account. El campo Country muestra una Conformance Rate del 72 %. Eso significa que el 28 % de sus Accounts contiene valores de país fuera de su lista permitida. Sus reglas de asignación de territorio, sus paneles regionales y su lógica de localización operan todos con datos incompletos.
Todas las demás métricas de consistencia existen para explicar qué aspecto tiene ese 28 % no conforme.
Paso 2: ¿cuál es la escala?
Las tasas indican la gravedad. Los recuentos indican la carga de trabajo. Dos métricas responden a la pregunta de escala:
| Métrica | Qué le indica |
|---|---|
| Conformance Count | Cuántos registros coinciden con sus valores permitidos. Úselo para informes de cobertura. |
| Non-Conforming Count | Cuántos registros quedan fuera de sus valores permitidos. Úselo para delimitar proyectos de limpieza. |
Estas dos cifras siempre suman el total de registros. Si su Conformance Count es 720 y el Non-Conforming Count es 280, tiene exactamente 1000 registros evaluados.
Ejemplo: su data steward necesita limpiar el campo Industry. Non-Conforming Count es 3400. Ya sabe el alcance del proyecto, puede asignar recursos y fijar un calendario realista para la estandarización.
Paso 3: ¿cuán fragmentados están los datos?
Variant Count mide el número de valores distintos encontrados en un campo entre todos los registros. Responde a: «¿de cuántas formas distintas se expresan estos datos?».
Esta métrica funciona como indicador del estado del esquema. Un campo Country con 5 valores distintos probablemente esté bien controlado. Un campo Country con 47 valores distintos señala una fragmentación grave, incluso antes de comprobar el conformance.
| Campo | Registros totales | Variant Count | Evaluación |
|---|---|---|---|
| Country | 1000 | 5 | Bien controlado, probablemente consistente |
| Country | 1000 | 47 | Muy fragmentado, requiere estandarización |
| Industry | 500 | 12 | Razonable, probablemente limitado por lista desplegable |
| Industry | 500 | 89 | Caos de texto libre, requiere atención inmediata |
Ejemplo: durante una auditoría de org, analiza Lead_Source__c en Leads. Variant Count devuelve 34. Su equipo de marketing definió 8 fuentes de lead. Las 26 variantes restantes son erratas, abreviaturas y entradas ad hoc de integraciones. La lista desplegable se impone técnicamente en la interfaz, pero los registros creados por API la eluden.
Paso 4: ¿cuáles son los valores reales?
Dominant Values devuelve los N valores más frecuentes del campo, junto con el recuento de frecuencia de cada valor. Esto le indica qué aspecto tienen realmente sus datos, no qué aspecto espera que tengan.
| Posición | Valor | Recuento | Porcentaje |
|---|---|---|---|
| 1 | United States | 450 | 45 % |
| 2 | USA | 230 | 23 % |
| 3 | US | 180 | 18 % |
| 4 | U.S.A. | 45 | 4,5 % |
| 5 | United States of America | 15 | 1,5 % |
Esta tabla revela tres cosas. Primero, el estándar de facto: «United States» con el 45 % es lo que introduce la mayoría de los usuarios. Segundo, las variaciones habituales: «USA» y «US» suman otro 41 %. Tercero, la larga cola: «U.S.A.» y «United States of America» son raras pero están presentes.
Ejemplo: su equipo debate si estandarizar los valores de Country a códigos ISO («US») o nombres completos («United States»). Dominant Values muestra que el 45 % de los registros ya utiliza «United States». Estandarizar a ese valor requiere cambiar el 55 % de los registros. Estandarizar a «US» requiere cambiar el 82 %. Los datos le indican el camino más económico.
Por qué las tasas y los recuentos vienen en pares
Las métricas de conformance se presentan como una tasa (Conformance Rate) y su inversa (Non-Conformance Rate), además de recuentos absolutos para ambos lados. Es intencional:
- Las tasas son para paneles, informes ejecutivos y seguimiento de tendencias. «El conformance mejoró del 72 % al 94 % este trimestre».
- Los recuentos son para la planificación de proyectos, la estimación de la carga de trabajo y la delimitación de la limpieza. «Tenemos 3400 registros no conformes que corregir».
Use las tasas para comunicar el progreso. Use los recuentos para planificar el trabajo.
Referencia de métricas
Métricas base
Estas 2 métricas forman la base de todo análisis de consistencia. Le indican la tasa de conformance y el número de registros que coinciden.
| Métrica | Tipo | Qué mide |
|---|---|---|
| Conformance Rate | Porcentaje | Proporción de registros que coinciden con sus valores permitidos |
| Conformance Count | Recuento | Número de registros que coinciden con sus valores permitidos |
Métricas avanzadas
Estas 4 métricas van más allá del «¿coincide?» para preguntar «¿qué aspecto tienen los datos no coincidentes?». Requieren el modo Advanced Conformance Analysis.
| Métrica | Tipo | Qué mide |
|---|---|---|
| Non-Conforming Count | Recuento | Registros con valores fuera de su lista permitida |
| Non-Conformance Rate | Porcentaje | Proporción de registros fuera de su lista permitida |
| Variant Count | Recuento | Total de valores distintos encontrados en el campo |
| Dominant Values | Lista | N valores más frecuentes con recuentos de frecuencia |
Cobertura por tipo de campo
DQS admite comprobaciones de consistencia en los siguientes tipos de campo de Salesforce:
| Tipo de campo | Foco de consistencia |
|---|---|
| String (Text) | Abreviaturas, ortografía, mayúsculas |
| TextArea | Estandarización de texto libre |
| Picklist | Validación de valores reales frente a las opciones esperadas |
| Estandarización de dominio, consistencia de formato | |
| Phone | Estandarización de formato (códigos de área, separadores) |
| URL | Consistencia de protocolo y ruta |
Dos modos de análisis
DQS ofrece dos modos de análisis de consistencia:
Conformance Check responde a la pregunta: «¿los valores del campo coinciden con mi lista permitida?». Produce las 2 métricas base y cubre lo esencial para una auditoría rápida de conformance.
Advanced Conformance Analysis va más allá. Produce las 6 métricas, incluyendo los recuentos de no conformes, la detección de variantes y la distribución de valores dominantes. Utilice este modo cuando necesite comprender el panorama completo de la fragmentación de valores, no solo la puntuación de conformance.
| Necesidad de negocio | Modo recomendado |
|---|---|
| Auditoría rápida de conformance o comprobación de línea base | Conformance Check |
| Limpieza de migración de datos | Advanced (Variant Count revela el caos importado) |
| Evaluación de preparación para la IA | Advanced (Dominant Values muestra lo que la IA aprenderá) |
| Gobernanza de datos continua | Empiece con Conformance Check y pase a Advanced cuando esté listo para un análisis más profundo |
Configurar la consistencia
DQS ofrece cuatro entradas de configuración para la consistencia. Cada una puede establecerse a nivel global (se aplica a todos los campos) y sobrescribirse a nivel de campo individual.
| Ajuste | Qué controla |
|---|---|
| Expected Values | La lista de valores que DQS trata como «conformes». Cualquier valor de campo que no esté en esta lista se marca como no conforme. Obligatorio: debe definir al menos un valor antes de ejecutar un análisis. |
| Case Sensitive | Controla si la coincidencia de valores tiene en cuenta las mayúsculas y minúsculas. Cuando está desactivada (por defecto), «Premium», «PREMIUM» y «premium» coinciden todos con el valor permitido «Premium». Cuando está activada, solo cuenta una coincidencia exacta de mayúsculas. |
| Top N | Cuántos valores dominantes devolver (de 1 a 100). Controla el tamaño de la salida de Dominant Values. Por defecto: 5. |
| Min Frequency | El número mínimo de veces que un valor debe aparecer para incluirse en la salida de Dominant Values (de 1 a 1000). Filtra los valores ultrararos que añaden ruido. Por defecto: 1. |
Consejo: empiece utilizando Import from Field para ver qué valores existen realmente en sus datos antes de definir su lista de valores permitidos.
Import from Field: configuración basada en el descubrimiento
Un reto habitual con la consistencia es saber qué valores esperar. No se pueden definir valores permitidos si no se sabe qué contienen los datos.
Import from Field resuelve esto. Consulta los datos reales del campo, agrupa los valores por frecuencia y muestra los resultados como una lista de verificación.
Cómo funciona:
- Abra la configuración de Expected Values.
- Haga clic en Import from Field. DQS consulta los datos en vivo y devuelve los valores distintos ordenados por frecuencia.
- Revise la lista de verificación. Cada valor muestra cuántos registros lo contienen.
- Marque los valores que considere correctos. Deje sin marcar los valores incorrectos, mal formados o placeholders.
- Haga clic en Add Selected. Los valores marcados pasan a su lista de valores permitidos.
Ejemplo: configura la consistencia para un campo Rating__c. Import from Field devuelve:
| Valor | Registros |
|---|---|
| Hot | 284 |
| Warm | 198 |
| Cold | 156 |
| Very High | 23 |
| 240 km/h | 12 |
| N/A | 8 |
Los tres primeros valores son sus valoraciones reales. Marca esos. «Very High» es un error de entrada de datos. «240 km/h» es, claramente, un dato en el campo equivocado. «N/A» es un placeholder. Deja esos sin marcar. Cuando se ejecute el análisis, esos 43 registros aparecerán como no conformes y su lista de valores permitidos se construirá a partir de lo que realmente contienen sus datos.
Este flujo invierte el enfoque tradicional de «adivinar primero, corregir después». Usted descubre primero y después define su estándar.
Incidencias habituales de consistencia
Variaciones de país y estado
La inconsistencia más habitual en los datos de Salesforce. Sin estandarización, un único concepto como «United States» aparece como 5 o más valores distintos. Los informes se fragmentan. Los filtros pierden registros. Las reglas de territorio fallan.
Solución: active las State and Country Picklists de Salesforce para todos los campos de dirección. Utilice DQS para encontrar y limpiar los valores no conformes existentes.
Campos de texto libre sin gobernanza
Los campos de texto que carecen de restricciones de lista desplegable acumulan variaciones con el tiempo. Los campos Industry, Job Title, Lead Source y Department son los infractores más habituales cuando se implementan como texto libre.
Solución: convierta los campos de texto libre de alto valor en listas desplegables. Utilice Import from Field para ver la distribución actual de valores antes de definir las opciones de la lista desplegable.
Variaciones creadas por integraciones
Los sistemas externos y las APIs escriben registros que eluden la validación de la interfaz de Salesforce. Una plataforma de automatización de marketing escribe «Info Technology» mientras que su estándar es «Information Technology». Estas variaciones se acumulan en silencio.
Solución: aplique reglas de mapeo de valores en su capa de integración. Ejecute análisis de consistencia periódicos para detectar nuevas variaciones de fuentes de datos que no controla.
Inconsistencias de mayúsculas
Los usuarios introducen «Active», «active» y «ACTIVE» en distintos registros. Con la coincidencia sensible a mayúsculas desactivada, DQS cuenta las tres como conformes. Pero el campo sigue conteniendo tres grafías distintas en los datos en bruto.
Solución: decida si las mayúsculas importan para su caso de uso. Para los campos de cara al usuario, estandarice las mayúsculas mediante limpieza de datos. Para fines de coincidencia, desactive la sensibilidad a mayúsculas en su configuración de DQS.
Buenas prácticas
Defina los estándares antes de analizar
Documente el valor esperado para cada campo restringido antes de ejecutar su primer análisis. Sin un estándar claro, no hay línea base con la que medir.
| Campo | Estándar | Razón |
|---|---|---|
| Country | Códigos ISO 3166-1 alpha-2 (US, CA, DE) | Estándar del sector, compacto |
| Industry | Taxonomía personalizada de 15 valores | Coincide con las categorías de informes |
| Lead Source | 8 fuentes definidas por marketing | Alineado con el seguimiento de campañas |
Utilice el flujo de descubrimiento para campos desconocidos
Para los campos en los que no dispone de un estándar predefinido, utilice Import from Field primero. Deje que los datos le digan cuál es el estándar de facto. El valor con la mayor frecuencia suele ser la opción correcta como valor canónico.
Haga seguimiento del conformance a lo largo del tiempo
Una única puntuación de conformance es una instantánea. Haga seguimiento de las puntuaciones a lo largo de varios análisis para detectar la degradación pronto, medir el progreso de la limpieza e identificar las fuentes de datos que introducen nuevas variaciones.
Utilice Variant Count como alerta temprana
Monitorice Variant Count entre análisis. Un campo que salta de 12 a 28 valores distintos entre análisis tiene una nueva fuente de variación. Investigue antes de que el problema se extienda.
Priorice por impacto en el negocio
No todos los campos necesitan un 100 % de conformance. Céntrese en los campos que impulsan los informes (Country, Industry), alimentan la automatización (Status, Stage) o proporcionan datos a la IA y Agentforce.
Próximos pasos
Ya ha completado las cinco dimensiones de calidad de datos. Continúe con su aprendizaje:
- En Salesforce: La calidad de datos en Salesforce - estandarice los valores de picklist y de referencia en Salesforce
- Siguiente: Preparación para Agentforce - conozca los requisitos de datos específicos de la IA
- Anterior: Actualidad - mida la frescura y la vigencia de los datos
- Visión general: Las cinco dimensiones - revise todas las dimensiones en conjunto
- Acción: Evaluación de preparación para la IA - vea sus puntuaciones de consistencia y más