Skip to main content

Consistencia: escenarios de configuración

Tres recorridos prácticos que muestran cómo configurar el análisis de consistencia de DQS para distintas necesidades del negocio.

Lo que cubren estos escenarios

Esta página recorre tres configuraciones de consistencia del mundo real, desde la configuración inicial hasta la lectura de los resultados del análisis. Cada escenario utiliza un contexto de negocio y un modo de análisis distintos.

Estos escenarios se apoyan en los conceptos y las métricas tratados en el artículo principal de Consistencia. Léalo primero si términos como Conformance Rate, Variant Count y Dominant Values son nuevos para usted.

Escenario 1: estandarización del campo Country con descubrimiento

El contexto de negocio

Su org tiene 15 000 registros de Account procedentes de 3 empresas fusionadas. El campo Country es de texto libre. Los paneles regionales muestran datos fragmentados: «United States» aparece como una fila, «USA» como otra y «US» como una tercera. Las reglas de asignación de territorio pasan por alto registros porque filtran por una única grafía. Necesita estandarizar, pero no sabe qué valores existen en los tres sistemas heredados.

Recorrido de configuración

Empiece con Import from Field para descubrir qué contienen realmente sus datos antes de definir los valores permitidos.

  1. Abra la configuración de Expected Values para el campo Country.
  2. Haga clic en Import from Field. DQS consulta los datos en vivo y devuelve los valores distintos ordenados por frecuencia.
  3. Revise la lista de verificación. La importación revela la imagen completa:
ValorRegistros
United States4500
USA2300
US1800
Canada1400
U.S.A.450
United States of America150
… (41 variaciones más)
  1. Decida su estándar. Los códigos de país ISO («US», «CA», «UK») son compactos, estándar del sector e inequívocos. Marque los códigos ISO de la lista de importación.
  2. Haga clic en Add Selected para rellenar sus valores permitidos.

Establezca el resto de la configuración:

AjusteValorRazón
Modo de análisisAdvanced Conformance AnalysisNecesita recuentos de variantes y valores dominantes para delimitar la limpieza
Expected ValuesUS, CA, UK, DE, FR, AU, JPCódigos ISO para sus mercados activos
Case SensitiveDesactivadoCaptar «us», «Us» y «US» como el mismo valor
Top N10Ver las variaciones más habituales
Min Frequency5Filtrar las erratas puntuales

Qué produce el análisis

MétricaValor
Conformance Rate12 %
Conformance Count1800
Non-Conforming Count13 200
Variant Count47
Dominant ValuesLos 10 valores principales con recuentos (véase la tabla de importación)

Leer los resultados

El 12 % de conformance es esperable. Ha definido un nuevo estándar (códigos ISO) al que los datos nunca se han normalizado. Solo coinciden los 1800 registros que ya contienen «US». Esta no es una puntuación mala. Es su punto de partida.

47 variantes revelan el alcance de la fragmentación. Tres sistemas fusionados han producido 47 formas distintas de expresar los nombres de país. Sin esta cifra, subestimaría el esfuerzo de limpieza.

Dominant Values muestra dónde centrarse. Las tres variaciones principales («United States», «USA», «US») suman 8600 registros. Estandarizar solo esos tres valores eleva su conformance del 12 % al 69 %. Empiece por ahí.

Non-Conforming Count (13 200) es su alcance de limpieza exacto. Su data steward tiene ahora un tamaño de proyecto concreto, no una estimación.

Próxima acción

Construya una tabla de mapeo de valores utilizando la salida de Dominant Values. Mapee «United States» a «US», «USA» a «US», y así sucesivamente. Ejecute la normalización de datos. Vuelva a analizar para verificar su nueva Conformance Rate.

Escenario 2: validación de Lead Rating

El contexto de negocio

Su campo Lead Rating (Rating__c) es un campo de texto que acepta «Hot», «Warm» o «Cold». Los gerentes de ventas informan de valores extraños en sus informes de pipeline. Un filtro por Rating = "Hot" devuelve menos registros de los esperados. Necesita una auditoría rápida de conformance para averiguar qué hay en el campo y cuántos registros requieren limpieza.

Recorrido de configuración

Empiece con Import from Field para ver los valores reales antes de configurar su análisis.

  1. Abra la configuración de Expected Values para Rating__c.
  2. Haga clic en Import from Field. La importación devuelve:
ValorRegistros
Hot284
Warm198
Cold156
Very High23
240 km/h12
N/A8

Los tres primeros valores son sus valoraciones reales. «Very High» proviene de una lista desplegable distinta (alguien copió del campo equivocado). «240 km/h» es, claramente, un dato de un campo totalmente distinto. «N/A» es un placeholder.

  1. Marque «Hot», «Warm» y «Cold». Deje el resto sin marcar.
  2. Haga clic en Add Selected.

Establezca el resto de la configuración:

AjusteValorRazón
Modo de análisisConformance CheckNecesita una respuesta sí/no, no un análisis profundo
Expected ValuesHot, Warm, ColdSus tres valoraciones válidas
Case SensitiveDesactivadoCapta «hot», «HOT» y «Hot» como coincidentes

Qué produce el análisis

MétricaValor
Conformance Rate93,7 %
Conformance Count638

Leer los resultados

El 93,7 % conforma. Eso significa que 43 registros tienen datos basura. Para una auditoría rápida, el modo Conformance Check le da la respuesta con rapidez sin calcular métricas avanzadas.

El paso Import from Field ya le dijo qué aspecto tiene la basura. «Very High» (23 registros de un valor de lista desplegable equivocado), «240 km/h» (12 registros con datos de un campo equivocado) y «N/A» (8 entradas placeholder). No necesita Dominant Values aquí porque la importación le dio el desglose antes incluso de que se ejecutara el análisis.

43 registros es una limpieza manejable. No es un proyecto de migración de datos. Es una corrección manual de 30 minutos o un único trabajo de actualización de datos.

Próxima acción

Corrija los 43 registros no conformes. Después convierta Rating__c de campo de texto en lista desplegable para evitar futuras incidencias. Los registros creados por API eluden la validación de la lista desplegable, así que ejecute análisis de consistencia periódicos para detectar nuevas variaciones de las integraciones.

Escenario 3: conformance de Job Title para segmentación por persona

El contexto de negocio

Su equipo de marketing ejecuta campañas por persona dirigidas a Contacts de «VP o superior». El campo Title es texto libre con miles de variaciones. Antes de cada campaña, alguien busca manualmente palabras clave de cargos, pasa por alto la mitad de las variaciones y construye una lista de audiencia incompleta. El equipo necesita una respuesta basada en datos a dos preguntas: «¿cuántos contactos de VP o superior tenemos?» y «¿qué cargos tienen el resto de nuestros contactos?».

Recorrido de configuración

  1. Abra la configuración de Expected Values para el campo Title en Contacts.
  2. Haga clic en Import from Field. La importación devuelve cientos de valores. Demasiados para marcarlos individualmente, pero los recuentos de frecuencia son útiles como contexto.
  3. Defina sus valores permitidos según el mapeo de persona. Marque o escriba los valores de cargo que su equipo considera «VP o superior»:
VP, Vice President, SVP, Senior Vice President, EVP,
Executive Vice President, Director, Senior Director,
CEO, CFO, CTO, CIO, CMO, COO, President
  1. Haga clic en Add Selected.

Establezca el resto de la configuración:

AjusteValorRazón
Modo de análisisAdvanced Conformance AnalysisNecesita la distribución completa de valores para ver qué cargos existen
Expected Values(los 16 valores de cargo listados arriba)Su definición de persona VP o superior
Case SensitiveDesactivadoCaptar «vp of sales», «VP of Sales», «VP OF SALES»
Top N20Ver una amplia distribución de lo existente
Min Frequency5Filtrar entradas puntuales como «Chief Happiness Officer»

Qué produce el análisis

MétricaValor
Conformance Rate34 %
Conformance Count3400
Non-Conforming Count6600
Variant Count312

Dominant Values (Top 20):

PosiciónValorRecuento
1Manager820
2Sales Representative650
3Account Executive480
4Director of Marketing340
5VP of Sales290
6Senior Manager275
7Consultant240
8Engineer210
9CEO195
10Head of Operations180
(10 más)

Leer los resultados

El 34 % de conformance no es un fracaso. Este no es un problema de calidad de datos. Significa que el 34 % de sus Contacts ocupa cargos de VP o superior y esa es la audiencia objetivo de su campaña. La cifra responde a la pregunta que su equipo de marketing ha estado intentando adivinar.

312 Variant Count confirma que Title en texto libre está muy fragmentado. 312 valores de cargo distintos entre 10 000 Contacts. Es normal en los campos de texto libre y explica por qué las búsquedas manuales dejan fuera a gente.

Dominant Values muestra qué cargos tienen realmente sus contactos. Muchos de los valores principales están por debajo del nivel de VP (Manager, Sales Rep, Account Executive). Es esperable. Esos contactos son registros válidos con cargos válidos. Quedan fuera de su persona objetivo.

Non-Conforming Count (6600) NO es un alcance de limpieza. A diferencia del escenario de Country, no son registros sucios. Son contactos con cargos fuera de su filtro de VP o superior. «Manager» es un cargo real, no un error de datos. Trate Non-Conforming Count como «contactos fuera de esta persona», no como «registros que corregir».

La conclusión real: ahora dispone de un tamaño de audiencia basado en datos. 3400 contactos de VP o superior, verificados analizando los datos reales. Se acabaron las búsquedas manuales por palabras clave.

Próxima acción

Utilice el Conformance Count (3400) como tamaño de audiencia para su campaña de VP o superior. Revise la lista de Dominant Values buscando cargos que haya pasado por alto. «Senior Manager» (275 registros) y «Head of Operations» (180 registros) son casos límite. Si esos roles califican para sus campañas, añádalos a los valores permitidos y vuelva a analizar.

Elegir su configuración

Si necesita…Empiece porAjustes clave
Auditar un campo controlado (lista desplegable, valoración, estado)Import from Field y después Conformance CheckExpected Values desde la importación, Case Sensitive desactivado
Estandarizar un campo fragmentado (país, sector)Import from Field y después Advanced Conformance AnalysisExpected Values como su estándar objetivo, Top N 10+, Min Frequency 5+
Dimensionar una audiencia o segmento a partir de datos de texto libreImport from Field y después Advanced Conformance AnalysisExpected Values como su definición de segmento, Top N 20, Min Frequency 5
Obtener una línea base rápida antes de un proyecto de limpiezaImport from Field y después Conformance CheckExpected Values desde su estándar de datos

Para una explicación completa de las 6 métricas de consistencia, los modos de análisis y las entradas de configuración, vuelva al artículo principal de Consistencia.

¿Listo para medir su propia calidad de datos? Realice la Evaluación de preparación para la IA para ver sus puntuaciones de consistencia y más.