Lo que cubren estos escenarios
Esta página recorre tres configuraciones del mundo real del análisis de validez de DQS. Cada escenario cubre un problema de negocio concreto, muestra los ajustes exactos que utilizar y explica cómo leer los resultados.
Estos recorridos se apoyan en los conceptos del artículo principal de Validez. Léalo primero si es nuevo en las métricas de validez, el flujo de diagnóstico o la configuración de patrones.
Escenario 1: validación de correo secundario en un campo de texto personalizado
El problema
Su organización almacena una dirección de correo secundaria en un campo de texto personalizado Secondary_Email__c del objeto Contact. A diferencia del campo Email estándar de Salesforce, un campo de texto no tiene validación de formato integrada. Los usuarios pegan, escriben e importan cualquier cosa en él. Marketing quiere utilizar esas direcciones secundarias para una campaña de reactivación, pero nadie sabe cuántas son estructuralmente válidas. Necesita una cifra concreta para que marketing pueda fijar proyecciones realistas de campaña y para que su equipo de operaciones pueda delimitar la limpieza.
¿Por qué no el campo Email estándar? El tipo de campo Email nativo de Salesforce valida el formato en la entrada. Los valores de un campo Email estándar ya superan las comprobaciones básicas de formato. La validación de correo de DQS es útil en campos de texto personalizados que almacenan direcciones de correo sin la aplicación nativa de Salesforce.
Configuración
Utilice el modo Format Validation sobre el objeto Contact, dirigiéndose al campo Secondary_Email__c. Necesita la tasa de validez principal y un recuento de registros utilizables. La detección de placeholders y el análisis de ruido no son relevantes aquí porque las direcciones de correo o coinciden con el formato o no.
| Ajuste | Valor | Motivo |
|---|---|---|
| Modo de análisis | Format Validation | Necesita la tasa de coincidencia y el recuento de válidos, no el desglose completo de no válidos |
| Pattern Type | Patrón integrado: ^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$ | |
| Include Blanks | Desactivado | Los correos en blanco son un problema de completitud, no de validez. Manténgalos fuera de este análisis. |
| Case Sensitive | Desactivado | Las direcciones de correo no distinguen entre mayúsculas y minúsculas por definición |
El patrón Email es un preset integrado. No necesita escribir regex. Seleccione «Email» en el selector de patrones y el regex se aplica automáticamente.
Resultados de ejemplo
| Métrica | Valor |
|---|---|
| Validity Rate | 71 % |
| Valid Count | 35 500 |
Total de registros de Contact evaluados: 50 000.
Leer los resultados
Empiece por la cifra principal: 71 % de validez. Eso significa que el 29 % de las direcciones de correo secundarias no supera la comprobación de formato. De 50 000 Contacts con Secondary_Email__c cumplimentado, solo 35 500 tienen una dirección estructuralmente válida.
Qué aspecto tiene un 29 % de no válidos en la práctica: son valores a los que les falta el símbolo «@» (john.company.com), sin extensión de dominio (john@company), con puntos dobles ([email protected]) o con espacios (john @company.com). Al tratarse de un campo de texto, Salesforce los aceptó todos en la entrada. Cada campaña enviada a esas direcciones rebota.
La aritmética de la campaña cambia. Marketing ha estado proyectando el alcance de la reactivación basándose en 50 000 direcciones secundarias. La audiencia direccionable real es de 35 500. Las tasas de apertura, clic y conversión deben recalcularse sobre la base válida, no sobre el total inflado.
Por qué basta con Format Validation. No necesita el modo Advanced para este escenario. La pregunta es sencilla: «¿cuántos correos secundarios coinciden con un formato válido?». Validity Rate y Valid Count responden a esa pregunta. Si más adelante necesita delimitar un proyecto de limpieza con recuentos exactos de no válidos, cambie a Advanced Format Validation para el desglose completo.
Qué hacer a continuación
Utilice Valid Count (35 500) como la audiencia direccionable real para la planificación de la campaña. Delimite un proyecto de limpieza para los 14 500 registros restantes: expórtelos, identifique los errores de formato más habituales y corríjalos mediante enriquecimiento de datos o corrección manual. Plantéese añadir una regla de validación de Salesforce en Secondary_Email__c para imponer el formato de correo en las entradas futuras, o convertir el campo al tipo Email si sus procesos lo permiten.
Escenario 2: validación de códigos de producto con Fixed Length
El problema
Su empresa utiliza códigos de producto de 8 caracteres en un campo personalizado Product_Code__c del objeto Opportunity Product. Estos códigos impulsan las búsquedas de inventario, las reglas de precios y la integración con el ERP. La sincronización con el ERP falla en aproximadamente el 5 % de los registros cada semana, y el equipo de integración sospecha que hay códigos de producto mal formados. Necesita confirmar cuántos códigos no superan la comprobación de formato y obtener el alcance exacto de la limpieza.
Configuración
Utilice el modo Advanced Format Validation sobre el objeto Opportunity Product, dirigiéndose al campo Product_Code__c. Necesita el desglose completo de válidos e inválidos para que el equipo de integración disponga de recuentos exactos para su proyecto de remediación.
| Ajuste | Valor | Motivo |
|---|---|---|
| Modo de análisis | Advanced Format Validation | Necesita Invalid Count para delimitar la limpieza, más Noise Rate para comprobar entradas basura |
| Pattern Type | Fixed Length | Los códigos de producto tienen siempre exactamente 8 caracteres |
| Fixed Length | 8 | Su longitud de código estándar |
| Include Blanks | Activado | Un código de producto en blanco no es válido para la sincronización con el ERP. Cuéntelo como fallo. |
| Case Sensitive | Desactivado | En su sistema, los códigos de producto no dependen de las mayúsculas |
El patrón Fixed Length genera automáticamente el regex ^.{8}$. Cualquier valor que no tenga exactamente 8 caracteres falla la validación.
Resultados de ejemplo
Métricas base:
| Métrica | Valor |
|---|---|
| Validity Rate | 94,2 % |
| Valid Count | 9420 |
Métricas avanzadas:
| Métrica | Valor |
|---|---|
| Invalid Rate | 5,8 % |
| Invalid Count | 580 |
| Noise Rate | 0,4 % |
| Noisy Records Count | 40 |
Total de registros evaluados: 10 000.
Leer los resultados
El 5,8 % de no válidos confirma la estimación del equipo de integración. 580 códigos de producto de 10 000 no coinciden con el formato de 8 caracteres. Son los registros que rompen la sincronización con el ERP.
Invalid Count (580) es el alcance de la limpieza. Su equipo de integración tiene ahora una cifra concreta. En lugar de investigar cada fallo de sincronización individualmente, puede extraer los 580 registros, categorizar los errores de formato y corregirlos en lote. Los problemas habituales en los campos de código de producto incluyen códigos truncados (5-7 caracteres por errores de copiar y pegar), códigos con espacios finales (9 caracteres debido a un espacio invisible) y códigos con guiones o prefijos añadidos por los usuarios («PC-12345678»).
Noise Rate (0,4 %) es baja, pero vale la pena señalarla. 40 registros contienen patrones de ruido: caracteres repetidos («XXXXXXXX»), entradas de teclado («asdfghjk») o cadenas de caracteres especiales. Esos 40 registros no son errores de formato. Son entradas basura que resultan tener exactamente 8 caracteres. Validity Rate los contó como válidos porque superan la comprobación de longitud, pero son datos basura que fallarán la búsqueda en el ERP por otra razón. Noise Rate capta lo que la comprobación de formato deja pasar.
Include Blanks activado importa aquí. Con Include Blanks activado, cualquier registro en el que Product_Code__c esté vacío cuenta como no válido. Si hubiera dejado este ajuste desactivado, esos registros en blanco quedarían excluidos por completo de la evaluación y su Invalid Count sería menor que el número real de registros que fallan la sincronización. Dado que un código de producto en blanco rompe la integración igual que uno mal formado, incluir los blancos le da el alcance de fallo preciso.
Qué hacer a continuación
Exporte los 580 registros no válidos para el equipo de integración. Categorice los errores por tipo: códigos truncados, caracteres adicionales, espacios finales. Corríjalos en lote mediante un trabajo de actualización de datos. Para los 40 registros ruidosos, investigue el origen. Si provienen de una importación o usuario concretos, aborde esa causa raíz. Tras la limpieza, añada una regla de validación de Salesforce que imponga la longitud de 8 caracteres en Product_Code__c para evitar nuevas entradas deficientes. Vuelva a analizar para verificar su nueva Validity Rate.
Escenario 3: detección de ruido en Company de web-to-lead
El problema
Su formulario web-to-lead exige el campo Company. El volumen de leads es alto: 20 000 nuevos leads por trimestre. Pero el equipo de SDR informa de que muchos leads tienen nombres de empresa basura, entradas como «asdf», «test», «xxx» o «na na na». Estos leads desperdician el tiempo de los SDR y contaminan su segmentación. Una comprobación básica de completitud muestra que el 98 % de los leads tiene valor de Company. Sospecha que el 98 % es engañoso porque las entradas basura están técnicamente «cumplimentadas».
Configuración
Utilice el modo Advanced Format Validation sobre el objeto Lead, dirigiéndose al campo Company. Necesita Noise Rate para cuantificar la basura que se esconde tras una puntuación de completitud saludable.
Para el patrón de formato, no hay una regla de formato estricta para los nombres de empresa. Los nombres de empresa son texto libre. Utilice una validación mínima de texto que compruebe que el valor contiene al menos un carácter alfanumérico.
| Ajuste | Valor | Motivo |
|---|---|---|
| Modo de análisis | Advanced Format Validation | Necesita Noise Rate y Noisy Records Count para cuantificar las entradas basura |
| Pattern Type | Custom | Ningún patrón integrado encaja con los nombres de empresa en texto libre |
| Custom Pattern | ^.*[a-zA-Z0-9].*$ | Coincide con cualquier valor que contenga al menos una letra o dígito. Capta los valores que son puramente caracteres especiales. |
| Include Blanks | Activado | Los nombres de empresa en blanco también son un problema. Inclúyalos en el recuento de fallos. |
| Case Sensitive | Desactivado | No es relevante para este patrón, pero déjelo desactivado como valor por defecto |
El valor real de este análisis está en las métricas de ruido, no en la validación de formato. El patrón personalizado es intencionadamente laxo porque no está imponiendo un formato concreto de nombre de empresa. Ejecuta el análisis en modo Advanced para acceder a Noise Rate y Noisy Records Count.
Resultados de ejemplo
Métricas base:
| Métrica | Valor |
|---|---|
| Validity Rate | 97,5 % |
| Valid Count | 19 500 |
Métricas avanzadas:
| Métrica | Valor |
|---|---|
| Invalid Rate | 2,5 % |
| Invalid Count | 500 |
| Noise Rate | 12 % |
| Noisy Records Count | 2400 |
Total de registros de Lead evaluados: 20 000.
Leer los resultados
El 97,5 % de validez es esperable y no es el objetivo. Casi todos los valores superan la comprobación de formato laxa porque el patrón solo requiere un carácter alfanumérico. Los 500 registros no válidos son entradas con solo caracteres especiales o espacios en blanco, valores como «---», «…» o «!!!». Son fáciles de identificar y eliminar.
Noise Rate (12 %) es el hallazgo real. 2400 leads tienen nombres de empresa que contienen patrones de ruido. Son entradas con caracteres repetidos («aaaa», «xxxxx»), caracteres especiales consecutivos («!@#$%») o caracteres de control. Superan la comprobación de formato porque contienen caracteres alfanuméricos, pero los valores son basura.
La imagen real de calidad de datos:
| Categoría | Registros | Qué significa |
|---|---|---|
| Limpios y válidos | 17 100 | Nombres de empresa reales listos para el contacto por los SDR |
| No válidos (basura pura) | 500 | Sin contenido alfanumérico alguno. Eliminar o poner en cuarentena. |
| Ruidosos (basura oculta) | 2400 | Parecen cumplimentados, pero contienen basura. Revisión manual o marca automática. |
Su equipo de SDR tiene razón: el problema de calidad de los leads es real. 2900 de 20 000 leads (14,5 %) tienen datos de empresa inutilizables. Ese es un 14,5 % del tiempo de los SDR desperdiciado en leads que nunca podrán enrutarse, enriquecerse ni segmentarse correctamente.
La brecha entre completitud y validez. La completitud dice que el 98 % de los leads tiene valor de Company. La validez dice que el 97,5 % supera la comprobación de formato. Noise Rate dice que el 12 % de esos valores que superan la comprobación son basura. Cada dimensión revela una capa distinta del problema. La completitud por sí sola pasa por alto la basura que Noise Rate sí capta.
Qué hacer a continuación
Construya una cola de limpieza con los 2900 registros combinados de no válidos y ruidosos. Para los 500 registros puramente no válidos, elimínelos automáticamente o póngalos en cuarentena. Para los 2400 registros ruidosos, decida: eliminar automáticamente los leads sin otros datos útiles, o marcarlos para revisión manual si los datos de teléfono o correo siguen siendo utilizables.
Arregle la fuente. La basura proviene de su formulario web. Añada validación en el cliente: una longitud mínima de caracteres, bloquee los patrones de caracteres repetidos y plantéese utilizar CAPTCHA para prevenir bots. Tras implementar los cambios en el formulario, vuelva a ejecutar el análisis el próximo trimestre y compare Noise Rate con esta línea base.
Elegir su configuración
Utilice esta tabla para elegir el punto de partida adecuado para su análisis de validez.
| Si necesita… | Empiece por | Ajustes clave |
|---|---|---|
| Comprobar el formato de correo en campos de texto personalizados | Format Validation | Pattern Type: Email, Include Blanks: desactivado |
| Validar códigos de longitud fija (códigos de producto, SKU, códigos postales) | Advanced Format Validation | Pattern Type: Fixed Length, establezca su número de caracteres, Include Blanks: activado |
| Validar el formato URL en campos de sitio web | Format Validation | Pattern Type: URL, Include Blanks: desactivado |
| Imponer un formato de negocio personalizado (regex) | Advanced Format Validation | Pattern Type: Custom, introduzca su patrón regex |
| Detectar basura y ruido en campos de texto libre | Advanced Format Validation | Utilice un patrón de formato laxo y céntrese en Noise Rate y Noisy Records Count |
| Delimitar un proyecto de limpieza de datos para una integración | Advanced Format Validation | Include Blanks: activado, use Invalid Count y Noisy Records Count para dimensionar el proyecto |
Para una referencia completa de las 6 métricas de validez, los tipos de patrón y los detalles de la detección de ruido, vuelva al artículo principal de Validez.
¿Listo para medir su propia calidad de datos? Realice la Evaluación de preparación para la IA para ver sus puntuaciones de validez y más.