Skip to main content

¿Qué es la calidad de datos?

Conozca qué significa la calidad de datos, cómo medirla y por qué determina el éxito de sus iniciativas de informes, automatización e IA.

Definir la calidad de datos

La calidad de datos mide en qué medida sus datos sirven a su propósito previsto. No se trata de si los datos son «correctos» en términos absolutos, sino de si son aptos para su uso en la toma de decisiones, las operaciones y la analítica.

La dirección de un cliente es de alta calidad si llega al cliente. Un código de producto es de alta calidad si sus sistemas lo reconocen. La calidad depende del contexto.

El principio de «apto para el propósito»

La calidad de datos es contextual. Una dirección de envío requiere precisión a nivel de calle. Una región de marketing solo requiere país o estado. Ambas pueden ser «de alta calidad» con niveles de precisión distintos.

Al evaluar la calidad de los datos, pregúntese: ¿qué tienen que hacer estos datos? Después mida si pueden hacerlo.

El marco de las cinco dimensiones

La calidad de datos se mide en cinco dimensiones clave. Este marco se ha adoptado en diversos sectores y constituye la base de los estándares ISO 8000 y DAMA.

DimensiónQué mideEjemplo
CompletitudLos datos requeridos están presentesTodos los campos obligatorios están cumplimentados
ValidezLos datos se ajustan a los formatosLas direcciones de correo tienen un formato válido
UnicidadNo hay registros duplicadosUn registro por cliente
ActualidadLos datos están vigentesInformación de contacto actualizada en los últimos 90 días
ConsistenciaLos datos son uniformesSe usa «USA» de forma consistente, no «US» ni «United States»

Cada dimensión responde a una pregunta concreta sobre sus datos. En conjunto ofrecen una imagen completa del estado de los datos.

Para orientación detallada sobre cada dimensión, consulte:

Estándares y marcos del sector

ISO 8000

El estándar ISO 8000 define los requisitos de calidad de datos para el intercambio de datos maestros. Establece principios de precisión, completitud y consistencia entre organizaciones.

DAMA-DMBOK

El Body of Knowledge de la Data Management Association (DAMA-DMBOK) define la calidad de datos como una de las once áreas de conocimiento de la gestión de datos. Ofrece orientación sobre los procesos de medición, monitorización y mejora.

La regla del 1-10-100

Este principio ilustra el coste creciente de la mala calidad de datos:

FaseCosteEjemplo
Prevención1 $Validación en la entrada de datos
Corrección10 $Limpieza de datos tras la entrada
Fallo100 $Impacto en el negocio de los datos deficientes

Invertir en calidad de datos en el origen ahorra costes significativos más adelante.

La calidad de datos frente a conceptos relacionados

Calidad de datos frente a gestión de datos

La gestión de datos es la práctica más amplia de recopilar, almacenar y mantener datos. La calidad de datos es un componente de la gestión de datos, centrado específicamente en la aptitud para el uso.

ConceptoAlcanceFoco
Gestión de datosTodas las prácticas de datosAlmacenamiento, acceso, seguridad, ciclo de vida
Calidad de datosAptitud para el propósitoCompletitud, validez, unicidad, actualidad, consistencia
Gobernanza de datosPolíticas y propiedadQuién posee los datos, quién puede modificarlos, qué reglas se aplican

Calidad de datos frente a precisión de datos

La precisión pregunta: ¿refleja este valor la realidad? La calidad pregunta: ¿estos datos funcionan para su propósito?

Una dirección de correo puede ser válida (formato correcto) pero imprecisa (la persona ya no la utiliza). DQS mide la calidad porque el formato y la completitud pueden automatizarse. La precisión normalmente requiere verificación externa.

Cómo se mide la calidad de datos

Métricas cuantitativas

La calidad de datos se expresa mediante indicadores medibles:

Tipo de métricaEjemploCálculo
PorcentajeFill Rate(Registros cumplimentados / Registros totales) x 100
RecuentoRecuento de duplicadosNúmero de registros con valores coincidentes
PuntuaciónPuntuación de validezMedia ponderada entre las reglas de validación
RatioConformance RateValores conformes / Valores totales

Umbrales y objetivos

Las organizaciones establecen umbrales según los requisitos del negocio:

NivelUmbralCaso de uso
Crítico99 %+Campos de informes regulatorios
Alto95 %+Datos de cara al cliente
Estándar85 %+Datos operativos
Bajo70 %+Datos históricos o de archivo

Medición continua frente a puntual

La medición puntual ofrece una instantánea. La medición continua sigue las tendencias y detecta la degradación pronto.

DQS admite ambos enfoques:

  • Ejecute análisis ad hoc para una evaluación inmediata
  • Programe análisis recurrentes para una monitorización continua

Por qué las organizaciones tienen dificultades

1. Silos de datos

Cuando los datos residen en sistemas desconectados, las inconsistencias se producen de forma natural. Ventas tiene una versión del registro de un cliente. Soporte tiene otra. Ninguno sabe cuál es la correcta.

2. Errores de entrada manual

La entrada manual de datos es propensa a erratas, formatos inconsistentes e información faltante. Sin reglas de validación, estos errores se acumulan con el tiempo.

3. Falta de propiedad clara

Cuando nadie es responsable de la calidad de datos, se convierte en problema de todos y prioridad de nadie. El data stewardship requiere una asignación explícita.

4. Falta de medición

No se puede mejorar lo que no se mide. Muchas organizaciones asumen que sus datos son lo bastante buenos sin establecer líneas base ni hacer seguimiento de métricas.

5. Proyectos de limpieza puntuales

Tratar la calidad de datos como un proyecto en lugar de como un proceso conduce a mejoras temporales que se degradan con el tiempo.

El impacto en el negocio

La mala calidad de datos afecta a todas las funciones:

FunciónImpacto
MarketingCampañas enviadas a direcciones erróneas, gasto desperdiciado
VentasTiempo perdido en leads duplicados, pérdida de contexto
FinanzasInformes imprecisos, riesgos de cumplimiento
OperacionesDecisiones basadas en datos defectuosos
IA/MLLos modelos entrenados con datos deficientes producen resultados deficientes

Cuantificar el coste

La investigación de MIT Sloan y los estudios del sector muestran que:

  • Las organizaciones pierden entre el 15 % y el 25 % de los ingresos anuales debido a la mala calidad de los datos
  • Más del 25 % de las organizaciones pierden más de 5 millones de dólares al año por incidencias de datos (IBM 2025)
  • Los empleados dedican hasta el 27 % de su tiempo a corregir datos deficientes

Conexión con la preparación para la IA

La calidad de datos tradicional (las cinco dimensiones) prepara sus datos para los informes y la automatización. Las aplicaciones de IA como Agentforce dependen de los mismos fundamentos: registros completos, formatos válidos, valores consistentes, datos vigentes y ausencia de duplicados.

Además de esas cinco dimensiones, el despliegue de IA introduce una preocupación adicional: la exposición de datos sensibles. Antes de conectar agentes de IA a sus datos de Salesforce, debe saber dónde reside el PII para poder enmascararlo o excluirlo.

DQS mide tanto la calidad de datos tradicional como la preparación para la IA en una sola plataforma:

  • Las cinco dimensiones de calidad de datos: completitud, validez, unicidad, actualidad, consistencia
  • Detección de PII: analiza los campos de texto en busca de datos sensibles (SSN, tarjetas de crédito, información personal) antes de exponerlos a la IA

Construir una práctica de calidad de datos

Una práctica de calidad de datos eficaz requiere tres elementos:

1. Medición

Establezca líneas base antes de mejorar. Sepa en qué punto se encuentra en cada dimensión y campo.

2. Proceso

Defina flujos de trabajo para el mantenimiento continuo de los datos:

  • Reglas de validación en la entrada de datos
  • Calendarios regulares de depuración
  • Procedimientos de escalado de incidencias
  • Protocolos de gestión del cambio

3. Cultura

Cree un compromiso en toda la organización:

  • Asigne data stewards para cada dominio
  • Incluya la calidad de datos en las métricas de rendimiento
  • Celebre las mejoras y comparta los éxitos
  • Haga visible la calidad mediante paneles

Empezar con DQS

DQS proporciona la base de medición para su práctica de calidad de datos:

  1. Seleccionar capacidades: elija qué dimensiones medir
  2. Definir alcance: elija los objetos y campos que analizar
  3. Configurar umbrales: establezca sus estándares de calidad
  4. Ejecutar análisis: lleve a cabo el análisis sobre sus datos
  5. Revisar resultados: identifique las incidencias y priorice las correcciones

El primer paso es comprender su situación actual. Realice la Evaluación de preparación para la IA para valorar la madurez de su calidad de datos en 3 minutos.

Próximos pasos