Définir la qualité des données
La qualité des données mesure à quel point vos données remplissent leur rôle. Il ne s’agit pas de savoir si les données sont « correctes » dans l’absolu. Il s’agit de savoir si vos données sont exploitables pour la prise de décision, les opérations et l’analytique.
Une adresse client est de qualité si elle atteint le client. Un code produit est de qualité si vos systèmes le reconnaissent. La qualité dépend du contexte.
Le principe du « fit for purpose »
La qualité des données est contextuelle. Une adresse d’expédition nécessite une précision au niveau de la rue. Une région marketing ne nécessite que le pays ou l’état. Les deux peuvent être « de haute qualité » à des niveaux de précision différents.
Pour évaluer la qualité des données, posez-vous la question : à quoi ces données doivent-elles servir ? Puis mesurez si elles peuvent le faire.
Le cadre des cinq dimensions
La qualité des données se mesure selon cinq dimensions clés. Ce cadre a été adopté dans tous les secteurs et sert de base aux normes ISO 8000 et DAMA.
| Dimension | Ce qu’elle mesure | Exemple |
|---|---|---|
| Complétude | Les données requises sont présentes | Tous les champs obligatoires sont remplis |
| Validité | Les données respectent les formats | Les adresses e-mail ont un format valide |
| Unicité | Aucun enregistrement en double | Un enregistrement par client |
| Actualité | Les données sont à jour | Les informations de contact mises à jour dans les 90 jours |
| Cohérence | Les données sont uniformes | « USA » utilisé de manière cohérente, pas « US » ni « United States » |
Chaque dimension répond à une question précise sur vos données. Ensemble, elles fournissent une image complète de la santé des données.
Pour des conseils détaillés sur chaque dimension, voir :
Normes et cadres sectoriels
ISO 8000
La norme ISO 8000 définit les exigences de qualité des données pour l’échange de master data. Elle établit les principes d’exactitude, de complétude et de cohérence des données entre organisations.
DAMA-DMBOK
Le Body of Knowledge de la Data Management Association (DAMA-DMBOK) définit la qualité des données comme l’un des onze domaines de connaissance du data management. Il fournit des conseils sur la mesure, la surveillance et les processus d’amélioration.
La règle 1-10-100
Ce principe illustre le coût croissant d’une mauvaise qualité des données :
| Étape | Coût | Exemple |
|---|---|---|
| Prévention | 1 $ | Validation à la saisie |
| Correction | 10 $ | Nettoyage des données après saisie |
| Défaillance | 100 $ | Impact métier de mauvaises données |
Investir dans la qualité des données à la source fait économiser des coûts significatifs en aval.
Qualité des données et concepts voisins
Qualité des données vs data management
Le data management est la pratique plus large de collecte, de stockage et de maintenance des données. La qualité des données est l’une de ses composantes, centrée spécifiquement sur l’adéquation à l’usage.
| Concept | Périmètre | Axe |
|---|---|---|
| Data management | Toutes les pratiques de données | Stockage, accès, sécurité, cycle de vie |
| Qualité des données | Adéquation à l’usage | Complétude, validité, unicité, actualité, cohérence |
| Gouvernance des données | Politiques et responsabilité | Qui possède les données, qui peut les modifier, quelles règles s’appliquent |
Qualité des données vs exactitude des données
L’exactitude demande : cette valeur reflète-t-elle la réalité ? La qualité demande : ces données fonctionnent-elles pour leur usage ?
Une adresse e-mail peut être valide (format correct) mais inexacte (la personne ne l’utilise plus). DQS mesure la qualité parce que le format et la complétude peuvent être automatisés. L’exactitude nécessite généralement une vérification externe.
Comment la qualité des données se mesure
Métriques quantitatives
La qualité des données s’exprime par des indicateurs mesurables :
| Type de métrique | Exemple | Calcul |
|---|---|---|
| Pourcentage | Taux de remplissage | (Enregistrements renseignés / Total) x 100 |
| Comptage | Nombre de doublons | Nombre d’enregistrements avec valeurs identiques |
| Score | Score de validité | Moyenne pondérée sur les règles de validation |
| Ratio | Taux de conformité | Valeurs conformes / Total des valeurs |
Seuils et objectifs
Les organisations définissent des seuils en fonction des exigences métier :
| Niveau | Seuil | Cas d’usage |
|---|---|---|
| Critique | 99 %+ | Champs de reporting réglementaire |
| Élevé | 95 %+ | Données en contact avec le client |
| Standard | 85 %+ | Données opérationnelles |
| Faible | 70 %+ | Données historiques ou d’archive |
Mesure continue vs ponctuelle
Une mesure ponctuelle fournit un instantané. Une mesure continue suit les tendances et détecte la dégradation tôt.
DQS prend en charge les deux approches :
- Lancez des scans ad hoc pour une évaluation immédiate
- Planifiez des scans récurrents pour une surveillance continue
Pourquoi les organisations peinent
1. Silos de données
Quand les données vivent dans des systèmes déconnectés, les incohérences apparaissent naturellement. Sales dispose d’une version d’un enregistrement client. Support en a une autre. Aucune équipe ne sait laquelle est correcte.
2. Erreurs de saisie manuelle
La saisie humaine est sujette aux fautes de frappe, aux formats incohérents et aux informations manquantes. Sans Validation Rules, ces erreurs s’accumulent avec le temps.
3. Pas de responsabilité claire
Quand personne n’est responsable de la qualité des données, elle devient le problème de tout le monde et la priorité de personne. Le data stewardship exige une attribution explicite.
4. Absence de mesure
Vous ne pouvez pas améliorer ce que vous ne mesurez pas. Beaucoup d’organisations supposent que leurs données sont « assez bonnes » sans établir de référence ni suivre de métriques.
5. Projets de nettoyage ponctuels
Traiter la qualité des données comme un projet plutôt que comme un processus mène à des améliorations temporaires qui se dégradent avec le temps.
L’impact métier
Une mauvaise qualité des données affecte toutes les fonctions :
| Fonction | Impact |
|---|---|
| Marketing | Campagnes envoyées à de mauvaises adresses, budget gaspillé |
| Commercial | Temps perdu sur des leads en double, contexte perdu |
| Finance | Rapports inexacts, risques de conformité |
| Opérations | Décisions basées sur des données erronées |
| IA / ML | Modèles entraînés sur de mauvaises données produisant de mauvais résultats |
Quantifier le coût
Les recherches du MIT Sloan et d’études sectorielles montrent que :
- Les organisations perdent 15 à 25 % de leur chiffre d’affaires chaque année à cause d’une mauvaise qualité des données
- Plus de 25 % des organisations perdent plus de 5 millions de dollars par an sur des problèmes de données (IBM 2025)
- Les employés passent jusqu’à 27 % de leur temps à corriger de mauvaises données
Le lien avec la préparation à l’IA
La qualité des données traditionnelle (les cinq dimensions) prépare vos données pour le reporting et l’automatisation. Les applications d’IA comme Agentforce reposent sur les mêmes fondations : enregistrements complets, formats valides, valeurs cohérentes, données à jour et absence de doublons.
Au-delà de ces cinq dimensions, le déploiement de l’IA introduit une préoccupation additionnelle : l’exposition de données sensibles. Avant de connecter des agents IA à vos données Salesforce, vous devez savoir où se trouvent les PII afin de pouvoir les masquer ou les exclure.
DQS mesure à la fois la qualité des données traditionnelle et la préparation à l’IA sur une seule plateforme :
- Cinq dimensions de qualité des données : complétude, validité, unicité, actualité, cohérence
- PII Detection : analyse les champs texte à la recherche de données sensibles (SSN, cartes de crédit, informations personnelles) avant toute exposition à l’IA
Construire une pratique de qualité des données
Une pratique efficace de qualité des données repose sur trois éléments :
1. Mesure
Établissez des références avant toute amélioration. Sachez où vous en êtes pour chaque dimension et chaque champ.
2. Processus
Définissez des workflows pour la maintenance continue des données :
- Validation Rules à la saisie
- Cycles de nettoyage réguliers
- Procédures d’escalade des incidents
- Protocoles de gestion du changement
3. Culture
Construisez un engagement à l’échelle de l’organisation :
- Attribuez des data stewards pour chaque domaine
- Incluez la qualité des données dans les indicateurs de performance
- Célébrez les améliorations et partagez les réussites
- Rendez la qualité visible grâce à des tableaux de bord
Démarrer avec DQS
DQS fournit le socle de mesure de votre pratique qualité des données :
- Sélectionnez les capabilities : choisissez les dimensions à mesurer
- Définissez le périmètre : choisissez les objets et champs à analyser
- Configurez les seuils : définissez vos standards de qualité
- Lancez les scans : exécutez l’analyse sur vos données
- Passez les résultats en revue : identifiez les problèmes et priorisez les corrections
La première étape consiste à comprendre votre état actuel. Passez l’évaluation de préparation à l’IA pour évaluer votre maturité qualité des données en 3 minutes.
Étapes suivantes
- Approfondissez la complétude, la première dimension
- Lisez Les cinq dimensions pour une vue d’ensemble
- Renseignez-vous sur Préparation à Agentforce pour les exigences spécifiques à l’IA
- Passez l’évaluation de préparation à l’IA pour voir vos scores actuels