Qu’est-ce que la cohérence ?
La cohérence mesure si vos valeurs respectent un standard convenu. Un champ est cohérent quand chaque enregistrement utilise le même terme pour le même concept. Un champ est incohérent quand existent des variantes qui signifient la même chose mais sont exprimées différemment.
« USA », « United States » et « US » font tous référence au même pays. Pour Salesforce, ce sont trois valeurs distinctes. Un rapport groupé par Country produit trois lignes au lieu d’une. Une automatisation filtrée sur « USA » manque 230 enregistrements contenant « United States ».
Taux de conformité = (Enregistrements conformes / Total) x 100
Si 850 des 1 000 enregistrements Account ont une valeur Country qui correspond à votre liste de valeurs autorisées, votre taux de conformité Country est de 85 %. Les 15 % restants contiennent des variantes qui nécessitent standardisation.
Pourquoi la cohérence compte
Reporting
Des données incohérentes fragmentent vos rapports. Quand votre champ Country contient cinq orthographes différentes du même pays, un rapport groupé par Country affiche cinq lignes au lieu d’une. Le total est correct, mais le regroupement est faux.
Automatisation
L’automatisation Salesforce dépend de correspondances exactes. Un Workflow filtrant sur Country = "USA" manque les enregistrements contenant « United States » et « US ». L’automatisation s’exécute correctement sur les enregistrements correspondants mais saute silencieusement tout le reste.
IA et Agentforce
Les modèles d’IA traitent chaque variante comme un concept séparé. « USA » et « United States » deviennent deux pays différents du point de vue du modèle. Agentforce génère des réponses à partir de vos valeurs de champs. Des valeurs incohérentes produisent des sorties IA incohérentes.
| Système | Impact de la cohérence |
|---|---|
| Rapports | Regroupements fragmentés, totaux trompeurs |
| Workflows | Les filtres manquent les variantes |
| Duplicate Rules | Les variantes empêchent le bon rapprochement |
| Agentforce | Des valeurs incohérentes produisent des réponses IA peu fiables |
Comment DQS mesure la cohérence
DQS produit 6 métriques de cohérence organisées autour d’une question de diagnostic : « Vos valeurs respectent-elles un standard, et sinon, que font-elles à la place ? »
Étape 1 : quelle est la cohérence ?
Conformance Rate est la métrique principale. Il calcule le pourcentage d’enregistrements où la valeur correspond à l’une de vos valeurs autorisées.
Vous scannez l’objet Account. Le champ Country affiche un taux de conformité de 72 %. Cela signifie que 28 % de vos Accounts contiennent des valeurs de pays en dehors de votre liste autorisée. Vos Sharing Rules de territoire, vos dashboards régionaux et votre logique de localisation travaillent tous sur des données incomplètes.
Étape 2 : quelle est l’ampleur ?
Les taux indiquent la gravité. Les comptages indiquent la charge.
| Métrique | Ce qu’elle vous dit |
|---|---|
| Conformance Count | Combien d’enregistrements correspondent aux valeurs autorisées. Pour le reporting de couverture. |
| Non-Conforming Count | Combien d’enregistrements tombent en dehors. Pour cadrer les projets de nettoyage. |
Exemple : votre data steward doit nettoyer le champ Industry. Non-Conforming Count est de 3 400. Elle connaît maintenant le périmètre du projet et peut fixer un calendrier réaliste.
Étape 3 : à quel point les données sont-elles fragmentées ?
Variant Count mesure le nombre de valeurs distinctes trouvées dans un champ. Il répond : « De combien de façons différentes les gens expriment-ils cette donnée ? »
| Champ | Total | Variant Count | Évaluation |
|---|---|---|---|
| Country | 1 000 | 5 | Bien maîtrisé, probablement cohérent |
| Country | 1 000 | 47 | Très fragmenté, standardisation nécessaire |
| Industry | 500 | 12 | Raisonnable, probablement picklist |
| Industry | 500 | 89 | Chaos de texte libre, attention immédiate |
Exemple : lors d’un audit de l’org, vous scannez Lead_Source__c sur Leads. Variant Count renvoie 34. Votre équipe marketing a défini 8 sources. Les 26 variantes restantes sont des fautes d’orthographe, des abréviations et des entrées ad hoc depuis les intégrations.
Étape 4 : quelles sont les valeurs réelles ?
Dominant Values renvoie les N valeurs les plus fréquentes avec leur comptage. Cela vous dit à quoi ressemblent réellement vos données, pas ce à quoi vous vous attendez.
| Rang | Valeur | Nombre | Pourcentage |
|---|---|---|---|
| 1 | United States | 450 | 45 % |
| 2 | USA | 230 | 23 % |
| 3 | US | 180 | 18 % |
| 4 | U.S.A. | 45 | 4,5 % |
| 5 | United States of America | 15 | 1,5 % |
Exemple : votre équipe débat de la standardisation Country vers des codes ISO (« US ») ou des noms complets (« United States »). Dominant Values montre que 45 % des enregistrements utilisent déjà « United States ». Standardiser vers cette valeur exige de changer 55 % des enregistrements. Standardiser vers « US » exige d’en changer 82 %.
Référence des métriques
Métriques fondamentales
| Métrique | Type | Ce qu’elle mesure |
|---|---|---|
| Conformance Rate | Pourcentage | Part des enregistrements correspondant aux valeurs autorisées |
| Conformance Count | Comptage | Nombre d’enregistrements correspondants |
Métriques avancées
| Métrique | Type | Ce qu’elle mesure |
|---|---|---|
| Non-Conforming Count | Comptage | Enregistrements en dehors de la liste autorisée |
| Non-Conformance Rate | Pourcentage | Part des enregistrements en dehors |
| Variant Count | Comptage | Total de valeurs distinctes trouvées |
| Dominant Values | Liste | Top N des valeurs les plus fréquentes |
Couverture des types de champs
| Type de champ | Focus cohérence |
|---|---|
| String (Text) | Abréviations, orthographe, casse |
| TextArea | Standardisation de texte libre |
| Picklist | Validation des valeurs réelles par rapport aux options attendues |
| Standardisation des domaines, cohérence de format | |
| Phone | Standardisation des formats (indicatifs, séparateurs) |
| URL | Cohérence de protocole et de chemin |
Deux modes d’analyse
Conformance Check répond à : « Les valeurs correspondent-elles à ma liste autorisée ? » Il produit les 2 métriques fondamentales.
Advanced Conformance Analysis produit les 6 métriques, y compris les comptages non conformes, la détection de variantes et la distribution des valeurs dominantes.
| Besoin métier | Mode recommandé |
|---|---|
| Audit rapide de conformité | Conformance Check |
| Nettoyage post-migration | Advanced (Variant Count révèle le chaos importé) |
| Évaluation de préparation IA | Advanced (Dominant Values montre ce dont l’IA apprendra) |
| Gouvernance continue | Commencer par Conformance Check, passer à Advanced |
Configurer la cohérence
DQS propose quatre paramètres de configuration pour la cohérence.
| Paramètre | Ce qu’il contrôle |
|---|---|
| Expected Values | La liste des valeurs que DQS traite comme « conformes ». Obligatoire. |
| Case Sensitive | Contrôle si la correspondance tient compte de la casse. Désactivé par défaut. |
| Top N | Combien de valeurs dominantes retourner (1 à 100). Par défaut : 5. |
| Min Frequency | Le nombre minimal d’occurrences pour figurer dans Dominant Values. Par défaut : 1. |
Astuce : commencez par utiliser Import from Field pour voir quelles valeurs existent vraiment dans vos données avant de définir votre liste autorisée.
Import from Field : configuration par découverte
Un défi courant avec la cohérence est de savoir quelles valeurs attendre. Vous ne pouvez pas définir des valeurs autorisées si vous ne savez pas ce que contiennent vos données.
Import from Field résout cela. Il interroge les données réelles du champ, groupe les valeurs par fréquence et affiche les résultats sous forme de checklist.
Comment ça marche :
- Ouvrez la configuration Expected Values.
- Cliquez sur Import from Field. DQS interroge les données en direct et renvoie les valeurs distinctes triées par fréquence.
- Passez la checklist en revue. Chaque valeur indique combien d’enregistrements la contiennent.
- Cochez les valeurs que vous considérez correctes. Laissez décochées les valeurs incorrectes, mal formées ou placeholder.
- Cliquez sur Add Selected. Les valeurs cochées alimentent votre liste autorisée.
Exemple : vous configurez la cohérence pour un champ Rating__c. Import from Field renvoie :
| Valeur | Enregistrements |
|---|---|
| Hot | 284 |
| Warm | 198 |
| Cold | 156 |
| Very High | 23 |
| 240 km/h | 12 |
| N/A | 8 |
Les trois premières valeurs sont vos vraies évaluations. Vous les cochez. « Very High » est une erreur de saisie. « 240 km/h » est clairement une donnée dans le mauvais champ. « N/A » est un placeholder. Vous les laissez décochées.
Problèmes de cohérence courants
Variantes de pays et de région
L’incohérence la plus courante dans Salesforce. Sans standardisation, un concept unique comme « United States » apparaît sous 5 valeurs distinctes ou plus.
Correctif : activez les State and Country Picklists Salesforce pour tous les champs d’adresse. Utilisez DQS pour trouver et nettoyer les valeurs non conformes existantes.
Champs texte libre sans gouvernance
Les champs texte sans contrainte de picklist accumulent des variantes avec le temps. Industry, Job Title, Lead Source et Department sont des coupables fréquents.
Correctif : convertissez en picklists les champs texte libre à forte valeur. Utilisez Import from Field pour voir votre distribution actuelle avant de définir les options.
Variantes créées par intégration
Les systèmes externes et les API écrivent des enregistrements qui contournent la validation de l’UI Salesforce. Une plateforme de marketing automation écrit « Info Technology » alors que votre standard est « Information Technology ».
Correctif : appliquez des règles de mapping dans votre couche d’intégration. Lancez des scans de cohérence périodiques.
Incohérences de casse
Les utilisateurs saisissent « Active », « active » et « ACTIVE » sur différents enregistrements. Avec la correspondance insensible à la casse, DQS les compte tous comme conformes. Mais le champ contient toujours trois orthographes.
Correctif : décidez si la casse compte pour votre cas d’usage.
Bonnes pratiques
Définissez vos standards avant de scanner
Documentez la valeur attendue pour chaque champ contraint avant de lancer votre premier scan.
| Champ | Standard | Justification |
|---|---|---|
| Country | Codes ISO 3166-1 alpha-2 (US, CA, DE) | Norme du secteur, compacte |
| Industry | Taxonomie personnalisée à 15 valeurs | Correspond aux catégories de reporting |
| Lead Source | 8 sources définies par le marketing | Aligné avec le suivi de campagnes |
Utilisez la découverte pour les champs inconnus
Pour les champs sans standard prédéfini, utilisez Import from Field d’abord. Laissez les données vous dire quel est le standard de facto.
Suivez la conformité dans le temps
Un score de conformité unique est un instantané. Suivez les scores sur plusieurs scans.
Utilisez Variant Count comme alerte précoce
Un champ qui passe de 12 à 28 valeurs distinctes entre deux scans a une nouvelle source de variation.
Priorisez par impact métier
Tous les champs n’ont pas besoin de 100 % de conformité. Concentrez-vous sur les champs qui alimentent le reporting, l’automatisation ou l’IA.
Étapes suivantes
Vous avez maintenant parcouru les cinq dimensions de la qualité des données. Poursuivez votre apprentissage :
- Dans Salesforce : La qualité des données dans Salesforce — standardisez les valeurs de picklist et de référence dans Salesforce
- Suivant : Préparation à Agentforce — exigences spécifiques à l’IA
- Précédent : Actualité — mesurer la fraîcheur des données
- Vue d’ensemble : Les cinq dimensions — revoir toutes les dimensions ensemble
- Action : Évaluation de préparation à l’IA — voir vos scores de cohérence