Ce que couvrent ces scénarios
Cette page déroule trois configurations réelles de cohérence, de la mise en place initiale à la lecture des résultats. Chaque scénario utilise un contexte métier et un mode d’analyse différents.
Ces scénarios s’appuient sur les concepts et métriques de l’article principal Cohérence. Lisez-le d’abord si les termes Conformance Rate, Variant Count et Dominant Values vous sont nouveaux.
Scénario 1 : standardisation du champ Country avec découverte
Le contexte métier
Votre org contient 15 000 Accounts issus de 3 entreprises fusionnées. Le champ Country est en texte libre. Les dashboards régionaux affichent des données fragmentées : « United States » apparaît sur une ligne, « USA » sur une autre, « US » sur une troisième. Les règles d’assignation de territoire manquent des enregistrements parce qu’elles filtrent sur une seule orthographe. Vous devez standardiser, mais vous ne savez pas quelles valeurs existent sur les trois systèmes legacy.
Pas à pas de configuration
Commencez par Import from Field pour découvrir ce que contiennent vos données avant de définir les valeurs autorisées.
- Ouvrez la configuration Expected Values pour le champ
Country. - Cliquez sur Import from Field. DQS interroge les données en direct et renvoie les valeurs distinctes triées par fréquence.
- Passez la checklist en revue :
| Valeur | Enregistrements |
|---|---|
| United States | 4 500 |
| USA | 2 300 |
| US | 1 800 |
| Canada | 1 400 |
| U.S.A. | 450 |
| United States of America | 150 |
| … (41 autres variantes) | … |
- Choisissez votre standard. Les codes pays ISO (« US », « CA », « UK ») sont compacts, standard du secteur et non ambigus. Cochez les codes ISO dans la liste.
- Cliquez sur Add Selected pour alimenter vos valeurs autorisées.
Définissez le reste de la configuration :
| Paramètre | Valeur | Justification |
|---|---|---|
| Mode d’analyse | Advanced Conformance Analysis | Vous avez besoin de Variant Count et Dominant Values pour cadrer le nettoyage |
| Expected Values | US, CA, UK, DE, FR, AU, JP | Codes ISO pour vos marchés actifs |
| Case Sensitive | OFF | Attraper « us », « Us » et « US » comme la même valeur |
| Top N | 10 | Voir les variantes les plus courantes |
| Min Frequency | 5 | Filtrer les typos uniques |
Ce que le scan produit
| Métrique | Valeur |
|---|---|
| Conformance Rate | 12 % |
| Conformance Count | 1 800 |
| Non-Conforming Count | 13 200 |
| Variant Count | 47 |
| Dominant Values | Top 10 avec comptages (voir table ci-dessus) |
Lire les résultats
12 % de conformité est attendu. Vous avez défini un nouveau standard (codes ISO) auquel les données n’ont jamais été normalisées. Seuls les 1 800 enregistrements contenant déjà « US » correspondent. Ce n’est pas un mauvais score. C’est votre point de départ.
47 variantes révèlent l’ampleur de la fragmentation. Trois systèmes fusionnés ont produit 47 façons d’exprimer les noms de pays. Sans ce chiffre, vous sous-estimeriez l’effort de nettoyage.
Dominant Values montre où se concentrer. Les 3 variantes du haut (« United States », « USA », « US ») représentent 8 600 enregistrements. Standardiser ces trois valeurs seules fait passer la conformité de 12 % à 69 %. Commencez là.
Non-Conforming Count (13 200) est votre périmètre de nettoyage exact. Votre data steward dispose d’une taille de projet concrète.
Action suivante
Construisez une table de mapping en vous appuyant sur Dominant Values. Mappez « United States » vers « US », « USA » vers « US », etc. Lancez la normalisation. Rescannez pour vérifier votre nouveau taux de conformité.
Scénario 2 : validation du rating Lead
Le contexte métier
Votre champ Lead Rating (Rating__c) est un champ texte qui accepte « Hot », « Warm » ou « Cold ». Les sales managers signalent des valeurs étranges dans leurs rapports pipeline. Un filtre sur Rating = "Hot" renvoie moins d’enregistrements qu’attendu. Vous avez besoin d’un audit de conformité rapide.
Pas à pas de configuration
Commencez par Import from Field pour voir les valeurs réelles.
- Ouvrez la configuration Expected Values pour
Rating__c. - Cliquez sur Import from Field. L’import renvoie :
| Valeur | Enregistrements |
|---|---|
| Hot | 284 |
| Warm | 198 |
| Cold | 156 |
| Very High | 23 |
| 240 km/h | 12 |
| N/A | 8 |
Les trois premières valeurs sont vos vraies évaluations. « Very High » vient d’une autre picklist (quelqu’un a collé depuis le mauvais champ). « 240 km/h » est clairement une donnée du mauvais champ. « N/A » est un placeholder.
- Cochez « Hot », « Warm » et « Cold ». Laissez le reste décoché.
- Cliquez sur Add Selected.
Définissez le reste de la configuration :
| Paramètre | Valeur | Justification |
|---|---|---|
| Mode d’analyse | Conformance Check | Vous voulez une réponse oui/non, pas une analyse profonde |
| Expected Values | Hot, Warm, Cold | Vos trois évaluations valides |
| Case Sensitive | OFF | Attraper « hot », « HOT » et « Hot » |
Ce que le scan produit
| Métrique | Valeur |
|---|---|
| Conformance Rate | 93,7 % |
| Conformance Count | 638 |
Lire les résultats
93,7 % conforme. Cela signifie que 43 enregistrements contiennent des données poubelle. Pour un audit rapide, le mode Conformance Check donne la réponse vite.
L’étape Import from Field vous a déjà dit à quoi ressemble le déchet. « Very High » (23 enregistrements issus d’une mauvaise picklist), « 240 km/h » (12 enregistrements avec donnée dans le mauvais champ) et « N/A » (8 entrées placeholder). Vous n’avez pas besoin de Dominant Values ici.
43 enregistrements est un nettoyage gérable. Ce n’est pas un projet de migration. C’est une correction manuelle de 30 minutes ou un seul job de mise à jour.
Action suivante
Corrigez les 43 enregistrements non conformes. Puis convertissez Rating__c de champ texte en picklist pour prévenir les problèmes futurs. Les enregistrements créés via API contournent la validation de picklist, donc lancez des scans de cohérence périodiques.
Scénario 3 : conformité Job Title pour le ciblage par persona
Le contexte métier
Votre équipe marketing lance des campagnes par persona ciblant les Contacts « VP et plus ». Le champ Title est en texte libre avec des milliers de variantes. Avant chaque campagne, quelqu’un cherche manuellement des mots-clés, rate la moitié des variantes et construit une audience incomplète. L’équipe a besoin d’une réponse pilotée par les données à deux questions : « Combien avons-nous de contacts VP+ ? » et « Quels titres ont les autres contacts ? »
Pas à pas de configuration
- Ouvrez la configuration Expected Values pour le champ
Titlesur Contacts. - Cliquez sur Import from Field. L’import renvoie des centaines de valeurs.
- Définissez vos valeurs autorisées selon votre cartographie de personas. Cochez ou tapez les titres que votre équipe considère « VP et plus » :
VP, Vice President, SVP, Senior Vice President, EVP,
Executive Vice President, Director, Senior Director,
CEO, CFO, CTO, CIO, CMO, COO, President
- Cliquez sur Add Selected.
Définissez le reste :
| Paramètre | Valeur | Justification |
|---|---|---|
| Mode d’analyse | Advanced Conformance Analysis | Vous voulez voir ce qui existe |
| Expected Values | (16 valeurs listées) | Votre définition de persona VP+ |
| Case Sensitive | OFF | Attraper toutes les casses |
| Top N | 20 | Voir un large éventail |
| Min Frequency | 5 | Filtrer les entrées uniques comme « Chief Happiness Officer » |
Ce que le scan produit
| Métrique | Valeur |
|---|---|
| Conformance Rate | 34 % |
| Conformance Count | 3 400 |
| Non-Conforming Count | 6 600 |
| Variant Count | 312 |
Dominant Values (Top 20) :
| Rang | Valeur | Nombre |
|---|---|---|
| 1 | Manager | 820 |
| 2 | Sales Representative | 650 |
| 3 | Account Executive | 480 |
| 4 | Director of Marketing | 340 |
| 5 | VP of Sales | 290 |
| 6 | Senior Manager | 275 |
| 7 | Consultant | 240 |
| 8 | Engineer | 210 |
| 9 | CEO | 195 |
| 10 | Head of Operations | 180 |
| … | (10 autres) | … |
Lire les résultats
34 % de conformité n’est pas un échec. Ce n’est pas un problème de qualité. Cela signifie que 34 % de vos Contacts ont des titres VP+, et c’est votre audience cible.
312 variantes confirme que Title en texte libre est très fragmenté. 312 valeurs distinctes sur 10 000 Contacts. C’est normal pour du texte libre.
Dominant Values montre les titres réels de vos contacts. Beaucoup des meilleures valeurs sont en dessous du niveau VP (Manager, Sales Rep, Account Executive). C’est attendu. Ce sont des enregistrements valides avec des titres valides qui tombent hors du persona cible.
Non-Conforming Count (6 600) n’est PAS un périmètre de nettoyage. Ce sont des contacts avec des titres hors de votre filtre VP+. « Manager » est un vrai titre, pas une erreur.
Le vrai insight : vous avez désormais une taille d’audience pilotée par les données. 3 400 contacts VP+, vérifiés en scannant les données réelles. Plus de recherches par mots-clés manuelles.
Action suivante
Utilisez Conformance Count (3 400) comme taille d’audience pour votre campagne VP+. Revoyez la liste Dominant Values pour les titres que vous auriez manqués. « Senior Manager » (275) et « Head of Operations » (180) sont limites. Si ces rôles qualifient, ajoutez-les aux valeurs autorisées et rescannez.
Choisir votre configuration
| Si vous devez… | Commencez par | Paramètres clés |
|---|---|---|
| Auditer un champ contrôlé (picklist, rating, status) | Import from Field, puis Conformance Check | Expected Values depuis l’import, Case Sensitive OFF |
| Standardiser un champ fragmenté (country, industry) | Import from Field, puis Advanced Conformance Analysis | Expected Values comme standard cible, Top N 10+, Min Frequency 5+ |
| Dimensionner une audience en texte libre | Import from Field, puis Advanced Conformance Analysis | Expected Values comme définition de segment, Top N 20, Min Frequency 5 |
| Obtenir une référence rapide avant un nettoyage | Import from Field, puis Conformance Check | Expected Values depuis votre standard de données |
Pour une explication complète des 6 métriques de cohérence, revenez à l’article principal Cohérence.
Prêt à mesurer votre propre qualité des données ? Passez l’évaluation de préparation à l’IA.