Cohérence : scénarios de configuration

Ce que couvrent ces scénarios

Cette page déroule trois configurations réelles de cohérence, de la mise en place initiale à la lecture des résultats. Chaque scénario utilise un contexte métier et un mode d’analyse différents.

Ces scénarios s’appuient sur les concepts et métriques de l’article principal Cohérence. Lisez-le d’abord si les termes Conformance Rate, Variant Count et Dominant Values vous sont nouveaux.

Scénario 1 : standardisation du champ Country avec découverte

Le contexte métier

Votre org contient 15 000 Accounts issus de 3 entreprises fusionnées. Le champ Country est en texte libre. Les dashboards régionaux affichent des données fragmentées : « United States » apparaît sur une ligne, « USA » sur une autre, « US » sur une troisième. Les règles d’assignation de territoire manquent des enregistrements parce qu’elles filtrent sur une seule orthographe. Vous devez standardiser, mais vous ne savez pas quelles valeurs existent sur les trois systèmes legacy.

Pas à pas de configuration

Commencez par Import from Field pour découvrir ce que contiennent vos données avant de définir les valeurs autorisées.

Ouvrez la configuration Expected Values pour le champ Country.
Cliquez sur Import from Field. DQS interroge les données en direct et renvoie les valeurs distinctes triées par fréquence.
Passez la checklist en revue :

Valeur	Enregistrements
United States	4 500
USA	2 300
US	1 800
Canada	1 400
U.S.A.	450
United States of America	150
… (41 autres variantes)	…

Choisissez votre standard. Les codes pays ISO (« US », « CA », « UK ») sont compacts, standard du secteur et non ambigus. Cochez les codes ISO dans la liste.
Cliquez sur Add Selected pour alimenter vos valeurs autorisées.

Définissez le reste de la configuration :

Paramètre	Valeur	Justification
Mode d’analyse	Advanced Conformance Analysis	Vous avez besoin de Variant Count et Dominant Values pour cadrer le nettoyage
Expected Values	US, CA, UK, DE, FR, AU, JP	Codes ISO pour vos marchés actifs
Case Sensitive	OFF	Attraper « us », « Us » et « US » comme la même valeur
Top N	10	Voir les variantes les plus courantes
Min Frequency	5	Filtrer les typos uniques

Ce que le scan produit

Métrique	Valeur
Conformance Rate	12 %
Conformance Count	1 800
Non-Conforming Count	13 200
Variant Count	47
Dominant Values	Top 10 avec comptages (voir table ci-dessus)

Lire les résultats

12 % de conformité est attendu. Vous avez défini un nouveau standard (codes ISO) auquel les données n’ont jamais été normalisées. Seuls les 1 800 enregistrements contenant déjà « US » correspondent. Ce n’est pas un mauvais score. C’est votre point de départ.

47 variantes révèlent l’ampleur de la fragmentation. Trois systèmes fusionnés ont produit 47 façons d’exprimer les noms de pays. Sans ce chiffre, vous sous-estimeriez l’effort de nettoyage.

Dominant Values montre où se concentrer. Les 3 variantes du haut (« United States », « USA », « US ») représentent 8 600 enregistrements. Standardiser ces trois valeurs seules fait passer la conformité de 12 % à 69 %. Commencez là.

Non-Conforming Count (13 200) est votre périmètre de nettoyage exact. Votre data steward dispose d’une taille de projet concrète.

Action suivante

Construisez une table de mapping en vous appuyant sur Dominant Values. Mappez « United States » vers « US », « USA » vers « US », etc. Lancez la normalisation. Rescannez pour vérifier votre nouveau taux de conformité.

Scénario 2 : validation du rating Lead

Le contexte métier

Votre champ Lead Rating (Rating__c) est un champ texte qui accepte « Hot », « Warm » ou « Cold ». Les sales managers signalent des valeurs étranges dans leurs rapports pipeline. Un filtre sur Rating = "Hot" renvoie moins d’enregistrements qu’attendu. Vous avez besoin d’un audit de conformité rapide.

Pas à pas de configuration

Commencez par Import from Field pour voir les valeurs réelles.

Ouvrez la configuration Expected Values pour Rating__c.
Cliquez sur Import from Field. L’import renvoie :

Valeur	Enregistrements
Hot	284
Warm	198
Cold	156
Very High	23
240 km/h	12
N/A	8

Les trois premières valeurs sont vos vraies évaluations. « Very High » vient d’une autre picklist (quelqu’un a collé depuis le mauvais champ). « 240 km/h » est clairement une donnée du mauvais champ. « N/A » est un placeholder.

Cochez « Hot », « Warm » et « Cold ». Laissez le reste décoché.
Cliquez sur Add Selected.

Définissez le reste de la configuration :

Paramètre	Valeur	Justification
Mode d’analyse	Conformance Check	Vous voulez une réponse oui/non, pas une analyse profonde
Expected Values	Hot, Warm, Cold	Vos trois évaluations valides
Case Sensitive	OFF	Attraper « hot », « HOT » et « Hot »

Ce que le scan produit

Métrique	Valeur
Conformance Rate	93,7 %
Conformance Count	638

Lire les résultats

93,7 % conforme. Cela signifie que 43 enregistrements contiennent des données poubelle. Pour un audit rapide, le mode Conformance Check donne la réponse vite.

L’étape Import from Field vous a déjà dit à quoi ressemble le déchet. « Very High » (23 enregistrements issus d’une mauvaise picklist), « 240 km/h » (12 enregistrements avec donnée dans le mauvais champ) et « N/A » (8 entrées placeholder). Vous n’avez pas besoin de Dominant Values ici.

43 enregistrements est un nettoyage gérable. Ce n’est pas un projet de migration. C’est une correction manuelle de 30 minutes ou un seul job de mise à jour.

Action suivante

Corrigez les 43 enregistrements non conformes. Puis convertissez Rating__c de champ texte en picklist pour prévenir les problèmes futurs. Les enregistrements créés via API contournent la validation de picklist, donc lancez des scans de cohérence périodiques.

Scénario 3 : conformité Job Title pour le ciblage par persona

Le contexte métier

Votre équipe marketing lance des campagnes par persona ciblant les Contacts « VP et plus ». Le champ Title est en texte libre avec des milliers de variantes. Avant chaque campagne, quelqu’un cherche manuellement des mots-clés, rate la moitié des variantes et construit une audience incomplète. L’équipe a besoin d’une réponse pilotée par les données à deux questions : « Combien avons-nous de contacts VP+ ? » et « Quels titres ont les autres contacts ? »

Pas à pas de configuration

Ouvrez la configuration Expected Values pour le champ Title sur Contacts.
Cliquez sur Import from Field. L’import renvoie des centaines de valeurs.
Définissez vos valeurs autorisées selon votre cartographie de personas. Cochez ou tapez les titres que votre équipe considère « VP et plus » :

VP, Vice President, SVP, Senior Vice President, EVP,
Executive Vice President, Director, Senior Director,
CEO, CFO, CTO, CIO, CMO, COO, President

Cliquez sur Add Selected.

Définissez le reste :

Paramètre	Valeur	Justification
Mode d’analyse	Advanced Conformance Analysis	Vous voulez voir ce qui existe
Expected Values	(16 valeurs listées)	Votre définition de persona VP+
Case Sensitive	OFF	Attraper toutes les casses
Top N	20	Voir un large éventail
Min Frequency	5	Filtrer les entrées uniques comme « Chief Happiness Officer »

Ce que le scan produit

Métrique	Valeur
Conformance Rate	34 %
Conformance Count	3 400
Non-Conforming Count	6 600
Variant Count	312

Dominant Values (Top 20) :

Rang	Valeur	Nombre
1	Manager	820
2	Sales Representative	650
3	Account Executive	480
4	Director of Marketing	340
5	VP of Sales	290
6	Senior Manager	275
7	Consultant	240
8	Engineer	210
9	CEO	195
10	Head of Operations	180
…	(10 autres)	…

Lire les résultats

34 % de conformité n’est pas un échec. Ce n’est pas un problème de qualité. Cela signifie que 34 % de vos Contacts ont des titres VP+, et c’est votre audience cible.

312 variantes confirme que Title en texte libre est très fragmenté. 312 valeurs distinctes sur 10 000 Contacts. C’est normal pour du texte libre.

Dominant Values montre les titres réels de vos contacts. Beaucoup des meilleures valeurs sont en dessous du niveau VP (Manager, Sales Rep, Account Executive). C’est attendu. Ce sont des enregistrements valides avec des titres valides qui tombent hors du persona cible.

Non-Conforming Count (6 600) n’est PAS un périmètre de nettoyage. Ce sont des contacts avec des titres hors de votre filtre VP+. « Manager » est un vrai titre, pas une erreur.

Le vrai insight : vous avez désormais une taille d’audience pilotée par les données. 3 400 contacts VP+, vérifiés en scannant les données réelles. Plus de recherches par mots-clés manuelles.

Action suivante

Utilisez Conformance Count (3 400) comme taille d’audience pour votre campagne VP+. Revoyez la liste Dominant Values pour les titres que vous auriez manqués. « Senior Manager » (275) et « Head of Operations » (180) sont limites. Si ces rôles qualifient, ajoutez-les aux valeurs autorisées et rescannez.

Choisir votre configuration

Si vous devez…	Commencez par	Paramètres clés
Auditer un champ contrôlé (picklist, rating, status)	Import from Field, puis Conformance Check	Expected Values depuis l’import, Case Sensitive OFF
Standardiser un champ fragmenté (country, industry)	Import from Field, puis Advanced Conformance Analysis	Expected Values comme standard cible, Top N 10+, Min Frequency 5+
Dimensionner une audience en texte libre	Import from Field, puis Advanced Conformance Analysis	Expected Values comme définition de segment, Top N 20, Min Frequency 5
Obtenir une référence rapide avant un nettoyage	Import from Field, puis Conformance Check	Expected Values depuis votre standard de données

Pour une explication complète des 6 métriques de cohérence, revenez à l’article principal Cohérence.

Prêt à mesurer votre propre qualité des données ? Passez l’évaluation de préparation à l’IA.