Skip to main content

Cohérence : scénarios de configuration

Trois cas pratiques détaillés montrant comment configurer l'analyse de cohérence de DQS pour différents besoins métier.

Ce que couvrent ces scénarios

Cette page déroule trois configurations réelles de cohérence, de la mise en place initiale à la lecture des résultats. Chaque scénario utilise un contexte métier et un mode d’analyse différents.

Ces scénarios s’appuient sur les concepts et métriques de l’article principal Cohérence. Lisez-le d’abord si les termes Conformance Rate, Variant Count et Dominant Values vous sont nouveaux.

Scénario 1 : standardisation du champ Country avec découverte

Le contexte métier

Votre org contient 15 000 Accounts issus de 3 entreprises fusionnées. Le champ Country est en texte libre. Les dashboards régionaux affichent des données fragmentées : « United States » apparaît sur une ligne, « USA » sur une autre, « US » sur une troisième. Les règles d’assignation de territoire manquent des enregistrements parce qu’elles filtrent sur une seule orthographe. Vous devez standardiser, mais vous ne savez pas quelles valeurs existent sur les trois systèmes legacy.

Pas à pas de configuration

Commencez par Import from Field pour découvrir ce que contiennent vos données avant de définir les valeurs autorisées.

  1. Ouvrez la configuration Expected Values pour le champ Country.
  2. Cliquez sur Import from Field. DQS interroge les données en direct et renvoie les valeurs distinctes triées par fréquence.
  3. Passez la checklist en revue :
ValeurEnregistrements
United States4 500
USA2 300
US1 800
Canada1 400
U.S.A.450
United States of America150
… (41 autres variantes)
  1. Choisissez votre standard. Les codes pays ISO (« US », « CA », « UK ») sont compacts, standard du secteur et non ambigus. Cochez les codes ISO dans la liste.
  2. Cliquez sur Add Selected pour alimenter vos valeurs autorisées.

Définissez le reste de la configuration :

ParamètreValeurJustification
Mode d’analyseAdvanced Conformance AnalysisVous avez besoin de Variant Count et Dominant Values pour cadrer le nettoyage
Expected ValuesUS, CA, UK, DE, FR, AU, JPCodes ISO pour vos marchés actifs
Case SensitiveOFFAttraper « us », « Us » et « US » comme la même valeur
Top N10Voir les variantes les plus courantes
Min Frequency5Filtrer les typos uniques

Ce que le scan produit

MétriqueValeur
Conformance Rate12 %
Conformance Count1 800
Non-Conforming Count13 200
Variant Count47
Dominant ValuesTop 10 avec comptages (voir table ci-dessus)

Lire les résultats

12 % de conformité est attendu. Vous avez défini un nouveau standard (codes ISO) auquel les données n’ont jamais été normalisées. Seuls les 1 800 enregistrements contenant déjà « US » correspondent. Ce n’est pas un mauvais score. C’est votre point de départ.

47 variantes révèlent l’ampleur de la fragmentation. Trois systèmes fusionnés ont produit 47 façons d’exprimer les noms de pays. Sans ce chiffre, vous sous-estimeriez l’effort de nettoyage.

Dominant Values montre où se concentrer. Les 3 variantes du haut (« United States », « USA », « US ») représentent 8 600 enregistrements. Standardiser ces trois valeurs seules fait passer la conformité de 12 % à 69 %. Commencez là.

Non-Conforming Count (13 200) est votre périmètre de nettoyage exact. Votre data steward dispose d’une taille de projet concrète.

Action suivante

Construisez une table de mapping en vous appuyant sur Dominant Values. Mappez « United States » vers « US », « USA » vers « US », etc. Lancez la normalisation. Rescannez pour vérifier votre nouveau taux de conformité.

Scénario 2 : validation du rating Lead

Le contexte métier

Votre champ Lead Rating (Rating__c) est un champ texte qui accepte « Hot », « Warm » ou « Cold ». Les sales managers signalent des valeurs étranges dans leurs rapports pipeline. Un filtre sur Rating = "Hot" renvoie moins d’enregistrements qu’attendu. Vous avez besoin d’un audit de conformité rapide.

Pas à pas de configuration

Commencez par Import from Field pour voir les valeurs réelles.

  1. Ouvrez la configuration Expected Values pour Rating__c.
  2. Cliquez sur Import from Field. L’import renvoie :
ValeurEnregistrements
Hot284
Warm198
Cold156
Very High23
240 km/h12
N/A8

Les trois premières valeurs sont vos vraies évaluations. « Very High » vient d’une autre picklist (quelqu’un a collé depuis le mauvais champ). « 240 km/h » est clairement une donnée du mauvais champ. « N/A » est un placeholder.

  1. Cochez « Hot », « Warm » et « Cold ». Laissez le reste décoché.
  2. Cliquez sur Add Selected.

Définissez le reste de la configuration :

ParamètreValeurJustification
Mode d’analyseConformance CheckVous voulez une réponse oui/non, pas une analyse profonde
Expected ValuesHot, Warm, ColdVos trois évaluations valides
Case SensitiveOFFAttraper « hot », « HOT » et « Hot »

Ce que le scan produit

MétriqueValeur
Conformance Rate93,7 %
Conformance Count638

Lire les résultats

93,7 % conforme. Cela signifie que 43 enregistrements contiennent des données poubelle. Pour un audit rapide, le mode Conformance Check donne la réponse vite.

L’étape Import from Field vous a déjà dit à quoi ressemble le déchet. « Very High » (23 enregistrements issus d’une mauvaise picklist), « 240 km/h » (12 enregistrements avec donnée dans le mauvais champ) et « N/A » (8 entrées placeholder). Vous n’avez pas besoin de Dominant Values ici.

43 enregistrements est un nettoyage gérable. Ce n’est pas un projet de migration. C’est une correction manuelle de 30 minutes ou un seul job de mise à jour.

Action suivante

Corrigez les 43 enregistrements non conformes. Puis convertissez Rating__c de champ texte en picklist pour prévenir les problèmes futurs. Les enregistrements créés via API contournent la validation de picklist, donc lancez des scans de cohérence périodiques.

Scénario 3 : conformité Job Title pour le ciblage par persona

Le contexte métier

Votre équipe marketing lance des campagnes par persona ciblant les Contacts « VP et plus ». Le champ Title est en texte libre avec des milliers de variantes. Avant chaque campagne, quelqu’un cherche manuellement des mots-clés, rate la moitié des variantes et construit une audience incomplète. L’équipe a besoin d’une réponse pilotée par les données à deux questions : « Combien avons-nous de contacts VP+ ? » et « Quels titres ont les autres contacts ? »

Pas à pas de configuration

  1. Ouvrez la configuration Expected Values pour le champ Title sur Contacts.
  2. Cliquez sur Import from Field. L’import renvoie des centaines de valeurs.
  3. Définissez vos valeurs autorisées selon votre cartographie de personas. Cochez ou tapez les titres que votre équipe considère « VP et plus » :
VP, Vice President, SVP, Senior Vice President, EVP,
Executive Vice President, Director, Senior Director,
CEO, CFO, CTO, CIO, CMO, COO, President
  1. Cliquez sur Add Selected.

Définissez le reste :

ParamètreValeurJustification
Mode d’analyseAdvanced Conformance AnalysisVous voulez voir ce qui existe
Expected Values(16 valeurs listées)Votre définition de persona VP+
Case SensitiveOFFAttraper toutes les casses
Top N20Voir un large éventail
Min Frequency5Filtrer les entrées uniques comme « Chief Happiness Officer »

Ce que le scan produit

MétriqueValeur
Conformance Rate34 %
Conformance Count3 400
Non-Conforming Count6 600
Variant Count312

Dominant Values (Top 20) :

RangValeurNombre
1Manager820
2Sales Representative650
3Account Executive480
4Director of Marketing340
5VP of Sales290
6Senior Manager275
7Consultant240
8Engineer210
9CEO195
10Head of Operations180
(10 autres)

Lire les résultats

34 % de conformité n’est pas un échec. Ce n’est pas un problème de qualité. Cela signifie que 34 % de vos Contacts ont des titres VP+, et c’est votre audience cible.

312 variantes confirme que Title en texte libre est très fragmenté. 312 valeurs distinctes sur 10 000 Contacts. C’est normal pour du texte libre.

Dominant Values montre les titres réels de vos contacts. Beaucoup des meilleures valeurs sont en dessous du niveau VP (Manager, Sales Rep, Account Executive). C’est attendu. Ce sont des enregistrements valides avec des titres valides qui tombent hors du persona cible.

Non-Conforming Count (6 600) n’est PAS un périmètre de nettoyage. Ce sont des contacts avec des titres hors de votre filtre VP+. « Manager » est un vrai titre, pas une erreur.

Le vrai insight : vous avez désormais une taille d’audience pilotée par les données. 3 400 contacts VP+, vérifiés en scannant les données réelles. Plus de recherches par mots-clés manuelles.

Action suivante

Utilisez Conformance Count (3 400) comme taille d’audience pour votre campagne VP+. Revoyez la liste Dominant Values pour les titres que vous auriez manqués. « Senior Manager » (275) et « Head of Operations » (180) sont limites. Si ces rôles qualifient, ajoutez-les aux valeurs autorisées et rescannez.

Choisir votre configuration

Si vous devez…Commencez parParamètres clés
Auditer un champ contrôlé (picklist, rating, status)Import from Field, puis Conformance CheckExpected Values depuis l’import, Case Sensitive OFF
Standardiser un champ fragmenté (country, industry)Import from Field, puis Advanced Conformance AnalysisExpected Values comme standard cible, Top N 10+, Min Frequency 5+
Dimensionner une audience en texte libreImport from Field, puis Advanced Conformance AnalysisExpected Values comme définition de segment, Top N 20, Min Frequency 5
Obtenir une référence rapide avant un nettoyageImport from Field, puis Conformance CheckExpected Values depuis votre standard de données

Pour une explication complète des 6 métriques de cohérence, revenez à l’article principal Cohérence.

Prêt à mesurer votre propre qualité des données ? Passez l’évaluation de préparation à l’IA.