Skip to main content

Les cinq dimensions de la qualité des données

Découvrez les cinq dimensions mesurées par DQS : complétude, validité, unicité, actualité et cohérence.

Comprendre les cinq dimensions

La qualité des données se mesure sur cinq dimensions clés. Chaque dimension répond à une question précise sur vos données ; ensemble, elles déterminent si vos données sont adaptées à leur usage.

DQS mesure les cinq dimensions nativement dans Salesforce.

DimensionQuestion cléExemple de problème
ComplétudeLa donnée est-elle présente ?Adresses e-mail manquantes
ValiditéLe format est-il correct ?Numéros de téléphone mal formés
UnicitéChaque enregistrement est-il distinct ?Contacts en double
ActualitéLa donnée est-elle à jour ?Dates d’Opportunity périmées
CohérenceLa donnée est-elle uniforme ?« USA » vs « United States »

1. Complétude

La complétude mesure si les valeurs requises sont présentes et non manquantes.

Ce que mesure DQS

  • Taux de remplissage : pourcentage d’enregistrements avec des valeurs non vides
  • Détection des blancs : chaînes vides et valeurs contenant uniquement des espaces
  • Détection des placeholders : valeurs comme « N/A », « TBD » ou « Unknown »

Pourquoi la complétude compte

Des données incomplètes cassent l’automatisation. Quand un Workflow exige une adresse e-mail qui n’existe pas, le Workflow échoue. Quand un rapport filtre par Industry mais que la moitié de vos enregistrements n’ont pas de valeur d’Industry, vos analytiques ne montrent qu’une partie du tableau.

Problèmes courants de complétude

ProblèmeExempleImpact
Champs videsContact Phone videImpossible d’appeler les prospects
Valeurs placeholder« TBD » dans Company NameInvalide pour le reporting
Espaces uniquement« » dans DescriptionApparaît rempli mais ne l’est pas

Astuce : commencez par vos champs les plus critiques. Vous n’avez pas besoin de 100 % de complétude sur chaque champ, seulement sur ceux qui comptent pour votre cas d’usage.

2. Validité

La validité mesure si les valeurs respectent les formats et motifs attendus.

Ce que mesure DQS

  • Validation de format : motifs pour e-mails, téléphones, URL
  • Correspondance de motifs : expressions régulières personnalisées
  • Validation de domaine : listes de valeurs autorisées

Validité vs exactitude

Validité et exactitude sont deux choses différentes. Une adresse e-mail peut être valide (format correct) mais inexacte (mauvaise personne). DQS mesure la validité parce que la validation de format peut être automatisée. L’exactitude nécessite une vérification externe.

ContrôleValide ?Exact ?
[email protected]OuiInconnu sans vérification
john@companyNonS/O (format erroné)
[email protected]OuiNon (la personne a quitté l’entreprise)

Problèmes courants de validité dans Salesforce

  • Adresses e-mail sans « @ » ou sans domaine
  • Numéros de téléphone avec un nombre de chiffres incorrect
  • URL sans protocole (http/https)
  • Texte libre là où des valeurs de picklist sont attendues

3. Unicité

L’unicité mesure si les valeurs sont distinctes et non dupliquées.

Ce que mesure DQS

  • Détection de doublons : correspondances exactes entre enregistrements
  • Comptage distinct : nombre total de valeurs uniques par champ
  • Analyse d’entropie : diversité et distribution des valeurs

Le coût des doublons

Les enregistrements en double gaspillent du stockage, dérangent les utilisateurs et produisent des métriques gonflées. Quand une équipe de vente a deux enregistrements pour la même entreprise, elle perd le contexte et risque une relance embarrassante en double.

Les études montrent que :

  • Les bases B2B contiennent en moyenne 10 à 30 % d’enregistrements en double
  • Chaque doublon coûte aux organisations en envois d’e-mails gaspillés, en reporting brouillé et en historique client fragmenté

Prévention vs détection des doublons

DQS se concentre sur la détection, qui vous aide à identifier les doublons déjà existants. La prévention (arrêter les doublons dès leur création) nécessite des Validation Rules et des Matching Rules dans la configuration Salesforce.

4. Actualité

L’actualité mesure si les données sont suffisamment récentes pour l’usage qu’on en fait.

Ce que mesure DQS

  • Taux de fraîcheur : pourcentage d’enregistrements dans l’âge acceptable
  • Détection des données périmées : enregistrements dépassant votre seuil
  • Âge moyen : moyenne de l’âge des valeurs de champs date
  • Détection de dates futures : dates invalides dans le futur

Définir des seuils de fraîcheur

Différents types de données ont des exigences de fraîcheur différentes :

Type de donnéeSeuil typiquePourquoi
Lead Last Activity30 joursLes leads froids perdent de la valeur
Informations de contact90 joursLes gens changent d’emploi
Opportunity Close DateTrimestre en coursPrécision des prévisions
Account Annual Revenue1 anMises à jour annuelles attendues

Pourquoi l’actualité compte pour l’IA

Les modèles d’IA et de machine learning apprennent de vos données. Quand vos données sont périmées, l’IA apprend des motifs dépassés. Agentforce, par exemple, utilise vos données Salesforce pour formuler ses réponses. Des informations de contact obsolètes conduisent à des recommandations incorrectes.

5. Cohérence

La cohérence mesure si les valeurs sont uniformes et standardisées.

Ce que mesure DQS

  • Taux de conformité : pourcentage correspondant aux motifs attendus
  • Détection de variantes : différentes représentations de la même valeur
  • Analyse de la valeur dominante : valeur la plus courante par champ

Types d’incohérence

TypeExempleProblème
Variation de format« USA » vs « United States » vs « US »Casse le filtrage et le regroupement
Variation orthographique« Acme Corp » vs « ACME Corporation »Crée de faux doublons
Variation de casse« new york » vs « New York »Peu professionnel dans les rapports

Pourquoi la cohérence compte pour l’IA

Les modèles d’IA traitent « USA » et « United States » comme des valeurs différentes. Si vos enregistrements utilisent les deux, l’IA ne peut pas les regrouper correctement. Des données incohérentes fragmentent la compréhension de votre IA et produisent des résultats peu fiables.

Atteindre la cohérence

  • Utilisez des picklists plutôt que du texte libre quand c’est possible
  • Standardisez sur un format unique pour chaque champ
  • Importez depuis les valeurs de picklist lors de la configuration des contrôles de cohérence DQS

Équilibrer les dimensions

Toutes les dimensions ne sont pas également importantes pour tous les cas d’usage. Réfléchissez à vos besoins :

Cas d’usageDimensions prioritaires
Campagnes marketingComplétude, validité (pour la délivrabilité)
Prévisions commercialesActualité, complétude
Service clientUnicité (une seule source de vérité)
IA / AgentforceLes cinq, plus les contrôles de préparation IA

Couverture des dimensions par DQS

DQS mesure les cinq dimensions grâce à des capabilities complètes :

DimensionCe que DQS mesure
ComplétudeTaux de remplissage, détection de null, détection de blancs, détection de placeholders, logique contextuelle
ValiditéValidation de format, motifs regex personnalisés, identification des enregistrements invalides
UnicitéDétection de doublons, analyse d’entropie, distribution des fréquences
ActualitéTaux de fraîcheur, détection des données périmées, âge moyen, détection de dates futures
CohérenceContrôle de conformité, découverte de variantes, analyse de la valeur dominante

Étapes suivantes

Maintenant que vous comprenez les cinq dimensions :

  1. Passez l’évaluation de préparation à l’IA pour voir vos scores actuels
  2. Lisez Préparation à Agentforce pour des contrôles additionnels au-delà de la qualité des données de base
  3. Apprenez à utiliser le Definition Builder pour configurer votre premier scan