Comprendre les cinq dimensions
La qualité des données se mesure sur cinq dimensions clés. Chaque dimension répond à une question précise sur vos données ; ensemble, elles déterminent si vos données sont adaptées à leur usage.
DQS mesure les cinq dimensions nativement dans Salesforce.
| Dimension | Question clé | Exemple de problème |
|---|---|---|
| Complétude | La donnée est-elle présente ? | Adresses e-mail manquantes |
| Validité | Le format est-il correct ? | Numéros de téléphone mal formés |
| Unicité | Chaque enregistrement est-il distinct ? | Contacts en double |
| Actualité | La donnée est-elle à jour ? | Dates d’Opportunity périmées |
| Cohérence | La donnée est-elle uniforme ? | « USA » vs « United States » |
1. Complétude
La complétude mesure si les valeurs requises sont présentes et non manquantes.
Ce que mesure DQS
- Taux de remplissage : pourcentage d’enregistrements avec des valeurs non vides
- Détection des blancs : chaînes vides et valeurs contenant uniquement des espaces
- Détection des placeholders : valeurs comme « N/A », « TBD » ou « Unknown »
Pourquoi la complétude compte
Des données incomplètes cassent l’automatisation. Quand un Workflow exige une adresse e-mail qui n’existe pas, le Workflow échoue. Quand un rapport filtre par Industry mais que la moitié de vos enregistrements n’ont pas de valeur d’Industry, vos analytiques ne montrent qu’une partie du tableau.
Problèmes courants de complétude
| Problème | Exemple | Impact |
|---|---|---|
| Champs vides | Contact Phone vide | Impossible d’appeler les prospects |
| Valeurs placeholder | « TBD » dans Company Name | Invalide pour le reporting |
| Espaces uniquement | « » dans Description | Apparaît rempli mais ne l’est pas |
Astuce : commencez par vos champs les plus critiques. Vous n’avez pas besoin de 100 % de complétude sur chaque champ, seulement sur ceux qui comptent pour votre cas d’usage.
2. Validité
La validité mesure si les valeurs respectent les formats et motifs attendus.
Ce que mesure DQS
- Validation de format : motifs pour e-mails, téléphones, URL
- Correspondance de motifs : expressions régulières personnalisées
- Validation de domaine : listes de valeurs autorisées
Validité vs exactitude
Validité et exactitude sont deux choses différentes. Une adresse e-mail peut être valide (format correct) mais inexacte (mauvaise personne). DQS mesure la validité parce que la validation de format peut être automatisée. L’exactitude nécessite une vérification externe.
| Contrôle | Valide ? | Exact ? |
|---|---|---|
| [email protected] | Oui | Inconnu sans vérification |
| john@company | Non | S/O (format erroné) |
| [email protected] | Oui | Non (la personne a quitté l’entreprise) |
Problèmes courants de validité dans Salesforce
- Adresses e-mail sans « @ » ou sans domaine
- Numéros de téléphone avec un nombre de chiffres incorrect
- URL sans protocole (http/https)
- Texte libre là où des valeurs de picklist sont attendues
3. Unicité
L’unicité mesure si les valeurs sont distinctes et non dupliquées.
Ce que mesure DQS
- Détection de doublons : correspondances exactes entre enregistrements
- Comptage distinct : nombre total de valeurs uniques par champ
- Analyse d’entropie : diversité et distribution des valeurs
Le coût des doublons
Les enregistrements en double gaspillent du stockage, dérangent les utilisateurs et produisent des métriques gonflées. Quand une équipe de vente a deux enregistrements pour la même entreprise, elle perd le contexte et risque une relance embarrassante en double.
Les études montrent que :
- Les bases B2B contiennent en moyenne 10 à 30 % d’enregistrements en double
- Chaque doublon coûte aux organisations en envois d’e-mails gaspillés, en reporting brouillé et en historique client fragmenté
Prévention vs détection des doublons
DQS se concentre sur la détection, qui vous aide à identifier les doublons déjà existants. La prévention (arrêter les doublons dès leur création) nécessite des Validation Rules et des Matching Rules dans la configuration Salesforce.
4. Actualité
L’actualité mesure si les données sont suffisamment récentes pour l’usage qu’on en fait.
Ce que mesure DQS
- Taux de fraîcheur : pourcentage d’enregistrements dans l’âge acceptable
- Détection des données périmées : enregistrements dépassant votre seuil
- Âge moyen : moyenne de l’âge des valeurs de champs date
- Détection de dates futures : dates invalides dans le futur
Définir des seuils de fraîcheur
Différents types de données ont des exigences de fraîcheur différentes :
| Type de donnée | Seuil typique | Pourquoi |
|---|---|---|
| Lead Last Activity | 30 jours | Les leads froids perdent de la valeur |
| Informations de contact | 90 jours | Les gens changent d’emploi |
| Opportunity Close Date | Trimestre en cours | Précision des prévisions |
| Account Annual Revenue | 1 an | Mises à jour annuelles attendues |
Pourquoi l’actualité compte pour l’IA
Les modèles d’IA et de machine learning apprennent de vos données. Quand vos données sont périmées, l’IA apprend des motifs dépassés. Agentforce, par exemple, utilise vos données Salesforce pour formuler ses réponses. Des informations de contact obsolètes conduisent à des recommandations incorrectes.
5. Cohérence
La cohérence mesure si les valeurs sont uniformes et standardisées.
Ce que mesure DQS
- Taux de conformité : pourcentage correspondant aux motifs attendus
- Détection de variantes : différentes représentations de la même valeur
- Analyse de la valeur dominante : valeur la plus courante par champ
Types d’incohérence
| Type | Exemple | Problème |
|---|---|---|
| Variation de format | « USA » vs « United States » vs « US » | Casse le filtrage et le regroupement |
| Variation orthographique | « Acme Corp » vs « ACME Corporation » | Crée de faux doublons |
| Variation de casse | « new york » vs « New York » | Peu professionnel dans les rapports |
Pourquoi la cohérence compte pour l’IA
Les modèles d’IA traitent « USA » et « United States » comme des valeurs différentes. Si vos enregistrements utilisent les deux, l’IA ne peut pas les regrouper correctement. Des données incohérentes fragmentent la compréhension de votre IA et produisent des résultats peu fiables.
Atteindre la cohérence
- Utilisez des picklists plutôt que du texte libre quand c’est possible
- Standardisez sur un format unique pour chaque champ
- Importez depuis les valeurs de picklist lors de la configuration des contrôles de cohérence DQS
Équilibrer les dimensions
Toutes les dimensions ne sont pas également importantes pour tous les cas d’usage. Réfléchissez à vos besoins :
| Cas d’usage | Dimensions prioritaires |
|---|---|
| Campagnes marketing | Complétude, validité (pour la délivrabilité) |
| Prévisions commerciales | Actualité, complétude |
| Service client | Unicité (une seule source de vérité) |
| IA / Agentforce | Les cinq, plus les contrôles de préparation IA |
Couverture des dimensions par DQS
DQS mesure les cinq dimensions grâce à des capabilities complètes :
| Dimension | Ce que DQS mesure |
|---|---|
| Complétude | Taux de remplissage, détection de null, détection de blancs, détection de placeholders, logique contextuelle |
| Validité | Validation de format, motifs regex personnalisés, identification des enregistrements invalides |
| Unicité | Détection de doublons, analyse d’entropie, distribution des fréquences |
| Actualité | Taux de fraîcheur, détection des données périmées, âge moyen, détection de dates futures |
| Cohérence | Contrôle de conformité, découverte de variantes, analyse de la valeur dominante |
Étapes suivantes
Maintenant que vous comprenez les cinq dimensions :
- Passez l’évaluation de préparation à l’IA pour voir vos scores actuels
- Lisez Préparation à Agentforce pour des contrôles additionnels au-delà de la qualité des données de base
- Apprenez à utiliser le Definition Builder pour configurer votre premier scan