De vijf dimensies begrijpen
Datakwaliteit wordt gemeten over vijf sleuteldimensies. Elke dimensie beantwoordt een specifieke vraag over uw data en samen bepalen ze of uw data geschikt is voor het beoogde doel.
DQS meet alle vijf dimensies native binnen Salesforce.
| Dimensie | Sleutelvraag | Voorbeeldprobleem |
|---|---|---|
| Volledigheid | Is de data aanwezig? | Ontbrekende e-mailadressen |
| Geldigheid | Is het formaat correct? | Onjuist gevormde telefoonnummers |
| Uniciteit | Is elk record uniek? | Dubbele contacts |
| Tijdigheid | Is de data actueel? | Verouderde opportunity-datums |
| Consistentie | Is de data uniform? | „USA” vs. „United States” |
1. Volledigheid
Volledigheid meet of vereiste datawaarden aanwezig en niet ontbrekend zijn.
Wat DQS meet
- Vulpercentage: Percentage records met niet-lege waarden
- Blanco-detectie: Lege tekenreeksen en waarden bestaande uit alleen witruimte
- Plaatshouderdetectie: Waarden zoals „N/A”, „TBD” of „Unknown”
Waarom volledigheid belangrijk is
Onvolledige data breekt automatisering. Wanneer een workflow een e-mailadres vereist dat niet bestaat, mislukt de workflow. Wanneer een rapport filtert op Industry maar de helft van uw records geen Industry-waarden heeft, toont uw analyse slechts een deel van het beeld.
Veelvoorkomende volledigheids-problemen
| Probleem | Voorbeeld | Impact |
|---|---|---|
| Lege velden | Leeg Contact Phone | Kan prospects niet bellen |
| Plaatshouderwaarden | „TBD” in Company Name | Ongeldig voor rapportage |
| Alleen-witruimte | „ ” in Description | Lijkt gevuld maar is dat niet |
Tip: Begin met uw meest kritieke velden. U heeft geen 100% volledigheid nodig op elk veld, alleen op de velden die belangrijk zijn voor uw gebruiksgeval.
2. Geldigheid
Geldigheid meet of datawaarden voldoen aan verwachte indelingen en patronen.
Wat DQS meet
- Indelingsvalidatie: E-mail-, telefoon-, URL-patronen
- Patroonherkenning: Aangepaste regex-patronen
- Domeinvalidatie: Lijsten met toegestane waarden
Geldigheid vs. nauwkeurigheid
Geldigheid en nauwkeurigheid zijn verschillende concepten. Een e-mailadres kan geldig zijn (correct formaat) maar onnauwkeurig (verkeerde persoon). DQS meet geldigheid omdat indelingsvalidatie geautomatiseerd kan worden. Nauwkeurigheid vereist externe verificatie.
| Controle | Geldig? | Nauwkeurig? |
|---|---|---|
| [email protected] | Ja | Onbekend zonder verificatie |
| john@company | Nee | N/A (formaat is onjuist) |
| [email protected] | Ja | Nee (persoon heeft het bedrijf verlaten) |
Veelvoorkomende geldigheids-problemen in Salesforce
- E-mailadressen zonder „@” of domein
- Telefoonnummers met onjuist aantal cijfers
- URL’s zonder protocol (http/https)
- Vrije tekst waar picklistwaarden worden verwacht
3. Uniciteit
Uniciteit meet of datawaarden uniek en niet-gedupliceerd zijn.
Wat DQS meet
- Duplicaatdetectie: Exacte overeenkomsten over records heen
- Uniek aantal: Totaal unieke waarden per veld
- Entropie-analyse: Waardediversiteit en -verdeling
De kosten van duplicaten
Dubbele records verspillen opslagruimte, verwarren gebruikers en produceren opgeblazen statistieken. Wanneer Sales twee records heeft voor hetzelfde bedrijf, verliezen ze context en riskeren ze gênante dubbele communicatie.
Onderzoek toont aan:
- B2B-databases bevatten gemiddeld 10-30% dubbele records
- Elk duplicaat kost organisaties in verspilde e-mailverzendingen, verwarrende rapportage en gefragmenteerde klantgeschiedenis
Duplicaatpreventie vs. -detectie
DQS richt zich op detectie, wat u helpt duplicaten te identificeren die al bestaan. Preventie (het stoppen van duplicaten bij aanmaak) vereist validatieregels en matching-regels in de Salesforce-instellingen.
4. Tijdigheid
Tijdigheid meet of data actueel genoeg is voor het beoogde gebruik.
Wat DQS meet
- Versheidspercentage: Percentage records binnen aanvaardbare leeftijd
- Verouderdheidsdetectie: Records die uw drempelwaarde overschrijden
- Gemiddelde leeftijd: Gemiddelde leeftijd van datumveldwaarden
- Toekomstige datumdetectie: Ongeldige datums in de toekomst
Versheidsdrempels instellen
Verschillende datatypen hebben verschillende versheids-vereisten:
| Datatype | Typische drempelwaarde | Waarom |
|---|---|---|
| Lead-laatste activiteit | 30 dagen | Koude leads verliezen waarde |
| Contactinfo | 90 dagen | Mensen wisselen van baan |
| Opportunity-sluitdatum | Huidig kwartaal | Prognasenauwkeurigheid |
| Account-jaaromzet | 1 jaar | Jaarlijkse updates verwacht |
Waarom tijdigheid belangrijk is voor AI
AI- en machine-learning-modellen leren van uw data. Wanneer uw data verouderd is, leert de AI verouderde patronen. Agentforce gebruikt bijvoorbeeld uw Salesforce-data om reacties te informeren. Verouderde contactinformatie leidt tot onjuiste aanbevelingen.
5. Consistentie
Consistentie meet of datawaarden uniform en gestandaardiseerd zijn.
Wat DQS meet
- Conformiteitspercentage: Percentage dat overeenkomt met verwachte patronen
- Variantdetectie: Verschillende representaties van dezelfde waarde
- Dominante-waardeanalyse: Meest voorkomende waarde per veld
Soorten inconsistentie
| Type | Voorbeeld | Probleem |
|---|---|---|
| Indelingsvariant | „USA” vs. „United States” vs. „US” | Breekt filteren en groeperen |
| Spellingvariant | „Acme Corp” vs. „ACME Corporation” | Maakt valse duplicaten |
| Hoofdlettervariant | „new york” vs. „New York” | Ziet er onprofessioneel uit in rapporten |
Waarom consistentie belangrijk is voor AI
AI-modellen behandelen „USA” en „United States” als verschillende waarden. Als uw records beide gebruiken, kan de AI ze niet correct groeperen. Inconsistente data fragmenteert het begrip van uw AI en produceert onbetrouwbare uitkomsten.
Consistentie bereiken
- Gebruik picklists in plaats van vrije tekst waar mogelijk
- Standaardiseer op één indeling voor elk veld
- Importeer picklistwaarden bij het configureren van DQS-consistentiecontroles
De dimensies in evenwicht brengen
Niet elke dimensie is even belangrijk voor elk gebruiksgeval. Overweeg wat u nodig heeft:
| Gebruiksgeval | Prioriteitsdimensies |
|---|---|
| Marketingcampagnes | Volledigheid, Geldigheid (voor bezorgbaarheid) |
| Verkoopprognoses | Tijdigheid, Volledigheid |
| Klantenservice | Uniciteit (één bron van waarheid) |
| AI/Agentforce | Alle vijf, plus AI-gereedheidschecks |
DQS-dimensiedekking
DQS meet alle vijf dimensies met uitgebreide mogelijkheden:
| Dimensie | Wat DQS meet |
|---|---|
| Volledigheid | Vulpercentage, null-detectie, blanco-detectie, plaatshouderdetectie, contextuele logica |
| Geldigheid | Indelingsvalidatie, aangepaste regex-patronen, identificatie van ongeldige records |
| Uniciteit | Duplicaatdetectie, entropie-analyse, frequentieverdeling |
| Tijdigheid | Versheidspercentage, verouderdheidsdetectie, gemiddelde leeftijd, toekomstige datumdetectie |
| Consistentie | Conformiteitscontrole, variantdetectie, dominante-waardeanalyse |
Volgende stappen
Nu u de vijf dimensies begrijpt:
- Neem de AI-gereedheidsbeoordeling om uw huidige scores te zien
- Lees over Agentforce-voorbereiding voor aanvullende controles buiten basis datakwaliteit
- Leer hoe u de Definition Builder gebruikt om uw eerste scan te configureren