Skip to main content

De vijf dimensies van datakwaliteit

Leer de vijf dimensies die DQS meet: Volledigheid, Geldigheid, Uniciteit, Tijdigheid en Consistentie.

De vijf dimensies begrijpen

Datakwaliteit wordt gemeten over vijf sleuteldimensies. Elke dimensie beantwoordt een specifieke vraag over uw data en samen bepalen ze of uw data geschikt is voor het beoogde doel.

DQS meet alle vijf dimensies native binnen Salesforce.

DimensieSleutelvraagVoorbeeldprobleem
VolledigheidIs de data aanwezig?Ontbrekende e-mailadressen
GeldigheidIs het formaat correct?Onjuist gevormde telefoonnummers
UniciteitIs elk record uniek?Dubbele contacts
TijdigheidIs de data actueel?Verouderde opportunity-datums
ConsistentieIs de data uniform?„USA” vs. „United States”

1. Volledigheid

Volledigheid meet of vereiste datawaarden aanwezig en niet ontbrekend zijn.

Wat DQS meet

  • Vulpercentage: Percentage records met niet-lege waarden
  • Blanco-detectie: Lege tekenreeksen en waarden bestaande uit alleen witruimte
  • Plaatshouderdetectie: Waarden zoals „N/A”, „TBD” of „Unknown”

Waarom volledigheid belangrijk is

Onvolledige data breekt automatisering. Wanneer een workflow een e-mailadres vereist dat niet bestaat, mislukt de workflow. Wanneer een rapport filtert op Industry maar de helft van uw records geen Industry-waarden heeft, toont uw analyse slechts een deel van het beeld.

Veelvoorkomende volledigheids-problemen

ProbleemVoorbeeldImpact
Lege veldenLeeg Contact PhoneKan prospects niet bellen
Plaatshouderwaarden„TBD” in Company NameOngeldig voor rapportage
Alleen-witruimte„ ” in DescriptionLijkt gevuld maar is dat niet

Tip: Begin met uw meest kritieke velden. U heeft geen 100% volledigheid nodig op elk veld, alleen op de velden die belangrijk zijn voor uw gebruiksgeval.

2. Geldigheid

Geldigheid meet of datawaarden voldoen aan verwachte indelingen en patronen.

Wat DQS meet

  • Indelingsvalidatie: E-mail-, telefoon-, URL-patronen
  • Patroonherkenning: Aangepaste regex-patronen
  • Domeinvalidatie: Lijsten met toegestane waarden

Geldigheid vs. nauwkeurigheid

Geldigheid en nauwkeurigheid zijn verschillende concepten. Een e-mailadres kan geldig zijn (correct formaat) maar onnauwkeurig (verkeerde persoon). DQS meet geldigheid omdat indelingsvalidatie geautomatiseerd kan worden. Nauwkeurigheid vereist externe verificatie.

ControleGeldig?Nauwkeurig?
[email protected]JaOnbekend zonder verificatie
john@companyNeeN/A (formaat is onjuist)
[email protected]JaNee (persoon heeft het bedrijf verlaten)

Veelvoorkomende geldigheids-problemen in Salesforce

  • E-mailadressen zonder „@” of domein
  • Telefoonnummers met onjuist aantal cijfers
  • URL’s zonder protocol (http/https)
  • Vrije tekst waar picklistwaarden worden verwacht

3. Uniciteit

Uniciteit meet of datawaarden uniek en niet-gedupliceerd zijn.

Wat DQS meet

  • Duplicaatdetectie: Exacte overeenkomsten over records heen
  • Uniek aantal: Totaal unieke waarden per veld
  • Entropie-analyse: Waardediversiteit en -verdeling

De kosten van duplicaten

Dubbele records verspillen opslagruimte, verwarren gebruikers en produceren opgeblazen statistieken. Wanneer Sales twee records heeft voor hetzelfde bedrijf, verliezen ze context en riskeren ze gênante dubbele communicatie.

Onderzoek toont aan:

  • B2B-databases bevatten gemiddeld 10-30% dubbele records
  • Elk duplicaat kost organisaties in verspilde e-mailverzendingen, verwarrende rapportage en gefragmenteerde klantgeschiedenis

Duplicaatpreventie vs. -detectie

DQS richt zich op detectie, wat u helpt duplicaten te identificeren die al bestaan. Preventie (het stoppen van duplicaten bij aanmaak) vereist validatieregels en matching-regels in de Salesforce-instellingen.

4. Tijdigheid

Tijdigheid meet of data actueel genoeg is voor het beoogde gebruik.

Wat DQS meet

  • Versheidspercentage: Percentage records binnen aanvaardbare leeftijd
  • Verouderdheidsdetectie: Records die uw drempelwaarde overschrijden
  • Gemiddelde leeftijd: Gemiddelde leeftijd van datumveldwaarden
  • Toekomstige datumdetectie: Ongeldige datums in de toekomst

Versheidsdrempels instellen

Verschillende datatypen hebben verschillende versheids-vereisten:

DatatypeTypische drempelwaardeWaarom
Lead-laatste activiteit30 dagenKoude leads verliezen waarde
Contactinfo90 dagenMensen wisselen van baan
Opportunity-sluitdatumHuidig kwartaalPrognasenauwkeurigheid
Account-jaaromzet1 jaarJaarlijkse updates verwacht

Waarom tijdigheid belangrijk is voor AI

AI- en machine-learning-modellen leren van uw data. Wanneer uw data verouderd is, leert de AI verouderde patronen. Agentforce gebruikt bijvoorbeeld uw Salesforce-data om reacties te informeren. Verouderde contactinformatie leidt tot onjuiste aanbevelingen.

5. Consistentie

Consistentie meet of datawaarden uniform en gestandaardiseerd zijn.

Wat DQS meet

  • Conformiteitspercentage: Percentage dat overeenkomt met verwachte patronen
  • Variantdetectie: Verschillende representaties van dezelfde waarde
  • Dominante-waardeanalyse: Meest voorkomende waarde per veld

Soorten inconsistentie

TypeVoorbeeldProbleem
Indelingsvariant„USA” vs. „United States” vs. „US”Breekt filteren en groeperen
Spellingvariant„Acme Corp” vs. „ACME Corporation”Maakt valse duplicaten
Hoofdlettervariant„new york” vs. „New York”Ziet er onprofessioneel uit in rapporten

Waarom consistentie belangrijk is voor AI

AI-modellen behandelen „USA” en „United States” als verschillende waarden. Als uw records beide gebruiken, kan de AI ze niet correct groeperen. Inconsistente data fragmenteert het begrip van uw AI en produceert onbetrouwbare uitkomsten.

Consistentie bereiken

  • Gebruik picklists in plaats van vrije tekst waar mogelijk
  • Standaardiseer op één indeling voor elk veld
  • Importeer picklistwaarden bij het configureren van DQS-consistentiecontroles

De dimensies in evenwicht brengen

Niet elke dimensie is even belangrijk voor elk gebruiksgeval. Overweeg wat u nodig heeft:

GebruiksgevalPrioriteitsdimensies
MarketingcampagnesVolledigheid, Geldigheid (voor bezorgbaarheid)
VerkoopprognosesTijdigheid, Volledigheid
KlantenserviceUniciteit (één bron van waarheid)
AI/AgentforceAlle vijf, plus AI-gereedheidschecks

DQS-dimensiedekking

DQS meet alle vijf dimensies met uitgebreide mogelijkheden:

DimensieWat DQS meet
VolledigheidVulpercentage, null-detectie, blanco-detectie, plaatshouderdetectie, contextuele logica
GeldigheidIndelingsvalidatie, aangepaste regex-patronen, identificatie van ongeldige records
UniciteitDuplicaatdetectie, entropie-analyse, frequentieverdeling
TijdigheidVersheidspercentage, verouderdheidsdetectie, gemiddelde leeftijd, toekomstige datumdetectie
ConsistentieConformiteitscontrole, variantdetectie, dominante-waardeanalyse

Volgende stappen

Nu u de vijf dimensies begrijpt:

  1. Neem de AI-gereedheidsbeoordeling om uw huidige scores te zien
  2. Lees over Agentforce-voorbereiding voor aanvullende controles buiten basis datakwaliteit
  3. Leer hoe u de Definition Builder gebruikt om uw eerste scan te configureren