Skip to main content

De fem dimensionerna av datakvalitet

Lär dig de fem dimensioner som DQS mäter: Fullständighet, Giltighet, Unikhet, Aktualitet och Konsekvens.

Förstå de fem dimensionerna

Datakvalitet mäts över fem nyckeldimensioner. Varje dimension svarar på en specifik fråga om dina data, och tillsammans avgör de om dina data är lämpliga för sitt syfte.

DQS mäter alla fem dimensioner nativt inom Salesforce.

DimensionNyckelfrågaExempelproblem
FullständighetFinns data?Saknade e-postadresser
GiltighetÄr formatet korrekt?Felformaterade telefonnummer
UnikhetÄr varje post distinkt?Dubblerade contacts
AktualitetÄr data aktuella?Inaktuella opportunity-datum
KonsekvensÄr data enhetliga?”USA” kontra “United States”

1. Fullständighet

Fullständighet mäter om obligatoriska datavärden finns och inte saknas.

Vad DQS mäter

  • Fyllnadsgrad: Procentandel poster med icke-tomma värden
  • Blank-identifiering: Tomma strängar och rena blankstegsvärden
  • Platshållaridentifiering: Värden som “N/A”, “TBD” eller “Unknown”

Varför fullständighet är viktigt

Ofullständiga data bryter automatisering. När ett arbetsflöde kräver en e-postadress som inte finns misslyckas arbetsflödet. När en rapport filtrerar på bransch men hälften av posterna saknar branschvärden visar din analys bara en del av bilden.

Vanliga fullständighetsproblem

ProblemExempelPåverkan
Tomma fältTomt Contact-telefonnummerKan inte ringa prospects
Platshållarvärden”TBD” i företagsnamnOgiltigt för rapportering
Endast blanksteg” ” i beskrivningVerkar ifyllt men är det inte

Tips: Börja med dina mest kritiska fält. Du behöver inte 100 % fullständighet på varje fält, bara på de som är viktiga för ditt användningsfall.

2. Giltighet

Giltighet mäter om datavärden överensstämmer med förväntade format och mönster.

Vad DQS mäter

  • Formatvalidering: Mönster för e-post, telefon, URL
  • Mönstermatchning: Anpassade regex-mönster
  • Domänvalidering: Listor med tillåtna värden

Giltighet kontra noggrannhet

Giltighet och noggrannhet är olika saker. En e-postadress kan vara giltig (korrekt format) men felaktig (fel person). DQS mäter giltighet eftersom formatvalidering kan automatiseras. Noggrannhet kräver extern verifiering.

KontrollGiltig?Noggrann?
[email protected]JaOkänt utan verifiering
john@companyNejEj tillämpligt (formatet är fel)
[email protected]JaNej (personen lämnade företaget)

Vanliga giltighetsproblem i Salesforce

  • E-postadresser saknar ”@” eller domän
  • Telefonnummer med fel antal siffror
  • Webbadresser utan protokoll (http/https)
  • Fritext där picklistvärden förväntas

3. Unikhet

Unikhet mäter om datavärden är distinkta och inte dubblerade.

Vad DQS mäter

  • Dubblettidentifiering: Exakta träffar över poster
  • Distinkt antal: Totalt antal unika värden per fält
  • Entropianalys: Värdediversitet och fördelning

Kostnaden för dubbletter

Dubblerade poster slösar lagringsutrymme, förvirrar användare och ger uppblåsta mätvärden. När Säljavdelningen har två poster för samma företag förlorar de sammanhang och riskerar genanta dubbla utskick.

Forskning visar:

  • B2B-databaser innehåller i genomsnitt 10–30 % dubblerade poster
  • Varje duplikat kostar organisationer i form av slösade e-postsändningar, förvirrad rapportering och fragmenterad kundhistorik

Förebyggande kontra identifiering av dubbletter

DQS fokuserar på identifiering, vilket hjälper dig att hitta dubbletter som redan finns. Förebyggande (att stoppa dubbletter vid skapandet) kräver valideringsregler och matchningsregler i Salesforce-inställningar.

4. Aktualitet

Aktualitet mäter om data är tillräckligt aktuella för sitt avsedda användande.

Vad DQS mäter

  • Aktualitetsgrad: Procentandel poster inom acceptabel ålder
  • Inaktuell identifiering: Poster som överskrider ditt tröskelvärde
  • Genomsnittsålder: Medelvärde för datumfältsvärden
  • Framtida datumidentifiering: Ogiltiga datum i framtiden

Ange aktualitetströsklar

Olika datatyper har olika aktualitetskrav:

DatatypTypiskt tröskelvärdeVarför
Lead senaste aktivitet30 dagarKalla leads förlorar värde
Kontaktinformation90 dagarFolk byter jobb
Opportunity stängningsdatumAktuellt kvartalPrognosnoggrannhet
Account-årsomsättning1 årÅrliga uppdateringar förväntas

Varför aktualitet är viktigt för AI

AI- och maskininlärningsmodeller lär sig från dina data. När dina data är inaktuella lär sig AI:n föråldrade mönster. Agentforce använder till exempel dina Salesforce-data för att informera svar. Föråldrad kontaktinformation leder till felaktiga rekommendationer.

5. Konsekvens

Konsekvens mäter om datavärden är enhetliga och standardiserade.

Vad DQS mäter

  • Konformansgrad: Procentandel som matchar förväntade mönster
  • Variantidentifiering: Olika representationer av samma värde
  • Dominerandevärdesanalys: Vanligaste värdet per fält

Typer av inkonsekvent

TypExempelProblem
Formatvariation”USA” kontra “United States” kontra “US”Bryter filtrering och gruppering
Stavningsvariation”Acme Corp” kontra “ACME Corporation”Skapar falska dubbletter
Skiftlägesvariation”new york” kontra “New York”Ser oprofessionellt ut i rapporter

Varför konsekvens är viktigt för AI

AI-modeller behandlar “USA” och “United States” som olika värden. Om dina poster använder båda kan AI:n inte gruppera dem korrekt. Inkonsekvent data fragmenterar AI:ns förståelse och producerar otillförlitliga resultat.

Uppnå konsekvens

  • Använd picklistor istället för fritext där möjligt
  • Standardisera på ett enda format för varje fält
  • Importera från picklistvärden när du konfigurerar DQS-konsekvensonskontroller

Balansera dimensionerna

Inte varje dimension är lika viktig för varje användningsfall. Tänk på vad du behöver:

AnvändningsfallPrioriterade dimensioner
MarknadsföringskampanjerFullständighet, Giltighet (för leveransbarhet)
FörsäljningsprognoserAktualitet, Fullständighet
KundtjänstUnikhet (en källa till sanning)
AI/AgentforceAlla fem, plus AI-beredskapskontroller

DQS-dimensionstäckning

DQS mäter alla fem dimensioner med omfattande funktioner:

DimensionVad DQS mäter
FullständighetFyllnadsgrad, null-identifiering, blank-identifiering, platshållaridentifiering, kontextuell logik
GiltighetFormatvalidering, anpassade regex-mönster, identifiering av ogiltiga poster
UnikhetDubblettidentifiering, entropianalys, frekvensfördelning
AktualitetAktualitetsgrad, inaktuell identifiering, genomsnittsålder, framtida datumidentifiering
KonsekvensKonformanskontroll, variantidentifiering, dominerandevärdesanalys

Nästa steg

Nu när du förstår de fem dimensionerna:

  1. Ta AI-beredskapsbedömningen för att se dina nuvarande poäng
  2. Läs om Agentforce-förberedelse för ytterligare kontroller bortom grundläggande datakvalitet
  3. Lär dig hur du använder Definition Builder för att konfigurera din första genomsökning