Skip to main content

Consistentie

Alle 6 consistentiestatistieken die DQS meet, de diagnostische stroom voor het vinden van waardefragmentatie, en hoe u conformiteitsanalyse configureert.

Wat is consistentie?

Consistentie meet of uw datawaarden voldoen aan een overeengekomen standaard. Een veld is consistent wanneer elk record dezelfde term gebruikt voor hetzelfde concept. Een veld is inconsistent wanneer variaties bestaan die hetzelfde betekenen maar anders worden uitgedrukt.

„USA”, „United States” en „US” verwijzen allemaal naar hetzelfde land. Voor Salesforce zijn het drie afzonderlijke waarden. Een rapport gegroepeerd op Country produceert drie rijen in plaats van één. Een automatisering die filtert op „USA” mist 230 records die „United States” bevatten.

Conformiteitspercentage = (Conforme records / Totale records) x 100

Als 850 van de 1.000 Account-records een Country-waarde hebben die overeenkomt met uw lijst met toegestane waarden, is uw Country-conformiteitspercentage 85%. De resterende 15% bevat variaties die gestandaardiseerd moeten worden.

Waarom consistentie belangrijk is

Rapportage

Inconsistente data fragmenteert uw rapporten. Wanneer uw Country-veld vijf verschillende spellingen van hetzelfde land bevat, toont een rapport gegroepeerd op Country vijf rijen in plaats van één. Het totaal is correct, maar de groepering is verkeerd. Executieve dashboards gebouwd op deze rapporten vertellen een misleidend verhaal.

Automatisering

Salesforce-automatisering is afhankelijk van exacte waardematches. Een workflow die filtert op Country = "USA" mist records met „United States” en „US.” De automatisering werkt correct op overeenkomende records maar slaat stilzwijgend alles andere over.

AI en Agentforce

AI-modellen behandelen elke variatie als een afzonderlijk concept. „USA” en „United States” worden twee verschillende landen in het oogpunt van het model. Agentforce genereert reacties met uw veldwaarden. Inconsistente waarden produceren inconsistente AI-uitkomsten.

SysteemImpact van consistentie
RapportenGefragmenteerde groeperingen, misleidende totalen
WorkflowsFilters missen niet-overeenkomende variaties
Duplicate RulesVariaties voorkomen correcte matching
AgentforceInconsistente veldwaarden produceren onbetrouwbare AI-reacties

Hoe DQS consistentie meet

DQS produceert 6 consistentiestatistieken georganiseerd rondom een diagnostische vraag: „Voldoen uw veldwaarden aan een standaard, en zo niet, wat doen ze in plaats daarvan?”

Denk aan deze statistieken als een diagnostische stroom. Elke stap onthult een andere laag van het probleem.

Stap 1: Hoe consistent is het?

Conformiteitspercentage is de hoofdstatistiek. Het berekent het percentage records waarbij de veldwaarde overeenkomt met één van uw gedefinieerde toegestane waarden. Dit is het getal dat u op een dashboard zet.

U voert een scan uit op het Account-object. Het veld Country toont een Conformiteitspercentage van 72%. Dat betekent dat 28% van uw Accounts landwaarden bevat buiten uw toegestane lijst. Uw territoriumtoewijzingsregels, regionale dashboards en lokalisatielogica werken allemaal op onvolledige data.

Elke andere consistentiestatistiek bestaat om te verklaren hoe de niet-conforme 28% eruitziet.

Stap 2: Wat is de omvang?

Percentages vertellen u de ernst. Aantallen vertellen u de werklast. Twee statistieken beantwoorden de omvangvraag:

StatistiekWat het u vertelt
ConformiteitsaantalHoeveel records overeenkomen met uw toegestane waarden. Gebruik dit voor dekkingsrapportage.
Niet-conform-aantalHoeveel records buiten uw toegestane waarden vallen. Gebruik dit om opschoonprojecten te bepalen.

Deze twee getallen tellen altijd op tot totale records. Als uw Conformiteitsaantal 720 is en Niet-conform-aantal 280, heeft u precies 1.000 geëvalueerde records.

Voorbeeld: Uw dataverzorger moet het Industry-veld opschonen. Niet-conform-aantal is 3.400. Zij weet nu de omvang van het project, kan middelen toewijzen en een realistische tijdlijn opstellen voor standaardisering.

Stap 3: Hoe gefragmenteerd is de data?

Variant-aantal meet het aantal unieke waarden in een veld over alle records heen. Het beantwoordt: „Op hoeveel verschillende manieren drukken mensen deze data uit?”

Deze statistiek werkt als een schema-gezondheidssindicator. Een Country-veld met 5 unieke waarden is waarschijnlijk goed beheerd. Een Country-veld met 47 unieke waarden signaleert ernstige fragmentatie, zelfs voordat u conformiteit controleert.

VeldTotale recordsVariant-aantalBeoordeling
Country1.0005Goed beheerd, waarschijnlijk consistent
Country1.00047Sterk gefragmenteerd, standaardisering nodig
Industry50012Redelijk, waarschijnlijk picklist-beperkt
Industry50089Vrije-tekst chaos, onmiddellijke aandacht nodig

Voorbeeld: Tijdens een org-audit scant u Lead_Source__c op Leads. Variant-aantal geeft 34 terug. Uw marketingteam heeft 8 lead-bronnen gedefinieerd. De resterende 26 varianten zijn spelfouten, afkortingen en ad-hocvermeldingen van integraties. De picklist is technisch afgedwongen in de UI, maar API-gemaakte records omzeilen deze.

Stap 4: Wat zijn de werkelijke waarden?

Dominante waarden retourneert de top N meest voorkomende waarden in het veld, samen met het frequentieaantal van elke waarde. Dit vertelt u hoe uw data er werkelijk uitziet, niet wat u ervan verwacht.

RangWaardeAantalPercentage
1United States45045%
2USA23023%
3US18018%
4U.S.A.454,5%
5United States of America151,5%

Deze tabel onthult drie dingen. Ten eerste de de-facto-standaard: „United States” met 45% is wat de meeste gebruikers invoeren. Ten tweede de veelgebruikte variaties: „USA” en „US” vertegenwoordigen nog eens 41%. Ten derde de lange staart: „U.S.A.” en „United States of America” zijn zeldzaam maar aanwezig.

Voorbeeld: Uw team debatteert of Country-waarden gestandaardiseerd moeten worden naar ISO-codes („US”) of volledige namen („United States”). Dominante waarden toont dat 45% van de records al „United States” gebruikt. Standaardisering naar die waarde vereist het wijzigen van 55% van de records. Standaardisering naar „US” vereist het wijzigen van 82%. De data vertelt u het goedkopere pad.

Waarom percentages en aantallen in paren komen

Conformiteitsstatistieken komen als een percentage (Conformiteitspercentage) en het inverse ervan (Niet-conformiteitspercentage), plus absolute aantallen voor beide kanten. Dit is opzettelijk:

  • Percentages zijn voor dashboards, executieve rapportage en trendregistratie. „Conformiteit verbeterd van 72% naar 94% dit kwartaal.”
  • Aantallen zijn voor projectplanning, werklastschatting en opschoontoewijzing. „We hebben 3.400 niet-conforme records te herstellen.”

Gebruik percentages om voortgang te communiceren. Gebruik aantallen om werk te plannen.

Statistiekenreferentie

Basisstatistieken

Deze 2 statistieken vormen de basis van elke consistentieanalyse. Ze vertellen u het conformiteitspercentage en het aantal records dat overeenkomt.

StatistiekTypeWat het meet
ConformiteitspercentagePercentageAandeel records dat overeenkomt met uw toegestane waarden
ConformiteitsaantalAantalAantal records dat overeenkomt met uw toegestane waarden

Geavanceerde statistieken

Deze 4 statistieken gaan verder dan „komt het overeen?” om te vragen „hoe ziet de niet-overeenkomende data eruit?” Ze vereisen de modus Geavanceerde conformiteitsanalyse.

StatistiekTypeWat het meet
Niet-conform-aantalAantalRecords met waarden buiten uw toegestane lijst
Niet-conformiteitspercentagePercentageAandeel records buiten uw toegestane lijst
Variant-aantalAantalTotale unieke waarden gevonden in het veld
Dominante waardenLijstTop N meest voorkomende waarden met frequentieaantallen

Veldtype-dekking

DQS ondersteunt consistentiecontroles op de volgende Salesforce-veldtypen:

VeldtypeConsistentiefocus
String (Text)Afkortingen, spelling, hoofdlettergebruik
TextAreaVrije-tekststandardisering
PicklistWerkelijke waarden valideren tegen verwachte opties
EmailDomeinstandardisering, indelingsconsistentie
PhoneIndelingsstandardisering (netnummers, scheidingstekens)
URLProtocol- en padconsistentie

Twee analysemodi

DQS biedt twee consistentieanalysemodi:

Conformiteitscontrole beantwoordt de vraag: „Komen veldwaarden overeen met mijn toegestane lijst?” Het produceert de 2 basisstatistieken en dekt de essentials voor een snelle conformiteitsaudit.

Geavanceerde conformiteitsanalyse gaat dieper. Het produceert alle 6 statistieken, inclusief niet-conformiteitsaantallen, variantdetectie en dominante-waardeverdeling. Gebruik deze modus wanneer u het volledige landschap van waardefragmentatie wilt begrijpen, niet alleen de conformiteitsscore.

Zakelijke behoefteAanbevolen modus
Snelle conformiteitsaudit of basislijncontroleConformiteitscontrole
Datamigratie-opschoningGeavanceerd (variant-aantal onthult geïmporteerde chaos)
AI-gereedheidsevaluatieGeavanceerd (dominante waarden tonen wat de AI van leert)
Voortdurende data-governanceBegin met Conformiteitscontrole, ga naar Geavanceerd voor diepere analyse

Consistentie configureren

DQS biedt vier configuratie-invoeren voor consistentie. Elke kan worden ingesteld op globaal niveau (van toepassing op alle velden) en worden overschreven op individueel veldniveau.

InstellingWat het beheert
Verwachte waardenDe lijst met waarden die DQS als „conform” behandelt. Elke veldwaarde die niet op deze lijst staat, wordt gemarkeerd als niet-conform. Vereist: u moet ten minste één waarde definiëren vóór het uitvoeren van een scan.
HoofdlettergevoeligBepaalt of waardematching rekening houdt met hoofdlettergebruik. Wanneer uitgeschakeld (de standaard), komen „Premium”, „PREMIUM” en „premium” allemaal overeen met de toegestane waarde „Premium.” Wanneer ingeschakeld, telt alleen een exacte hoofdlettermatch.
Top NHoeveel dominante waarden te retourneren (1 tot 100). Bepaalt de grootte van de Dominante waarden-uitvoer. Standaard: 5.
Minimale frequentieHet minimale aantal keren dat een waarde moet voorkomen om te worden opgenomen in de Dominante waarden-uitvoer (1 tot 1.000). Filtert ultra-zeldzame waarden die ruis toevoegen. Standaard: 1.

Tip: Begin door Importeren uit veld te gebruiken om te zien welke waarden er daadwerkelijk in uw data bestaan voordat u uw lijst met toegestane waarden definieert.

Importeren uit veld: ontdekking-eerste configuratie

Een veelvoorkomende uitdaging bij consistentie is weten welke waarden te verwachten. U kunt geen toegestane waarden definiëren als u niet weet wat uw data bevat.

Importeren uit veld lost dit op. Het bevraagt de werkelijke velddata, groepeert waarden op frequentie en toont de resultaten als een checklist.

Hoe het werkt:

  1. Open de configuratie Verwachte waarden.
  2. Klik op Importeren uit veld. DQS bevraagt de live data en retourneert unieke waarden gesorteerd op frequentie.
  3. Bekijk de checklist. Elke waarde toont hoeveel records deze bevatten.
  4. Vink de waarden aan die u als correct beschouwt. Laat onjuiste, onjuist gevormde of plaatshouderwaarden uitgevinkt.
  5. Klik op Geselecteerden toevoegen. De aangevinkte waarden vullen uw lijst met toegestane waarden.

Voorbeeld: U configureert consistentie voor een Rating__c-veld. Importeren uit veld retourneert:

WaardeRecords
Hot284
Warm198
Cold156
Very High23
240 km/h12
N/A8

De eerste drie waarden zijn uw echte beoordelingen. U vinkt die aan. „Very High” is een gegevensinvoerfout. „240 km/h” is duidelijk verkeerd-veld-data. „N/A” is een plaatshouder. U laat die uitgevinkt. Wanneer de scan wordt uitgevoerd, verschijnen die 43 records als niet-conform, en uw lijst met toegestane waarden is gebouwd vanuit wat uw data werkelijk bevat.

Deze workflow keert de traditionele „raad-eerst, herstel-later”-aanpak om. U ontdekt eerst, dan definieert u uw standaard.

Veelvoorkomende consistentie-problemen

Land- en staatvariaties

Het meest voorkomende inconsistentieprobleem in Salesforce-data. Zonder standaardisering verschijnt één concept zoals „United States” als 5 of meer unieke waarden. Rapporten fragmenteren. Filters missen records. Territoriumregels mislukken.

Oplossing: Schakel Salesforce State and Country Picklists in voor alle adresvelden. Gebruik DQS om bestaande niet-conforme waarden te vinden en op te schonen.

Vrije-tekstvelden zonder governance

Tekstvelden die picklist-beperkingen missen, accumuleren in de loop van de tijd variaties. Industry, Job Title, Lead Source en Department-velden zijn frequente overtreders wanneer ze als vrije tekst zijn geïmplementeerd.

Oplossing: Converteer waardevolle vrije-tekstvelden naar picklists. Gebruik Importeren uit veld om uw huidige waardeverdeling te zien voordat u de picklistopties definieert.

Door integratie gecreëerde variaties

Externe systemen en API’s schrijven records die Salesforce UI-validatie omzeilen. Een marketingautomatiseringsplatform schrijft „Info Technology” terwijl uw standaard „Information Technology” is. Deze variaties accumuleren stilzwijgend.

Oplossing: Pas waardenmappingregels toe in uw integratielaag. Voer periodieke consistentiescans uit om nieuwe variaties op te vangen van databronnen die u niet beheerst.

Hoofdletter-inconsistenties

Gebruikers voeren „Active”, „active” en „ACTIVE” in over verschillende records. Met hoofdlettergevoelige matching uitgeschakeld, telt DQS alle drie als conform. Maar het veld bevat nog steeds drie verschillende spellingen in de ruwe data.

Oplossing: Beslis of hoofdlettergebruik belangrijk is voor uw gebruiksgeval. Voor weergavegerichte velden, standaardiseer hoofdlettergebruik via data-opschoning. Voor matchingdoeleinden, schakel hoofdlettergevoeligheid uit in uw DQS-configuratie.

Best practices

Definieer standaarden vóór het scannen

Documenteer de verwachte waarde voor elk beperkt veld vóór uw eerste scan. Zonder een duidelijke standaard heeft u geen basislijn om tegen te meten.

VeldStandaardRedenering
CountryISO 3166-1 alpha-2-codes (US, CA, DE)Branchestandaard, compact
IndustryAangepaste taxonomie met 15 waardenKomt overeen met rapportcategorieën
Lead Source8 door marketing gedefinieerde bronnenSluit aan bij campagnetracking

Gebruik de ontdekkingsworkflow voor onbekende velden

Gebruik voor velden waar u geen vooraf gedefinieerde standaard heeft, eerst Importeren uit veld. Laat de data u vertellen wat de de-facto-standaard is. De waarde met de hoogste frequentie is vaak de juiste keuze als uw canonieke waarde.

Volg conformiteit in de loop van de tijd

Een enkele conformiteitsscore is een momentopname. Volg scores over meerdere scans heen om degradatie vroeg te detecteren, opschoonvoortgang te meten en databronnen te identificeren die nieuwe variaties introduceren.

Gebruik Variant-aantal als vroegwaarschuwing

Monitor Variant-aantal over scans heen. Een veld dat springt van 12 naar 28 unieke waarden tussen scans heeft een nieuwe bron van variatie. Onderzoek dit voordat het probleem escaleert.

Prioriteer op zakelijke impact

Niet elk veld heeft 100% conformiteit nodig. Richt u op velden die rapportage aansturen (Country, Industry), automatisering voeden (Status, Stage) of data leveren aan AI en Agentforce.

Volgende stappen

U heeft nu alle vijf datakwaliteitsdimensies voltooid. Ga verder met leren: