Consistentie: configuratiescenario's

Wat deze scenario’s behandelen

Deze pagina doorloopt drie praktijkconsistentieconfiguraties, van eerste opzet tot het lezen van de scanresultaten. Elk scenario gebruikt een andere zakelijke context en analysemodus.

Deze scenario’s bouwen voort op de concepten en statistieken behandeld in het hoofdartikel Consistentie. Lees dat eerst als termen zoals Conformiteitspercentage, Variant-aantal en Dominante waarden nieuw voor u zijn.

Scenario 1: Country-veld standaardisering met ontdekking

De zakelijke context

Uw org heeft 15.000 Account-records van 3 gefuseerde bedrijven. Het Country-veld is vrije tekst. Regionale dashboards tonen gefragmenteerde data: „United States” verschijnt als één rij, „USA” als een andere, „US” als een derde. Territoriumtoewijzingsregels missen records omdat ze filteren op één spelling. U moet standaardiseren, maar u weet niet welke waarden er in alle drie de legacy-systemen bestaan.

Configuratie walkthrough

Begin met Importeren uit veld om te ontdekken wat uw data werkelijk bevat vóór het definiëren van toegestane waarden.

Open de configuratie Verwachte waarden voor het veld Country.
Klik op Importeren uit veld. DQS bevraagt de live data en retourneert unieke waarden gesorteerd op frequentie.
Bekijk de checklist. De import onthult het volledige beeld:

Waarde	Records
United States	4.500
USA	2.300
US	1.800
Canada	1.400
U.S.A.	450
United States of America	150
… (41 meer variaties)	…

Beslis over uw standaard. ISO-landcodes („US”, „CA”, „UK”) zijn compact, branchestandaard en ondubbelzinnig. Vink de ISO-codes aan uit de importlijst.
Klik op Geselecteerden toevoegen om uw lijst met toegestane waarden in te vullen.

Stel de resterende configuratie in:

Instelling	Waarde	Redenering
Analysemodus	Geavanceerde Conformiteitsanalyse	U heeft variant-aantallen en dominante waarden nodig om de opschoning te bepalen
Verwachte waarden	US, CA, UK, DE, FR, AU, JP	ISO-codes voor uw actieve markten
Hoofdlettergevoelig	UIT	„us”, „Us” en „US” als dezelfde waarde opvangen
Top N	10	De meest voorkomende variaties zien
Minimale frequentie	5	Eenmalige typefouten filteren

Wat de scan produceert

Statistiek	Waarde
Conformiteitspercentage	12%
Conformiteitsaantal	1.800
Niet-conform-aantal	13.200
Variant-aantal	47
Dominante waarden	Top 10 waarden met aantallen (zie importtabel hierboven)

Resultaten lezen

12% conformiteit is verwacht. U heeft een nieuwe standaard gedefinieerd (ISO-codes) waarnaar de data nog nooit is genormaliseerd. Alleen de 1.800 records die al „US” bevatten, komen overeen. Dit is geen slechte score. Het is uw startpunt.

47 varianten onthult de omvang van fragmentatie. Drie gefuseerde systemen produceerden 47 verschillende manieren om landnamen uit te drukken. Zonder dit getal zou u de opschooninspanning onderschatten.

Dominante waarden toont waar u zich op moet richten. De top 3 variaties („United States”, „USA”, „US”) vertegenwoordigen 8.600 records. Alleen die drie waarden standaardiseren verhoogt uw conformiteit van 12% naar 69%. Begin daar.

Niet-conform-aantal (13.200) is uw exacte opschoontaak. Uw dataverzorger heeft nu een concrete projectomvang, geen gok.

Volgende actie

Bouw een waardenmappingtabel met behulp van de Dominante waarden-uitvoer. Wijs „United States” toe aan „US”, „USA” aan „US”, enzovoort. Voer de datanormalisatie uit. Scan opnieuw om uw nieuwe Conformiteitspercentage te verifiëren.

Scenario 2: Lead-beoordelingsvalidatie

De zakelijke context

Uw Lead-beoordelingsveld (Rating__c) is een tekstveld dat „Hot”, „Warm” of „Cold” accepteert. Salesmanagers melden vreemde waarden in hun pijplijnrapporten. Een filter voor Rating = "Hot" retourneert minder records dan verwacht. U heeft een snelle conformiteitsaudit nodig om uit te zoeken wat er in het veld zit en hoeveel records er opgeschoond moeten worden.

Configuratie walkthrough

Begin met Importeren uit veld om de werkelijke waarden te zien vóór het configureren van uw scan.

Open de configuratie Verwachte waarden voor Rating__c.
Klik op Importeren uit veld. De import retourneert:

Waarde	Records
Hot	284
Warm	198
Cold	156
Very High	23
240 km/h	12
N/A	8

De eerste drie waarden zijn uw echte beoordelingen. „Very High” komt van een andere picklist (iemand heeft geplakt vanuit het verkeerde veld). „240 km/h” is duidelijk data van het volledig verkeerde veld. „N/A” is een plaatshouder.

Vink „Hot”, „Warm” en „Cold” aan. Laat de rest uitgevinkt.
Klik op Geselecteerden toevoegen.

Stel de resterende configuratie in:

Instelling	Waarde	Redenering
Analysemodus	Conformiteitscontrole	U heeft een ja/nee-antwoord nodig, geen diepgaande analyse
Verwachte waarden	Hot, Warm, Cold	Uw drie geldige beoordelingen
Hoofdlettergevoelig	UIT	„hot”, „HOT” en „Hot” als overeenkomstig opvangen

Wat de scan produceert

Statistiek	Waarde
Conformiteitspercentage	93,7%
Conformiteitsaantal	638

Resultaten lezen

93,7% voldoet. Dat betekent dat 43 records rommeldata hebben. Voor een snelle audit geeft de Conformiteitscontrole-modus u snel het antwoord zonder geavanceerde statistieken te berekenen.

De Importeren uit veld-stap heeft u al verteld hoe de rommel eruitziet. „Very High” (23 records van een foutieve picklistwaarde), „240 km/h” (12 records met verkeerd-veld-data) en „N/A” (8 plaatshouder-vermeldingen). U heeft Dominante waarden hier niet nodig omdat de import u de uitsplitsing al gaf vóórdat de scan werd uitgevoerd.

43 records is een beheersbare opschoning. Dit is geen datamigratie-project. Het is een handmatige correctie van 30 minuten of een enkele data-updatetaak.

Volgende actie

Herstel de 43 niet-conforme records. Converteer vervolgens Rating__c van een tekstveld naar een picklist om toekomstige problemen te voorkomen. API-gemaakte records omzeilen picklistvalidatie, dus voer periodieke consistentiescans uit om nieuwe variaties van integraties op te vangen.

Scenario 3: Functietitel-conformiteit voor persona-targeting

De zakelijke context

Uw marketingteam voert persona-gebaseerde campagnes uit die „VP en hoger” Contacts targeten. Het Title-veld is vrije tekst met duizenden variaties. Vóór elke campagne zoekt iemand handmatig naar titelsleutelwoorden, mist de helft van de variaties en bouwt een onvolledige doelgroeplijst. Het team heeft een datagedreven antwoord nodig op twee vragen: „Hoeveel VP+ contacts hebben we?” en „Welke titels hebben de rest van onze contacts?”

Configuratie walkthrough

Open de configuratie Verwachte waarden voor het veld Title op Contacts.
Klik op Importeren uit veld. De import retourneert honderden waarden. Te veel om individueel te beoordelen, maar de frequentietellingen zijn nuttig voor context.
Definieer uw toegestane waarden op basis van uw persona-mapping. Vink of typ de titelwaarden die uw team als „VP en hoger” beschouwt:

VP, Vice President, SVP, Senior Vice President, EVP,
Executive Vice President, Director, Senior Director,
CEO, CFO, CTO, CIO, CMO, COO, President

Klik op Geselecteerden toevoegen.

Stel de resterende configuratie in:

Instelling	Waarde	Redenering
Analysemodus	Geavanceerde Conformiteitsanalyse	U heeft de volledige waardeverdeling nodig om te zien welke titels er bestaan
Verwachte waarden	(16 titelwaarden hierboven vermeld)	Uw VP+ persona-definitie
Hoofdlettergevoelig	UIT	„vp of sales”, „VP of Sales”, „VP OF SALES” opvangen
Top N	20	Een brede spreiding van wat er bestaat zien
Minimale frequentie	5	Eenmalige vermeldingen zoals „Chief Happiness Officer” filteren

Wat de scan produceert

Statistiek	Waarde
Conformiteitspercentage	34%
Conformiteitsaantal	3.400
Niet-conform-aantal	6.600
Variant-aantal	312

Dominante waarden (Top 20):

Rang	Waarde	Aantal
1	Manager	820
2	Sales Representative	650
3	Account Executive	480
4	Director of Marketing	340
5	VP of Sales	290
6	Senior Manager	275
7	Consultant	240
8	Engineer	210
9	CEO	195
10	Head of Operations	180
…	(10 meer)	…

Resultaten lezen

34% conformiteit is geen mislukking. Dit is geen datakwaliteitsprobleem. Het betekent dat 34% van uw Contacts VP+-titels heeft, en dat is uw campagnedoelgroep. Het getal beantwoordt de vraag waar uw marketingteam naar heeft geraden.

312 Variant-aantal bevestigt dat vrije-tekst Titel sterk gefragmenteerd is. 312 unieke titelwaarden over 10.000 Contacts. Dit is normaal voor vrije-tekstvelden en verklaart waarom handmatige zoekopdrachten mensen missen.

Dominante waarden toont welke titels uw contacts werkelijk hebben. Veel van de topwaarden liggen onder het VP-niveau (Manager, Sales Rep, Account Executive). Dat is verwacht. Deze contacts zijn geldige records met geldige titels. Ze vallen buiten uw doelpersona.

Niet-conform-aantal (6.600) is GEEN opschoontaak. In tegenstelling tot het Country-scenario zijn dit geen vuile records. Het zijn contacts met titels buiten uw VP+-filter. „Manager” is een echte titel, geen datafout. Behandel Niet-conform-aantal als „contacts buiten deze persona”, niet als „records te herstellen.”

Het echte inzicht: U heeft nu een datagedreven doelgroepgrootte. 3.400 VP+-contacts, geverifieerd door de werkelijke data te scannen. Geen handmatige trefwoordzoekopdrachten meer.

Volgende actie

Gebruik het Conformiteitsaantal (3.400) als uw VP+-campagnedoelgroepgrootte. Bekijk de Dominante waarden-lijst voor titels die u heeft gemist. „Senior Manager” (275 records) en „Head of Operations” (180 records) zijn grensgevallen. Als die rollen in aanmerking komen voor uw campagnes, voeg ze dan toe aan de toegestane waarden en scan opnieuw.

Uw configuratie kiezen

Als u…	Begin met	Sleutelinstellingen
Een gecontroleerd veld wilt controleren (picklist, beoordeling, status)	Importeren uit veld, dan Conformiteitscontrole	Verwachte waarden uit import, Hoofdlettergevoelig UIT
Een gefragmenteerd veld wilt standaardiseren (land, branche)	Importeren uit veld, dan Geavanceerde Conformiteitsanalyse	Verwachte waarden als uw doelstandaard, Top N 10+, Minimale frequentie 5+
Een doelgroep of segment wilt bepalen vanuit vrije-tekstdata	Importeren uit veld, dan Geavanceerde Conformiteitsanalyse	Verwachte waarden als uw segmentdefinitie, Top N 20, Minimale frequentie 5
Een snelle basislijn wilt krijgen vóór een opschoonproject	Importeren uit veld, dan Conformiteitscontrole	Verwachte waarden uit uw datastandaard

Voor een volledige uitleg van alle 6 consistentiestatistieken, analysemodi en configuratie-invoeren, ga terug naar het hoofdartikel Consistentie.

Klaar om uw eigen datakwaliteit te meten? Neem de AI-gereedheidsbeoordeling om uw consistentie-scores en meer te zien.