Skip to main content

Consistentie: configuratiescenario's

Drie praktische walkthroughs die laten zien hoe u DQS-consistentieanalyse configureert voor verschillende zakelijke behoeften.

Wat deze scenario’s behandelen

Deze pagina doorloopt drie praktijkconsistentieconfiguraties, van eerste opzet tot het lezen van de scanresultaten. Elk scenario gebruikt een andere zakelijke context en analysemodus.

Deze scenario’s bouwen voort op de concepten en statistieken behandeld in het hoofdartikel Consistentie. Lees dat eerst als termen zoals Conformiteitspercentage, Variant-aantal en Dominante waarden nieuw voor u zijn.

Scenario 1: Country-veld standaardisering met ontdekking

De zakelijke context

Uw org heeft 15.000 Account-records van 3 gefuseerde bedrijven. Het Country-veld is vrije tekst. Regionale dashboards tonen gefragmenteerde data: „United States” verschijnt als één rij, „USA” als een andere, „US” als een derde. Territoriumtoewijzingsregels missen records omdat ze filteren op één spelling. U moet standaardiseren, maar u weet niet welke waarden er in alle drie de legacy-systemen bestaan.

Configuratie walkthrough

Begin met Importeren uit veld om te ontdekken wat uw data werkelijk bevat vóór het definiëren van toegestane waarden.

  1. Open de configuratie Verwachte waarden voor het veld Country.
  2. Klik op Importeren uit veld. DQS bevraagt de live data en retourneert unieke waarden gesorteerd op frequentie.
  3. Bekijk de checklist. De import onthult het volledige beeld:
WaardeRecords
United States4.500
USA2.300
US1.800
Canada1.400
U.S.A.450
United States of America150
… (41 meer variaties)
  1. Beslis over uw standaard. ISO-landcodes („US”, „CA”, „UK”) zijn compact, branchestandaard en ondubbelzinnig. Vink de ISO-codes aan uit de importlijst.
  2. Klik op Geselecteerden toevoegen om uw lijst met toegestane waarden in te vullen.

Stel de resterende configuratie in:

InstellingWaardeRedenering
AnalysemodusGeavanceerde ConformiteitsanalyseU heeft variant-aantallen en dominante waarden nodig om de opschoning te bepalen
Verwachte waardenUS, CA, UK, DE, FR, AU, JPISO-codes voor uw actieve markten
HoofdlettergevoeligUIT„us”, „Us” en „US” als dezelfde waarde opvangen
Top N10De meest voorkomende variaties zien
Minimale frequentie5Eenmalige typefouten filteren

Wat de scan produceert

StatistiekWaarde
Conformiteitspercentage12%
Conformiteitsaantal1.800
Niet-conform-aantal13.200
Variant-aantal47
Dominante waardenTop 10 waarden met aantallen (zie importtabel hierboven)

Resultaten lezen

12% conformiteit is verwacht. U heeft een nieuwe standaard gedefinieerd (ISO-codes) waarnaar de data nog nooit is genormaliseerd. Alleen de 1.800 records die al „US” bevatten, komen overeen. Dit is geen slechte score. Het is uw startpunt.

47 varianten onthult de omvang van fragmentatie. Drie gefuseerde systemen produceerden 47 verschillende manieren om landnamen uit te drukken. Zonder dit getal zou u de opschooninspanning onderschatten.

Dominante waarden toont waar u zich op moet richten. De top 3 variaties („United States”, „USA”, „US”) vertegenwoordigen 8.600 records. Alleen die drie waarden standaardiseren verhoogt uw conformiteit van 12% naar 69%. Begin daar.

Niet-conform-aantal (13.200) is uw exacte opschoontaak. Uw dataverzorger heeft nu een concrete projectomvang, geen gok.

Volgende actie

Bouw een waardenmappingtabel met behulp van de Dominante waarden-uitvoer. Wijs „United States” toe aan „US”, „USA” aan „US”, enzovoort. Voer de datanormalisatie uit. Scan opnieuw om uw nieuwe Conformiteitspercentage te verifiëren.

Scenario 2: Lead-beoordelingsvalidatie

De zakelijke context

Uw Lead-beoordelingsveld (Rating__c) is een tekstveld dat „Hot”, „Warm” of „Cold” accepteert. Salesmanagers melden vreemde waarden in hun pijplijnrapporten. Een filter voor Rating = "Hot" retourneert minder records dan verwacht. U heeft een snelle conformiteitsaudit nodig om uit te zoeken wat er in het veld zit en hoeveel records er opgeschoond moeten worden.

Configuratie walkthrough

Begin met Importeren uit veld om de werkelijke waarden te zien vóór het configureren van uw scan.

  1. Open de configuratie Verwachte waarden voor Rating__c.
  2. Klik op Importeren uit veld. De import retourneert:
WaardeRecords
Hot284
Warm198
Cold156
Very High23
240 km/h12
N/A8

De eerste drie waarden zijn uw echte beoordelingen. „Very High” komt van een andere picklist (iemand heeft geplakt vanuit het verkeerde veld). „240 km/h” is duidelijk data van het volledig verkeerde veld. „N/A” is een plaatshouder.

  1. Vink „Hot”, „Warm” en „Cold” aan. Laat de rest uitgevinkt.
  2. Klik op Geselecteerden toevoegen.

Stel de resterende configuratie in:

InstellingWaardeRedenering
AnalysemodusConformiteitscontroleU heeft een ja/nee-antwoord nodig, geen diepgaande analyse
Verwachte waardenHot, Warm, ColdUw drie geldige beoordelingen
HoofdlettergevoeligUIT„hot”, „HOT” en „Hot” als overeenkomstig opvangen

Wat de scan produceert

StatistiekWaarde
Conformiteitspercentage93,7%
Conformiteitsaantal638

Resultaten lezen

93,7% voldoet. Dat betekent dat 43 records rommeldata hebben. Voor een snelle audit geeft de Conformiteitscontrole-modus u snel het antwoord zonder geavanceerde statistieken te berekenen.

De Importeren uit veld-stap heeft u al verteld hoe de rommel eruitziet. „Very High” (23 records van een foutieve picklistwaarde), „240 km/h” (12 records met verkeerd-veld-data) en „N/A” (8 plaatshouder-vermeldingen). U heeft Dominante waarden hier niet nodig omdat de import u de uitsplitsing al gaf vóórdat de scan werd uitgevoerd.

43 records is een beheersbare opschoning. Dit is geen datamigratie-project. Het is een handmatige correctie van 30 minuten of een enkele data-updatetaak.

Volgende actie

Herstel de 43 niet-conforme records. Converteer vervolgens Rating__c van een tekstveld naar een picklist om toekomstige problemen te voorkomen. API-gemaakte records omzeilen picklistvalidatie, dus voer periodieke consistentiescans uit om nieuwe variaties van integraties op te vangen.

Scenario 3: Functietitel-conformiteit voor persona-targeting

De zakelijke context

Uw marketingteam voert persona-gebaseerde campagnes uit die „VP en hoger” Contacts targeten. Het Title-veld is vrije tekst met duizenden variaties. Vóór elke campagne zoekt iemand handmatig naar titelsleutelwoorden, mist de helft van de variaties en bouwt een onvolledige doelgroeplijst. Het team heeft een datagedreven antwoord nodig op twee vragen: „Hoeveel VP+ contacts hebben we?” en „Welke titels hebben de rest van onze contacts?”

Configuratie walkthrough

  1. Open de configuratie Verwachte waarden voor het veld Title op Contacts.
  2. Klik op Importeren uit veld. De import retourneert honderden waarden. Te veel om individueel te beoordelen, maar de frequentietellingen zijn nuttig voor context.
  3. Definieer uw toegestane waarden op basis van uw persona-mapping. Vink of typ de titelwaarden die uw team als „VP en hoger” beschouwt:
VP, Vice President, SVP, Senior Vice President, EVP,
Executive Vice President, Director, Senior Director,
CEO, CFO, CTO, CIO, CMO, COO, President
  1. Klik op Geselecteerden toevoegen.

Stel de resterende configuratie in:

InstellingWaardeRedenering
AnalysemodusGeavanceerde ConformiteitsanalyseU heeft de volledige waardeverdeling nodig om te zien welke titels er bestaan
Verwachte waarden(16 titelwaarden hierboven vermeld)Uw VP+ persona-definitie
HoofdlettergevoeligUIT„vp of sales”, „VP of Sales”, „VP OF SALES” opvangen
Top N20Een brede spreiding van wat er bestaat zien
Minimale frequentie5Eenmalige vermeldingen zoals „Chief Happiness Officer” filteren

Wat de scan produceert

StatistiekWaarde
Conformiteitspercentage34%
Conformiteitsaantal3.400
Niet-conform-aantal6.600
Variant-aantal312

Dominante waarden (Top 20):

RangWaardeAantal
1Manager820
2Sales Representative650
3Account Executive480
4Director of Marketing340
5VP of Sales290
6Senior Manager275
7Consultant240
8Engineer210
9CEO195
10Head of Operations180
(10 meer)

Resultaten lezen

34% conformiteit is geen mislukking. Dit is geen datakwaliteitsprobleem. Het betekent dat 34% van uw Contacts VP+-titels heeft, en dat is uw campagnedoelgroep. Het getal beantwoordt de vraag waar uw marketingteam naar heeft geraden.

312 Variant-aantal bevestigt dat vrije-tekst Titel sterk gefragmenteerd is. 312 unieke titelwaarden over 10.000 Contacts. Dit is normaal voor vrije-tekstvelden en verklaart waarom handmatige zoekopdrachten mensen missen.

Dominante waarden toont welke titels uw contacts werkelijk hebben. Veel van de topwaarden liggen onder het VP-niveau (Manager, Sales Rep, Account Executive). Dat is verwacht. Deze contacts zijn geldige records met geldige titels. Ze vallen buiten uw doelpersona.

Niet-conform-aantal (6.600) is GEEN opschoontaak. In tegenstelling tot het Country-scenario zijn dit geen vuile records. Het zijn contacts met titels buiten uw VP+-filter. „Manager” is een echte titel, geen datafout. Behandel Niet-conform-aantal als „contacts buiten deze persona”, niet als „records te herstellen.”

Het echte inzicht: U heeft nu een datagedreven doelgroepgrootte. 3.400 VP+-contacts, geverifieerd door de werkelijke data te scannen. Geen handmatige trefwoordzoekopdrachten meer.

Volgende actie

Gebruik het Conformiteitsaantal (3.400) als uw VP+-campagnedoelgroepgrootte. Bekijk de Dominante waarden-lijst voor titels die u heeft gemist. „Senior Manager” (275 records) en „Head of Operations” (180 records) zijn grensgevallen. Als die rollen in aanmerking komen voor uw campagnes, voeg ze dan toe aan de toegestane waarden en scan opnieuw.

Uw configuratie kiezen

Als u…Begin metSleutelinstellingen
Een gecontroleerd veld wilt controleren (picklist, beoordeling, status)Importeren uit veld, dan ConformiteitscontroleVerwachte waarden uit import, Hoofdlettergevoelig UIT
Een gefragmenteerd veld wilt standaardiseren (land, branche)Importeren uit veld, dan Geavanceerde ConformiteitsanalyseVerwachte waarden als uw doelstandaard, Top N 10+, Minimale frequentie 5+
Een doelgroep of segment wilt bepalen vanuit vrije-tekstdataImporteren uit veld, dan Geavanceerde ConformiteitsanalyseVerwachte waarden als uw segmentdefinitie, Top N 20, Minimale frequentie 5
Een snelle basislijn wilt krijgen vóór een opschoonprojectImporteren uit veld, dan ConformiteitscontroleVerwachte waarden uit uw datastandaard

Voor een volledige uitleg van alle 6 consistentiestatistieken, analysemodi en configuratie-invoeren, ga terug naar het hoofdartikel Consistentie.

Klaar om uw eigen datakwaliteit te meten? Neem de AI-gereedheidsbeoordeling om uw consistentie-scores en meer te zien.