Skip to main content

Geldigheid: configuratiescenario's

Drie praktische walkthroughs die laten zien hoe u DQS-geldigheidsanalyse configureert voor verschillende zakelijke behoeften.

Wat deze scenario’s behandelen

Deze pagina doorloopt drie praktijkconfiguraties van DQS-geldigheidsanalyse. Elk scenario behandelt een specifiek zakelijk probleem, toont de exacte te gebruiken instellingen en legt uit hoe u de resultaten kunt lezen.

Deze walkthroughs bouwen voort op de concepten uit het hoofdartikel Geldigheid. Lees dat eerst als u nieuw bent met geldigheidsstatistieken, de diagnostische flow of patternconfiguratie.

Scenario 1: Validatie van secundaire e-mail op een aangepast tekstveld

Het probleem

Uw organisatie slaat een secundair e-mailadres op in een aangepast veld Secondary_Email__c (tekstveld) op het Contact-object. In tegenstelling tot het standaard Salesforce-e-mailveld heeft een tekstveld geen ingebouwde formaatvalidatie. Gebruikers plakken, typen en importeren er van alles in. Marketing wil deze secundaire adressen gebruiken voor een heractivatiecampagne, maar niemand weet hoeveel er structureel geldig zijn. U heeft een concreet getal nodig zodat marketing realistische campagneprognoses kan stellen en uw ops-team de opschoning kan bepalen.

Waarom niet het standaard E-mailveld? Het native E-mailveld van Salesforce valideert het formaat bij invoer. Waarden in een standaard E-mailveld doorstaan al basale formaatcontroles. DQS-e-mailvalidatie is nuttig op aangepaste tekstvelden die e-mailadressen opslaan zonder Salesforce’s ingebouwde handhaving.

Configuratie

Gebruik de modus Formaatvalidatie op het Contact-object, gericht op het veld Secondary_Email__c. U heeft de kopgeldigheidsgraad en een aantal bruikbare records nodig. Plaatshouderdetectie en ruisanalyse zijn hier niet relevant omdat e-mailadressen ofwel overeenkomen met het formaat of niet.

InstellingWaardeWaarom
AnalysemodusFormaatvalidatieU heeft de overeenkomstgraad en het geldige aantal nodig, niet de volledige ongeldige uitsplitsing
PatroontypeE-mailIngebouwd patroon: ^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$
Inclusief lege waardenUITLege e-mails zijn een volledigsheidsprobleem, geen geldigsheidsprobleem. Houd ze buiten deze analyse.
HoofdlettergevoeligUITE-mailadressen zijn per definitie niet hoofdlettergevoelig

Het E-mailpatroon is een ingebouwde preset. U hoeft geen regex te schrijven. Selecteer „E-mail” uit de patroonkiezer en de regex wordt automatisch toegepast.

Voorbeeldresultaten

StatistiekWaarde
Geldigheidsgraad71%
Geldig aantal35.500

Totaal geëvalueerde Contact-records: 50.000.

Resultaten lezen

Begin met de kop: 71% geldigheid. Dat betekent dat 29% van de secundaire e-mailadressen de formaatcontrole niet doorstaat. Van 50.000 Contacts met een gevuld Secondary_Email__c hebben slechts 35.500 een structureel geldig adres.

Hoe 29% ongeldig eruitziet in de praktijk: Dit zijn waarden zonder het „@“-symbool (john.company.com), zonder domeinextensie (john@company), met dubbele punten ([email protected]) of met spaties (john @company.com). Omdat dit een tekstveld is, heeft Salesforce ze allemaal geaccepteerd bij invoer. Elke campagne die naar deze adressen wordt gestuurd, stuitert terug.

De campagneberekening verandert. Marketing heeft heractivatiebereik geprojecteerd op basis van 50.000 secundaire adressen. Het werkelijk adresseerbare publiek is 35.500. Openingspercentages, klikpercentages en conversieprognosticaties moeten allemaal worden herberekend op basis van de geldige basis, niet het opgeblazen totaal.

Waarom Formaatvalidatie hier voldoende is. U heeft de Geavanceerde modus niet nodig voor dit scenario. De vraag is eenvoudig: „Hoeveel secundaire e-mails komen overeen met een geldig formaat?” Geldigheidsgraad en Geldig aantal beantwoorden die vraag. Als u later de omvang van een opschoonproject wilt bepalen met exacte ongeldige aantallen, schakel dan over naar Geavanceerde Formaatvalidatie voor de volledige uitsplitsing.

Wat u vervolgens kunt doen

Gebruik Geldig aantal (35.500) als het werkelijke adresseerbare publiek voor campagneplanning. Bepaal de omvang van een opschoonproject voor de resterende 14.500 records: exporteer ze, identificeer de meest voorkomende formaatfouten en herstel ze via dataverrijking of handmatige correctie. Overweeg een Salesforce-validatieregel toe te voegen op Secondary_Email__c om e-mailformaat af te dwingen bij toekomstige invoeren, of converteer het veld naar het E-mailtype als uw processen dat toestaan.


Scenario 2: Productcodevalidatie met vaste lengte

Het probleem

Uw bedrijf gebruikt 8-tekens productcodes in een aangepast veld Product_Code__c op het object Opportunity Product. Deze codes sturen voorraadzoekopdrachten, prijsregels en ERP-integratie aan. De ERP-synchronisatie mislukt bij ongeveer 5% van de records elke week, en het integratieteam vermoedt misvormde productcodes. U moet bevestigen hoeveel codes de formaatcontrole niet doorstaan en de exacte opschoonomvang bepalen.

Configuratie

Gebruik de modus Geavanceerde Formaatvalidatie op het object Opportunity Product, gericht op het veld Product_Code__c. U heeft de volledige uitsplitsing geldig/ongeldig nodig zodat het integratieteam exacte recordaantallen heeft voor hun herstelproject.

InstellingWaardeWaarom
AnalysemodusGeavanceerde FormaatvalidatieU heeft Ongeldig aantal nodig om de opschoning te bepalen, plus Ruisgraad om te controleren op junk-invoeren
PatroontypeVaste lengteProductcodes zijn altijd precies 8 tekens
Vaste lengte8Uw standaard codelengte
Inclusief lege waardenAANEen lege productcode is ongeldig voor ERP-synchronisatie. Tel dit als een fout.
HoofdlettergevoeligUITProductcodes zijn niet hoofdlettergevoelig in uw systeem

Het Vaste lengte-patroon genereert automatisch de regex ^.{8}$. Elke waarde die niet precies 8 tekens is, faalt de validatie.

Voorbeeldresultaten

Basisstatistieken:

StatistiekWaarde
Geldigheidsgraad94,2%
Geldig aantal9.420

Geavanceerde statistieken:

StatistiekWaarde
Ongeldige graad5,8%
Ongeldig aantal580
Ruisgraad0,4%
Ruisrecordaantal40

Totaal geëvalueerde records: 10.000.

Resultaten lezen

5,8% ongeldig bevestigt de schatting van het integratieteam. 580 productcodes van de 10.000 komen niet overeen met het 8-tekensformaat. Dit zijn de records die de ERP-synchronisatie onderbreken.

Ongeldig aantal (580) is de opschoonomvang. Uw integratieteam heeft nu een concreet getal. In plaats van elk synchronisatiefalen afzonderlijk te onderzoeken, kunnen ze de 580 records ophalen, de formaatfouten categoriseren en ze batchgewijs herstellen. Veelvoorkomende problemen in productcodevelden zijn afgekorte codes (5-7 tekens van kopieer-plakfouten), codes met afsluitende spaties (9 tekens vanwege een onzichtbare spatie) en codes met koppeltekens of voorvoegsels die door gebruikers zijn toegevoegd („PC-12345678”).

Ruisgraad (0,4%) is laag maar vermeldenswaard. 40 records bevatten ruispatronen: herhaalde tekens („XXXXXXXX”), toetsenbordinvoeren („asdfghjk”) of speciale teken-reeksen. Deze 40 records zijn geen formaatfouten. Het zijn junk-invoeren die toevallig precies 8 tekens lang zijn. Geldigheidsgraad telde ze als geldig omdat ze de lengtecontrole doorstaan, maar het zijn afvaldata die de ERP-zoekopdracht om een andere reden zullen mislukken. Ruisgraad vangt op wat de formaatcontrole mist.

Inclusief lege waarden AAN is hier van belang. Met Inclusief lege waarden ingeschakeld, telt elk record waarbij Product_Code__c leeg is als ongeldig. Als u deze instelling had uitgeschakeld, zouden die lege records volledig worden uitgesloten van evaluatie, en zou uw Ongeldig aantal lager zijn dan het werkelijke aantal records dat ERP-synchronisatie mislukt. Omdat een lege productcode de integratie op dezelfde manier onderbreekt als een misvormde, geeft het opnemen van lege waarden u de nauwkeurige faalomvang.

Wat u vervolgens kunt doen

Exporteer de 580 ongeldige records voor het integratieteam. Categoriseer fouten op type: afgekorte codes, extra tekens, afsluitende spaties. Herstel ze in bulk via een dataupdatetaak. Onderzoek voor de 40 ruisrecords de bron. Als ze van een specifieke import of gebruiker kwamen, pak dan die oorzaak aan. Na opschoning voegt u een Salesforce-validatieregel toe die de 8-tekenslengte afdwingt op Product_Code__c om nieuwe slechte invoeren te voorkomen. Scan opnieuw om uw nieuwe Geldigheidsgraad te verifiëren.


Scenario 3: Ruisdetectie van websiteleadnaam op webformulier

Het probleem

Uw web-to-lead-formulier vereist het veld Company. Het leadvolume is sterk: 20.000 nieuwe leads per kwartaal. Maar het SDR-team meldt dat veel leads onzinnige bedrijfsnamen hebben, invoeren zoals „asdf”, „test”, „xxx” of „na na na.” Deze leads verspillen SDR-tijd en vervuilen uw segmentatie. Een basale volledigheidscontrole toont dat 98% van de leads een Company-waarde heeft. U vermoedt dat de 98% misleidend is omdat junk-invoeren technisch gezien „gevuld” zijn.

Configuratie

Gebruik de modus Geavanceerde Formaatvalidatie op het Lead-object, gericht op het veld Company. U heeft Ruisgraad nodig om het afval te kwantificeren dat zich achter een gezonde volledigheidscore verbergt.

Voor het formaatpatroon is er geen strikte formaatRegel voor bedrijfsnamen. Bedrijfsnamen zijn vrije tekst. Gebruik een minimale tekstvalidatie om te controleren of de waarde ten minste één alfanumeriek teken bevat.

InstellingWaardeWaarom
AnalysemodusGeavanceerde FormaatvalidatieU heeft Ruisgraad en Ruisrecordaantal nodig om junk-invoeren te kwantificeren
PatroontypeAangepastGeen ingebouwd patroon past bij vrije-tekst bedrijfsnamen
Aangepast patroon^.*[a-zA-Z0-9].*$Komt overeen met elke waarde die ten minste één letter of cijfer bevat. Vangt waarden op die puur speciale tekens zijn.
Inclusief lege waardenAANLege bedrijfsnamen zijn ook een probleem. Neem ze op in het faalantal.
HoofdlettergevoeligUITNiet relevant voor dit patroon, maar laat het uit als standaard

De echte waarde van deze scan zit in de ruisstatistieken, niet de formaatvalidatie. Het aangepaste patroon is opzettelijk los omdat u geen specifiek bedrijfsnaamformaat afdwingt. U voert de scan uit in de Geavanceerde modus om toegang te krijgen tot Ruisgraad en Ruisrecordaantal.

Voorbeeldresultaten

Basisstatistieken:

StatistiekWaarde
Geldigheidsgraad97,5%
Geldig aantal19.500

Geavanceerde statistieken:

StatistiekWaarde
Ongeldige graad2,5%
Ongeldig aantal500
Ruisgraad12%
Ruisrecordaantal2.400

Totaal geëvalueerde Lead-records: 20.000.

Resultaten lezen

97,5% geldigheid is te verwachten en niet het punt. Bijna elke waarde doorstaat de losse formaatcontrole omdat het patroon slechts één alfanumeriek teken vereist. De 500 ongeldige records zijn invoeren met alleen speciale tekens of witruimte, waarden zoals „---”, „…” of „!!!”. Die zijn gemakkelijk te identificeren en te verwijderen.

Ruisgraad (12%) is de werkelijke bevinding. 2.400 leads hebben bedrijfsnamen die ruispatronen bevatten. Dit zijn invoeren met herhaalde tekens („aaaa”, „xxxxx”), opeenvolgende speciale tekens („!@#$%”) of controle-tekens. Ze doorstaan de formaatcontrole omdat ze alfanumerieke tekens bevatten, maar de waarden zijn afval.

Het werkelijke datakwaliteitsplaatje:

CategorieRecordsWat het betekent
Schoon en geldig17.100Echte bedrijfsnamen klaar voor SDR-outreach
Ongeldig (puur afval)500Geen alfanumerieke inhoud. Verwijder of quarantaine.
Ruisig (verborgen afval)2.400Ziet er gevuld uit maar bevat afval. Handmatige beoordeling of automatische markering.

Uw SDR-team heeft gelijk: het leadkwaliteitsprobleem is reëel. 2.900 van de 20.000 leads (14,5%) heeft onbruikbare Company-data. Dat is 14,5% van de SDR-tijd verspild aan leads die nooit correct kunnen worden gerouteerd, verrijkt of gesegmenteerd.

De volledigheid versus geldigheidkloof. Volledigheid zegt dat 98% van de leads een Company-waarde heeft. Geldigheid zegt dat 97,5% de formaatcontrole doorstaat. Ruisgraad zegt dat 12% van die doorgestane waarden afval zijn. Elke dimensie onthult een andere laag van het probleem. Volledigheid alleen mist het afval dat Ruisgraad opvangt.

Wat u vervolgens kunt doen

Bouw een opschoonwachtrij voor de 2.900 gecombineerde ongeldige en ruisige records. Verwijder of quarantineer de 500 puur ongeldige records automatisch. Beslis voor de 2.400 ruisige records: verwijder leads automatisch zonder andere nuttige data, of markeer ze voor handmatige beoordeling als telefoon- of e-maildata nog bruikbaar is.

Los de bron op. Het afval is afkomstig van uw webformulier. Voeg client-side validatie toe: een minimale tekenlengte, blokkeer herhaalde-teken-patronen en overweeg CAPTCHA voor botpreventie. Voer na het implementeren van formulierwijzigingen de scan opnieuw uit volgend kwartaal en vergelijk Ruisgraad met deze basislijn.


Uw configuratie kiezen

Gebruik deze tabel om het juiste startpunt te kiezen voor uw geldigheidsanalyse.

Als u moet…Begin metSleutelinstellingen
E-mailformaat controleren op aangepaste tekstveldenFormaatvalidatiePatroontype: E-mail, Inclusief lege waarden: UIT
Codes met vaste lengte valideren (productcodes, SKU’s, postcodes)Geavanceerde FormaatvalidatiePatroontype: Vaste lengte, stel uw tekenaaantal in, Inclusief lege waarden: AAN
URL-formaat valideren op websiteveldenFormaatvalidatiePatroontype: URL, Inclusief lege waarden: UIT
Een aangepast bedrijfsformaat afdwingen (regex)Geavanceerde FormaatvalidatiePatroontype: Aangepast, voer uw regex-patroon in
Junk en ruis detecteren in vrije-tekstveldenGeavanceerde FormaatvalidatieGebruik een los formaatpatroon, focus op Ruisgraad en Ruisrecordaantal
De omvang van een dataopschoonproject bepalen voor een integratieGeavanceerde FormaatvalidatieInclusief lege waarden: AAN, gebruik Ongeldig aantal en Ruisrecordaantal voor projectbepaling

Voor een volledige referentie van alle 6 geldigheidsstatistieken, patroontypen en ruisdetectiedetails, ga terug naar het hoofdartikel Geldigheid.

Klaar om uw eigen datakwaliteit te meten? Neem de AI-gereedheidsbeoordeling om uw geldigheidsscores en meer te zien.