Skip to main content

Giltighet: Konfigurationsscenarier

Tre praktiska genomgångar som visar hur man konfigurerar DQS giltighetsanalys för olika affärsbehov.

Vad dessa scenarier täcker

Den här sidan går igenom tre verkliga konfigurationer av DQS giltighetsanalys. Varje scenario täcker ett specifikt affärsproblem, visar exakta inställningar att använda och förklarar hur man läser resultaten.

Dessa genomgångar bygger på koncepten från den huvudsakliga artikeln Giltighet. Läs den först om du är ny för giltighets­mätvärden, det diagnostiska flödet eller mönsterkonfiguration.

Scenario 1: Sekundär e-postvalidering på ett anpassat textfält

Problemet

Din organisation lagrar en sekundär e-postadress i ett anpassat fält Secondary_Email__c av texttyp på Contact-objektet. Till skillnad från Salesforces standardfält för e-post har ett textfält ingen inbyggd formatvalidering. Användare klistrar in, skriver och importerar vad som helst i det. Marknadsföringen vill använda dessa sekundära adresser för en återengagemangskampanj, men ingen vet hur många som är strukturellt giltiga. Du behöver ett konkret tal så att marknadsföringen kan sätta realistiska kampanjprojektioner och ditt operationsteam kan avgränsa rensningen.

Varför inte standardfältet Email? Salesforces inbyggda fälttyp Email validerar format vid inmatning. Värden i ett standard­e-postfält klarar redan grundläggande formatkontroller. DQS e-postvalidering är användbar på anpassade Textfält som lagrar e-postadresser utan Salesforces inbyggda tillämpning.

Konfiguration

Använd läget Formatvalidering på Contact-objektet, och rikta dig mot fältet Secondary_Email__c. Du behöver rubrikgiltighetsgraden och ett antal användbara poster. Platshållaridentifiering och brusanalys är inte relevanta här eftersom e-postadresser antingen matchar formatet eller inte.

InställningVärdeVarför
AnalyslägeFormatvalideringDu behöver träffgraden och det giltiga antalet, inte den fullständiga ogiltiga uppdelningen
MönstertypE-postInbyggt mönster: ^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$
Inkludera tommaAVTomma e-poster är ett fullständighetsproblem, inte ett giltighetsproblem. Håll dem utanför den här analysen.
SkiftlägeskänsligAVE-postadresser är per definition skiftlägeskänsliga

E-postmönstret är en inbyggd förinställning. Du behöver inte skriva någon regex. Välj “E-post” från mönsterväljaren och regex tillämpas automatiskt.

Exempelresultat

MätvärdeVärde
Giltighetsgrad71 %
Giltigt antal35 500

Totalt antal Contact-poster utvärderade: 50 000.

Läsa resultaten

Börja med rubriken: 71 % giltighet. Det innebär att 29 % av de sekundära e-postadresserna misslyckas med formatkontollen. Av 50 000 Contacts med ett ifyllt Secondary_Email__c har bara 35 500 en strukturellt giltig adress.

Vad 29 % ogiltigt ser ut som i praktiken: Det här är värden som saknar ”@“-tecknet (john.company.com), saknar ett domäntillägg (john@company), innehåller dubbla punkter ([email protected]) eller inkluderar mellanslag (john @company.com). Eftersom det här är ett textfält godkände Salesforce alla vid inmatning. Varje kampanj som skickas till dessa adresser studsar.

Kampanjmatten förändras. Marknadsföringen har projicerat räckvidden för återengagemang baserat på 50 000 sekundära adresser. Den verkliga adresserbara publiken är 35 500. Öppningsfrekvenser, klickfrekvenser och konverteringsprojektioner behöver alla räknas om mot den giltiga basen, inte den uppblåsta totalen.

Varför Formatvalidering räcker här. Du behöver inte Avancerat läge för det här scenariot. Frågan är enkel: “Hur många sekundära e-poster matchar ett giltigt format?” Giltighetsgrad och Giltigt antal svarar på den frågan. Om du senare behöver avgränsa ett rensningsprojekt med exakta ogiltiga antal, byt till Avancerad formatvalidering för den fullständiga uppdelningen.

Vad du gör härnäst

Använd Giltigt antal (35 500) som den verkliga adresserbara publiken för kampanjplanering. Avgränsa ett rensningsprojekt för de återstående 14 500 posterna: exportera dem, identifiera de vanligaste formaterrorna och åtgärda dem genom databerikning eller manuell korrigering. Överväg att lägga till en Salesforce-valideringsregel på Secondary_Email__c för att tillämpa e-postformat på framtida poster, eller konvertera fältet till typen E-post om dina processer tillåter det.


Scenario 2: Produktkodsvalidering med fast längd

Problemet

Ditt företag använder 8-teckens produktkoder i ett anpassat fält Product_Code__c på Opportunity Product-objektet. Dessa koder driver lagersökningar, prisregler och ERP-integration. ERP-synkroniseringen har misslyckats på ungefär 5 % av posterna varje vecka, och integrationsteamet misstänker felformaterade produktkoder. Du behöver bekräfta hur många koder som misslyckas med formatkontollen och få den exakta rensningsomfattningen.

Konfiguration

Använd läget Avancerad formatvalidering på Opportunity Product-objektet, och rikta dig mot fältet Product_Code__c. Du behöver den fullständiga giltig/ogiltig uppdelningen så att integrationsteamet har exakta postantal för sitt saneringsprojekt.

InställningVärdeVarför
AnalyslägeAvancerad formatvalideringDu behöver Ogiltigt antal för att avgränsa rensningen, plus Brusgrad för att kontrollera skräpposter
MönstertypFast längdProduktkoder är alltid exakt 8 tecken
Fast längd8Din standardkodlängd
Inkludera tommaEn tom produktkod är ogiltig för ERP-synk. Räkna den som ett misslyckande.
SkiftlägeskänsligAVProduktkoder är inte skiftlägeskänsliga i ditt system

Mönstret Fast längd genererar automatiskt regex ^.{8}$. Alla värden som inte är exakt 8 tecken misslyckas med validering.

Exempelresultat

Grundläggande mätvärden:

MätvärdeVärde
Giltighetsgrad94,2 %
Giltigt antal9 420

Avancerade mätvärden:

MätvärdeVärde
Ogiltighetsgrad5,8 %
Ogiltigt antal580
Brusgrad0,4 %
Antal brusposter40

Totalt antal poster utvärderade: 10 000.

Läsa resultaten

5,8 % ogiltigt bekräftar integrationsteamets uppskattning. 580 produktkoder av 10 000 matchar inte 8-teckensformatet. Det här är posterna som bryter ERP-synken.

Ogiltigt antal (580) är rensningsomfattningen. Ditt integrationsteam har nu ett konkret tal. Istället för att undersöka varje synkfel individuellt kan de plocka ut de 580 posterna, kategorisera formaterrorna och batch-åtgärda dem. Vanliga problem i produktkodsfält inkluderar trunkerade koder (5-7 tecken från kopiera-klistra-fel), koder med avslutande mellanslag (9 tecken på grund av ett osynligt mellanslag) och koder med bindestreck eller prefix tillagda av användare (“PC-12345678”).

Brusgrad (0,4 %) är låg men värd att notera. 40 poster innehåller brusmönster: upprepade tecken (“XXXXXXXX”), tangentbords­poster (“asdfghjk”) eller specialteckensträngar. Dessa 40 poster är inte formaterror. De är skräpinmatningar som råkar vara exakt 8 tecken långa. Giltighetsgraden räknade dem som giltiga eftersom de klarar längdkontrollen, men de är skräpdata som kommer att misslyckas med ERP-sökning av en annan anledning. Brusgraden fångar det som formatkontollen missar.

Inkludera tomma PÅ är viktigt här. Med Inkludera tomma aktiverat räknas varje post där Product_Code__c är tom som ogiltig. Om du hade lämnat den inställningen av, skulle dessa tomma poster exkluderas från utvärderingen helt och hållet, och ditt Ogiltiga antal skulle vara lägre än det verkliga antalet poster som misslyckas med ERP-synk. Eftersom en tom produktkod bryter integrationen på samma sätt som en felformaterad gör, ger inkludering av tomma dig den korrekta misslyckandes­omfattningen.

Vad du gör härnäst

Exportera de 580 ogiltiga posterna för integrationsteamet. Kategorisera fel per typ: trunkerade koder, extra tecken, avslutande mellanslag. Åtgärda dem i bulk med ett datauppdateringsjobb. För de 40 brusposterna, undersök källan. Om de kom från en specifik import eller användare, åtgärda den rotorsaken. Efter rensning, lägg till en Salesforce-valideringsregel som tillämpar 8-teckens­längden på Product_Code__c för att förhindra nya felaktiga poster. Genomsök igen för att verifiera din nya Giltighetsgrad.


Scenario 3: Brusidentifiering i webbformulärets företagsnamn för Lead

Problemet

Ditt webbformulär för Lead kräver fältet Company. Lead-volymen är stark: 20 000 nya Leads per kvartal. Men SDR-teamet rapporterar att många Leads har skräp­företagsnamn, poster som “asdf”, “test”, “xxx” eller “na na na.” Dessa Leads slösar SDR-tid och förorenar din segmentering. En grundläggande fullständighetskontroll visar att 98 % av Leads har ett Company-värde. Du misstänker att 98 % är vilseledande eftersom skräpposter är tekniskt “ifyllda.”

Konfiguration

Använd läget Avancerad formatvalidering på Lead-objektet, och rikta dig mot fältet Company. Du behöver Brusgraden för att kvantifiera skräpet som döljer sig bakom en hälsosam fullständighetspoäng.

För formatmönstret finns ingen strikt formatregel för företagsnamn. Företagsnamn är fritext. Använd en minimal textvalidering för att kontrollera att värdet innehåller minst ett alfanumeriskt tecken.

InställningVärdeVarför
AnalyslägeAvancerad formatvalideringDu behöver Brusgrad och Antal brusposter för att kvantifiera skräpposter
MönstertypAnpassadInget inbyggt mönster passar fritextföretagsnamn
Anpassat mönster^.*[a-zA-Z0-9].*$Matchar alla värden som innehåller minst en bokstav eller siffra. Fångar värden som är rent specialtecken.
Inkludera tommaTomma företagsnamn är också ett problem. Inkludera dem i misslyckandesantalet.
SkiftlägeskänsligAVInte relevant för det här mönstret, men lämna av som standard

Det verkliga värdet av den här genomsökningen finns i brusmätvärdena, inte formatvalideringen. Det anpassade mönstret är avsiktligt löst eftersom du inte tillämpar ett specifikt företagsnamsformat. Du kör genomsökningen i Avancerat läge för att få tillgång till Brusgrad och Antal brusposter.

Exempelresultat

Grundläggande mätvärden:

MätvärdeVärde
Giltighetsgrad97,5 %
Giltigt antal19 500

Avancerade mätvärden:

MätvärdeVärde
Ogiltighetsgrad2,5 %
Ogiltigt antal500
Brusgrad12 %
Antal brusposter2 400

Totalt antal Lead-poster utvärderade: 20 000.

Läsa resultaten

97,5 % giltighet är förväntat och inte poängen. Nästan varje värde klarar den lösa formatkontollen eftersom mönstret bara kräver ett alfanumeriskt tecken. De 500 ogiltiga posterna är poster med bara specialtecken eller blanksteg, värden som ”---”, ”…” eller ”!!!”. Dessa är lätta att identifiera och ta bort.

Brusgrad (12 %) är det verkliga fyndet. 2 400 Leads har företagsnamn som innehåller brusmönster. Det här är poster med upprepade tecken (“aaaa”, “xxxxx”), konsekutiva specialtecken (”!@#$%”) eller kontrolltecken. De klarar formatkontollen eftersom de innehåller alfanumeriska tecken, men värdena är skräp.

Den sanna datakvalitetsbilden:

KategoriPosterVad det innebär
Rena och giltiga17 100Riktiga företagsnamn redo för SDR-outreach
Ogiltiga (rent skräp)500Inget alfanumeriskt innehåll alls. Ta bort eller karantänisera.
Brusiga (dolt skräp)2 400Ser ifyllt ut men innehåller skräp. Manuell granskning eller automatisk flaggning.

Ditt SDR-team har rätt: Lead-kvalitetsproblemet är verkligt. 2 900 av 20 000 Leads (14,5 %) har oanvändbar Company-data. Det är 14,5 % av SDR-tid slösad på Leads som aldrig kan dirigeras, berikas eller segmenteras korrekt.

Gapet fullständighet kontra giltighet. Fullständighet säger att 98 % av Leads har ett Company-värde. Giltighet säger att 97,5 % klarar formatkontollen. Brusgrad säger att 12 % av dessa godkända värden är skräp. Varje dimension avslöjar ett annat lager av problemet. Fullständighet ensam missar skräpet som Brusgraden fångar.

Vad du gör härnäst

Bygg en rensningskö för de 2 900 kombinerade ogiltiga och brusiga posterna. För de 500 rent ogiltiga posterna, ta bort eller karantänisera dem automatiskt. För de 2 400 brusiga posterna, bestäm: ta bort Leads automatiskt utan annan användbar data, eller flagga dem för manuell granskning om telefon- eller e-postdata fortfarande är användbar.

Åtgärda källan. Skräpet kommer från ditt webbformulär. Lägg till klientsidevalidering: en minsta teckenlängd, blockera upprepade-tecken-mönster och överväg CAPTCHA för botskydd. Efter implementering av formulärförändringar, kör genomsökningen igen nästa kvartal och jämför Brusgraden mot den här baslinjen.


Välja din konfiguration

Använd den här tabellen för att välja rätt startpunkt för din giltighetsanalys.

Om du behöver…Börja medNyckelinställningar
Kontrollera e-postformat på anpassade textfältFormatvalideringMönstertyp: E-post, Inkludera tomma: AV
Validera fast längd-koder (produktkoder, SKU:er, postnummer)Avancerad formatvalideringMönstertyp: Fast längd, ange ditt teckenantal, Inkludera tomma: PÅ
Validera URL-format på webbplatsfältFormatvalideringMönstertyp: URL, Inkludera tomma: AV
Tillämpa ett anpassat affärsformat (regex)Avancerad formatvalideringMönstertyp: Anpassad, ange ditt regex-mönster
Identifiera skräp och brus i fritext­fältAvancerad formatvalideringAnvänd ett löst formatmönster, fokusera på Brusgrad och Antal brusposter
Avgränsa ett datarensnings­projekt för en integrationAvancerad formatvalideringInkludera tomma: PÅ, använd Ogiltigt antal och Antal brusposter för projektberäkning

För en fullständig referens av alla 6 giltighetsmätvärden, mönstertyper och brusidentifieringsdetaljer, återvänd till den huvudsakliga artikeln Giltighet.

Redo att mäta din egen datakvalitet? Ta AI-beredskapsbedömningen för att se dina giltighetspoäng och mer.