Skip to main content

Consistency: Configuration Scenarios

तीन practical walkthroughs दिखाते हैं कि DQS consistency analysis को अलग-अलग business needs के लिए कैसे configure करें।

ये Scenarios क्या Cover करते हैं

यह page तीन real-world consistency configurations के माध्यम से walk-through करती है, initial setup से लेकर scan results पढ़ने तक। प्रत्येक scenario एक अलग business context और analysis mode उपयोग करता है।

ये scenarios main Consistency article में cover किए गए concepts और metrics पर build करते हैं। यदि Conformance Rate, Variant Count, और Dominant Values जैसे terms आपके लिए new हैं तो पहले वह पढ़ें।

Scenario 1: Discovery के साथ Country Field Standardization

Business Context

आपके org में 3 merged companies से 15,000 Account records हैं। Country field free text है। Regional dashboards fragmented data दिखाते हैं: “United States” एक row के रूप में दिखाई देता है, “USA” दूसरे के रूप में, “US” तीसरे के रूप में। Territory assignment rules records miss करते हैं क्योंकि वे single spelling के लिए filter करते हैं। आपको standardize करना है, लेकिन आप नहीं जानते कि तीनों legacy systems में कौन सी values exist करती हैं।

Configuration Walkthrough

अपने allowed values define करने से पहले discover करने के लिए पहले Import from Field से शुरू करें।

  1. Country field के लिए Expected Values configuration खोलें।
  2. Import from Field पर click करें। DQS live data query करता है और distinct values को frequency द्वारा sorted करके return करता है।
  3. Checklist review करें। Import full picture reveal करता है:
ValueRecords
United States4,500
USA2,300
US1,800
Canada1,400
U.S.A.450
United States of America150
… (41 और variations)
  1. अपना standard decide करें। ISO country codes (“US”, “CA”, “UK”) compact, industry-standard, और unambiguous हैं। Import list से ISO codes check करें।
  2. अपनी allowed values populate करने के लिए Add Selected click करें।

Remaining configuration set करें:

SettingValueतर्क
Analysis ModeAdvanced Conformance AnalysisCleanup scope के लिए variant counts और dominant values चाहिए
Expected ValuesUS, CA, UK, DE, FR, AU, JPआपके active markets के लिए ISO codes
Case SensitiveOFF”us”, “Us”, और “US” को same value के रूप में catch करें
Top N10Most common variations देखें
Min Frequency5One-off typos filter करें

Scan क्या Produce करता है

MetricValue
Conformance Rate12%
Conformance Count1,800
Non-Conforming Count13,200
Variant Count47
Dominant ValuesTop 10 values with counts (import table ऊपर देखें)

Results पढ़ना

12% conformance expected है। आपने एक new standard (ISO codes) define किया जिस पर data कभी normalized नहीं हुआ। केवल वे 1,800 records जिनमें पहले से “US” है match करते हैं। यह bad score नहीं है। यह आपका starting point है।

47 variants fragmentation का scale reveal करता है। तीन merged systems ने country names express करने के 47 अलग-अलग तरीके produce किए। इस number के बिना, आप cleanup effort को underestimate करेंगे।

Dominant Values दिखाता है कि कहाँ focus करना है। Top 3 variations (“United States”, “USA”, “US”) 8,600 records account करती हैं। उन तीन values को standardize करना अकेले ही आपकी conformance 12% से 69% तक lift करेगा। वहाँ से शुरू करें।

Non-Conforming Count (13,200) आपकी exact cleanup scope है। आपके data steward के पास अब एक concrete project size है, guess नहीं।

अगला Action

Dominant Values output का उपयोग करके एक value mapping table build करें। “United States” को “US” map करें, “USA” को “US” map करें, इत्यादि। Data normalization run करें। अपना नया Conformance Rate verify करने के लिए rescan करें।

Scenario 2: Lead Rating Validation

Business Context

आपका Lead Rating field (Rating__c) एक text field है जो “Hot”, “Warm”, या “Cold” accept करता है। Sales managers अपनी pipeline reports में strange values report करते हैं। Rating = "Hot" के लिए filter expected से कम records return करता है। आपको field में क्या है और कितने records को cleanup की जरूरत है यह find out करने के लिए quick conformance audit चाहिए।

Configuration Walkthrough

Scan configure करने से पहले actual values देखने के लिए पहले Import from Field से शुरू करें।

  1. Rating__c के लिए Expected Values configuration खोलें।
  2. Import from Field click करें। Import return करता है:
ValueRecords
Hot284
Warm198
Cold156
Very High23
240 km/h12
N/A8

पहले तीन values आपकी real ratings हैं। “Very High” एक different picklist से आता है (किसी ने wrong field से paste किया)। “240 km/h” clearly wrong field का data है। “N/A” एक placeholder है।

  1. “Hot”, “Warm”, और “Cold” check करें। बाकी unchecked छोड़ें।
  2. Add Selected click करें।

Remaining configuration set करें:

SettingValueतर्क
Analysis ModeConformance Checkआपको yes/no answer चाहिए, deep analysis नहीं
Expected ValuesHot, Warm, Coldआपकी तीन valid ratings
Case SensitiveOFF”hot”, “HOT”, और “Hot” को matching के रूप में catch करें

Scan क्या Produce करता है

MetricValue
Conformance Rate93.7%
Conformance Count638

Results पढ़ना

93.7% conform करता है। इसका मतलब है 43 records में garbage data है।

Import from Field step ने पहले से बताया कि garbage कैसा दिखता है। “Very High” (wrong picklist value से 23 records), “240 km/h” (wrong-field data के साथ 12 records), और “N/A” (8 placeholder entries)। यहाँ Dominant Values की जरूरत नहीं क्योंकि import ने scan run होने से पहले ही breakdown दे दी।

43 records manageable cleanup है। यह data migration project नहीं है। यह 30-minute manual fix या single data update job है।

अगला Action

43 non-conforming records fix करें। फिर future issues prevent करने के लिए Rating__c को text field से picklist में convert करें। API-created records picklist validation bypass करते हैं, इसलिए integrations से नई variations catch करने के लिए periodic consistency scans चलाएँ।

Scenario 3: Persona Targeting के लिए Job Title Conformance

Business Context

आपकी marketing team “VP और उससे ऊपर” Contacts को target करने वाले persona-based campaigns चलाती है। Title field हजारों variations के साथ free text है। हर campaign से पहले, कोई title keywords manual search करता है, आधी variations miss करता है, और incomplete audience list build करता है। Team को दो questions का data-driven answer चाहिए: “हमारे पास कितने VP+ contacts हैं?” और “बाकी contacts के titles क्या हैं?”

Configuration Walkthrough

  1. Contacts पर Title field के लिए Expected Values configuration खोलें।
  2. Import from Field click करें। Import सैकड़ों values return करती है।
  3. अपने persona mapping के आधार पर अपने allowed values define करें। उन title values check करें या type करें जिन्हें आपकी team “VP और उससे ऊपर” मानती है:
VP, Vice President, SVP, Senior Vice President, EVP,
Executive Vice President, Director, Senior Director,
CEO, CFO, CTO, CIO, CMO, COO, President
  1. Add Selected click करें।

Remaining configuration set करें:

SettingValueतर्क
Analysis ModeAdvanced Conformance AnalysisFull value distribution देखना है
Expected Values(16 title values ऊपर listed)आपकी VP+ persona definition
Case SensitiveOFF”vp of sales”, “VP of Sales”, “VP OF SALES” catch करें
Top N20Values का broad spread देखें
Min Frequency5”Chief Happiness Officer” जैसी one-off entries filter करें

Scan क्या Produce करता है

MetricValue
Conformance Rate34%
Conformance Count3,400
Non-Conforming Count6,600
Variant Count312

Dominant Values (Top 20):

RankValueCount
1Manager820
2Sales Representative650
3Account Executive480
4Director of Marketing340
5VP of Sales290
6Senior Manager275
7Consultant240
8Engineer210
9CEO195
10Head of Operations180
(10 और)

Results पढ़ना

34% conformance failure नहीं है। यह data quality problem नहीं है। इसका मतलब है 34% Contacts VP+ titles hold करते हैं, और यह आपका campaign target audience है।

312 Variant Count confirm करता है कि free-text Title highly fragmented है। 10,000 Contacts में 312 distinct title values। यह free-text fields के लिए normal है और explain करता है कि manual searches लोगों को क्यों miss करती हैं।

Dominant Values दिखाता है कि आपके contacts के पास actually क्या titles हैं। Top values में से कई VP level से नीचे हैं (Manager, Sales Rep, Account Executive)। वे valid records हैं। वे आपके target persona से बाहर आते हैं।

Non-Conforming Count (6,600) cleanup scope नहीं है। Country scenario के विपरीत, ये dirty records नहीं हैं। ये आपके VP+ filter से बाहर titles वाले contacts हैं। “Manager” एक real title है, data error नहीं। Non-Conforming Count को “इस persona से बाहर contacts” मानें, “fix करने के records” नहीं।

Real insight: आपके पास अब data-driven audience size है। 3,400 VP+ contacts, actual data scan करके verified। अब कोई manual keyword searches नहीं।

अगला Action

अपने VP+ campaign audience size के रूप में Conformance Count (3,400) उपयोग करें। आपके द्वारा missed titles के लिए Dominant Values list review करें। “Senior Manager” (275 records) और “Head of Operations” (180 records) borderline हैं। यदि वे roles आपके campaigns के लिए qualify होती हैं, तो उन्हें allowed values में add करें और rescan करें।

अपना Configuration चुनना

यदि आपको करना है…यहाँ से शुरू करेंKey Settings
एक controlled field (picklist, rating, status) audit करेंImport from Field, फिर Conformance CheckImport से Expected Values, Case Sensitive OFF
एक fragmented field (country, industry) standardize करेंImport from Field, फिर Advanced Conformance AnalysisTarget standard के रूप में Expected Values, Top N 10+, Min Frequency 5+
Free-text data से audience या segment size करेंImport from Field, फिर Advanced Conformance AnalysisSegment definition के रूप में Expected Values, Top N 20, Min Frequency 5
Cleanup project से पहले quick baseline प्राप्त करेंImport from Field, फिर Conformance Checkआपके data standard से Expected Values

सभी 6 consistency metrics, analysis modes, और configuration inputs की full explanation के लिए main Consistency article पर return करें।

अपनी खुद की data quality measure करने के लिए तैयार हैं? अपने consistency scores और अधिक देखने के लिए AI Readiness Assessment लें।