Consistency: Configuration Scenarios

ये Scenarios क्या Cover करते हैं

यह page तीन real-world consistency configurations के माध्यम से walk-through करती है, initial setup से लेकर scan results पढ़ने तक। प्रत्येक scenario एक अलग business context और analysis mode उपयोग करता है।

ये scenarios main Consistency article में cover किए गए concepts और metrics पर build करते हैं। यदि Conformance Rate, Variant Count, और Dominant Values जैसे terms आपके लिए new हैं तो पहले वह पढ़ें।

Scenario 1: Discovery के साथ Country Field Standardization

Business Context

आपके org में 3 merged companies से 15,000 Account records हैं। Country field free text है। Regional dashboards fragmented data दिखाते हैं: “United States” एक row के रूप में दिखाई देता है, “USA” दूसरे के रूप में, “US” तीसरे के रूप में। Territory assignment rules records miss करते हैं क्योंकि वे single spelling के लिए filter करते हैं। आपको standardize करना है, लेकिन आप नहीं जानते कि तीनों legacy systems में कौन सी values exist करती हैं।

Configuration Walkthrough

अपने allowed values define करने से पहले discover करने के लिए पहले Import from Field से शुरू करें।

Country field के लिए Expected Values configuration खोलें।
Import from Field पर click करें। DQS live data query करता है और distinct values को frequency द्वारा sorted करके return करता है।
Checklist review करें। Import full picture reveal करता है:

Value	Records
United States	4,500
USA	2,300
US	1,800
Canada	1,400
U.S.A.	450
United States of America	150
… (41 और variations)	…

अपना standard decide करें। ISO country codes (“US”, “CA”, “UK”) compact, industry-standard, और unambiguous हैं। Import list से ISO codes check करें।
अपनी allowed values populate करने के लिए Add Selected click करें।

Remaining configuration set करें:

Setting	Value	तर्क
Analysis Mode	Advanced Conformance Analysis	Cleanup scope के लिए variant counts और dominant values चाहिए
Expected Values	US, CA, UK, DE, FR, AU, JP	आपके active markets के लिए ISO codes
Case Sensitive	OFF	”us”, “Us”, और “US” को same value के रूप में catch करें
Top N	10	Most common variations देखें
Min Frequency	5	One-off typos filter करें

Scan क्या Produce करता है

Metric	Value
Conformance Rate	12%
Conformance Count	1,800
Non-Conforming Count	13,200
Variant Count	47
Dominant Values	Top 10 values with counts (import table ऊपर देखें)

Results पढ़ना

12% conformance expected है। आपने एक new standard (ISO codes) define किया जिस पर data कभी normalized नहीं हुआ। केवल वे 1,800 records जिनमें पहले से “US” है match करते हैं। यह bad score नहीं है। यह आपका starting point है।

47 variants fragmentation का scale reveal करता है। तीन merged systems ने country names express करने के 47 अलग-अलग तरीके produce किए। इस number के बिना, आप cleanup effort को underestimate करेंगे।

Dominant Values दिखाता है कि कहाँ focus करना है। Top 3 variations (“United States”, “USA”, “US”) 8,600 records account करती हैं। उन तीन values को standardize करना अकेले ही आपकी conformance 12% से 69% तक lift करेगा। वहाँ से शुरू करें।

Non-Conforming Count (13,200) आपकी exact cleanup scope है। आपके data steward के पास अब एक concrete project size है, guess नहीं।

अगला Action

Dominant Values output का उपयोग करके एक value mapping table build करें। “United States” को “US” map करें, “USA” को “US” map करें, इत्यादि। Data normalization run करें। अपना नया Conformance Rate verify करने के लिए rescan करें।

Scenario 2: Lead Rating Validation

Business Context

आपका Lead Rating field (Rating__c) एक text field है जो “Hot”, “Warm”, या “Cold” accept करता है। Sales managers अपनी pipeline reports में strange values report करते हैं। Rating = "Hot" के लिए filter expected से कम records return करता है। आपको field में क्या है और कितने records को cleanup की जरूरत है यह find out करने के लिए quick conformance audit चाहिए।

Configuration Walkthrough

Scan configure करने से पहले actual values देखने के लिए पहले Import from Field से शुरू करें।

Rating__c के लिए Expected Values configuration खोलें।
Import from Field click करें। Import return करता है:

Value	Records
Hot	284
Warm	198
Cold	156
Very High	23
240 km/h	12
N/A	8

पहले तीन values आपकी real ratings हैं। “Very High” एक different picklist से आता है (किसी ने wrong field से paste किया)। “240 km/h” clearly wrong field का data है। “N/A” एक placeholder है।

“Hot”, “Warm”, और “Cold” check करें। बाकी unchecked छोड़ें।
Add Selected click करें।

Remaining configuration set करें:

Setting	Value	तर्क
Analysis Mode	Conformance Check	आपको yes/no answer चाहिए, deep analysis नहीं
Expected Values	Hot, Warm, Cold	आपकी तीन valid ratings
Case Sensitive	OFF	”hot”, “HOT”, और “Hot” को matching के रूप में catch करें

Scan क्या Produce करता है

Metric	Value
Conformance Rate	93.7%
Conformance Count	638

Results पढ़ना

93.7% conform करता है। इसका मतलब है 43 records में garbage data है।

Import from Field step ने पहले से बताया कि garbage कैसा दिखता है। “Very High” (wrong picklist value से 23 records), “240 km/h” (wrong-field data के साथ 12 records), और “N/A” (8 placeholder entries)। यहाँ Dominant Values की जरूरत नहीं क्योंकि import ने scan run होने से पहले ही breakdown दे दी।

43 records manageable cleanup है। यह data migration project नहीं है। यह 30-minute manual fix या single data update job है।

अगला Action

43 non-conforming records fix करें। फिर future issues prevent करने के लिए Rating__c को text field से picklist में convert करें। API-created records picklist validation bypass करते हैं, इसलिए integrations से नई variations catch करने के लिए periodic consistency scans चलाएँ।

Scenario 3: Persona Targeting के लिए Job Title Conformance

Business Context

आपकी marketing team “VP और उससे ऊपर” Contacts को target करने वाले persona-based campaigns चलाती है। Title field हजारों variations के साथ free text है। हर campaign से पहले, कोई title keywords manual search करता है, आधी variations miss करता है, और incomplete audience list build करता है। Team को दो questions का data-driven answer चाहिए: “हमारे पास कितने VP+ contacts हैं?” और “बाकी contacts के titles क्या हैं?”

Configuration Walkthrough

Contacts पर Title field के लिए Expected Values configuration खोलें।
Import from Field click करें। Import सैकड़ों values return करती है।
अपने persona mapping के आधार पर अपने allowed values define करें। उन title values check करें या type करें जिन्हें आपकी team “VP और उससे ऊपर” मानती है:

VP, Vice President, SVP, Senior Vice President, EVP,
Executive Vice President, Director, Senior Director,
CEO, CFO, CTO, CIO, CMO, COO, President

Add Selected click करें।

Remaining configuration set करें:

Setting	Value	तर्क
Analysis Mode	Advanced Conformance Analysis	Full value distribution देखना है
Expected Values	(16 title values ऊपर listed)	आपकी VP+ persona definition
Case Sensitive	OFF	”vp of sales”, “VP of Sales”, “VP OF SALES” catch करें
Top N	20	Values का broad spread देखें
Min Frequency	5	”Chief Happiness Officer” जैसी one-off entries filter करें

Scan क्या Produce करता है

Metric	Value
Conformance Rate	34%
Conformance Count	3,400
Non-Conforming Count	6,600
Variant Count	312

Dominant Values (Top 20):

Rank	Value	Count
1	Manager	820
2	Sales Representative	650
3	Account Executive	480
4	Director of Marketing	340
5	VP of Sales	290
6	Senior Manager	275
7	Consultant	240
8	Engineer	210
9	CEO	195
10	Head of Operations	180
…	(10 और)	…

Results पढ़ना

34% conformance failure नहीं है। यह data quality problem नहीं है। इसका मतलब है 34% Contacts VP+ titles hold करते हैं, और यह आपका campaign target audience है।

312 Variant Count confirm करता है कि free-text Title highly fragmented है। 10,000 Contacts में 312 distinct title values। यह free-text fields के लिए normal है और explain करता है कि manual searches लोगों को क्यों miss करती हैं।

Dominant Values दिखाता है कि आपके contacts के पास actually क्या titles हैं। Top values में से कई VP level से नीचे हैं (Manager, Sales Rep, Account Executive)। वे valid records हैं। वे आपके target persona से बाहर आते हैं।

Non-Conforming Count (6,600) cleanup scope नहीं है। Country scenario के विपरीत, ये dirty records नहीं हैं। ये आपके VP+ filter से बाहर titles वाले contacts हैं। “Manager” एक real title है, data error नहीं। Non-Conforming Count को “इस persona से बाहर contacts” मानें, “fix करने के records” नहीं।

Real insight: आपके पास अब data-driven audience size है। 3,400 VP+ contacts, actual data scan करके verified। अब कोई manual keyword searches नहीं।

अगला Action

अपने VP+ campaign audience size के रूप में Conformance Count (3,400) उपयोग करें। आपके द्वारा missed titles के लिए Dominant Values list review करें। “Senior Manager” (275 records) और “Head of Operations” (180 records) borderline हैं। यदि वे roles आपके campaigns के लिए qualify होती हैं, तो उन्हें allowed values में add करें और rescan करें।

अपना Configuration चुनना

यदि आपको करना है…	यहाँ से शुरू करें	Key Settings
एक controlled field (picklist, rating, status) audit करें	Import from Field, फिर Conformance Check	Import से Expected Values, Case Sensitive OFF
एक fragmented field (country, industry) standardize करें	Import from Field, फिर Advanced Conformance Analysis	Target standard के रूप में Expected Values, Top N 10+, Min Frequency 5+
Free-text data से audience या segment size करें	Import from Field, फिर Advanced Conformance Analysis	Segment definition के रूप में Expected Values, Top N 20, Min Frequency 5
Cleanup project से पहले quick baseline प्राप्त करें	Import from Field, फिर Conformance Check	आपके data standard से Expected Values

सभी 6 consistency metrics, analysis modes, और configuration inputs की full explanation के लिए main Consistency article पर return करें।

अपनी खुद की data quality measure करने के लिए तैयार हैं? अपने consistency scores और अधिक देखने के लिए AI Readiness Assessment लें।