ما تغطّيه هذه السيناريوهات
تستعرض هذه الصفحة ثلاثة إعدادات اتساق من العالم الحقيقي، من الإعداد الأولي إلى قراءة نتائج الفحص. يستخدم كل سيناريو سياق عمل مختلفًا ووضع تحليل مختلفًا.
تبني هذه السيناريوهات على المفاهيم والمقاييس التي تغطّيها مقالة الاتساق الرئيسية. اقرأها أولًا إذا كانت مصطلحات مثل Conformance Rate و Variant Count و Dominant Values جديدة عليك.
السيناريو 1: توحيد حقل Country مع الاكتشاف
سياق العمل
لدى مؤسستك 15000 سجل Account من 3 شركات مدمجة. حقل Country نص حرّ. تُظهر لوحات المعلومات الإقليمية بيانات مُجزّأة: «United States» يظهر كصفّ واحد، و«USA» كآخر، و«US» كثالث. تفوّت قواعد تعيين المناطق السجلات لأنها تُصفّي لتهجئة واحدة. تحتاج إلى التوحيد، لكنك لا تعرف ما القيم الموجودة عبر الأنظمة القديمة الثلاثة.
جولة الإعداد
ابدأ بـ Import from Field لاكتشاف ما تحتويه بياناتك فعلًا قبل تعريف القيم المسموح بها.
- افتح إعداد Expected Values لحقل
Country. - انقر Import from Field. يستعلم DQS عن البيانات الحية ويُعيد القيم المتميّزة مرتّبة حسب التردّد.
- راجع قائمة التحقّق. يكشف الاستيراد الصورة الكاملة:
| القيمة | السجلات |
|---|---|
| United States | 4500 |
| USA | 2300 |
| US | 1800 |
| Canada | 1400 |
| U.S.A. | 450 |
| United States of America | 150 |
| … (41 اختلافًا آخر) | … |
- قرّر معيارك. رموز ISO للدول («US» و«CA» و«UK») مضغوطة وقياسية صناعيًا وغير غامضة. حدّد رموز ISO من قائمة الاستيراد.
- انقر Add Selected لملء قيمك المسموح بها.
اضبط بقية الإعدادات:
| الإعداد | القيمة | المنطق |
|---|---|---|
| Analysis Mode | Advanced Conformance Analysis | تحتاج إلى أعداد الاختلافات والقيم المهيمنة لتحديد نطاق التنظيف |
| Expected Values | US, CA, UK, DE, FR, AU, JP | رموز ISO لأسواقك النشطة |
| Case Sensitive | OFF | التقاط «us» و«Us» و«US» كنفس القيمة |
| Top N | 10 | رؤية الاختلافات الأكثر شيوعًا |
| Min Frequency | 5 | ترشيح الأخطاء الإملائية لمرة واحدة |
ما ينتجه الفحص
| المقياس | القيمة |
|---|---|
| Conformance Rate | 12% |
| Conformance Count | 1800 |
| Non-Conforming Count | 13200 |
| Variant Count | 47 |
| Dominant Values | أعلى 10 قيم مع الأعداد (انظر جدول الاستيراد أعلاه) |
قراءة النتائج
مطابقة 12% متوقّعة. عرّفت معيارًا جديدًا (رموز ISO) لم تُوحَّد البيانات إليه من قبل. فقط الـ 1800 سجل الذي يحتوي بالفعل على «US» يُطابق. هذه ليست درجة سيئة. إنها نقطة انطلاقك.
47 اختلافًا يكشف حجم التجزّؤ. أنتجت ثلاثة أنظمة مدمجة 47 طريقة مختلفة للتعبير عن أسماء الدول. بدون هذا الرقم، كنت ستُقلّل من تقدير جهد التنظيف.
Dominant Values تُظهر أين تركّز. الـ 3 اختلافات الأعلى («United States» و«USA» و«US») تمثّل 8600 سجل. توحيد هذه القيم الثلاث وحدها يرفع مطابقتك من 12% إلى 69%. ابدأ هناك.
Non-Conforming Count (13200) هو نطاق تنظيفك الدقيق. لدى data steward لديك الآن حجم مشروع ملموس، لا تخمينًا.
الإجراء التالي
ابنِ جدول تعيين قيم باستخدام مخرجات Dominant Values. عيّن «United States» إلى «US»، و«USA» إلى «US»، وهكذا. شغّل تطبيع البيانات. أعد الفحص للتحقّق من Conformance Rate الجديد.
السيناريو 2: التحقّق من تقييم Lead
سياق العمل
حقل Lead Rating لديك (Rating__c) هو حقل نصي يقبل «Hot» أو «Warm» أو «Cold». يُبلّغ مديرو المبيعات عن قيم غريبة في تقارير خطّ أنابيبهم. مُرشّح لـ Rating = "Hot" يُعيد عدد سجلات أقل من المتوقّع. تحتاج إلى تدقيق مطابقة سريع لمعرفة ما في الحقل وكم عدد السجلات التي تحتاج إلى تنظيف.
جولة الإعداد
ابدأ بـ Import from Field لرؤية القيم الفعلية قبل إعداد فحصك.
- افتح إعداد Expected Values لـ
Rating__c. - انقر Import from Field. يُعيد الاستيراد:
| القيمة | السجلات |
|---|---|
| Hot | 284 |
| Warm | 198 |
| Cold | 156 |
| Very High | 23 |
| 240 km/h | 12 |
| N/A | 8 |
القيم الثلاث الأولى هي تقييماتك الحقيقية. «Very High» تأتي من picklist مختلف (ألصقها أحد من الحقل الخاطئ). «240 km/h» هي بيانات من الحقل الخاطئ بوضوح. «N/A» قيمة نائبة.
- حدّد «Hot» و«Warm» و«Cold». اترك الباقي غير محدّد.
- انقر Add Selected.
اضبط بقية الإعدادات:
| الإعداد | القيمة | المنطق |
|---|---|---|
| Analysis Mode | Conformance Check | تحتاج إلى إجابة نعم/لا، لا تحليل عميق |
| Expected Values | Hot, Warm, Cold | تقييماتك الصحيحة الثلاثة |
| Case Sensitive | OFF | التقاط «hot» و«HOT» و«Hot» كمتطابقة |
ما ينتجه الفحص
| المقياس | القيمة |
|---|---|
| Conformance Rate | 93,7% |
| Conformance Count | 638 |
قراءة النتائج
93,7% تطابق. هذا يعني أن 43 سجلًا يحتوي على بيانات قمامة. لتدقيق سريع، يمنحك وضع Conformance Check الإجابة بسرعة دون حساب المقاييس المتقدّمة.
خطوة Import from Field أخبرتك بالفعل كيف تبدو القمامة. «Very High» (23 سجلًا من قيمة picklist خاطئة)، و«240 km/h» (12 سجلًا ببيانات حقل خاطئ)، و«N/A» (8 إدخالات نائبة). لست بحاجة إلى Dominant Values هنا لأن الاستيراد أعطاك التفصيل قبل تشغيل الفحص.
43 سجلًا هو تنظيف قابل للإدارة. هذا ليس مشروع هجرة بيانات. إنه إصلاح يدوي لمدة 30 دقيقة أو مهمة تحديث بيانات واحدة.
الإجراء التالي
أصلح السجلات الـ 43 غير المطابقة. ثم حوّل Rating__c من حقل نصي إلى picklist لمنع المشكلات المستقبلية. السجلات المنشأة عبر API تتجاوز تحقّق picklist، لذا شغّل فحوصات اتساق دورية لالتقاط الاختلافات الجديدة من التكاملات.
السيناريو 3: مطابقة Job Title لاستهداف Persona
سياق العمل
يُشغّل فريق التسويق لديك حملات قائمة على persona تستهدف Contacts «VP وما فوق». حقل Title نص حرّ بآلاف الاختلافات. قبل كل حملة، يبحث شخص يدويًا عن كلمات مفتاحية للمسمّى، ويفوّت نصف الاختلافات، ويبني قائمة جمهور ناقصة. يحتاج الفريق إلى إجابة مبنية على البيانات لسؤالَين: «كم لدينا من contacts بمستوى VP+؟» و«ما هي المسمّيات التي يحملها بقية contacts لدينا؟».
جولة الإعداد
- افتح إعداد Expected Values لحقل
Titleعلى Contacts. - انقر Import from Field. يُعيد الاستيراد مئات القيم. كثيرة جدًّا للتحقّق منها فرديًا، لكن أعداد التردّد مفيدة للسياق.
- عرّف قيمك المسموح بها بناءً على خريطة persona لديك. حدّد أو اكتب قيم المسمّيات التي يعتبرها فريقك «VP وما فوق»:
VP, Vice President, SVP, Senior Vice President, EVP,
Executive Vice President, Director, Senior Director,
CEO, CFO, CTO, CIO, CMO, COO, President
- انقر Add Selected.
اضبط بقية الإعدادات:
| الإعداد | القيمة | المنطق |
|---|---|---|
| Analysis Mode | Advanced Conformance Analysis | تحتاج إلى توزيع القيم الكامل لرؤية ما يوجد من مسمّيات |
| Expected Values | (16 قيمة مسمّى مذكورة أعلاه) | تعريف persona VP+ لديك |
| Case Sensitive | OFF | التقاط «vp of sales» و«VP of Sales» و«VP OF SALES» |
| Top N | 20 | رؤية انتشار واسع لما هو موجود |
| Min Frequency | 5 | ترشيح الإدخالات لمرة واحدة مثل «Chief Happiness Officer» |
ما ينتجه الفحص
| المقياس | القيمة |
|---|---|
| Conformance Rate | 34% |
| Conformance Count | 3400 |
| Non-Conforming Count | 6600 |
| Variant Count | 312 |
Dominant Values (أعلى 20):
| الرتبة | القيمة | العدد |
|---|---|---|
| 1 | Manager | 820 |
| 2 | Sales Representative | 650 |
| 3 | Account Executive | 480 |
| 4 | Director of Marketing | 340 |
| 5 | VP of Sales | 290 |
| 6 | Senior Manager | 275 |
| 7 | Consultant | 240 |
| 8 | Engineer | 210 |
| 9 | CEO | 195 |
| 10 | Head of Operations | 180 |
| … | (10 أخرى) | … |
قراءة النتائج
مطابقة 34% ليست فشلًا. هذه ليست مشكلة جودة بيانات. تعني أن 34% من Contacts لديك يحملون مسمّيات VP+، وهذا هو جمهورك المستهدف للحملة. الرقم يُجيب عن السؤال الذي كان فريق التسويق لديك يُخمّنه.
312 Variant Count تؤكّد أن Title بالنص الحرّ مُجزَّأ بشدّة. 312 قيمة مسمّى متميّزة عبر 10000 Contact. هذا طبيعي للحقول النصية الحرّة ويشرح لماذا تفوّت عمليات البحث اليدوية أشخاصًا.
Dominant Values تُظهر ما هي المسمّيات التي يحملها contacts لديك فعلًا. كثير من القيم العليا دون مستوى VP (Manager, Sales Rep, Account Executive). هذا متوقّع. هذه contacts صحيحة بمسمّيات صحيحة. تقع خارج persona المستهدفة.
Non-Conforming Count (6600) ليس نطاق تنظيف. على عكس سيناريو Country، هذه ليست سجلات قذرة. هي contacts بمسمّيات خارج مرشّح VP+ لديك. «Manager» مسمّى حقيقي، لا خطأ بيانات. عامل Non-Conforming Count كـ «contacts خارج هذه persona»، لا «سجلات لإصلاحها».
الرؤية الحقيقية: لديك الآن حجم جمهور مبني على البيانات. 3400 contact بمستوى VP+، مُتحقَّق منها بفحص البيانات الفعلية. لا مزيد من عمليات البحث اليدوية بالكلمات المفتاحية.
الإجراء التالي
استخدم Conformance Count (3400) كحجم جمهور حملة VP+ لديك. راجع قائمة Dominant Values للمسمّيات التي فاتتك. «Senior Manager» (275 سجلًا) و«Head of Operations» (180 سجلًا) حدّية. إذا كانت هذه الأدوار تؤهّل لحملاتك، أضفها إلى القيم المسموح بها وأعد الفحص.
اختيار إعدادك
| إذا كنت بحاجة إلى… | ابدأ بـ | الإعدادات الرئيسية |
|---|---|---|
| تدقيق حقل مُتحكَّم به (picklist, rating, status) | Import from Field، ثم Conformance Check | Expected Values من الاستيراد، Case Sensitive OFF |
| توحيد حقل مُجزَّأ (country, industry) | Import from Field، ثم Advanced Conformance Analysis | Expected Values كمعيارك المستهدف، Top N 10+، Min Frequency 5+ |
| تحديد حجم جمهور أو قطاع من بيانات نص حرّ | Import from Field، ثم Advanced Conformance Analysis | Expected Values كتعريف قطاعك، Top N 20، Min Frequency 5 |
| الحصول على خطّ أساس سريع قبل مشروع تنظيف | Import from Field، ثم Conformance Check | Expected Values من معيار بياناتك |
للحصول على شرح كامل لمقاييس الاتساق الستة وأوضاع التحليل ومدخلات الإعداد، عُد إلى مقالة الاتساق الرئيسية.
هل أنت مستعد لقياس جودة بياناتك الخاصة؟ أجرِ تقييم الجاهزية للذكاء الاصطناعي لترى درجات اتساقك والمزيد.