Skip to main content

الاتساق: سيناريوهات الإعداد

ثلاث جولات عملية تُظهر كيفية إعداد تحليل اتساق DQS لاحتياجات العمل المختلفة.

ما تغطّيه هذه السيناريوهات

تستعرض هذه الصفحة ثلاثة إعدادات اتساق من العالم الحقيقي، من الإعداد الأولي إلى قراءة نتائج الفحص. يستخدم كل سيناريو سياق عمل مختلفًا ووضع تحليل مختلفًا.

تبني هذه السيناريوهات على المفاهيم والمقاييس التي تغطّيها مقالة الاتساق الرئيسية. اقرأها أولًا إذا كانت مصطلحات مثل Conformance Rate و Variant Count و Dominant Values جديدة عليك.

السيناريو 1: توحيد حقل Country مع الاكتشاف

سياق العمل

لدى مؤسستك 15000 سجل Account من 3 شركات مدمجة. حقل Country نص حرّ. تُظهر لوحات المعلومات الإقليمية بيانات مُجزّأة: «United States» يظهر كصفّ واحد، و«USA» كآخر، و«US» كثالث. تفوّت قواعد تعيين المناطق السجلات لأنها تُصفّي لتهجئة واحدة. تحتاج إلى التوحيد، لكنك لا تعرف ما القيم الموجودة عبر الأنظمة القديمة الثلاثة.

جولة الإعداد

ابدأ بـ Import from Field لاكتشاف ما تحتويه بياناتك فعلًا قبل تعريف القيم المسموح بها.

  1. افتح إعداد Expected Values لحقل Country.
  2. انقر Import from Field. يستعلم DQS عن البيانات الحية ويُعيد القيم المتميّزة مرتّبة حسب التردّد.
  3. راجع قائمة التحقّق. يكشف الاستيراد الصورة الكاملة:
القيمةالسجلات
United States4500
USA2300
US1800
Canada1400
U.S.A.450
United States of America150
… (41 اختلافًا آخر)
  1. قرّر معيارك. رموز ISO للدول («US» و«CA» و«UK») مضغوطة وقياسية صناعيًا وغير غامضة. حدّد رموز ISO من قائمة الاستيراد.
  2. انقر Add Selected لملء قيمك المسموح بها.

اضبط بقية الإعدادات:

الإعدادالقيمةالمنطق
Analysis ModeAdvanced Conformance Analysisتحتاج إلى أعداد الاختلافات والقيم المهيمنة لتحديد نطاق التنظيف
Expected ValuesUS, CA, UK, DE, FR, AU, JPرموز ISO لأسواقك النشطة
Case SensitiveOFFالتقاط «us» و«Us» و«US» كنفس القيمة
Top N10رؤية الاختلافات الأكثر شيوعًا
Min Frequency5ترشيح الأخطاء الإملائية لمرة واحدة

ما ينتجه الفحص

المقياسالقيمة
Conformance Rate12%
Conformance Count1800
Non-Conforming Count13200
Variant Count47
Dominant Valuesأعلى 10 قيم مع الأعداد (انظر جدول الاستيراد أعلاه)

قراءة النتائج

مطابقة 12% متوقّعة. عرّفت معيارًا جديدًا (رموز ISO) لم تُوحَّد البيانات إليه من قبل. فقط الـ 1800 سجل الذي يحتوي بالفعل على «US» يُطابق. هذه ليست درجة سيئة. إنها نقطة انطلاقك.

47 اختلافًا يكشف حجم التجزّؤ. أنتجت ثلاثة أنظمة مدمجة 47 طريقة مختلفة للتعبير عن أسماء الدول. بدون هذا الرقم، كنت ستُقلّل من تقدير جهد التنظيف.

Dominant Values تُظهر أين تركّز. الـ 3 اختلافات الأعلى («United States» و«USA» و«US») تمثّل 8600 سجل. توحيد هذه القيم الثلاث وحدها يرفع مطابقتك من 12% إلى 69%. ابدأ هناك.

Non-Conforming Count (13200) هو نطاق تنظيفك الدقيق. لدى data steward لديك الآن حجم مشروع ملموس، لا تخمينًا.

الإجراء التالي

ابنِ جدول تعيين قيم باستخدام مخرجات Dominant Values. عيّن «United States» إلى «US»، و«USA» إلى «US»، وهكذا. شغّل تطبيع البيانات. أعد الفحص للتحقّق من Conformance Rate الجديد.

السيناريو 2: التحقّق من تقييم Lead

سياق العمل

حقل Lead Rating لديك (Rating__c) هو حقل نصي يقبل «Hot» أو «Warm» أو «Cold». يُبلّغ مديرو المبيعات عن قيم غريبة في تقارير خطّ أنابيبهم. مُرشّح لـ Rating = "Hot" يُعيد عدد سجلات أقل من المتوقّع. تحتاج إلى تدقيق مطابقة سريع لمعرفة ما في الحقل وكم عدد السجلات التي تحتاج إلى تنظيف.

جولة الإعداد

ابدأ بـ Import from Field لرؤية القيم الفعلية قبل إعداد فحصك.

  1. افتح إعداد Expected Values لـ Rating__c.
  2. انقر Import from Field. يُعيد الاستيراد:
القيمةالسجلات
Hot284
Warm198
Cold156
Very High23
240 km/h12
N/A8

القيم الثلاث الأولى هي تقييماتك الحقيقية. «Very High» تأتي من picklist مختلف (ألصقها أحد من الحقل الخاطئ). «240 km/h» هي بيانات من الحقل الخاطئ بوضوح. «N/A» قيمة نائبة.

  1. حدّد «Hot» و«Warm» و«Cold». اترك الباقي غير محدّد.
  2. انقر Add Selected.

اضبط بقية الإعدادات:

الإعدادالقيمةالمنطق
Analysis ModeConformance Checkتحتاج إلى إجابة نعم/لا، لا تحليل عميق
Expected ValuesHot, Warm, Coldتقييماتك الصحيحة الثلاثة
Case SensitiveOFFالتقاط «hot» و«HOT» و«Hot» كمتطابقة

ما ينتجه الفحص

المقياسالقيمة
Conformance Rate93,7%
Conformance Count638

قراءة النتائج

93,7% تطابق. هذا يعني أن 43 سجلًا يحتوي على بيانات قمامة. لتدقيق سريع، يمنحك وضع Conformance Check الإجابة بسرعة دون حساب المقاييس المتقدّمة.

خطوة Import from Field أخبرتك بالفعل كيف تبدو القمامة. «Very High» (23 سجلًا من قيمة picklist خاطئة)، و«240 km/h» (12 سجلًا ببيانات حقل خاطئ)، و«N/A» (8 إدخالات نائبة). لست بحاجة إلى Dominant Values هنا لأن الاستيراد أعطاك التفصيل قبل تشغيل الفحص.

43 سجلًا هو تنظيف قابل للإدارة. هذا ليس مشروع هجرة بيانات. إنه إصلاح يدوي لمدة 30 دقيقة أو مهمة تحديث بيانات واحدة.

الإجراء التالي

أصلح السجلات الـ 43 غير المطابقة. ثم حوّل Rating__c من حقل نصي إلى picklist لمنع المشكلات المستقبلية. السجلات المنشأة عبر API تتجاوز تحقّق picklist، لذا شغّل فحوصات اتساق دورية لالتقاط الاختلافات الجديدة من التكاملات.

السيناريو 3: مطابقة Job Title لاستهداف Persona

سياق العمل

يُشغّل فريق التسويق لديك حملات قائمة على persona تستهدف Contacts «VP وما فوق». حقل Title نص حرّ بآلاف الاختلافات. قبل كل حملة، يبحث شخص يدويًا عن كلمات مفتاحية للمسمّى، ويفوّت نصف الاختلافات، ويبني قائمة جمهور ناقصة. يحتاج الفريق إلى إجابة مبنية على البيانات لسؤالَين: «كم لدينا من contacts بمستوى VP+؟» و«ما هي المسمّيات التي يحملها بقية contacts لدينا؟».

جولة الإعداد

  1. افتح إعداد Expected Values لحقل Title على Contacts.
  2. انقر Import from Field. يُعيد الاستيراد مئات القيم. كثيرة جدًّا للتحقّق منها فرديًا، لكن أعداد التردّد مفيدة للسياق.
  3. عرّف قيمك المسموح بها بناءً على خريطة persona لديك. حدّد أو اكتب قيم المسمّيات التي يعتبرها فريقك «VP وما فوق»:
VP, Vice President, SVP, Senior Vice President, EVP,
Executive Vice President, Director, Senior Director,
CEO, CFO, CTO, CIO, CMO, COO, President
  1. انقر Add Selected.

اضبط بقية الإعدادات:

الإعدادالقيمةالمنطق
Analysis ModeAdvanced Conformance Analysisتحتاج إلى توزيع القيم الكامل لرؤية ما يوجد من مسمّيات
Expected Values(16 قيمة مسمّى مذكورة أعلاه)تعريف persona VP+ لديك
Case SensitiveOFFالتقاط «vp of sales» و«VP of Sales» و«VP OF SALES»
Top N20رؤية انتشار واسع لما هو موجود
Min Frequency5ترشيح الإدخالات لمرة واحدة مثل «Chief Happiness Officer»

ما ينتجه الفحص

المقياسالقيمة
Conformance Rate34%
Conformance Count3400
Non-Conforming Count6600
Variant Count312

Dominant Values (أعلى 20):

الرتبةالقيمةالعدد
1Manager820
2Sales Representative650
3Account Executive480
4Director of Marketing340
5VP of Sales290
6Senior Manager275
7Consultant240
8Engineer210
9CEO195
10Head of Operations180
(10 أخرى)

قراءة النتائج

مطابقة 34% ليست فشلًا. هذه ليست مشكلة جودة بيانات. تعني أن 34% من Contacts لديك يحملون مسمّيات VP+، وهذا هو جمهورك المستهدف للحملة. الرقم يُجيب عن السؤال الذي كان فريق التسويق لديك يُخمّنه.

312 Variant Count تؤكّد أن Title بالنص الحرّ مُجزَّأ بشدّة. 312 قيمة مسمّى متميّزة عبر 10000 Contact. هذا طبيعي للحقول النصية الحرّة ويشرح لماذا تفوّت عمليات البحث اليدوية أشخاصًا.

Dominant Values تُظهر ما هي المسمّيات التي يحملها contacts لديك فعلًا. كثير من القيم العليا دون مستوى VP (Manager, Sales Rep, Account Executive). هذا متوقّع. هذه contacts صحيحة بمسمّيات صحيحة. تقع خارج persona المستهدفة.

Non-Conforming Count (6600) ليس نطاق تنظيف. على عكس سيناريو Country، هذه ليست سجلات قذرة. هي contacts بمسمّيات خارج مرشّح VP+ لديك. «Manager» مسمّى حقيقي، لا خطأ بيانات. عامل Non-Conforming Count كـ «contacts خارج هذه persona»، لا «سجلات لإصلاحها».

الرؤية الحقيقية: لديك الآن حجم جمهور مبني على البيانات. 3400 contact بمستوى VP+، مُتحقَّق منها بفحص البيانات الفعلية. لا مزيد من عمليات البحث اليدوية بالكلمات المفتاحية.

الإجراء التالي

استخدم Conformance Count (3400) كحجم جمهور حملة VP+ لديك. راجع قائمة Dominant Values للمسمّيات التي فاتتك. «Senior Manager» (275 سجلًا) و«Head of Operations» (180 سجلًا) حدّية. إذا كانت هذه الأدوار تؤهّل لحملاتك، أضفها إلى القيم المسموح بها وأعد الفحص.

اختيار إعدادك

إذا كنت بحاجة إلى…ابدأ بـالإعدادات الرئيسية
تدقيق حقل مُتحكَّم به (picklist, rating, status)Import from Field، ثم Conformance CheckExpected Values من الاستيراد، Case Sensitive OFF
توحيد حقل مُجزَّأ (country, industry)Import from Field، ثم Advanced Conformance AnalysisExpected Values كمعيارك المستهدف، Top N 10+، Min Frequency 5+
تحديد حجم جمهور أو قطاع من بيانات نص حرّImport from Field، ثم Advanced Conformance AnalysisExpected Values كتعريف قطاعك، Top N 20، Min Frequency 5
الحصول على خطّ أساس سريع قبل مشروع تنظيفImport from Field، ثم Conformance CheckExpected Values من معيار بياناتك

للحصول على شرح كامل لمقاييس الاتساق الستة وأوضاع التحليل ومدخلات الإعداد، عُد إلى مقالة الاتساق الرئيسية.

هل أنت مستعد لقياس جودة بياناتك الخاصة؟ أجرِ تقييم الجاهزية للذكاء الاصطناعي لترى درجات اتساقك والمزيد.