ما هو الاكتمال؟
يقيس الاكتمال ما إذا كانت بياناتك موجودة فعلًا. يكون الحقل مكتملًا عندما يحتوي على بيانات ذات معنى. ويكون غير مكتمل عندما يكون null أو فارغًا أو معبّأ بقيمة نائبة مثل «N/A» أو «TBD».
الاكتمال هو البُعد الأساسي الأول لجودة البيانات. بدون بيانات، ليس لديك ما تتحقّق منه أو تُنقّحه من التكرار أو تحلّله.
Completeness Rate = (السجلات التي تحتوي على بيانات / إجمالي السجلات) × 100
إذا احتوى 850 من أصل 1000 سجل Contact على قيمة Email، فإن معدّل اكتمال Email لديك هو 85%. هذا المقياس (يُسمّى أحيانًا fill rate) هو الرقم الرئيسي لأي حقل.
لماذا يهمّ الاكتمال
التقارير
تُشوّه البيانات غير المكتملة تحليلاتك. عندما يفتقر 40% من سجلات Account إلى قيمة Industry، فإن أي تقرير مجمّع حسب Industry يُظهر حقيقة جزئية فقط. تصبح لوحات المعلومات غير موثوقة. وتستند القرارات التنفيذية إلى جزء من الصورة.
الأتمتة
تعتمد أتمتة Salesforce على قيم الحقول. سير عمل يرسل رسائل بريد إلكتروني يفشل عندما يكون Email فارغًا. عملية تُحدّث Account Owner تفشل عندما يكون lookup فارغًا. كل قيمة مفقودة فشل محتمل في الأتمتة.
الذكاء الاصطناعي و Agentforce
تتعلّم نماذج الذكاء الاصطناعي من بياناتك. عندما تكون الحقول فارغة، ليس لدى النموذج ما يتعلّم منه. يستخدم Agentforce بيانات Salesforce لديك لتوليد الردود واتخاذ الإجراءات. البيانات المفقودة تعني سياقًا غير مكتمل ومخرجات ذكاء اصطناعي أقل فائدة.
| النظام | تأثير الاكتمال |
|---|---|
| التقارير | البيانات الجزئية تنتج مقاييس مشوّهة |
| سير العمل | القيم المفقودة تسبّب فشلًا في العمليات |
| قواعد المكررات | السجلات غير المكتملة أصعب في المطابقة |
| Agentforce | الفجوات في السياق تقلّل من دقة الذكاء الاصطناعي |
كيف يقيس DQS الاكتمال
ينتج DQS 10 مقاييس للاكتمال منظّمة حول سؤال تشخيصي: «أين البيانات مفقودة، ولماذا، وهل البيانات الموجودة مفيدة فعلًا؟»
فكّر في هذه المقاييس كقمع تشخيصي. كل خطوة تبني على التي قبلها.
الخطوة 1: ما مدى اكتماله؟
Completeness Rate هو المقياس الرئيسي. يحسب نسبة السجلات التي يحتوي فيها الحقل على قيمة غير فارغة وغير null. هذا هو الرقم الذي تضعه في لوحة المعلومات.
تشغّل فحصًا على كائن Account. يُظهر حقل Industry معدّل اكتمال بنسبة 62%. هذا يعني أن 38% من Accounts لديك لا تحتوي على قيمة Industry، مما يعني أن تقارير التقسيم، وقواعد الأقاليم، والحملات التسويقية التي تُصفّي حسب الصناعة، جميعها تعمل ببيانات غير مكتملة.
كل مقياس اكتمال آخر موجود ليشرح لماذا هذا الرقم ليس 100%.
الخطوة 2: ما هو النطاق؟
تخبرك المعدلات بالحدّة. وتخبرك الأعداد بحجم العمل. Populated Count يجيب عن سؤال النطاق: كم عدد السجلات التي تحتوي فعلًا على قيمة. استخدمه لتقارير التغطية ولتحديد حجم الفجوة مقابل إجمالي عدد سجلاتك — الفرق بين إجماليك و Populated Count هو سجلّ التنظيف المتراكم.
مثال: يحتاج data steward إلى بناء حملة تنظيف. مع 50000 Contact و Populated Count يبلغ 35800 على Phone، تعرف أن 14200 سجل تحتاج إلى إثراء، ويمكنها تقدير التكلفة مع مزوّد بيانات، ووضع جدول زمني واقعي.
الخطوة 3: لماذا هو غير مكتمل؟
تُحلّل ثلاثة مقاييس سبب عدم الاكتمال. كل واحد يشير إلى مشكلة جذرية مختلفة.
Null Count و Null Rate يقيسان السجلات التي يحتوي فيها الحقل على null حقيقي في قاعدة البيانات، أي أن الحقل لم يُعبَّأ أبدًا. في Salesforce، null والسلسلة الفارغة حالتان مختلفتان. الحقل الذي لم يُمَسّ أبدًا يكون null. الحقل الذي تم مسحه صراحة يكون سلسلة فارغة. هذا التمييز يخبرك ما إذا كانت البيانات لم تُلتقط أبدًا أم تم إزالتها عمدًا.
مثال: بعد هجرة بيانات، يُظهر حقل Fax في Accounts معدّل Null بنسبة 45%. بيانات الفاكس لم تُهاجَر من النظام القديم (null = لم توجد أبدًا) بدلًا من أن تُلتقط ثم تُمسح لاحقًا. معدّل Null المرتفع يوجّهك نحو النظام المصدر، لا سلوك المستخدم.
Placeholder Count و Placeholder Rate يقيسان السجلات التي تحتوي على قيم نائبة معروفة مثل «N/A» أو «TBD» أو «Unknown» أو أي قيم مخصصة تعرّفها. هذه القيم تبدو كبيانات لكنها لا تحمل أي معلومة حقيقية.
مثال: تُظهر بيانات Account العالمية لديك معدّل اكتمال بنسبة 94% على Industry. تبدو رائعة على الورق. لكن Placeholder Rate يكشف أن 18% من تلك القيم «المعبّأة» هي في الواقع «N/A» أو «Other» أو «Unknown». الاكتمال الحقيقي أقرب إلى 76%. هذا هو المقياس الذي يحوّل لوحة معلومات خضراء إلى حمراء.
الخطوة 4: هل البيانات «المكتملة» مفيدة؟
تحدّد الخطوات الثلاث الأولى ما هو مفقود. تسأل الخطوة 4 سؤالًا أصعب: هل البيانات الموجودة تستحق فعلًا الاحتفاظ بها؟
Incompleted Count هو المقياس الأوسع للبيانات المفقودة. يجمع كل أشكال عدم الاكتمال: nulls وblanks وقيم placeholder. عندما يكون كشف placeholder نشطًا، يكون Incompleted Count دائمًا أكبر أو يساوي Null Count وحده، لأنه يلتقط أيضًا إدخالات المسافات فقط وقيم placeholder.
مثال: يُظهر حقل Description في Opportunities قيمة Null Count تبلغ 500 لكن Incompleted Count تبلغ 1800. الفرق؟ 1300 سجل يحتوي على أوصاف مثل «TBD» أو «N/A» أو «---». هذه السجلات معبّأة تقنيًا لكنها عديمة الجدوى عمليًا. بدون هذا المقياس، كنت ستعتقد أن لديك 500 سجل فقط لإصلاحها بدلًا من 1800.
Rich Text Ratio يقيس نسبة سجلات الحقل النصي التي تحتوي على محتوى كبير يتجاوز عتبة عدد الأحرف. يفصل الحقول ذات النثر الفعلي عن الحقول ذات الكلمات القليلة. حقل Description يكون «معبّأ» سواء احتوى على «عميل جيد» أو خطّة حساب من ثلاث فقرات. بالنسبة للجاهزية للذكاء الاصطناعي، عمق المحتوى لا يقلّ أهمية عن وجوده.
مثال: تقيّم شركتك أداة ذكاء اصطناعي تُلخّص أوصاف Case. تفحص حقل Description في Cases: معدّل اكتمال 88%، لكن Rich Text Ratio يبلغ 31% فقط. 31% فقط من أوصاف Cases بها مضمون كافٍ ليعمل عليه الذكاء الاصطناعي. الباقي إدخالات مثل «اتصال لاحقًا» أو «راجع البريد» أو «تم الإبلاغ عن مشكلة». يحتاج مشروع الذكاء الاصطناعي إلى مرحلة إثراء للبيانات قبل أن يتمكّن من تقديم قيمة.
Text Field Utilization يقيس مقدار استخدام سعة الأحرف المتاحة لحقل نصي. حقل Long Text Area بسعة 32000 حرف حيث متوسط الإدخال 45 حرفًا لديه استخدام منخفض جدًا.
Average Utilization يمنحك متوسط النسبة المئوية لطول الحقل المستخدم عبر جميع السجلات. إلى جانب Text Field Utilization، يرسم صورة كاملة لما إذا كانت حقولك النصية بالحجم الصحيح.
مثال: أثناء تقييم مؤسسي، يكشف Text Field Utilization أن Notes__c (Long Text Area بسعة 131072 حرفًا) يبلغ متوسط استخدامه 3,2%، مع أغلب الإدخالات دون 200 حرف. في الوقت نفسه، يُظهر Short_Description__c (Text بسعة 255 حرفًا) استخدامًا بنسبة 94% مع مشكلات اقتطاع متكررة. المخطّط يحتاج إلى إعادة ضبط الحجم: Long Text Area مبالغ فيه، وحقل Text صغير جدًا.
ملاحظة: Text Field Utilization و Average Utilization ينطبقان فقط على حقول String و TextArea، لأن هذه أنواع الحقول التي لها سعة أحرف محدّدة يمكن القياس مقابلها.
لماذا تأتي المعدلات والأعداد في أزواج
معظم المقاييس تأتي كمعدّل (نسبة مئوية) وعدّ (رقم مطلق). هذا متعمّد:
- المعدلات للوحات المعلومات والتقارير التنفيذية وتتبّع الاتجاهات. «تحسّن الاكتمال من 72% إلى 89% هذا الربع».
- الأعداد لتخطيط المشاريع وتقدير أعباء العمل وتحديد نطاق التنظيف. «لدينا 14200 سجل لإصلاحها».
استخدم المعدلات لإيصال التقدّم. واستخدم الأعداد لتخطيط العمل.
مرجع المقاييس
المقاييس الأساسية
تشكّل هذه المقاييس الخمسة أساس كل تحليل للاكتمال. وتعمل على جميع أنواع الحقول تقريبًا.
| المقياس | النوع | ينطبق على |
|---|---|---|
| Completeness Rate | نسبة | جميع أنواع الحقول |
| Populated Count | عدد | جميع أنواع الحقول |
| Incompleted Count | عدد | جميع أنواع الحقول |
| Null Rate | نسبة | جميع أنواع الحقول |
| Null Count | عدد | جميع أنواع الحقول |
المقاييس السياقية
تتجاوز هذه المقاييس الخمسة سؤال «هل هو موجود؟» لتسأل «هل هو ذو معنى؟». وتتطلّب وضع Contextual Completeness للتحليل.
| المقياس | النوع | ينطبق على |
|---|---|---|
| Placeholder Rate | نسبة | الحقول النصية فقط |
| Placeholder Count | عدد | الحقول النصية فقط |
| Rich Text Ratio | نسبة | الحقول النصية فقط |
| Text Field Utilization | نسبة | String و TextArea فقط |
| Average Utilization | نسبة | String و TextArea فقط |
تغطية أنواع الحقول
يدعم DQS فحوصات الاكتمال على جميع أنواع حقول Salesforce القياسية:
| مجموعة التغطية | أنواع الحقول | المقاييس المتاحة |
|---|---|---|
| جميع الأنواع (20) | String, TextArea, LongTextArea, Html, EncryptedText, Picklist, Multipicklist, Email, Phone, URL, Reference (Lookup), Date, DateTime, Double, Integer, Currency, Percent, Boolean, Combobox, Id | Completeness Rate, Populated/Incompleted Count, Null Rate/Count |
| الحقول النصية (8) | Text, TextArea, LongTextArea, Html, EncryptedText, Email, Phone, URL | ما سبق + Placeholder Rate/Count, Rich Text Ratio |
| String و TextArea (2) | String, TextArea | ما سبق + Text Field Utilization, Average Utilization |
وضعَا التحليل
يقدّم DQS وضعَين لتحليل الاكتمال:
Basic Completeness يجيب عن السؤال: «هل الحقول معبّأة؟». ينتج المقاييس الأساسية الخمسة ويغطّي الضروريات التي تحتاجها كل مؤسسة لفحص نظافة البيانات أو تدقيق سريع.
Contextual Completeness يذهب أعمق. ينتج جميع المقاييس العشرة، بما في ذلك كشف placeholder وتحليل الرسم النصي واستخدام الحقل. استخدم هذا الوضع عندما تحتاج إلى التمييز بين البيانات الموجودة والبيانات المفيدة.
| الحاجة التجارية | الوضع الموصى به |
|---|---|
| فحص نظافة سريع أو تدقيق خطّ الأساس | Basic Completeness |
| تقييم هجرة البيانات | Contextual (كشف placeholder يلتقط البيانات الزائفة من الأنظمة القديمة) |
| تقييم الجاهزية للذكاء الاصطناعي | Contextual (Rich Text Ratio ومقاييس الاستخدام تقيّم عمق المحتوى) |
| حوكمة البيانات المستمرة | ابدأ بـ Basic، وانتقل إلى Contextual عند الاستعداد لتحليل أعمق |
إعداد الاكتمال
يقدّم DQS أربع مدخلات إعداد للاكتمال. يمكن ضبط كل واحدة على المستوى العالمي (تنطبق على جميع الحقول) وتجاوزها على مستوى الحقل الفردي.
| الإعداد | ما يتحكّم فيه |
|---|---|
| Blank As Incomplete | عند التفعيل، يعامل DQS السلاسل الفارغة والقيم ذات المسافات فقط كغير مكتملة. الافتراضي: مفعّل. |
| Placeholders As Incomplete | عند التفعيل، يعامل DQS القيم النائبة (مثل «N/A» أو «TBD») كغير مكتملة. الافتراضي: معطّل. |
| Placeholder Values | قائمة السلاسل التي يعاملها DQS كعناصر نائبة. تعرّفها بناءً على أنماط إدخال البيانات في مؤسستك (مثل N/A, TBD, Unknown, --, 000-000-0000). |
| Case-Sensitive Placeholders | يتحكّم في ما إذا كانت مطابقة placeholder حسّاسة لحالة الأحرف. عند التفعيل، «tbd» و«TBD» يُعامَلان كقيمتين مختلفتين. الافتراضي: حسّاس لحالة الأحرف. |
نصيحة: ابدأ بالعناصر النائبة الشائعة («N/A» و«TBD» و«Unknown» و«—») وأضِف قيمًا خاصة بمؤسستك عند اكتشافها في نتائج الفحص.
مشكلات الاكتمال الشائعة
الحقول الاختيارية لا تُعبَّأ أبدًا
عندما تكون الحقول اختيارية، يتخطّاها المستخدمون. بمرور الوقت، تصبح معدلات اكتمال الحقول القيّمة مثل Company Description أو LinkedIn URL قريبة من الصفر.
الحل: اجعل الحقول الحرجة إلزامية، أو أنشئ مطالبات أثناء تحرير السجل.
الاستيراد الجماعي مع فجوات
غالبًا ما تفتقر عمليات هجرة البيانات واستيراد القوائم إلى قيم لبعض الحقول. قائمة جهات اتصال مُشتراة لا تحتوي على ارتباط Account. تصدير نظام قديم يفتقر إلى قيم Industry موحّدة.
الحل: دقّق عمليات الاستيراد قبل التحميل. استخدم DQS لإرساء خطوط أساس وتتبّع التحسّن بعد كل استيراد.
إساءة استخدام placeholder
يُدخل المستخدمون «N/A» أو «TBD» لتجاوز قواعد التحقّق. يبدو الحقل مكتملًا لكنه لا يحتوي على بيانات قابلة للاستخدام. تحسب التقارير القياسية هذه كقيم معبّأة.
الحل: فعّل كشف placeholder وعرّف قائمة قيم placeholder لديك. راجع وحدّث هذه القيم أثناء الصيانة المنتظمة للبيانات.
حشو المسافات
تترك بعض التكاملات أو الإدخال اليدوي الحقول بمسافات فقط. Salesforce يحسبها «معبّأة» لكنها لا تحتوي على شيء مفيد.
الحل: فعّل كشف الفراغات لالتقاط القيم ذات المسافات فقط.
أفضل الممارسات
رتّب حسب التأثير التجاري
ليس كل حقل بحاجة إلى اكتمال عالٍ. ركّز على الحقول التي تدفع الأتمتة، وتظهر في لوحات المعلومات التنفيذية، وتغذّي الذكاء الاصطناعي و Agentforce، أو تدعم متطلبات الامتثال.
تتبّع الاتجاهات عبر الزمن
درجة اكتمال واحدة هي لقطة. تتبّع الدرجات عبر فحوصات متعددة لاكتشاف التدهور مبكرًا، وقياس مبادرات التحسين، وتحديد مصادر البيانات المُشكلة.
عالِج الأسباب الجذرية
الاكتمال المنخفض يشير إلى مشكلة في العملية. تحقّق ممّا إذا كان المستخدمون يتخطّون الحقول، أو أن عمليات الاستيراد تفتقر إلى بيانات، أو أن التكاملات تفشل بصمت. أصلح المصدر لا العَرَض فقط.
استخدم قمع التشخيص
لا تتوقّف عند Completeness Rate. امشِ عبر القمع: تحقّق من النطاق (Populated Count)، وحدّد السبب (Null مقابل Placeholder)، ثم قيّم جودة المحتوى (Rich Text Ratio والاستخدام). كل خطوة تكشف عن نوع مختلف من المشكلات بإصلاح مختلف.
الخطوات التالية
أنت تفهم الآن كيفية قياس الاكتمال وتحسينه. واصل التعلّم عن البُعد التالي:
- التالي: الصحة — تأكّد من أن بياناتك تتوافق مع التنسيقات المتوقّعة
- ذو صلة: الأبعاد الخمسة — نظرة عامة على جميع الأبعاد
- إجراء: تقييم الجاهزية للذكاء الاصطناعي — اطّلع على درجات اكتمالك الحالية