Vollständigkeit | DQS Resources

Was ist Vollständigkeit?

Vollständigkeit misst, ob Ihre Daten tatsächlich vorhanden sind. Ein Feld ist vollständig, wenn es sinnvolle Daten enthält. Ein Feld ist unvollständig, wenn es null, leer oder mit einem Platzhalter wie „N/A” oder „TBD” befüllt ist.

Vollständigkeit ist die grundlegendste Datenqualitätsdimension. Ohne Daten haben Sie nichts zu validieren, zu deduplizieren oder zu analysieren.

Vollständigkeitsrate = (Datensätze mit Daten / Gesamtdatensätze) x 100

Wenn 850 von 1.000 Contact-Datensätzen einen E-Mail-Wert haben, beträgt Ihre E-Mail-Vollständigkeitsrate 85 %. Diese Metrik (manchmal als Befüllungsrate bezeichnet) ist die Leitkennzahl für jedes Feld.

Warum Vollständigkeit wichtig ist

Reporting

Unvollständige Daten verzerren Ihre Analysen. Wenn 40 % der Account-Datensätze keinen Branchenwert haben, zeigt jeder nach Branche gruppierte Bericht nur eine Teilwahrheit. Dashboards werden unzuverlässig. Führungsentscheidungen beruhen auf einem Bruchteil des Gesamtbildes.

Automatisierung

Salesforce-Automatisierung hängt von Feldwerten ab. Ein Workflow, der E-Mails sendet, schlägt fehl, wenn E-Mail leer ist. Ein Prozess, der den Account Owner aktualisiert, schlägt fehl, wenn das Lookup null ist. Jeder fehlende Wert ist ein potenzielles Automatisierungsversagen.

KI und Agentforce

KI-Modelle lernen aus Ihren Daten. Wenn Felder leer sind, hat das Modell nichts, wovon es lernen kann. Agentforce nutzt Ihre Salesforce-Daten, um Antworten zu generieren und Aktionen auszuführen. Fehlende Daten bedeuten unvollständigen Kontext und weniger nützliche KI-Ausgaben.

System	Auswirkung der Vollständigkeit
Berichte	Teildaten erzeugen verzerrte Metriken
Workflows	Fehlende Werte verursachen Prozessfehler
Dublettenregeln	Unvollständige Datensätze sind schwerer abzugleichen
Agentforce	Lücken im Kontext reduzieren die KI-Genauigkeit

Wie DQS Vollständigkeit misst

DQS erzeugt 10 Vollständigkeitsmetriken rund um eine diagnostische Frage: „Wo fehlen die Daten, warum, und sind die vorhandenen Daten tatsächlich nützlich?”

Betrachten Sie diese Metriken als diagnostischen Funnel. Jeder Schritt baut auf dem vorherigen auf.

Schritt 1: Wie vollständig ist es?

Vollständigkeitsrate ist die Leitmetrik. Sie berechnet den Prozentsatz der Datensätze, in denen das Feld einen nicht-leeren, nicht-null Wert enthält. Dies ist die Zahl, die Sie auf ein Dashboard setzen.

Sie führen einen Scan auf dem Account-Objekt durch. Das Feld Industry zeigt eine Vollständigkeitsrate von 62 %. Das bedeutet, 38 % Ihrer Accounts haben keinen Branchenwert, was bedeutet, dass Ihre Segmentierungsberichte, Territoriumsregeln und Marketingkampagnen, die nach Branche filtern, alle mit unvollständigen Daten arbeiten.

Jede andere Vollständigkeitsmetrik existiert, um zu erklären, warum diese Zahl nicht 100 % ist.

Schritt 2: Was ist das Ausmaß?

Raten sagen Ihnen den Schweregrad. Zählungen sagen Ihnen den Arbeitsaufwand. Populated Count beantwortet die Ausmaß-Frage: wie viele Datensätze tatsächlich einen Wert haben. Verwenden Sie es für Abdeckungsberichte und um die Lücke gegen Ihre Gesamtanzahl zu dimensionieren — die Differenz zwischen Ihrer Gesamtzahl und dem Populated Count ist der Bereinigungsrückstand.

Beispiel: Ihre Data Stewardin muss eine Bereinigungskampagne aufbauen. Bei 50.000 Contacts und einem Populated Count von 35.800 auf Phone weiß sie, dass 14.200 Datensätze angereichert werden müssen, kann Kosten mit einem Datenanbieter schätzen und einen realistischen Zeitplan festlegen.

Schritt 3: Warum ist es unvollständig?

Drei Metriken schlüsseln die Ursache der Unvollständigkeit auf. Jede weist auf ein anderes Grundproblem hin.

Null Count und Null Rate messen Datensätze, in denen das Feld ein echtes Datenbank-Null hat, was bedeutet, dass das Feld nie befüllt wurde. In Salesforce sind Null und leere Zeichenkette unterschiedliche Zustände. Ein nie berührtes Feld ist null. Ein explizit geleertes Feld ist eine leere Zeichenkette. Diese Unterscheidung sagt Ihnen, ob Daten nie erfasst oder absichtlich entfernt wurden.

Beispiel: Nach einer Datenmigration zeigt das Feld Fax auf Accounts eine Null Rate von 45 %. Die Faxdaten wurden nie aus dem Altsystem migriert (null = existierten nie), anstatt erfasst und später geleert worden zu sein. Eine hohe Null Rate weist Sie auf das Quellsystem hin, nicht auf das Benutzerverhalten.

Placeholder Count und Placeholder Rate messen Datensätze, die bekannte Platzhalterwerte wie „N/A”, „TBD”, „Unknown” oder beliebige von Ihnen definierte benutzerdefinierte Werte enthalten. Diese Werte sehen aus wie Daten, tragen aber keine echte Information.

Beispiel: Ihre globalen Account-Daten zeigen 94 % Vollständigkeitsrate auf Industry. Sieht auf dem Papier großartig aus. Aber Placeholder Rate zeigt, dass 18 % dieser „befüllten” Werte tatsächlich „N/A”, „Other” oder „Unknown” sind. Die wahre Vollständigkeit liegt näher bei 76 %. Dies ist die Metrik, die ein grünes Dashboard rot färbt.

Schritt 4: Sind die „vollständigen” Daten nützlich?

Die ersten drei Schritte identifizieren, was fehlt. Schritt 4 stellt eine schwerere Frage: Sind die vorhandenen Daten tatsächlich wertvoll?

Incompleted Count ist das breiteste Maß für fehlende Daten. Es kombiniert alle Formen von Unvollständigkeit: Nulls, Blanks und Platzhalterwerte. Wenn die Platzhaltererkennung aktiv ist, ist Incompleted Count immer größer oder gleich dem Null Count allein, da es auch Nur-Leerzeichen- und Platzhaltereinträge erfasst.

Beispiel: Ihr Feld Description auf Opportunities zeigt einen Null Count von 500, aber einen Incompleted Count von 1.800. Der Unterschied? 1.300 Datensätze haben Beschreibungen wie „TBD”, „N/A” oder „---”. Diese Datensätze sind technisch befüllt, aber praktisch nutzlos. Ohne diese Metrik würden Sie denken, dass Sie nur 500 statt 1.800 Datensätze reparieren müssen.

Rich Text Ratio misst den Prozentsatz der Textfelddatensätze, die substanziellen Inhalt oberhalb einer Zeichenschwelle enthalten. Es trennt Felder mit sinnvoller Prosa von Feldern mit ein paar Wörtern. Ein Description-Feld ist „befüllt”, egal ob es „Guter Kunde” oder einen dreiseitigen Account-Plan enthält. Für die KI-Bereitschaft zählt die Tiefe des Inhalts genauso wie dessen Vorhandensein.

Beispiel: Ihr Unternehmen bewertet ein KI-Tool, das Case-Beschreibungen zusammenfasst. Sie scannen das Feld Description auf Cases: 88 % Vollständigkeitsrate, aber nur 31 % Rich Text Ratio. Nur 31 % der Case-Beschreibungen haben genug Substanz, damit die KI damit arbeiten kann. Der Rest sind Einträge wie „Zurückrufen”, „Siehe E-Mail” oder „Problem gemeldet”. Das KI-Projekt braucht eine Datenanreicherungsphase, bevor es Wert liefern kann.

Text Field Utilization misst, wie viel der verfügbaren Zeichenkapazität eines Textfeldes genutzt wird. Ein Long Text Area mit 32.000 Zeichen Kapazität, bei dem der Durchschnittseintrag 45 Zeichen lang ist, hat eine sehr niedrige Auslastung.

Average Utilization gibt Ihnen den mittleren Prozentsatz der über alle Datensätze genutzten Feldlänge. Zusammen mit Text Field Utilization zeichnet es ein vollständiges Bild davon, ob Ihre Textfelder richtig dimensioniert sind.

Beispiel: Während einer Org-Bewertung zeigt Text Field Utilization, dass Notes__c (ein Long Text Area, 131.072 Zeichen) durchschnittlich 3,2 % Auslastung hat, wobei die meisten Einträge unter 200 Zeichen liegen. Gleichzeitig zeigt Short_Description__c (Text, 255 Zeichen) 94 % Auslastung mit häufigen Truncierungsproblemen. Das Schema muss richtig dimensioniert werden: Die Long Text Area ist überdimensioniert, und das Text-Feld ist zu klein.

Hinweis: Text Field Utilization und Average Utilization gelten nur für String- und TextArea-Felder, da dies die Feldtypen mit einer definierten Zeichenkapazität sind, gegen die gemessen werden kann.

Warum Raten und Zählungen paarweise kommen

Die meisten Metriken kommen als Rate (Prozentsatz) und Zählung (absolute Zahl). Dies ist beabsichtigt:

Raten sind für Dashboards, Executive Reporting und Trendverfolgung. „Die Vollständigkeit verbesserte sich in diesem Quartal von 72 % auf 89 %.”
Zählungen sind für Projektplanung, Arbeitsaufwandsschätzung und Bereinigungsplanung. „Wir haben 14.200 Datensätze zu reparieren.”

Verwenden Sie Raten, um Fortschritt zu kommunizieren. Verwenden Sie Zählungen, um Arbeit zu planen.

Metrik-Referenz

Basismetriken

Diese 5 Metriken bilden die Basis jeder Vollständigkeitsanalyse. Sie funktionieren praktisch auf allen Feldtypen.

Metrik	Typ	Gilt für
Vollständigkeitsrate	Prozentsatz	Alle Feldtypen
Populated Count	Anzahl	Alle Feldtypen
Incompleted Count	Anzahl	Alle Feldtypen
Null Rate	Prozentsatz	Alle Feldtypen
Null Count	Anzahl	Alle Feldtypen

Kontextuelle Metriken

Diese 5 Metriken gehen über „ist es vorhanden?” hinaus und fragen „ist es sinnvoll?”. Sie erfordern den Analysemodus Contextual Completeness.

Metrik	Typ	Gilt für
Placeholder Rate	Prozentsatz	Nur Textfelder
Placeholder Count	Anzahl	Nur Textfelder
Rich Text Ratio	Prozentsatz	Nur Textfelder
Text Field Utilization	Prozentsatz	Nur String und TextArea
Average Utilization	Prozentsatz	Nur String und TextArea

Feldtyp-Abdeckung

DQS unterstützt Vollständigkeitsprüfungen auf allen Standard-Salesforce-Feldtypen:

Abdeckungsgruppe	Feldtypen	Verfügbare Metriken
Alle Typen (20)	String, TextArea, LongTextArea, Html, EncryptedText, Picklist, Multipicklist, Email, Phone, URL, Reference (Lookup), Date, DateTime, Double, Integer, Currency, Percent, Boolean, Combobox, Id	Vollständigkeitsrate, Populated/Incompleted Count, Null Rate/Count
Textfelder (8)	Text, TextArea, LongTextArea, Html, EncryptedText, Email, Phone, URL	Oben + Placeholder Rate/Count, Rich Text Ratio
String und TextArea (2)	String, TextArea	Oben + Text Field Utilization, Average Utilization

Zwei Analysemodi

DQS bietet zwei Vollständigkeitsanalysemodi:

Basic Completeness beantwortet die Frage: „Sind Felder befüllt?” Es erzeugt die 5 Basismetriken und deckt die Grundlagen ab, die jede Org für eine Datenhygiene-Prüfung oder ein schnelles Audit benötigt.

Contextual Completeness geht tiefer. Es erzeugt alle 10 Metriken, einschließlich Platzhaltererkennung, Rich-Text-Analyse und Feldauslastung. Verwenden Sie diesen Modus, wenn Sie zwischen vorhandenen und nützlichen Daten unterscheiden müssen.

Geschäftsanforderung	Empfohlener Modus
Schnelle Hygieneprüfung oder Baseline-Audit	Basic Completeness
Bewertung einer Datenmigration	Contextual (Platzhaltererkennung erkennt Fake-Daten aus Altsystemen)
KI-Bereitschaftsbewertung	Contextual (Rich Text Ratio und Auslastungsmetriken bewerten Inhaltstiefe)
Laufende Data Governance	Beginnen Sie mit Basic, wechseln Sie zu Contextual, wenn Sie bereit für tiefere Analysen sind

Vollständigkeit konfigurieren

DQS bietet vier Konfigurationseingaben für Vollständigkeit. Jede kann auf globaler Ebene (gilt für alle Felder) festgelegt und auf Feldebene überschrieben werden.

Einstellung	Was sie steuert
Blank As Incomplete	Wenn aktiviert, behandelt DQS leere Zeichenketten und Nur-Leerzeichen-Werte als unvollständig. Standard: aktiviert.
Placeholders As Incomplete	Wenn aktiviert, behandelt DQS Platzhalterwerte (wie „N/A” oder „TBD”) als unvollständig. Standard: deaktiviert.
Placeholder Values	Die Liste der Zeichenketten, die DQS als Platzhalter behandelt. Sie definieren diese basierend auf den Dateneingabemustern Ihrer Org (z. B. `N/A, TBD, Unknown, --, 000-000-0000`).
Case-Sensitive Placeholders	Steuert, ob der Platzhalterabgleich zwischen Groß-/Kleinschreibung unterscheidet. Wenn aktiviert, werden „tbd” und „TBD” als unterschiedliche Werte behandelt. Standard: zwischen Groß-/Kleinschreibung unterscheidend.

Tipp: Beginnen Sie mit den üblichen Platzhaltern („N/A”, „TBD”, „Unknown”, „—”) und fügen Sie org-spezifische Werte hinzu, wenn Sie sie in den Scan-Ergebnissen entdecken.

Häufige Vollständigkeitsprobleme

Optionale Felder werden nie befüllt

Wenn Felder optional sind, überspringen Benutzer sie. Mit der Zeit haben wertvolle Felder wie Unternehmensbeschreibung oder LinkedIn-URL nahezu null Vollständigkeitsraten.

Fix: Machen Sie kritische Felder pflichtig oder erstellen Sie Eingabeaufforderungen während der Datensatzbearbeitung.

Massenimporte mit Lücken

Datenmigrationen und Listenimporte haben oft fehlende Werte für bestimmte Felder. Eine gekaufte Kontaktliste hat keine Account-Zuordnung. Ein Legacy-Systemexport hat keine standardisierten Branchenwerte.

Fix: Auditieren Sie Importe vor dem Laden. Verwenden Sie DQS, um Baselines zu etablieren und Verbesserungen nach jedem Import zu verfolgen.

Platzhaltermissbrauch

Benutzer geben „N/A” oder „TBD” ein, um Validierungsregeln zu umgehen. Das Feld erscheint vollständig, enthält aber keine nutzbaren Daten. Standardberichte zählen diese als befüllt.

Fix: Aktivieren Sie die Platzhaltererkennung und definieren Sie Ihre Platzhalterwerte-Liste. Überprüfen und aktualisieren Sie Platzhalterwerte während der regulären Datenpflege.

Leerzeichen-Padding

Einige Integrationen oder manuelle Eingaben hinterlassen Felder, die nur Leerzeichen enthalten. Salesforce zählt diese als „befüllt”, aber sie enthalten nichts Nützliches.

Fix: Aktivieren Sie die Leer-Erkennung, um Nur-Leerzeichen-Werte zu erfassen.

Best Practices

Nach geschäftlicher Wirkung priorisieren

Nicht jedes Feld benötigt hohe Vollständigkeit. Konzentrieren Sie sich auf Felder, die Automatisierung antreiben, in Executive-Dashboards erscheinen, KI und Agentforce speisen oder Compliance-Anforderungen unterstützen.

Trends über die Zeit verfolgen

Ein einzelner Vollständigkeits-Score ist eine Momentaufnahme. Verfolgen Sie Scores über mehrere Scans, um Verschlechterungen frühzeitig zu erkennen, Verbesserungsinitiativen zu messen und Problemdatenquellen zu identifizieren.

Grundursachen angehen

Niedrige Vollständigkeit signalisiert ein Prozessproblem. Untersuchen Sie, ob Benutzer Felder überspringen, Importe Daten fehlen oder Integrationen stillschweigend fehlschlagen. Beheben Sie die Quelle, nicht nur das Symptom.

Den diagnostischen Funnel nutzen

Hören Sie nicht bei der Vollständigkeitsrate auf. Gehen Sie den Funnel durch: Prüfen Sie das Ausmaß (Populated Count), identifizieren Sie die Ursache (Null vs. Placeholder), bewerten Sie dann die Inhaltsqualität (Rich Text Ratio, Utilization). Jeder Schritt offenbart einen anderen Problemtyp mit einem anderen Fix.

Nächste Schritte

Sie verstehen jetzt, wie man Vollständigkeit misst und verbessert. Lernen Sie weiter über die nächste Dimension:

In Salesforce: Datenqualität in Salesforce - messen Sie die Vollständigkeit Ihrer CRM-Datensätze
Nächste: Gültigkeit - Stellen Sie sicher, dass Ihre Daten erwarteten Formaten entsprechen
Verwandt: Die fünf Dimensionen - Überblick über alle Dimensionen
Aktion: AI Readiness Assessment - Sehen Sie Ihre aktuellen Vollständigkeits-Scores