Skip to main content

Vollständigkeit

Alle 10 Vollständigkeitsmetriken, die DQS misst, der diagnostische Funnel zum Auffinden fehlender Daten und wie Sie die Vollständigkeitsanalyse konfigurieren.

Was ist Vollständigkeit?

Vollständigkeit misst, ob Ihre Daten tatsächlich vorhanden sind. Ein Feld ist vollständig, wenn es sinnvolle Daten enthält. Ein Feld ist unvollständig, wenn es null, leer oder mit einem Platzhalter wie „N/A” oder „TBD” befüllt ist.

Vollständigkeit ist die grundlegendste Datenqualitätsdimension. Ohne Daten haben Sie nichts zu validieren, zu deduplizieren oder zu analysieren.

Vollständigkeitsrate = (Datensätze mit Daten / Gesamtdatensätze) x 100

Wenn 850 von 1.000 Contact-Datensätzen einen E-Mail-Wert haben, beträgt Ihre E-Mail-Vollständigkeitsrate 85 %. Diese Metrik (manchmal als Befüllungsrate bezeichnet) ist die Leitkennzahl für jedes Feld.

Warum Vollständigkeit wichtig ist

Reporting

Unvollständige Daten verzerren Ihre Analysen. Wenn 40 % der Account-Datensätze keinen Branchenwert haben, zeigt jeder nach Branche gruppierte Bericht nur eine Teilwahrheit. Dashboards werden unzuverlässig. Führungsentscheidungen beruhen auf einem Bruchteil des Gesamtbildes.

Automatisierung

Salesforce-Automatisierung hängt von Feldwerten ab. Ein Workflow, der E-Mails sendet, schlägt fehl, wenn E-Mail leer ist. Ein Prozess, der den Account Owner aktualisiert, schlägt fehl, wenn das Lookup null ist. Jeder fehlende Wert ist ein potenzielles Automatisierungsversagen.

KI und Agentforce

KI-Modelle lernen aus Ihren Daten. Wenn Felder leer sind, hat das Modell nichts, wovon es lernen kann. Agentforce nutzt Ihre Salesforce-Daten, um Antworten zu generieren und Aktionen auszuführen. Fehlende Daten bedeuten unvollständigen Kontext und weniger nützliche KI-Ausgaben.

SystemAuswirkung der Vollständigkeit
BerichteTeildaten erzeugen verzerrte Metriken
WorkflowsFehlende Werte verursachen Prozessfehler
DublettenregelnUnvollständige Datensätze sind schwerer abzugleichen
AgentforceLücken im Kontext reduzieren die KI-Genauigkeit

Wie DQS Vollständigkeit misst

DQS erzeugt 10 Vollständigkeitsmetriken rund um eine diagnostische Frage: „Wo fehlen die Daten, warum, und sind die vorhandenen Daten tatsächlich nützlich?”

Betrachten Sie diese Metriken als diagnostischen Funnel. Jeder Schritt baut auf dem vorherigen auf.

Schritt 1: Wie vollständig ist es?

Vollständigkeitsrate ist die Leitmetrik. Sie berechnet den Prozentsatz der Datensätze, in denen das Feld einen nicht-leeren, nicht-null Wert enthält. Dies ist die Zahl, die Sie auf ein Dashboard setzen.

Sie führen einen Scan auf dem Account-Objekt durch. Das Feld Industry zeigt eine Vollständigkeitsrate von 62 %. Das bedeutet, 38 % Ihrer Accounts haben keinen Branchenwert, was bedeutet, dass Ihre Segmentierungsberichte, Territoriumsregeln und Marketingkampagnen, die nach Branche filtern, alle mit unvollständigen Daten arbeiten.

Jede andere Vollständigkeitsmetrik existiert, um zu erklären, warum diese Zahl nicht 100 % ist.

Schritt 2: Was ist das Ausmaß?

Raten sagen Ihnen den Schweregrad. Zählungen sagen Ihnen den Arbeitsaufwand. Populated Count beantwortet die Ausmaß-Frage: wie viele Datensätze tatsächlich einen Wert haben. Verwenden Sie es für Abdeckungsberichte und um die Lücke gegen Ihre Gesamtanzahl zu dimensionieren — die Differenz zwischen Ihrer Gesamtzahl und dem Populated Count ist der Bereinigungsrückstand.

Beispiel: Ihre Data Stewardin muss eine Bereinigungskampagne aufbauen. Bei 50.000 Contacts und einem Populated Count von 35.800 auf Phone weiß sie, dass 14.200 Datensätze angereichert werden müssen, kann Kosten mit einem Datenanbieter schätzen und einen realistischen Zeitplan festlegen.

Schritt 3: Warum ist es unvollständig?

Drei Metriken schlüsseln die Ursache der Unvollständigkeit auf. Jede weist auf ein anderes Grundproblem hin.

Null Count und Null Rate messen Datensätze, in denen das Feld ein echtes Datenbank-Null hat, was bedeutet, dass das Feld nie befüllt wurde. In Salesforce sind Null und leere Zeichenkette unterschiedliche Zustände. Ein nie berührtes Feld ist null. Ein explizit geleertes Feld ist eine leere Zeichenkette. Diese Unterscheidung sagt Ihnen, ob Daten nie erfasst oder absichtlich entfernt wurden.

Beispiel: Nach einer Datenmigration zeigt das Feld Fax auf Accounts eine Null Rate von 45 %. Die Faxdaten wurden nie aus dem Altsystem migriert (null = existierten nie), anstatt erfasst und später geleert worden zu sein. Eine hohe Null Rate weist Sie auf das Quellsystem hin, nicht auf das Benutzerverhalten.

Placeholder Count und Placeholder Rate messen Datensätze, die bekannte Platzhalterwerte wie „N/A”, „TBD”, „Unknown” oder beliebige von Ihnen definierte benutzerdefinierte Werte enthalten. Diese Werte sehen aus wie Daten, tragen aber keine echte Information.

Beispiel: Ihre globalen Account-Daten zeigen 94 % Vollständigkeitsrate auf Industry. Sieht auf dem Papier großartig aus. Aber Placeholder Rate zeigt, dass 18 % dieser „befüllten” Werte tatsächlich „N/A”, „Other” oder „Unknown” sind. Die wahre Vollständigkeit liegt näher bei 76 %. Dies ist die Metrik, die ein grünes Dashboard rot färbt.

Schritt 4: Sind die „vollständigen” Daten nützlich?

Die ersten drei Schritte identifizieren, was fehlt. Schritt 4 stellt eine schwerere Frage: Sind die vorhandenen Daten tatsächlich wertvoll?

Incompleted Count ist das breiteste Maß für fehlende Daten. Es kombiniert alle Formen von Unvollständigkeit: Nulls, Blanks und Platzhalterwerte. Wenn die Platzhaltererkennung aktiv ist, ist Incompleted Count immer größer oder gleich dem Null Count allein, da es auch Nur-Leerzeichen- und Platzhaltereinträge erfasst.

Beispiel: Ihr Feld Description auf Opportunities zeigt einen Null Count von 500, aber einen Incompleted Count von 1.800. Der Unterschied? 1.300 Datensätze haben Beschreibungen wie „TBD”, „N/A” oder „---”. Diese Datensätze sind technisch befüllt, aber praktisch nutzlos. Ohne diese Metrik würden Sie denken, dass Sie nur 500 statt 1.800 Datensätze reparieren müssen.

Rich Text Ratio misst den Prozentsatz der Textfelddatensätze, die substanziellen Inhalt oberhalb einer Zeichenschwelle enthalten. Es trennt Felder mit sinnvoller Prosa von Feldern mit ein paar Wörtern. Ein Description-Feld ist „befüllt”, egal ob es „Guter Kunde” oder einen dreiseitigen Account-Plan enthält. Für die KI-Bereitschaft zählt die Tiefe des Inhalts genauso wie dessen Vorhandensein.

Beispiel: Ihr Unternehmen bewertet ein KI-Tool, das Case-Beschreibungen zusammenfasst. Sie scannen das Feld Description auf Cases: 88 % Vollständigkeitsrate, aber nur 31 % Rich Text Ratio. Nur 31 % der Case-Beschreibungen haben genug Substanz, damit die KI damit arbeiten kann. Der Rest sind Einträge wie „Zurückrufen”, „Siehe E-Mail” oder „Problem gemeldet”. Das KI-Projekt braucht eine Datenanreicherungsphase, bevor es Wert liefern kann.

Text Field Utilization misst, wie viel der verfügbaren Zeichenkapazität eines Textfeldes genutzt wird. Ein Long Text Area mit 32.000 Zeichen Kapazität, bei dem der Durchschnittseintrag 45 Zeichen lang ist, hat eine sehr niedrige Auslastung.

Average Utilization gibt Ihnen den mittleren Prozentsatz der über alle Datensätze genutzten Feldlänge. Zusammen mit Text Field Utilization zeichnet es ein vollständiges Bild davon, ob Ihre Textfelder richtig dimensioniert sind.

Beispiel: Während einer Org-Bewertung zeigt Text Field Utilization, dass Notes__c (ein Long Text Area, 131.072 Zeichen) durchschnittlich 3,2 % Auslastung hat, wobei die meisten Einträge unter 200 Zeichen liegen. Gleichzeitig zeigt Short_Description__c (Text, 255 Zeichen) 94 % Auslastung mit häufigen Truncierungsproblemen. Das Schema muss richtig dimensioniert werden: Die Long Text Area ist überdimensioniert, und das Text-Feld ist zu klein.

Hinweis: Text Field Utilization und Average Utilization gelten nur für String- und TextArea-Felder, da dies die Feldtypen mit einer definierten Zeichenkapazität sind, gegen die gemessen werden kann.

Warum Raten und Zählungen paarweise kommen

Die meisten Metriken kommen als Rate (Prozentsatz) und Zählung (absolute Zahl). Dies ist beabsichtigt:

  • Raten sind für Dashboards, Executive Reporting und Trendverfolgung. „Die Vollständigkeit verbesserte sich in diesem Quartal von 72 % auf 89 %.”
  • Zählungen sind für Projektplanung, Arbeitsaufwandsschätzung und Bereinigungsplanung. „Wir haben 14.200 Datensätze zu reparieren.”

Verwenden Sie Raten, um Fortschritt zu kommunizieren. Verwenden Sie Zählungen, um Arbeit zu planen.

Metrik-Referenz

Basismetriken

Diese 5 Metriken bilden die Basis jeder Vollständigkeitsanalyse. Sie funktionieren praktisch auf allen Feldtypen.

MetrikTypGilt für
VollständigkeitsrateProzentsatzAlle Feldtypen
Populated CountAnzahlAlle Feldtypen
Incompleted CountAnzahlAlle Feldtypen
Null RateProzentsatzAlle Feldtypen
Null CountAnzahlAlle Feldtypen

Kontextuelle Metriken

Diese 5 Metriken gehen über „ist es vorhanden?” hinaus und fragen „ist es sinnvoll?”. Sie erfordern den Analysemodus Contextual Completeness.

MetrikTypGilt für
Placeholder RateProzentsatzNur Textfelder
Placeholder CountAnzahlNur Textfelder
Rich Text RatioProzentsatzNur Textfelder
Text Field UtilizationProzentsatzNur String und TextArea
Average UtilizationProzentsatzNur String und TextArea

Feldtyp-Abdeckung

DQS unterstützt Vollständigkeitsprüfungen auf allen Standard-Salesforce-Feldtypen:

AbdeckungsgruppeFeldtypenVerfügbare Metriken
Alle Typen (20)String, TextArea, LongTextArea, Html, EncryptedText, Picklist, Multipicklist, Email, Phone, URL, Reference (Lookup), Date, DateTime, Double, Integer, Currency, Percent, Boolean, Combobox, IdVollständigkeitsrate, Populated/Incompleted Count, Null Rate/Count
Textfelder (8)Text, TextArea, LongTextArea, Html, EncryptedText, Email, Phone, URLOben + Placeholder Rate/Count, Rich Text Ratio
String und TextArea (2)String, TextAreaOben + Text Field Utilization, Average Utilization

Zwei Analysemodi

DQS bietet zwei Vollständigkeitsanalysemodi:

Basic Completeness beantwortet die Frage: „Sind Felder befüllt?” Es erzeugt die 5 Basismetriken und deckt die Grundlagen ab, die jede Org für eine Datenhygiene-Prüfung oder ein schnelles Audit benötigt.

Contextual Completeness geht tiefer. Es erzeugt alle 10 Metriken, einschließlich Platzhaltererkennung, Rich-Text-Analyse und Feldauslastung. Verwenden Sie diesen Modus, wenn Sie zwischen vorhandenen und nützlichen Daten unterscheiden müssen.

GeschäftsanforderungEmpfohlener Modus
Schnelle Hygieneprüfung oder Baseline-AuditBasic Completeness
Bewertung einer DatenmigrationContextual (Platzhaltererkennung erkennt Fake-Daten aus Altsystemen)
KI-BereitschaftsbewertungContextual (Rich Text Ratio und Auslastungsmetriken bewerten Inhaltstiefe)
Laufende Data GovernanceBeginnen Sie mit Basic, wechseln Sie zu Contextual, wenn Sie bereit für tiefere Analysen sind

Vollständigkeit konfigurieren

DQS bietet vier Konfigurationseingaben für Vollständigkeit. Jede kann auf globaler Ebene (gilt für alle Felder) festgelegt und auf Feldebene überschrieben werden.

EinstellungWas sie steuert
Blank As IncompleteWenn aktiviert, behandelt DQS leere Zeichenketten und Nur-Leerzeichen-Werte als unvollständig. Standard: aktiviert.
Placeholders As IncompleteWenn aktiviert, behandelt DQS Platzhalterwerte (wie „N/A” oder „TBD”) als unvollständig. Standard: deaktiviert.
Placeholder ValuesDie Liste der Zeichenketten, die DQS als Platzhalter behandelt. Sie definieren diese basierend auf den Dateneingabemustern Ihrer Org (z. B. N/A, TBD, Unknown, --, 000-000-0000).
Case-Sensitive PlaceholdersSteuert, ob der Platzhalterabgleich zwischen Groß-/Kleinschreibung unterscheidet. Wenn aktiviert, werden „tbd” und „TBD” als unterschiedliche Werte behandelt. Standard: zwischen Groß-/Kleinschreibung unterscheidend.

Tipp: Beginnen Sie mit den üblichen Platzhaltern („N/A”, „TBD”, „Unknown”, „—”) und fügen Sie org-spezifische Werte hinzu, wenn Sie sie in den Scan-Ergebnissen entdecken.

Häufige Vollständigkeitsprobleme

Optionale Felder werden nie befüllt

Wenn Felder optional sind, überspringen Benutzer sie. Mit der Zeit haben wertvolle Felder wie Unternehmensbeschreibung oder LinkedIn-URL nahezu null Vollständigkeitsraten.

Fix: Machen Sie kritische Felder pflichtig oder erstellen Sie Eingabeaufforderungen während der Datensatzbearbeitung.

Massenimporte mit Lücken

Datenmigrationen und Listenimporte haben oft fehlende Werte für bestimmte Felder. Eine gekaufte Kontaktliste hat keine Account-Zuordnung. Ein Legacy-Systemexport hat keine standardisierten Branchenwerte.

Fix: Auditieren Sie Importe vor dem Laden. Verwenden Sie DQS, um Baselines zu etablieren und Verbesserungen nach jedem Import zu verfolgen.

Platzhaltermissbrauch

Benutzer geben „N/A” oder „TBD” ein, um Validierungsregeln zu umgehen. Das Feld erscheint vollständig, enthält aber keine nutzbaren Daten. Standardberichte zählen diese als befüllt.

Fix: Aktivieren Sie die Platzhaltererkennung und definieren Sie Ihre Platzhalterwerte-Liste. Überprüfen und aktualisieren Sie Platzhalterwerte während der regulären Datenpflege.

Leerzeichen-Padding

Einige Integrationen oder manuelle Eingaben hinterlassen Felder, die nur Leerzeichen enthalten. Salesforce zählt diese als „befüllt”, aber sie enthalten nichts Nützliches.

Fix: Aktivieren Sie die Leer-Erkennung, um Nur-Leerzeichen-Werte zu erfassen.

Best Practices

Nach geschäftlicher Wirkung priorisieren

Nicht jedes Feld benötigt hohe Vollständigkeit. Konzentrieren Sie sich auf Felder, die Automatisierung antreiben, in Executive-Dashboards erscheinen, KI und Agentforce speisen oder Compliance-Anforderungen unterstützen.

Ein einzelner Vollständigkeits-Score ist eine Momentaufnahme. Verfolgen Sie Scores über mehrere Scans, um Verschlechterungen frühzeitig zu erkennen, Verbesserungsinitiativen zu messen und Problemdatenquellen zu identifizieren.

Grundursachen angehen

Niedrige Vollständigkeit signalisiert ein Prozessproblem. Untersuchen Sie, ob Benutzer Felder überspringen, Importe Daten fehlen oder Integrationen stillschweigend fehlschlagen. Beheben Sie die Quelle, nicht nur das Symptom.

Den diagnostischen Funnel nutzen

Hören Sie nicht bei der Vollständigkeitsrate auf. Gehen Sie den Funnel durch: Prüfen Sie das Ausmaß (Populated Count), identifizieren Sie die Ursache (Null vs. Placeholder), bewerten Sie dann die Inhaltsqualität (Rich Text Ratio, Utilization). Jeder Schritt offenbart einen anderen Problemtyp mit einem anderen Fix.

Nächste Schritte

Sie verstehen jetzt, wie man Vollständigkeit misst und verbessert. Lernen Sie weiter über die nächste Dimension: