Skip to main content

Konsistenz

Alle 6 Konsistenzmetriken, die DQS misst, der diagnostische Ablauf zum Auffinden von Wertfragmentierung und wie Sie die Konformitätsanalyse konfigurieren.

Was ist Konsistenz?

Konsistenz misst, ob Ihre Datenwerte einem vereinbarten Standard entsprechen. Ein Feld ist konsistent, wenn jeder Datensatz denselben Begriff für dasselbe Konzept verwendet. Ein Feld ist inkonsistent, wenn Variationen existieren, die dasselbe bedeuten, aber unterschiedlich ausgedrückt werden.

„USA”, „United States” und „US” beziehen sich alle auf dasselbe Land. Für Salesforce sind sie drei distinkte Werte. Ein nach Land gruppierter Bericht erzeugt drei Zeilen statt einer. Eine Automatisierung, die nach „USA” filtert, verpasst 230 Datensätze, die „United States” enthalten.

Conformance Rate = (Konforme Datensätze / Gesamtdatensätze) x 100

Wenn 850 von 1.000 Account-Datensätzen einen Country-Wert haben, der Ihrer Liste erlaubter Werte entspricht, beträgt Ihre Country-Conformance-Rate 85 %. Die verbleibenden 15 % enthalten Variationen, die standardisiert werden müssen.

Warum Konsistenz wichtig ist

Reporting

Inkonsistente Daten fragmentieren Ihre Berichte. Wenn Ihr Country-Feld fünf verschiedene Schreibweisen desselben Landes enthält, zeigt ein nach Country gruppierter Bericht fünf Zeilen statt einer. Die Summe ist korrekt, aber die Gruppierung ist falsch. Executive-Dashboards, die auf diesen Berichten aufbauen, erzählen eine irreführende Geschichte.

Automatisierung

Salesforce-Automatisierung hängt von exakten Wertübereinstimmungen ab. Ein Workflow, der nach Country = "USA" filtert, verpasst Datensätze mit „United States” und „US”. Die Automatisierung läuft korrekt auf übereinstimmenden Datensätzen, überspringt aber stillschweigend alles andere.

KI und Agentforce

KI-Modelle behandeln jede Variation als separates Konzept. „USA” und „United States” werden zu zwei verschiedenen Ländern in der Ansicht des Modells. Agentforce generiert Antworten mit Ihren Feldwerten. Inkonsistente Werte erzeugen inkonsistente KI-Ausgaben.

SystemAuswirkung der Konsistenz
BerichteFragmentierte Gruppierungen, irreführende Summen
WorkflowsFilter verpassen nicht übereinstimmende Variationen
DublettenregelnVariationen verhindern korrektes Matching
AgentforceInkonsistente Feldwerte erzeugen unzuverlässige KI-Antworten

Wie DQS Konsistenz misst

DQS erzeugt 6 Konsistenzmetriken rund um eine diagnostische Frage: „Entsprechen Ihre Feldwerte einem Standard, und wenn nicht, was tun sie stattdessen?”

Betrachten Sie diese Metriken als diagnostischen Ablauf. Jeder Schritt offenbart eine andere Ebene des Problems.

Schritt 1: Wie konsistent ist es?

Conformance Rate ist die Leitmetrik. Sie berechnet den Prozentsatz der Datensätze, bei denen der Feldwert einem Ihrer definierten erlaubten Werte entspricht. Dies ist die Zahl, die Sie auf ein Dashboard setzen.

Sie führen einen Scan auf dem Account-Objekt durch. Das Feld Country zeigt eine Conformance Rate von 72 %. Das bedeutet, 28 % Ihrer Accounts enthalten Country-Werte außerhalb Ihrer erlaubten Liste. Ihre Territoriumszuweisungsregeln, regionalen Dashboards und Lokalisierungslogik arbeiten alle mit unvollständigen Daten.

Jede andere Konsistenzmetrik existiert, um zu erklären, wie die nicht-konformen 28 % aussehen.

Schritt 2: Was ist das Ausmaß?

Raten sagen Ihnen den Schweregrad. Zählungen sagen Ihnen den Arbeitsaufwand. Zwei Metriken beantworten die Ausmaß-Frage:

MetrikWas sie Ihnen sagt
Conformance CountWie viele Datensätze Ihren erlaubten Werten entsprechen. Verwenden Sie dies für Abdeckungsberichte.
Non-Conforming CountWie viele Datensätze außerhalb Ihrer erlaubten Werte fallen. Verwenden Sie dies, um Bereinigungsprojekte zu skopieren.

Diese beiden Zahlen ergeben immer die Gesamtdatensätze. Wenn Ihr Conformance Count 720 und Non-Conforming Count 280 beträgt, haben Sie genau 1.000 ausgewertete Datensätze.

Beispiel: Ihre Data Stewardin muss das Feld Industry bereinigen. Non-Conforming Count beträgt 3.400. Sie kennt jetzt den Umfang des Projekts, kann Ressourcen zuweisen und einen realistischen Zeitplan für die Standardisierung festlegen.

Schritt 3: Wie fragmentiert sind die Daten?

Variant Count misst die Anzahl distinkter Werte, die in einem Feld über alle Datensätze hinweg gefunden werden. Es beantwortet: „Auf wie viele verschiedene Weisen drücken Menschen diese Daten aus?”

Diese Metrik funktioniert als Schema-Gesundheitsindikator. Ein Country-Feld mit 5 distinkten Werten ist wahrscheinlich gut kontrolliert. Ein Country-Feld mit 47 distinkten Werten signalisiert ernsthafte Fragmentierung, selbst bevor Sie die Konformität prüfen.

FeldGesamtdatensätzeVariant CountBewertung
Country1.0005Gut kontrolliert, wahrscheinlich konsistent
Country1.00047Stark fragmentiert, benötigt Standardisierung
Industry50012Angemessen, wahrscheinlich Picklist-beschränkt
Industry50089Freitext-Chaos, benötigt sofortige Aufmerksamkeit

Beispiel: Während eines Org-Audits scannen Sie Lead_Source__c auf Leads. Variant Count gibt 34 zurück. Ihr Marketing-Team hat 8 Lead-Quellen definiert. Die verbleibenden 26 Varianten sind Rechtschreibfehler, Abkürzungen und Ad-hoc-Einträge aus Integrationen. Die Picklist ist an der UI technisch erzwungen, aber über API erstellte Datensätze umgehen sie.

Schritt 4: Was sind die tatsächlichen Werte?

Dominant Values gibt die Top N häufigsten Werte im Feld zurück, zusammen mit der Häufigkeitszählung jedes Werts. Dies sagt Ihnen, wie Ihre Daten tatsächlich aussehen, nicht wie Sie erwarten, dass sie aussehen.

RangWertAnzahlProzentsatz
1United States45045 %
2USA23023 %
3US18018 %
4U.S.A.454,5 %
5United States of America151,5 %

Diese Tabelle offenbart drei Dinge. Erstens, den De-facto-Standard: „United States” mit 45 % ist das, was die meisten Benutzer eingeben. Zweitens, die häufigen Variationen: „USA” und „US” machen weitere 41 % aus. Drittens, den Long Tail: „U.S.A.” und „United States of America” sind selten, aber vorhanden.

Beispiel: Ihr Team debattiert, ob Country-Werte zu ISO-Codes („US”) oder vollständigen Namen („United States”) standardisiert werden sollen. Dominant Values zeigt, dass 45 % der Datensätze bereits „United States” verwenden. Die Standardisierung auf diesen Wert erfordert die Änderung von 55 % der Datensätze. Die Standardisierung auf „US” erfordert die Änderung von 82 %. Die Daten sagen Ihnen den günstigeren Weg.

Warum Raten und Zählungen paarweise kommen

Konformitätsmetriken kommen als Rate (Conformance Rate) und deren Inverse (Non-Conformance Rate), plus absolute Zählungen für beide Seiten. Dies ist beabsichtigt:

  • Raten sind für Dashboards, Executive Reporting und Trendverfolgung. „Die Konformität verbesserte sich in diesem Quartal von 72 % auf 94 %.”
  • Zählungen sind für Projektplanung, Arbeitsaufwandsschätzung und Bereinigungsplanung. „Wir haben 3.400 nicht-konforme Datensätze zu reparieren.”

Verwenden Sie Raten, um Fortschritt zu kommunizieren. Verwenden Sie Zählungen, um Arbeit zu planen.

Metrik-Referenz

Basismetriken

Diese 2 Metriken bilden die Basis jeder Konsistenzanalyse. Sie sagen Ihnen die Konformitätsrate und die Anzahl der übereinstimmenden Datensätze.

MetrikTypWas sie misst
Conformance RateProzentsatzAnteil der Datensätze, die Ihren erlaubten Werten entsprechen
Conformance CountAnzahlAnzahl der Datensätze, die Ihren erlaubten Werten entsprechen

Erweiterte Metriken

Diese 4 Metriken gehen über „entspricht es?” hinaus, um zu fragen „wie sehen die nicht übereinstimmenden Daten aus?”. Sie erfordern den Analysemodus Advanced Conformance Analysis.

MetrikTypWas sie misst
Non-Conforming CountAnzahlDatensätze mit Werten außerhalb Ihrer erlaubten Liste
Non-Conformance RateProzentsatzAnteil der Datensätze außerhalb Ihrer erlaubten Liste
Variant CountAnzahlGesamtzahl distinkter Werte im Feld
Dominant ValuesListeTop N häufigste Werte mit Häufigkeitszählung

Feldtyp-Abdeckung

DQS unterstützt Konsistenzprüfungen auf den folgenden Salesforce-Feldtypen:

FeldtypKonsistenzfokus
String (Text)Abkürzungen, Schreibweise, Groß-/Kleinschreibung
TextAreaFreitext-Standardisierung
PicklistValidierung tatsächlicher Werte gegen erwartete Optionen
EmailDomänen-Standardisierung, Format-Konsistenz
PhoneFormat-Standardisierung (Vorwahlen, Trennzeichen)
URLProtokoll- und Pfadkonsistenz

Zwei Analysemodi

DQS bietet zwei Konsistenzanalysemodi:

Conformance Check beantwortet die Frage: „Entsprechen Feldwerte meiner erlaubten Liste?” Es erzeugt die 2 Basismetriken und deckt die Grundlagen für ein schnelles Konformitätsaudit ab.

Advanced Conformance Analysis geht tiefer. Es erzeugt alle 6 Metriken, einschließlich nicht-konformer Zählungen, Variantenerkennung und dominanter Wertverteilung. Verwenden Sie diesen Modus, wenn Sie die vollständige Landschaft der Wertfragmentierung verstehen müssen, nicht nur den Konformitäts-Score.

GeschäftsanforderungEmpfohlener Modus
Schnelles Konformitätsaudit oder Baseline-PrüfungConformance Check
Bereinigung einer DatenmigrationAdvanced (Variant Count offenbart importiertes Chaos)
KI-BereitschaftsbewertungAdvanced (Dominant Values zeigen, wovon die KI lernen wird)
Laufende Data GovernanceBeginnen Sie mit Conformance Check, wechseln Sie zu Advanced, wenn Sie bereit für tiefere Analysen sind

Konsistenz konfigurieren

DQS bietet vier Konfigurationseingaben für Konsistenz. Jede kann auf globaler Ebene (gilt für alle Felder) festgelegt und auf Feldebene überschrieben werden.

EinstellungWas sie steuert
Expected ValuesDie Liste der Werte, die DQS als „konform” behandelt. Jeder Feldwert, der nicht auf dieser Liste steht, wird als nicht-konform markiert. Erforderlich: Sie müssen mindestens einen Wert definieren, bevor Sie einen Scan ausführen.
Case SensitiveSteuert, ob der Wertabgleich Groß-/Kleinschreibung berücksichtigt. Wenn deaktiviert (Standard), passen „Premium”, „PREMIUM” und „premium” alle zum erlaubten Wert „Premium”. Wenn aktiviert, zählt nur eine exakte Übereinstimmung.
Top NWie viele dominante Werte zurückgegeben werden sollen (1 bis 100). Steuert die Größe der Dominant-Values-Ausgabe. Standard: 5.
Min FrequencyDie Mindestanzahl an Vorkommen, die ein Wert haben muss, um in die Dominant-Values-Ausgabe aufgenommen zu werden (1 bis 1.000). Filtert ultra-seltene Werte heraus, die Rauschen hinzufügen. Standard: 1.

Tipp: Beginnen Sie mit Import from Field, um zu sehen, welche Werte in Ihren Daten tatsächlich existieren, bevor Sie Ihre erlaubte Werteliste definieren.

Import from Field: Discovery-First-Konfiguration

Eine häufige Herausforderung bei der Konsistenz ist zu wissen, welche Werte erwartet werden sollen. Sie können erlaubte Werte nicht definieren, wenn Sie nicht wissen, was Ihre Daten enthalten.

Import from Field löst dies. Es fragt die tatsächlichen Felddaten ab, gruppiert Werte nach Häufigkeit und zeigt die Ergebnisse als Checkliste an.

So funktioniert es:

  1. Öffnen Sie die Expected-Values-Konfiguration.
  2. Klicken Sie auf Import from Field. DQS fragt die Live-Daten ab und gibt distinkte Werte sortiert nach Häufigkeit zurück.
  3. Überprüfen Sie die Checkliste. Jeder Wert zeigt, wie viele Datensätze ihn enthalten.
  4. Markieren Sie die Werte, die Sie für korrekt halten. Lassen Sie falsche, fehlerhafte oder Platzhalterwerte unmarkiert.
  5. Klicken Sie auf Add Selected. Die markierten Werte befüllen Ihre erlaubte Werteliste.

Beispiel: Sie konfigurieren Konsistenz für ein Feld Rating__c. Import from Field gibt zurück:

WertDatensätze
Hot284
Warm198
Cold156
Very High23
240 km/h12
N/A8

Die ersten drei Werte sind Ihre echten Ratings. Sie markieren diese. „Very High” ist ein Dateneingabefehler. „240 km/h” ist offensichtlich Daten im falschen Feld. „N/A” ist ein Platzhalter. Diese lassen Sie unmarkiert. Wenn der Scan läuft, erscheinen diese 43 Datensätze als nicht-konform, und Ihre erlaubte Werteliste wird aus dem aufgebaut, was Ihre Daten tatsächlich enthalten.

Dieser Workflow kehrt den traditionellen „Erst raten, dann reparieren”-Ansatz um. Sie entdecken zuerst, dann definieren Sie Ihren Standard.

Häufige Konsistenzprobleme

Land- und Staaten-Variationen

Die häufigste Inkonsistenz in Salesforce-Daten. Ohne Standardisierung erscheint ein einzelnes Konzept wie „United States” als 5 oder mehr distinkte Werte. Berichte fragmentieren. Filter verpassen Datensätze. Territoriumsregeln schlagen fehl.

Fix: Aktivieren Sie Salesforce State- und Country-Picklists für alle Adressfelder. Verwenden Sie DQS, um vorhandene nicht-konforme Werte zu finden und zu bereinigen.

Freitextfelder ohne Governance

Textfelder, die keine Picklist-Einschränkungen haben, akkumulieren mit der Zeit Variationen. Industry-, Jobtitel-, Lead-Source- und Abteilungsfelder sind häufige Übeltäter, wenn sie als Freitext implementiert sind.

Fix: Konvertieren Sie wertvolle Freitextfelder in Picklists. Verwenden Sie Import from Field, um Ihre aktuelle Wertverteilung zu sehen, bevor Sie die Picklist-Optionen definieren.

Integrations-erzeugte Variationen

Externe Systeme und APIs schreiben Datensätze, die die Salesforce-UI-Validierung umgehen. Eine Marketing-Automatisierungsplattform schreibt „Info Technology”, während Ihr Standard „Information Technology” ist. Diese Variationen akkumulieren stillschweigend.

Fix: Wenden Sie Wertmappingregeln in Ihrer Integrationsschicht an. Führen Sie regelmäßige Konsistenz-Scans aus, um neue Variationen aus Datenquellen zu erfassen, die Sie nicht kontrollieren.

Groß-/Kleinschreibungs-Inkonsistenzen

Benutzer geben „Active”, „active” und „ACTIVE” über verschiedene Datensätze hinweg ein. Mit deaktiviertem case-sensitivem Abgleich zählt DQS alle drei als konform. Aber das Feld enthält immer noch drei verschiedene Schreibweisen in den Rohdaten.

Fix: Entscheiden Sie, ob Groß-/Kleinschreibung für Ihren Anwendungsfall wichtig ist. Für anzeigbezogene Felder standardisieren Sie die Schreibweise durch Datenbereinigung. Für Abgleichszwecke deaktivieren Sie Case Sensitivity in Ihrer DQS-Konfiguration.

Best Practices

Standards vor dem Scannen definieren

Dokumentieren Sie den erwarteten Wert für jedes eingeschränkte Feld, bevor Sie Ihren ersten Scan ausführen. Ohne klaren Standard haben Sie keine Baseline, gegen die gemessen werden kann.

FeldStandardBegründung
CountryISO 3166-1 Alpha-2-Codes (US, CA, DE)Branchenstandard, kompakt
Industry15-Werte benutzerdefinierte TaxonomiePasst zu Reporting-Kategorien
Lead Source8 marketing-definierte QuellenStimmt mit Kampagnen-Tracking überein

Discovery-Workflow für unbekannte Felder verwenden

Für Felder, bei denen Sie keinen vordefinierten Standard haben, verwenden Sie zuerst Import from Field. Lassen Sie die Daten Ihnen sagen, was der De-facto-Standard ist. Der Wert mit der höchsten Häufigkeit ist oft die richtige Wahl als Ihr kanonischer Wert.

Konformität über die Zeit verfolgen

Ein einzelner Konformitäts-Score ist eine Momentaufnahme. Verfolgen Sie Scores über mehrere Scans, um Verschlechterungen frühzeitig zu erkennen, den Bereinigungsfortschritt zu messen und Datenquellen zu identifizieren, die neue Variationen einführen.

Variant Count als Frühwarnung verwenden

Überwachen Sie Variant Count über Scans. Ein Feld, das zwischen Scans von 12 auf 28 distinkte Werte springt, hat eine neue Variationsquelle. Untersuchen Sie, bevor das Problem skaliert.

Nach geschäftlicher Wirkung priorisieren

Nicht jedes Feld benötigt 100 % Konformität. Konzentrieren Sie sich auf Felder, die Reporting antreiben (Country, Industry), Automatisierung speisen (Status, Stage) oder Daten an KI und Agentforce liefern.

Nächste Schritte

Sie haben nun alle fünf Datenqualitätsdimensionen abgeschlossen. Setzen Sie Ihr Lernen fort: