Was diese Szenarien abdecken
Diese Seite führt durch drei praxisnahe Konsistenzkonfigurationen, von der Ersteinrichtung bis zum Lesen der Scan-Ergebnisse. Jedes Szenario verwendet einen anderen geschäftlichen Kontext und Analysemodus.
Diese Szenarien bauen auf den Konzepten und Metriken auf, die im Hauptartikel Konsistenz behandelt werden. Lesen Sie diesen zuerst, falls Begriffe wie Conformance Rate, Variant Count und Dominant Values für Sie neu sind.
Szenario 1: Standardisierung des Country-Felds mit Discovery
Der geschäftliche Kontext
Ihre Org enthält 15.000 Account-Datensätze aus 3 fusionierten Unternehmen. Das Feld Country ist Freitext. Regionale Dashboards zeigen fragmentierte Daten: „United States” erscheint als eine Zeile, „USA” als eine weitere, „US” als dritte. Regeln zur Gebietszuordnung übersehen Datensätze, weil sie nach einer einzigen Schreibweise filtern. Sie müssen standardisieren, wissen aber nicht, welche Werte in den drei Altsystemen existieren.
Konfiguration Schritt für Schritt
Beginnen Sie mit Import from Field, um herauszufinden, was Ihre Daten tatsächlich enthalten, bevor Sie die zulässigen Werte definieren.
- Öffnen Sie die Konfiguration der Expected Values für das Feld
Country. - Klicken Sie auf Import from Field. DQS fragt die Live-Daten ab und liefert distinkte Werte nach Häufigkeit sortiert.
- Prüfen Sie die Checkliste. Der Import zeigt das vollständige Bild:
| Wert | Datensätze |
|---|---|
| United States | 4.500 |
| USA | 2.300 |
| US | 1.800 |
| Canada | 1.400 |
| U.S.A. | 450 |
| United States of America | 150 |
| … (41 weitere Varianten) | … |
- Entscheiden Sie sich für Ihren Standard. ISO-Ländercodes („US”, „CA”, „UK”) sind kompakt, branchenüblich und eindeutig. Setzen Sie Häkchen bei den ISO-Codes aus der Importliste.
- Klicken Sie auf Add Selected, um Ihre zulässigen Werte zu befüllen.
Setzen Sie die restliche Konfiguration:
| Einstellung | Wert | Begründung |
|---|---|---|
| Analysemodus | Advanced Conformance Analysis | Sie benötigen Variant Counts und Dominant Values, um die Bereinigung zu dimensionieren |
| Expected Values | US, CA, UK, DE, FR, AU, JP | ISO-Codes für Ihre aktiven Märkte |
| Case Sensitive | AUS | Erfasst „us”, „Us” und „US” als denselben Wert |
| Top N | 10 | Zeigt die häufigsten Variationen |
| Min Frequency | 5 | Filtert einmalige Tippfehler heraus |
Was der Scan liefert
| Metrik | Wert |
|---|---|
| Conformance Rate | 12 % |
| Conformance Count | 1.800 |
| Non-Conforming Count | 13.200 |
| Variant Count | 47 |
| Dominant Values | Top-10-Werte mit Häufigkeiten (siehe Importtabelle oben) |
Ergebnisse interpretieren
12 % Konformität sind zu erwarten. Sie haben einen neuen Standard (ISO-Codes) definiert, auf den die Daten nie normalisiert wurden. Nur die 1.800 Datensätze, die bereits „US” enthalten, passen. Das ist kein schlechter Wert. Es ist Ihr Ausgangspunkt.
47 Varianten offenbaren das Ausmaß der Fragmentierung. Drei fusionierte Systeme haben 47 verschiedene Schreibweisen für Ländernamen erzeugt. Ohne diese Zahl würden Sie den Bereinigungsaufwand unterschätzen.
Dominant Values zeigt, wo Sie ansetzen sollten. Die Top-3-Varianten („United States”, „USA”, „US”) machen 8.600 Datensätze aus. Allein die Standardisierung dieser drei Werte hebt Ihre Konformität von 12 % auf 69 %. Beginnen Sie dort.
Non-Conforming Count (13.200) ist Ihr exakter Bereinigungsumfang. Ihr Data Steward hat nun eine konkrete Projektgröße, keine Schätzung.
Nächster Schritt
Erstellen Sie eine Wertzuordnungstabelle auf Basis der Dominant-Values-Ausgabe. Ordnen Sie „United States” zu „US”, „USA” zu „US” usw. zu. Führen Sie die Datennormalisierung durch. Scannen Sie erneut, um Ihre neue Conformance Rate zu überprüfen.
Szenario 2: Lead-Rating-Validierung
Der geschäftliche Kontext
Ihr Lead-Rating-Feld (Rating__c) ist ein Textfeld, das „Hot”, „Warm” oder „Cold” akzeptiert. Sales Manager berichten von seltsamen Werten in ihren Pipeline-Berichten. Ein Filter für Rating = "Hot" liefert weniger Datensätze als erwartet. Sie benötigen ein schnelles Konformitäts-Audit, um zu erfahren, was im Feld steht und wie viele Datensätze bereinigt werden müssen.
Konfiguration Schritt für Schritt
Beginnen Sie mit Import from Field, um die tatsächlichen Werte zu sehen, bevor Sie Ihren Scan konfigurieren.
- Öffnen Sie die Expected-Values-Konfiguration für
Rating__c. - Klicken Sie auf Import from Field. Der Import liefert:
| Wert | Datensätze |
|---|---|
| Hot | 284 |
| Warm | 198 |
| Cold | 156 |
| Very High | 23 |
| 240 km/h | 12 |
| N/A | 8 |
Die ersten drei Werte sind Ihre echten Ratings. „Very High” stammt aus einer anderen Picklist (jemand hat aus dem falschen Feld eingefügt). „240 km/h” sind eindeutig Daten aus einem völlig falschen Feld. „N/A” ist ein Platzhalter.
- Wählen Sie „Hot”, „Warm” und „Cold” aus. Lassen Sie den Rest unmarkiert.
- Klicken Sie auf Add Selected.
Setzen Sie die restliche Konfiguration:
| Einstellung | Wert | Begründung |
|---|---|---|
| Analysemodus | Conformance Check | Sie benötigen eine Ja/Nein-Antwort, keine tiefgehende Analyse |
| Expected Values | Hot, Warm, Cold | Ihre drei gültigen Ratings |
| Case Sensitive | AUS | Erfasst „hot”, „HOT” und „Hot” als Treffer |
Was der Scan liefert
| Metrik | Wert |
|---|---|
| Conformance Rate | 93,7 % |
| Conformance Count | 638 |
Ergebnisse interpretieren
93,7 % konform. Das bedeutet, dass 43 Datensätze Datenmüll enthalten. Für ein schnelles Audit liefert der Modus Conformance Check die Antwort zügig, ohne fortgeschrittene Metriken zu berechnen.
Der Schritt Import from Field hat Ihnen bereits gezeigt, wie der Datenmüll aussieht. „Very High” (23 Datensätze aus einem falschen Picklist-Wert), „240 km/h” (12 Datensätze mit Daten aus dem falschen Feld) und „N/A” (8 Platzhaltereinträge). Sie benötigen Dominant Values hier nicht, da der Import Ihnen die Aufschlüsselung schon vor dem Scan geliefert hat.
43 Datensätze sind eine überschaubare Bereinigung. Dies ist kein Datenmigrationsprojekt. Es ist eine 30-minütige manuelle Korrektur oder ein einzelner Datenaktualisierungs-Job.
Nächster Schritt
Korrigieren Sie die 43 nicht-konformen Datensätze. Wandeln Sie dann Rating__c von einem Textfeld in eine Picklist um, um künftige Probleme zu verhindern. Per API erstellte Datensätze umgehen die Picklist-Validierung; führen Sie daher regelmäßig Konsistenzscans durch, um neue Variationen aus Integrationen zu erkennen.
Szenario 3: Job-Title-Konformität für Persona-Targeting
Der geschäftliche Kontext
Ihr Marketingteam führt persona-basierte Kampagnen durch, die Contacts „VP und höher” adressieren. Das Feld Title ist Freitext mit Tausenden von Variationen. Vor jeder Kampagne sucht jemand manuell nach Title-Stichwörtern, übersieht die Hälfte der Varianten und erstellt eine unvollständige Zielgruppenliste. Das Team braucht eine datengetriebene Antwort auf zwei Fragen: „Wie viele VP+-Contacts haben wir?” und „Welche Titles haben die restlichen Contacts?”
Konfiguration Schritt für Schritt
- Öffnen Sie die Expected-Values-Konfiguration für das Feld
Titleauf Contacts. - Klicken Sie auf Import from Field. Der Import liefert Hunderte Werte. Zu viele, um sie einzeln auszuwählen, aber die Häufigkeiten sind als Kontext hilfreich.
- Definieren Sie Ihre zulässigen Werte basierend auf Ihrer Persona-Zuordnung. Markieren oder tippen Sie die Title-Werte, die Ihr Team als „VP und höher” betrachtet:
VP, Vice President, SVP, Senior Vice President, EVP,
Executive Vice President, Director, Senior Director,
CEO, CFO, CTO, CIO, CMO, COO, President
- Klicken Sie auf Add Selected.
Setzen Sie die restliche Konfiguration:
| Einstellung | Wert | Begründung |
|---|---|---|
| Analysemodus | Advanced Conformance Analysis | Sie benötigen die vollständige Werteverteilung, um zu sehen, welche Titles existieren |
| Expected Values | (16 oben aufgelistete Title-Werte) | Ihre VP+-Persona-Definition |
| Case Sensitive | AUS | Erfasst „vp of sales”, „VP of Sales”, „VP OF SALES” |
| Top N | 20 | Sehen Sie eine breite Streuung |
| Min Frequency | 5 | Filtert Einmaleinträge wie „Chief Happiness Officer” |
Was der Scan liefert
| Metrik | Wert |
|---|---|
| Conformance Rate | 34 % |
| Conformance Count | 3.400 |
| Non-Conforming Count | 6.600 |
| Variant Count | 312 |
Dominant Values (Top 20):
| Rang | Wert | Anzahl |
|---|---|---|
| 1 | Manager | 820 |
| 2 | Sales Representative | 650 |
| 3 | Account Executive | 480 |
| 4 | Director of Marketing | 340 |
| 5 | VP of Sales | 290 |
| 6 | Senior Manager | 275 |
| 7 | Consultant | 240 |
| 8 | Engineer | 210 |
| 9 | CEO | 195 |
| 10 | Head of Operations | 180 |
| … | (10 weitere) | … |
Ergebnisse interpretieren
34 % Konformität ist kein Misserfolg. Dies ist kein Datenqualitätsproblem. Es bedeutet, dass 34 % Ihrer Contacts VP+-Titles haben, und das ist Ihre Kampagnen-Zielgruppe. Die Zahl beantwortet die Frage, an der Ihr Marketingteam bisher gerätselt hat.
312 Variant Count bestätigt, dass der Freitext-Title stark fragmentiert ist. 312 unterschiedliche Title-Werte über 10.000 Contacts. Das ist normal für Freitextfelder und erklärt, warum manuelle Suchen Personen übersehen.
Dominant Values zeigt, welche Titles Ihre Contacts tatsächlich haben. Viele der Spitzenwerte liegen unterhalb der VP-Ebene (Manager, Sales Rep, Account Executive). Das ist zu erwarten. Diese Contacts sind gültige Datensätze mit gültigen Titles. Sie fallen außerhalb Ihrer Zielpersona.
Non-Conforming Count (6.600) ist KEIN Bereinigungsumfang. Im Unterschied zum Country-Szenario sind dies keine schmutzigen Datensätze. Es sind Contacts mit Titles außerhalb Ihres VP+-Filters. „Manager” ist ein echter Title, kein Datenfehler. Betrachten Sie Non-Conforming Count als „Contacts außerhalb dieser Persona”, nicht als „zu korrigierende Datensätze”.
Die eigentliche Erkenntnis: Sie haben jetzt eine datengetriebene Zielgruppengröße. 3.400 VP+-Contacts, verifiziert durch Scannen der tatsächlichen Daten. Keine manuellen Stichwortsuchen mehr.
Nächster Schritt
Verwenden Sie den Conformance Count (3.400) als Zielgruppengröße Ihrer VP+-Kampagne. Überprüfen Sie die Dominant-Values-Liste auf Titles, die Sie übersehen haben. „Senior Manager” (275 Datensätze) und „Head of Operations” (180 Datensätze) sind Grenzfälle. Falls diese Rollen für Ihre Kampagnen in Frage kommen, fügen Sie sie den zulässigen Werten hinzu und scannen Sie erneut.
Ihre Konfiguration wählen
| Wenn Sie … müssen | Beginnen Sie mit | Wichtige Einstellungen |
|---|---|---|
| Ein kontrolliertes Feld (Picklist, Rating, Status) prüfen | Import from Field, dann Conformance Check | Expected Values aus Import, Case Sensitive AUS |
| Ein fragmentiertes Feld (Country, Industry) standardisieren | Import from Field, dann Advanced Conformance Analysis | Expected Values als Zielstandard, Top N 10+, Min Frequency 5+ |
| Eine Zielgruppe oder ein Segment aus Freitextdaten dimensionieren | Import from Field, dann Advanced Conformance Analysis | Expected Values als Segmentdefinition, Top N 20, Min Frequency 5 |
| Eine schnelle Baseline vor einem Bereinigungsprojekt | Import from Field, dann Conformance Check | Expected Values aus Ihrem Datenstandard |
Für eine vollständige Erläuterung aller 6 Konsistenzmetriken, Analysemodi und Konfigurationseingaben kehren Sie zum Hauptartikel Konsistenz zurück.
Bereit, Ihre eigene Datenqualität zu messen? Nehmen Sie am AI Readiness Assessment teil, um Ihre Konsistenzwerte und mehr zu sehen.