Skip to main content

Die fünf Dimensionen der Datenqualität

Lernen Sie die fünf Dimensionen kennen, die DQS misst: Vollständigkeit, Gültigkeit, Eindeutigkeit, Aktualität und Konsistenz.

Die fünf Dimensionen verstehen

Datenqualität wird anhand von fünf Schlüsseldimensionen gemessen. Jede Dimension beantwortet eine spezifische Frage zu Ihren Daten, und zusammen bestimmen sie, ob Ihre Daten zweckmäßig sind.

DQS misst alle fünf Dimensionen nativ innerhalb von Salesforce.

DimensionKernfrageBeispielproblem
VollständigkeitSind die Daten vorhanden?Fehlende E-Mail-Adressen
GültigkeitIst das Format korrekt?Fehlerhafte Telefonnummern
EindeutigkeitIst jeder Datensatz eindeutig?Doppelte Contacts
AktualitätSind die Daten aktuell?Veraltete Opportunity-Daten
KonsistenzSind die Daten einheitlich?„USA” vs. „United States”

1. Vollständigkeit

Vollständigkeit misst, ob erforderliche Datenwerte vorhanden sind und nicht fehlen.

Was DQS misst

  • Befüllungsrate: Prozentsatz der Datensätze mit nicht-leeren Werten
  • Leer-Erkennung: Leere Zeichenketten und nur aus Leerzeichen bestehende Werte
  • Platzhalter-Erkennung: Werte wie „N/A”, „TBD” oder „Unknown”

Warum Vollständigkeit wichtig ist

Unvollständige Daten brechen Automatisierung. Wenn ein Workflow eine nicht vorhandene E-Mail-Adresse erfordert, schlägt der Workflow fehl. Wenn ein Bericht nach Branche filtert, aber der Hälfte Ihrer Datensätze die Branchenwerte fehlen, zeigt Ihre Analyse nur einen Teil des Bildes.

Häufige Vollständigkeitsprobleme

ProblemBeispielAuswirkung
Leere FelderLeeres Contact-TelefonKeine Anrufe bei Interessenten möglich
Platzhalterwerte„TBD” im FirmennamenUngültig für Reporting
Nur Leerzeichen„ ” in BeschreibungWirkt befüllt, ist es aber nicht

Tipp: Beginnen Sie mit Ihren kritischsten Feldern. Sie benötigen nicht 100 % Vollständigkeit bei jedem Feld, nur bei denen, die für Ihren Anwendungsfall relevant sind.

2. Gültigkeit

Gültigkeit misst, ob Datenwerte erwarteten Formaten und Mustern entsprechen.

Was DQS misst

  • Formatvalidierung: E-Mail-, Telefon-, URL-Muster
  • Musterabgleich: Benutzerdefinierte Regex-Muster
  • Domänenvalidierung: Listen erlaubter Werte

Gültigkeit vs. Genauigkeit

Gültigkeit und Genauigkeit sind unterschiedlich. Eine E-Mail-Adresse kann gültig (korrektes Format) aber ungenau (falsche Person) sein. DQS misst Gültigkeit, weil Formatvalidierung automatisiert werden kann. Genauigkeit erfordert externe Verifizierung.

PrüfungGültig?Genau?
[email protected]JaOhne Verifizierung unbekannt
john@companyNeinN/A (Format ist falsch)
[email protected]JaNein (Person hat Unternehmen verlassen)

Häufige Gültigkeitsprobleme in Salesforce

  • E-Mail-Adressen ohne „@” oder Domäne
  • Telefonnummern mit falscher Ziffernanzahl
  • URLs ohne Protokoll (http/https)
  • Freitext, wo Picklist-Werte erwartet werden

3. Eindeutigkeit

Eindeutigkeit misst, ob Datenwerte distinkt und nicht dupliziert sind.

Was DQS misst

  • Dublettenerkennung: Exakte Übereinstimmungen zwischen Datensätzen
  • Distinkt-Anzahl: Gesamtzahl eindeutiger Werte pro Feld
  • Entropie-Analyse: Wertvielfalt und -verteilung

Die Kosten von Dubletten

Doppelte Datensätze verschwenden Speicher, verwirren Benutzer und erzeugen überhöhte Metriken. Wenn Sales zwei Datensätze für dasselbe Unternehmen hat, verlieren sie den Kontext und riskieren peinliche doppelte Ansprache.

Forschungen zeigen:

  • B2B-Datenbanken enthalten durchschnittlich 10-30 % Dubletten
  • Jede Dublette kostet Organisationen durch verschwendete E-Mail-Versendungen, verwirrtes Reporting und fragmentierte Kundenhistorie

Dublettenvermeidung vs. -erkennung

DQS konzentriert sich auf Erkennung, die Ihnen hilft, bereits existierende Dubletten zu identifizieren. Vermeidung (Verhindern von Dubletten bei der Erstellung) erfordert Validierungsregeln und Matching-Regeln in der Salesforce-Konfiguration.

4. Aktualität

Aktualität misst, ob Daten für ihren vorgesehenen Zweck aktuell genug sind.

Was DQS misst

  • Aktualitätsrate: Prozentsatz der Datensätze innerhalb eines akzeptablen Alters
  • Veraltungserkennung: Datensätze, die Ihren Schwellenwert überschreiten
  • Durchschnittsalter: Mittleres Alter der Datumsfeldwerte
  • Erkennung zukünftiger Daten: Ungültige Daten in der Zukunft

Festlegung von Aktualitätsschwellen

Unterschiedliche Datentypen haben unterschiedliche Aktualitätsanforderungen:

DatentypTypischer SchwellenwertWarum
Lead Last Activity30 TageKalte Leads verlieren an Wert
Kontaktinfo90 TageMenschen wechseln Jobs
Opportunity Close DateAktuelles QuartalPrognosegenauigkeit
Account Annual Revenue1 JahrJährliche Aktualisierungen erwartet

Warum Aktualität für KI wichtig ist

KI- und Machine-Learning-Modelle lernen aus Ihren Daten. Wenn Ihre Daten veraltet sind, lernt die KI veraltete Muster. Agentforce beispielsweise nutzt Ihre Salesforce-Daten, um Antworten zu informieren. Veraltete Kontaktinformationen führen zu falschen Empfehlungen.

5. Konsistenz

Konsistenz misst, ob Datenwerte einheitlich und standardisiert sind.

Was DQS misst

  • Konformitätsrate: Prozentsatz, der erwarteten Mustern entspricht
  • Variantenerkennung: Unterschiedliche Darstellungen desselben Werts
  • Dominante-Wert-Analyse: Häufigster Wert pro Feld

Arten von Inkonsistenz

TypBeispielProblem
Formatvariation„USA” vs. „United States” vs. „US”Bricht Filterung und Gruppierung
Schreibweisenvariation„Acme Corp” vs. „ACME Corporation”Erzeugt falsche Dubletten
Groß-/Kleinschreibung„new york” vs. „New York”Wirkt unprofessionell in Berichten

Warum Konsistenz für KI wichtig ist

KI-Modelle behandeln „USA” und „United States” als unterschiedliche Werte. Wenn Ihre Datensätze beide verwenden, kann die KI sie nicht korrekt gruppieren. Inkonsistente Daten fragmentieren das Verständnis Ihrer KI und erzeugen unzuverlässige Ergebnisse.

Konsistenz erreichen

  • Verwenden Sie nach Möglichkeit Picklists statt Freitext
  • Standardisieren Sie ein einheitliches Format für jedes Feld
  • Importieren Sie aus Picklist-Werten beim Konfigurieren von DQS-Konsistenzprüfungen

Die Dimensionen ausbalancieren

Nicht jede Dimension ist für jeden Anwendungsfall gleich wichtig. Überlegen Sie, was Sie benötigen:

AnwendungsfallPrioritätsdimensionen
MarketingkampagnenVollständigkeit, Gültigkeit (für Zustellbarkeit)
VertriebsprognoseAktualität, Vollständigkeit
KundenserviceEindeutigkeit (eine verlässliche Quelle)
KI/AgentforceAlle fünf, plus AI-Readiness-Prüfungen

DQS-Abdeckung der Dimensionen

DQS misst alle fünf Dimensionen mit umfassenden Fähigkeiten:

DimensionWas DQS misst
VollständigkeitBefüllungsrate, Null-Erkennung, Leer-Erkennung, Platzhalter-Erkennung, kontextbezogene Logik
GültigkeitFormatvalidierung, benutzerdefinierte Regex-Muster, Identifizierung ungültiger Datensätze
EindeutigkeitDublettenerkennung, Entropie-Analyse, Häufigkeitsverteilung
AktualitätAktualitätsrate, Veraltungserkennung, Durchschnittsalter, Erkennung zukünftiger Daten
KonsistenzKonformitätsprüfung, Variantenerkennung, Dominante-Wert-Analyse

Nächste Schritte

Jetzt, wo Sie die fünf Dimensionen verstehen:

  1. Nehmen Sie am AI Readiness Assessment teil, um Ihre aktuellen Scores zu sehen
  2. Lesen Sie über Agentforce-Vorbereitung für zusätzliche Prüfungen über die grundlegende Datenqualität hinaus
  3. Erfahren Sie, wie Sie den Definition Builder verwenden, um Ihren ersten Scan zu konfigurieren