Czym jest spójność?
Spójność mierzy, czy Twoje wartości danych są zgodne z uzgodnionym standardem. Pole jest spójne, gdy każdy rekord używa tego samego terminu dla tego samego pojęcia. Pole jest niespójne, gdy istnieją wariacje, które oznaczają to samo, ale są wyrażane inaczej.
„USA”, „United States” i „US” odnoszą się do tego samego kraju. Dla Salesforce to trzy odrębne wartości. Raport grupowany według Country produkuje trzy wiersze zamiast jednego. Automatyzacja filtrująca „USA” pomija 230 rekordów zawierających „United States”.
Conformance Rate = (Rekordy zgodne / Łączna liczba rekordów) x 100
Jeśli 850 z 1000 rekordów Account ma wartość Country pasującą do Twojej listy dozwolonych wartości, Twój stopień zgodności dla Country wynosi 85%. Pozostałe 15% zawiera wariacje wymagające standaryzacji.
Dlaczego spójność ma znaczenie
Raportowanie
Niespójne dane fragmentują Twoje raporty. Gdy Twoje pole Country zawiera pięć różnych pisowni tego samego kraju, raport grupowany według Country pokazuje pięć wierszy zamiast jednego. Suma jest poprawna, ale grupowanie jest błędne. Dashboardy zarządu zbudowane na tych raportach opowiadają mylącą historię.
Automatyzacja
Automatyzacja Salesforce zależy od dokładnych dopasowań wartości. Flow filtrujący Country = "USA" pomija rekordy z „United States” i „US”. Automatyzacja działa poprawnie na pasujących rekordach, ale cicho pomija wszystko inne.
AI i Agentforce
Modele AI traktują każdą wariację jako odrębne pojęcie. „USA” i „United States” stają się dwoma różnymi krajami w widoku modelu. Agentforce generuje odpowiedzi używając wartości Twoich pól. Niespójne wartości produkują niespójne wyniki AI.
| System | Wpływ spójności |
|---|---|
| Raporty | Fragmentaryczne grupowania, mylące sumy |
| Flows | Filtry pomijają niepasujące wariacje |
| Reguły duplikatów | Wariacje uniemożliwiają poprawne dopasowanie |
| Agentforce | Niespójne wartości pól produkują nierzetelne odpowiedzi AI |
Jak DQS mierzy spójność
DQS produkuje 6 metryk spójności zorganizowanych wokół pytania diagnostycznego: „Czy Twoje wartości pól są zgodne ze standardem, a jeśli nie, to co robią zamiast tego?”
Pomyśl o tych metrykach jak o przepływie diagnostycznym. Każdy krok ujawnia inną warstwę problemu.
Krok 1: Jak spójne są dane?
Conformance Rate to metryka nagłówkowa. Oblicza procent rekordów, w których wartość pola pasuje do jednej z Twoich zdefiniowanych dozwolonych wartości. To liczba, którą umieszcza się na dashboardzie.
Uruchamiasz skanowanie obiektu Account. Pole Country pokazuje Conformance Rate 72%. Oznacza to, że 28% Twoich Accounts zawiera wartości krajów spoza Twojej dozwolonej listy. Twoje reguły przypisywania terytoriów, dashboardy regionalne i logika lokalizacji działają na niekompletnych danych.
Każda inna metryka spójności istnieje, aby wyjaśnić, jak wygląda niezgodne 28%.
Krok 2: Jaka jest skala?
Stopnie mówią o dotkliwości. Liczby mówią o obciążeniu. Dwie metryki odpowiadają na pytanie o skalę:
| Metryka | Co Ci mówi |
|---|---|
| Conformance Count | Ile rekordów pasuje do Twoich dozwolonych wartości. Używaj do raportowania pokrycia. |
| Non-Conforming Count | Ile rekordów wypada poza Twoje dozwolone wartości. Używaj do planowania projektów czyszczenia. |
Te dwie liczby zawsze sumują się do łącznej liczby rekordów. Jeśli Twój Conformance Count wynosi 720, a Non-Conforming Count 280, masz dokładnie 1000 ocenianych rekordów.
Przykład: Twój data steward musi wyczyścić pole Industry. Non-Conforming Count wynosi 3400. Zna teraz zakres projektu, może przypisać zasoby i ustawić realistyczny harmonogram standaryzacji.
Krok 3: Jak fragmentaryczne są dane?
Variant Count mierzy liczbę odrębnych wartości znalezionych w polu we wszystkich rekordach. Odpowiada na pytanie: „Na ile różnych sposobów ludzie wyrażają te dane?”
Ta metryka działa jako wskaźnik zdrowia schematu. Pole Country z 5 odrębnymi wartościami jest prawdopodobnie dobrze kontrolowane. Pole Country z 47 odrębnymi wartościami sygnalizuje poważną fragmentację, nawet zanim sprawdzisz zgodność.
| Pole | Łączna liczba rekordów | Variant Count | Ocena |
|---|---|---|---|
| Country | 1000 | 5 | Dobrze kontrolowane, prawdopodobnie spójne |
| Country | 1000 | 47 | Wysoce fragmentaryczne, wymaga standaryzacji |
| Industry | 500 | 12 | Rozsądne, prawdopodobnie ograniczone picklist |
| Industry | 500 | 89 | Chaos tekstu dowolnego, wymaga natychmiastowej uwagi |
Przykład: Podczas audytu org skanujesz Lead_Source__c na Leads. Variant Count zwraca 34. Twój zespół marketingu zdefiniował 8 źródeł Leads. Pozostałe 26 wariantów to literówki, skróty i wpisy ad-hoc z integracji. Picklist jest technicznie egzekwowana w UI, ale rekordy tworzone przez API ją omijają.
Krok 4: Jakie są rzeczywiste wartości?
Dominant Values zwraca N najczęstszych wartości w polu wraz z liczbą wystąpień każdej wartości. To mówi Ci, jak faktycznie wyglądają Twoje dane, a nie jak oczekujesz, że będą wyglądały.
| Pozycja | Wartość | Liczba | Procent |
|---|---|---|---|
| 1 | United States | 450 | 45% |
| 2 | USA | 230 | 23% |
| 3 | US | 180 | 18% |
| 4 | U.S.A. | 45 | 4,5% |
| 5 | United States of America | 15 | 1,5% |
Ta tabela ujawnia trzy rzeczy. Po pierwsze, de facto standard: „United States” na 45% to to, co wprowadza większość użytkowników. Po drugie, popularne wariacje: „USA” i „US” odpowiadają za kolejne 41%. Po trzecie, długi ogon: „U.S.A.” i „United States of America” są rzadkie, ale obecne.
Przykład: Twój zespół debatuje, czy ustandaryzować wartości Country do kodów ISO („US”), czy pełnych nazw („United States”). Dominant Values pokazuje, że 45% rekordów już używa „United States”. Standaryzacja do tej wartości wymaga zmiany 55% rekordów. Standaryzacja do „US” wymaga zmiany 82%. Dane mówią Ci tańszą drogę.
Dlaczego stopnie i liczby występują w parach
Metryki zgodności występują jako stopień (Conformance Rate) i jego odwrotność (Non-Conformance Rate), plus bezwzględne liczby dla obu stron. Jest to celowe:
- Stopnie są dla dashboardów, raportowania dla zarządu i śledzenia trendów. „Zgodność poprawiła się z 72% do 94% w tym kwartale.”
- Liczby są do planowania projektów, szacowania obciążenia i określania zakresu czyszczenia. „Mamy 3400 niezgodnych rekordów do naprawy.”
Używaj stopni do komunikowania postępu. Używaj liczb do planowania pracy.
Referencja metryk
Metryki podstawowe
Te 2 metryki tworzą bazę każdej analizy spójności. Mówią Ci o stopniu zgodności i liczbie pasujących rekordów.
| Metryka | Typ | Co mierzy |
|---|---|---|
| Conformance Rate | Procent | Udział rekordów pasujących do Twoich dozwolonych wartości |
| Conformance Count | Liczba | Liczba rekordów pasujących do Twoich dozwolonych wartości |
Metryki zaawansowane
Te 4 metryki wykraczają poza „czy pasuje?”, aby zapytać „jak wyglądają niepasujące dane?”. Wymagają trybu Advanced Conformance Analysis.
| Metryka | Typ | Co mierzy |
|---|---|---|
| Non-Conforming Count | Liczba | Rekordy z wartościami poza Twoją dozwoloną listą |
| Non-Conformance Rate | Procent | Udział rekordów poza Twoją dozwoloną listą |
| Variant Count | Liczba | Łączna liczba odrębnych wartości znalezionych w polu |
| Dominant Values | Lista | N najczęstszych wartości z liczbami wystąpień |
Pokrycie typów pól
DQS obsługuje sprawdzenia spójności na następujących typach pól Salesforce:
| Typ pola | Skupienie spójności |
|---|---|
| String (Text) | Skróty, pisownia, wielkość liter |
| TextArea | Standaryzacja tekstu dowolnego |
| Picklist | Walidacja rzeczywistych wartości względem oczekiwanych opcji |
| Standaryzacja domen, spójność formatu | |
| Phone | Standaryzacja formatu (kody obszaru, separatory) |
| URL | Spójność protokołu i ścieżki |
Dwa tryby analizy
DQS oferuje dwa tryby analizy spójności:
Conformance Check odpowiada na pytanie: „Czy wartości pól pasują do mojej dozwolonej listy?” Produkuje 2 metryki podstawowe i pokrywa podstawy dla szybkiego audytu zgodności.
Advanced Conformance Analysis idzie głębiej. Produkuje wszystkie 6 metryk, w tym liczby niezgodne, wykrywanie wariantów i rozkład wartości dominujących. Używaj tego trybu, gdy musisz zrozumieć pełny krajobraz fragmentacji wartości, a nie tylko wynik zgodności.
| Potrzeba biznesowa | Rekomendowany tryb |
|---|---|
| Szybki audyt zgodności lub sprawdzenie bazowe | Conformance Check |
| Czyszczenie po migracji danych | Advanced (variant count ujawnia zaimportowany chaos) |
| Ocena gotowości na AI | Advanced (wartości dominujące pokazują, z czego AI będzie się uczyło) |
| Bieżące zarządzanie danymi | Zacznij od Conformance Check, przejdź do Advanced, gdy będziesz gotowy na głębszą analizę |
Konfigurowanie spójności
DQS udostępnia cztery wejścia konfiguracyjne dla spójności. Każde można ustawić na poziomie globalnym (dotyczy wszystkich pól) i nadpisać na poziomie pojedynczego pola.
| Ustawienie | Co kontroluje |
|---|---|
| Expected Values | Lista wartości, które DQS traktuje jako „zgodne”. Każda wartość pola nie na tej liście jest flagowana jako niezgodna. Wymagane: musisz zdefiniować co najmniej jedną wartość przed uruchomieniem skanowania. |
| Case Sensitive | Kontroluje, czy dopasowanie wartości uwzględnia wielkość liter. Gdy wyłączone (domyślnie), „Premium”, „PREMIUM” i „premium” wszystkie pasują do dozwolonej wartości „Premium”. Gdy włączone, liczy się tylko dokładne dopasowanie wielkości liter. |
| Top N | Ile wartości dominujących zwrócić (1 do 100). Kontroluje rozmiar wyjścia Dominant Values. Domyślnie: 5. |
| Min Frequency | Minimalna liczba wystąpień wartości wymaganych do włączenia w wyjście Dominant Values (1 do 1000). Filtruje ultra-rzadkie wartości dodające szum. Domyślnie: 1. |
Wskazówka: Zacznij od użycia Import from Field, aby zobaczyć, jakie wartości rzeczywiście istnieją w Twoich danych, przed zdefiniowaniem listy dozwolonych wartości.
Import from Field: Konfiguracja oparta na odkrywaniu
Typowym wyzwaniem w spójności jest znajomość wartości do oczekiwania. Nie możesz zdefiniować dozwolonych wartości, jeśli nie wiesz, co zawierają Twoje dane.
Import from Field rozwiązuje ten problem. Odpytuje rzeczywiste dane pola, grupuje wartości według częstości i wyświetla wyniki jako listę kontrolną.
Jak to działa:
- Otwórz konfigurację Expected Values.
- Kliknij Import from Field. DQS odpytuje dane na żywo i zwraca odrębne wartości posortowane według częstości.
- Przejrzyj listę kontrolną. Każda wartość pokazuje, ile rekordów ją zawiera.
- Zaznacz wartości, które uważasz za poprawne. Pozostaw niezaznaczone wartości niepoprawne, zniekształcone lub zastępcze.
- Kliknij Add Selected. Zaznaczone wartości wypełniają Twoją listę dozwolonych wartości.
Przykład: Konfigurujesz spójność dla pola Rating__c. Import from Field zwraca:
| Wartość | Rekordy |
|---|---|
| Hot | 284 |
| Warm | 198 |
| Cold | 156 |
| Very High | 23 |
| 240 km/h | 12 |
| N/A | 8 |
Pierwsze trzy wartości to Twoje rzeczywiste oceny. Zaznaczasz je. „Very High” to błąd wprowadzania danych. „240 km/h” to oczywiście dane z niewłaściwego pola. „N/A” to wartość zastępcza. Pozostawiasz je niezaznaczone. Gdy skanowanie się uruchomi, te 43 rekordy pojawią się jako niezgodne, a Twoja lista dozwolonych wartości zostanie zbudowana z tego, co faktycznie zawierają Twoje dane.
Ten przepływ pracy odwraca tradycyjne podejście „zgadnij najpierw, napraw później”. Najpierw odkrywasz, potem definiujesz swój standard.
Typowe problemy ze spójnością
Wariacje kraju i stanu
Najczęstsza niespójność w danych Salesforce. Bez standaryzacji pojedyncze pojęcie takie jak „United States” pojawia się jako 5 lub więcej odrębnych wartości. Raporty się fragmentują. Filtry pomijają rekordy. Reguły terytorialne zawodzą.
Rozwiązanie: Włącz Salesforce State and Country Picklists dla wszystkich pól adresowych. Użyj DQS, aby znaleźć i wyczyścić istniejące niezgodne wartości.
Pola tekstu dowolnego bez zarządzania
Pola tekstowe bez ograniczeń picklisty akumulują wariacje z czasem. Industry, Job Title, Lead Source i Department to częste winowajcy, gdy są zaimplementowane jako tekst dowolny.
Rozwiązanie: Konwertuj wartościowe pola tekstu dowolnego na picklisty. Użyj Import from Field, aby zobaczyć aktualny rozkład wartości przed zdefiniowaniem opcji picklisty.
Wariacje tworzone przez integracje
Systemy zewnętrzne i API zapisują rekordy, które omijają walidację UI Salesforce. Platforma automatyzacji marketingu zapisuje „Info Technology”, podczas gdy Twój standard to „Information Technology”. Te wariacje akumulują się cicho.
Rozwiązanie: Zastosuj reguły mapowania wartości w warstwie integracji. Uruchamiaj okresowe skanowania spójności, aby wychwycić nowe wariacje ze źródeł danych, których nie kontrolujesz.
Niespójności wielkości liter
Użytkownicy wprowadzają „Active”, „active” i „ACTIVE” w różnych rekordach. Z wyłączonym dopasowaniem uwzględniającym wielkość liter, DQS liczy wszystkie trzy jako zgodne. Ale pole nadal zawiera trzy różne pisownie w surowych danych.
Rozwiązanie: Zdecyduj, czy wielkość liter ma znaczenie dla Twojego przypadku użycia. Dla pól wyświetlanych ustandaryzuj wielkość liter przez czyszczenie danych. Dla celów dopasowania wyłącz wrażliwość na wielkość liter w konfiguracji DQS.
Najlepsze praktyki
Definiuj standardy przed skanowaniem
Dokumentuj oczekiwaną wartość dla każdego ograniczonego pola przed uruchomieniem pierwszego skanowania. Bez jasnego standardu nie masz bazy do mierzenia.
| Pole | Standard | Uzasadnienie |
|---|---|---|
| Country | Kody ISO 3166-1 alfa-2 (US, CA, DE) | Standard branżowy, kompaktowy |
| Industry | 15-wartościowa taksonomia niestandardowa | Pasuje do kategorii raportowania |
| Lead Source | 8 źródeł zdefiniowanych przez marketing | Zgodne ze śledzeniem Campaign |
Używaj przepływu odkrywania dla nieznanych pól
Dla pól, gdzie nie masz predefiniowanego standardu, użyj najpierw Import from Field. Pozwól danym powiedzieć Ci, co jest de facto standardem. Wartość o najwyższej częstości jest często odpowiednim wyborem jako Twoja kanoniczna wartość.
Śledź zgodność w czasie
Pojedynczy wynik zgodności to migawka. Śledź wyniki z wielu skanowań, aby wcześnie wykrywać degradację, mierzyć postęp czyszczenia i identyfikować źródła danych wprowadzające nowe wariacje.
Używaj Variant Count jako wczesnego ostrzeżenia
Monitoruj Variant Count między skanowaniami. Pole, które przeskakuje z 12 do 28 odrębnych wartości między skanowaniami, ma nowe źródło wariacji. Zbadaj, zanim problem się skaluje.
Ustalaj priorytety według wpływu biznesowego
Nie każde pole potrzebuje 100% zgodności. Skoncentruj się na polach napędzających raportowanie (Country, Industry), zasilających automatyzację (Status, Stage) lub dostarczających dane do AI i Agentforce.
Następne kroki
Ukończyłeś teraz wszystkie pięć wymiarów jakości danych. Kontynuuj swoją naukę:
- Dalej: Przygotowanie do Agentforce - Poznaj wymagania danych specyficzne dla AI
- Poprzednio: Aktualność - Mierz świeżość i bieżącość danych
- Przegląd: Pięć wymiarów - Przejrzyj wszystkie wymiary razem
- Działanie: Ocena gotowości na AI - Zobacz swoje wyniki spójności i więcej