Wykrywanie PII: scenariusze konfiguracji

Co obejmują te scenariusze

Ta strona przeprowadza przez trzy rzeczywiste konfiguracje wykrywania PII w DQS. Każdy scenariusz dotyczy konkretnej potrzeby skanowania, pokazuje dokładne ustawienia i wyjaśnia, jak czytać wyniki.

Te przewodniki bazują na koncepcjach z głównego artykułu Wykrywanie PII. Przeczytaj go najpierw, jeśli dopiero poznajesz wzorce wykrywania PII, presety lub przepływ diagnostyczny.

Scenariusz 1: audyt przed AI na komentarzach do Case

Kontekst biznesowy

Twoja firma wdraża Agentforce w Service Cloud. Przed połączeniem danych Case z AI zespół compliance wymaga raportu narażenia na PII. Musisz przeskanować swobodne pola tekstowe Case (Description, Internal Comments), aby wiedzieć, czy PII jest obecne i jak rozległe.

Konfiguracja

Użyj presetu Standard z trybem PII Detection Analysis. Daje to obie metryki: liczbę i wskaźnik narażenia.

Ustawienie	Wartość	Dlaczego
Preset	Standard (SSN, Credit Card, Email, US Phone)	Obejmuje cztery najczęstsze typy PII bez szumu z wysokich FP
Analysis Mode	PII Detection Analysis	Potrzebujesz zarówno Records with PII (liczba), jak i PII Exposure Rate (procent) do raportu compliance
Fields	Description (LongTextArea), Internal_Comments__c (LongTextArea)	Pola swobodnego tekstu, gdzie agenci wklejają komunikację z klientami

Przykładowe wyniki (dla pola Description)

Metryka	Wartość
Records with PII	1 247
PII Exposure Rate	15,6%

Łącznie przeskanowanych rekordów Case: 8 000.

Jak czytać wyniki

Zacznij od PII Exposure Rate: 15,6%. Mniej więcej 1 na 6 opisów Case zawiera PII. To powyżej jakiegokolwiek rozsądnego progu dla przetwarzania AI.

Records with PII daje zakres oczyszczania: 1 247 spraw wymaga przeglądu. Ta liczba mówi zespołowi compliance, jak duży jest wysiłek remediacyjny.

Preset Standard skanuje pod kątem SSN, Credit Card, Email i US Phone. Wysokie dopasowania na polu Description prawdopodobnie pochodzą z adresów e-mail (agenci wklejający e-maile klientów) i numerów telefonów (szczegóły oddzwonienia). Dopasowania SSN i kart kredytowych to krytyczne dla compliance ustalenia.

Aby rozbić narażenie według typu PII, uruchom oddzielne skany z włączonymi pojedynczymi wzorcami. Najpierw przeskanuj tylko z SSN + Credit Card (preset Critical), aby wyizolować ustalenia o wysokiej istotności. Następnie porównaj z pełnym skanem Standard, aby zobaczyć, ile narażenia to informacje kontaktowe vs finansowe PII.

Następna akcja

Przedstaw zespołowi compliance dwie liczby: 1 247 rekordów dotkniętych, 15,6% narażenia. Jeśli podzbiór SSN/karty kredytowe jest niezerowy, te rekordy wymagają remediacji przed wdrożeniem AI. Dopasowania e-mail i telefonów wymagają decyzji politycznej: czy te typy PII są akceptowalne w kontekście AI, czy też one również wymagają maskowania?

Scenariusz 2: szybka kontrola finansowego compliance na rekordach Lead

Kontekst biznesowy

Twój zespół danych migruje 50 000 rekordów Lead do nowej platformy marketing automation. DPA (Data Processing Agreement) dostawcy zabrania przekazywania numerów SSN ani kart kredytowych. Potrzebujesz szybkiej odpowiedzi tak/nie: czy dane Lead zawierają finansowe PII?

Konfiguracja

Użyj presetu Critical z trybem PII Scan. Dwa wzorce, szybki skan, wyjście tylko z liczbą.

Ustawienie	Wartość	Dlaczego
Preset	Critical (SSN, Credit Card)	Tylko dwa wzorce. Minimalny skan dla finansowych PII. Bliski zero wskaźnik FP.
Analysis Mode	PII Scan	Potrzebujesz liczby, nie procentu. Szybki skan dla decyzji go/no-go.
Fields	Description (LongTextArea), Notes__c (TextArea), Company (String)	Pola swobodnego tekstu, gdzie może pojawić się finansowe PII

Przykładowe wyniki (dla pola Description)

Metryka	Wartość
Records with PII	23

Łącznie przeskanowanych rekordów Lead: 50 000.

Jak czytać wyniki

23 rekordy z 50 000. Wzorzec SSN (NNN-NN-NNNN) i wzorzec karty kredytowej (sekwencje 13-16 cyfr) znalazły dopasowania w 23 opisach Lead.

To mała liczba, ale dla migracji objętej DPA nawet jeden rekord ma znaczenie. Te 23 rekordy wymagają ręcznego przeglądu przed eksportem.

Niektóre dopasowania są prawdopodobnie fałszywie dodatnie, zwłaszcza ze wzorca karty kredytowej. Długie sekwencje numeryczne w opisach Lead (numery śledzenia, identyfikatory faktur) mogą wyzwalać regex 13-16 cyfr. Przejrzyj 23 rekordy, aby oddzielić potwierdzone PII od fałszywych dopasowań.

Jeśli pola Notes__c i Company również pokazują dopasowania, dodaj je do listy przeglądu. Pole Company (typ String) to krótki tekst, więc fałszywe dopasowania ze wzorca karty kredytowej są mniej prawdopodobne, ale wciąż możliwe.

Następna akcja

Pobierz 23 rekordy do ręcznego przeglądu. Potwierdź, które są rzeczywistymi SSN lub numerami kart kredytowych vs fałszywe dopasowania. Usuń potwierdzone PII: skasuj, zamaskuj lub wyklucz z eksportu. Uruchom skan ponownie po remediacji, aby zweryfikować zero dopasowań. Udokumentuj czysty wynik skanu do pliku compliance DPA dostawcy.

Scenariusz 3: strategia nadpisań per-field dla organizacji wsparcia

Kontekst biznesowy

Twoja organizacja wsparcia ma 6 pól tekstowych w obiektach Case i Contact. Każde pole ma inne cechy ryzyka PII. Jeden globalny zestaw wzorców produkuje zbyt wiele fałszywych dopasowań w niektórych polach, a w innych pomija ryzyko. Potrzebujesz konfiguracji wzorców specyficznych dla pola.

Konfiguracja

Zacznij od globalnej bazy, a następnie nadpisuj per-field.

Konfiguracja globalna:

Ustawienie	Wartość	Dlaczego
Preset	Standard (SSN, Credit Card, Email, US Phone)	Rozsądny domyślny wybór dla większości pól
Analysis Mode	PII Detection Analysis	Wskaźniki narażenia potrzebne do kwartalnego raportu governance

Nadpisania per-field:

Pole	Obiekt	Typ	Nadpisane wzorce	Uzasadnienie
Email	Contact	Email	Tylko SSN, Credit Card	Pole Email z założenia zawiera adresy e-mail. Skanowanie wzorcem e-mail daje 100% dopasowań. Skanuj tylko pod kątem finansowego PII, które nie powinno się tu znaleźć.
Description	Case	LongTextArea	Extended (wszystkie 8)	Swobodny tekst, gdzie może pojawić się wszystko. Agenci wklejają pełne komunikacje klientów. Użyj najszerszej sieci.
Subject	Case	String	Critical (SSN, Credit Card)	Krótkie pole tekstowe. Wysokie ryzyko FP dla wzorców jak DOB. Skanuj tylko dwa typy o najwyższej istotności.
Internal_Comments__c	Case	LongTextArea	Standard (4 wzorce)	Zachowaj globalny domyślny. Wewnętrzne komentarze mają umiarkowane ryzyko PII.
Phone	Contact	Phone	Tylko SSN, Credit Card	Pole Phone z założenia zawiera numery telefonów. Ta sama logika co Email: skanuj tylko pod kątem typów PII, które tu nie powinny się znaleźć.
Notes__c	Contact	TextArea	Standard + IP Address	Pole Notes dostaje domyślny plus IP Address. Kontakty wsparcia czasem zawierają informacje o serwerach/sieci w notatkach.

Przykładowe wyniki

Pole	Records with PII	PII Exposure Rate
Email (Contact)	3	0,04%
Description (Case)	1 847	23,1%
Subject (Case)	0	n/d
Internal_Comments__c (Case)	412	5,2%
Phone (Contact)	0	n/d
Notes__c (Contact)	89	2,8%

Jak czytać wyniki

Pole Email: 3 rekordy, 0,04%. Trzy pola e-mail Contact zawierają coś pasującego do wzorca SSN lub karty kredytowej. To nieoczekiwane i warto zbadać. Prawdopodobnie błąd wprowadzania danych, gdzie ktoś wpisał SSN w polu e-mail.

Pole Description: 1 847 rekordów, 23,1%. Prawie jedna czwarta opisów Case zawiera PII. Preset Extended wyłapuje wszystko. Wysoka liczba jest oczekiwana dla pola swobodnego tekstu, gdzie agenci wklejają komunikację z klientami. To pole jest twoim celem remediacji o najwyższym priorytecie.

Pole Subject: 0 rekordów. Czyste. Preset Critical w krótkim polu tekstowym produkuje zero szumu.

Internal Comments: 412 rekordów, 5,2%. Umiarkowane narażenie. Preset Standard wyłapuje typowe wzorce bez szumu FP z DOB. 412 rekordów to możliwy do ogarnięcia zakres przeglądu.

Pole Phone: 0 rekordów. Czyste. Brak SSN ani kart kredytowych w polu telefonu.

Pole Notes: 89 rekordów, 2,8%. Niskie narażenie. Dodanie wzorca IP Address wyłapało kilka dopasowań w notatkach. Sprawdź, czy to rzeczywiste adresy IP z konfiguracji serwerów wklejone przez personel wsparcia.

Następna akcja

Skup remediację najpierw na polu Description (najwyższe narażenie). Użyj wyników per-field do priorytetyzacji: Description (23,1%) > Internal Comments (5,2%) > Notes (2,8%) > Email (0,04%). Pola Subject i Phone są czyste.

Uruchamiaj ten skan kwartalnie. Nadpisania per-field pozostają, więc każdy kolejny skan używa tej samej ukierunkowanej konfiguracji.

Wybór konfiguracji

Jeśli potrzebujesz…	Zacznij od	Kluczowe ustawienia
Przeprowadzić audyt PII przed projektem AI	Preset Standard, PII Detection Analysis	Obie metryki dają liczbę + wskaźnik narażenia do raportów compliance
Sprawdzić finansowe PII przed migracją danych	Preset Critical, PII Scan	Dwa wzorce, szybki skan, bliski zero FP
Zmaksymalizować pokrycie wykrywania w pierwszym audycie	Preset Extended, PII Detection Analysis	Wszystkie 8 wzorców. Wyższy wskaźnik FP, ale nic nie zostanie pominięte.
Dostroić wykrywanie per-field, aby zmniejszyć FP	Globalny Standard + nadpisania per-field	Usuń wzorce treści oczekiwanej (e-mail w polach Email, telefon w polach Phone)
Przeprowadzić ukierunkowaną kontrolę compliance dla konkretnych typów PII	Własny zestaw wzorców, PII Scan	Włącz tylko konkretne wzorce istotne dla twojego ramienia compliance

Pełna referencja wszystkich 8 wzorców wykrywania, trzech presetów i sposobu działania przepływu diagnostycznego — wróć do głównego artykułu Wykrywanie PII.

Aby zobaczyć, jak wykrywanie PII wpisuje się w szerszy obraz gotowości na AI, wykonaj AI Readiness Assessment.