Skip to main content

Wykrywanie PII: scenariusze konfiguracji

Trzy praktyczne przewodniki pokazujące, jak skonfigurować wykrywanie PII w DQS dla różnych potrzeb skanowania.

Co obejmują te scenariusze

Ta strona przeprowadza przez trzy rzeczywiste konfiguracje wykrywania PII w DQS. Każdy scenariusz dotyczy konkretnej potrzeby skanowania, pokazuje dokładne ustawienia i wyjaśnia, jak czytać wyniki.

Te przewodniki bazują na koncepcjach z głównego artykułu Wykrywanie PII. Przeczytaj go najpierw, jeśli dopiero poznajesz wzorce wykrywania PII, presety lub przepływ diagnostyczny.

Scenariusz 1: audyt przed AI na komentarzach do Case

Kontekst biznesowy

Twoja firma wdraża Agentforce w Service Cloud. Przed połączeniem danych Case z AI zespół compliance wymaga raportu narażenia na PII. Musisz przeskanować swobodne pola tekstowe Case (Description, Internal Comments), aby wiedzieć, czy PII jest obecne i jak rozległe.

Konfiguracja

Użyj presetu Standard z trybem PII Detection Analysis. Daje to obie metryki: liczbę i wskaźnik narażenia.

UstawienieWartośćDlaczego
PresetStandard (SSN, Credit Card, Email, US Phone)Obejmuje cztery najczęstsze typy PII bez szumu z wysokich FP
Analysis ModePII Detection AnalysisPotrzebujesz zarówno Records with PII (liczba), jak i PII Exposure Rate (procent) do raportu compliance
FieldsDescription (LongTextArea), Internal_Comments__c (LongTextArea)Pola swobodnego tekstu, gdzie agenci wklejają komunikację z klientami

Przykładowe wyniki (dla pola Description)

MetrykaWartość
Records with PII1 247
PII Exposure Rate15,6%

Łącznie przeskanowanych rekordów Case: 8 000.

Jak czytać wyniki

Zacznij od PII Exposure Rate: 15,6%. Mniej więcej 1 na 6 opisów Case zawiera PII. To powyżej jakiegokolwiek rozsądnego progu dla przetwarzania AI.

Records with PII daje zakres oczyszczania: 1 247 spraw wymaga przeglądu. Ta liczba mówi zespołowi compliance, jak duży jest wysiłek remediacyjny.

Preset Standard skanuje pod kątem SSN, Credit Card, Email i US Phone. Wysokie dopasowania na polu Description prawdopodobnie pochodzą z adresów e-mail (agenci wklejający e-maile klientów) i numerów telefonów (szczegóły oddzwonienia). Dopasowania SSN i kart kredytowych to krytyczne dla compliance ustalenia.

Aby rozbić narażenie według typu PII, uruchom oddzielne skany z włączonymi pojedynczymi wzorcami. Najpierw przeskanuj tylko z SSN + Credit Card (preset Critical), aby wyizolować ustalenia o wysokiej istotności. Następnie porównaj z pełnym skanem Standard, aby zobaczyć, ile narażenia to informacje kontaktowe vs finansowe PII.

Następna akcja

Przedstaw zespołowi compliance dwie liczby: 1 247 rekordów dotkniętych, 15,6% narażenia. Jeśli podzbiór SSN/karty kredytowe jest niezerowy, te rekordy wymagają remediacji przed wdrożeniem AI. Dopasowania e-mail i telefonów wymagają decyzji politycznej: czy te typy PII są akceptowalne w kontekście AI, czy też one również wymagają maskowania?


Scenariusz 2: szybka kontrola finansowego compliance na rekordach Lead

Kontekst biznesowy

Twój zespół danych migruje 50 000 rekordów Lead do nowej platformy marketing automation. DPA (Data Processing Agreement) dostawcy zabrania przekazywania numerów SSN ani kart kredytowych. Potrzebujesz szybkiej odpowiedzi tak/nie: czy dane Lead zawierają finansowe PII?

Konfiguracja

Użyj presetu Critical z trybem PII Scan. Dwa wzorce, szybki skan, wyjście tylko z liczbą.

UstawienieWartośćDlaczego
PresetCritical (SSN, Credit Card)Tylko dwa wzorce. Minimalny skan dla finansowych PII. Bliski zero wskaźnik FP.
Analysis ModePII ScanPotrzebujesz liczby, nie procentu. Szybki skan dla decyzji go/no-go.
FieldsDescription (LongTextArea), Notes__c (TextArea), Company (String)Pola swobodnego tekstu, gdzie może pojawić się finansowe PII

Przykładowe wyniki (dla pola Description)

MetrykaWartość
Records with PII23

Łącznie przeskanowanych rekordów Lead: 50 000.

Jak czytać wyniki

23 rekordy z 50 000. Wzorzec SSN (NNN-NN-NNNN) i wzorzec karty kredytowej (sekwencje 13-16 cyfr) znalazły dopasowania w 23 opisach Lead.

To mała liczba, ale dla migracji objętej DPA nawet jeden rekord ma znaczenie. Te 23 rekordy wymagają ręcznego przeglądu przed eksportem.

Niektóre dopasowania są prawdopodobnie fałszywie dodatnie, zwłaszcza ze wzorca karty kredytowej. Długie sekwencje numeryczne w opisach Lead (numery śledzenia, identyfikatory faktur) mogą wyzwalać regex 13-16 cyfr. Przejrzyj 23 rekordy, aby oddzielić potwierdzone PII od fałszywych dopasowań.

Jeśli pola Notes__c i Company również pokazują dopasowania, dodaj je do listy przeglądu. Pole Company (typ String) to krótki tekst, więc fałszywe dopasowania ze wzorca karty kredytowej są mniej prawdopodobne, ale wciąż możliwe.

Następna akcja

Pobierz 23 rekordy do ręcznego przeglądu. Potwierdź, które są rzeczywistymi SSN lub numerami kart kredytowych vs fałszywe dopasowania. Usuń potwierdzone PII: skasuj, zamaskuj lub wyklucz z eksportu. Uruchom skan ponownie po remediacji, aby zweryfikować zero dopasowań. Udokumentuj czysty wynik skanu do pliku compliance DPA dostawcy.


Scenariusz 3: strategia nadpisań per-field dla organizacji wsparcia

Kontekst biznesowy

Twoja organizacja wsparcia ma 6 pól tekstowych w obiektach Case i Contact. Każde pole ma inne cechy ryzyka PII. Jeden globalny zestaw wzorców produkuje zbyt wiele fałszywych dopasowań w niektórych polach, a w innych pomija ryzyko. Potrzebujesz konfiguracji wzorców specyficznych dla pola.

Konfiguracja

Zacznij od globalnej bazy, a następnie nadpisuj per-field.

Konfiguracja globalna:

UstawienieWartośćDlaczego
PresetStandard (SSN, Credit Card, Email, US Phone)Rozsądny domyślny wybór dla większości pól
Analysis ModePII Detection AnalysisWskaźniki narażenia potrzebne do kwartalnego raportu governance

Nadpisania per-field:

PoleObiektTypNadpisane wzorceUzasadnienie
EmailContactEmailTylko SSN, Credit CardPole Email z założenia zawiera adresy e-mail. Skanowanie wzorcem e-mail daje 100% dopasowań. Skanuj tylko pod kątem finansowego PII, które nie powinno się tu znaleźć.
DescriptionCaseLongTextAreaExtended (wszystkie 8)Swobodny tekst, gdzie może pojawić się wszystko. Agenci wklejają pełne komunikacje klientów. Użyj najszerszej sieci.
SubjectCaseStringCritical (SSN, Credit Card)Krótkie pole tekstowe. Wysokie ryzyko FP dla wzorców jak DOB. Skanuj tylko dwa typy o najwyższej istotności.
Internal_Comments__cCaseLongTextAreaStandard (4 wzorce)Zachowaj globalny domyślny. Wewnętrzne komentarze mają umiarkowane ryzyko PII.
PhoneContactPhoneTylko SSN, Credit CardPole Phone z założenia zawiera numery telefonów. Ta sama logika co Email: skanuj tylko pod kątem typów PII, które tu nie powinny się znaleźć.
Notes__cContactTextAreaStandard + IP AddressPole Notes dostaje domyślny plus IP Address. Kontakty wsparcia czasem zawierają informacje o serwerach/sieci w notatkach.

Przykładowe wyniki

PoleRecords with PIIPII Exposure Rate
Email (Contact)30,04%
Description (Case)1 84723,1%
Subject (Case)0n/d
Internal_Comments__c (Case)4125,2%
Phone (Contact)0n/d
Notes__c (Contact)892,8%

Jak czytać wyniki

Pole Email: 3 rekordy, 0,04%. Trzy pola e-mail Contact zawierają coś pasującego do wzorca SSN lub karty kredytowej. To nieoczekiwane i warto zbadać. Prawdopodobnie błąd wprowadzania danych, gdzie ktoś wpisał SSN w polu e-mail.

Pole Description: 1 847 rekordów, 23,1%. Prawie jedna czwarta opisów Case zawiera PII. Preset Extended wyłapuje wszystko. Wysoka liczba jest oczekiwana dla pola swobodnego tekstu, gdzie agenci wklejają komunikację z klientami. To pole jest twoim celem remediacji o najwyższym priorytecie.

Pole Subject: 0 rekordów. Czyste. Preset Critical w krótkim polu tekstowym produkuje zero szumu.

Internal Comments: 412 rekordów, 5,2%. Umiarkowane narażenie. Preset Standard wyłapuje typowe wzorce bez szumu FP z DOB. 412 rekordów to możliwy do ogarnięcia zakres przeglądu.

Pole Phone: 0 rekordów. Czyste. Brak SSN ani kart kredytowych w polu telefonu.

Pole Notes: 89 rekordów, 2,8%. Niskie narażenie. Dodanie wzorca IP Address wyłapało kilka dopasowań w notatkach. Sprawdź, czy to rzeczywiste adresy IP z konfiguracji serwerów wklejone przez personel wsparcia.

Następna akcja

Skup remediację najpierw na polu Description (najwyższe narażenie). Użyj wyników per-field do priorytetyzacji: Description (23,1%) > Internal Comments (5,2%) > Notes (2,8%) > Email (0,04%). Pola Subject i Phone są czyste.

Uruchamiaj ten skan kwartalnie. Nadpisania per-field pozostają, więc każdy kolejny skan używa tej samej ukierunkowanej konfiguracji.


Wybór konfiguracji

Jeśli potrzebujesz…Zacznij odKluczowe ustawienia
Przeprowadzić audyt PII przed projektem AIPreset Standard, PII Detection AnalysisObie metryki dają liczbę + wskaźnik narażenia do raportów compliance
Sprawdzić finansowe PII przed migracją danychPreset Critical, PII ScanDwa wzorce, szybki skan, bliski zero FP
Zmaksymalizować pokrycie wykrywania w pierwszym audyciePreset Extended, PII Detection AnalysisWszystkie 8 wzorców. Wyższy wskaźnik FP, ale nic nie zostanie pominięte.
Dostroić wykrywanie per-field, aby zmniejszyć FPGlobalny Standard + nadpisania per-fieldUsuń wzorce treści oczekiwanej (e-mail w polach Email, telefon w polach Phone)
Przeprowadzić ukierunkowaną kontrolę compliance dla konkretnych typów PIIWłasny zestaw wzorców, PII ScanWłącz tylko konkretne wzorce istotne dla twojego ramienia compliance

Pełna referencja wszystkich 8 wzorców wykrywania, trzech presetów i sposobu działania przepływu diagnostycznego — wróć do głównego artykułu Wykrywanie PII.

Aby zobaczyć, jak wykrywanie PII wpisuje się w szerszy obraz gotowości na AI, wykonaj AI Readiness Assessment.