PII 탐지: 구성 시나리오

이 시나리오가 다루는 내용

이 페이지는 DQS PII 탐지의 세 가지 실제 구성을 안내합니다. 각 시나리오는 특정 스캔 요구를 다루고, 사용할 정확한 설정을 보여주며, 결과를 읽는 방법을 설명합니다.

이 워크스루는 주요 PII 탐지 문서의 개념을 기반으로 합니다. PII 탐지 패턴, 사전 설정 또는 진단 흐름이 새로운 경우 먼저 그것을 읽으십시오.

시나리오 1: Case 코멘트에 대한 사전 AI 감사

비즈니스 맥락

귀사는 Service Cloud에서 Agentforce를 출시하고 있습니다. Case 데이터를 AI에 연결하기 전에 컴플라이언스 팀이 PII 노출 보고서를 요구합니다. PII가 있는지와 얼마나 광범위한지 알기 위해 Case 자유 텍스트 필드 (Description, Internal Comments)를 스캔해야 합니다.

구성

PII 탐지 분석 모드와 Standard 사전 설정을 사용하십시오. 이렇게 하면 두 가지 메트릭인 수와 노출률을 모두 얻을 수 있습니다.

설정	값	이유
사전 설정	Standard (SSN, 신용카드, 이메일, US 전화)	높은 오탐 패턴의 노이즈 없이 네 가지 가장 일반적인 PII 유형을 커버
분석 모드	PII 탐지 분석	컴플라이언스 보고서에 PII가 있는 레코드 (수)와 PII 노출률 (백분율) 모두 필요
필드	Description (LongTextArea), Internal_Comments__c (LongTextArea)	에이전트가 고객 커뮤니케이션을 붙여넣는 자유 텍스트 필드

샘플 결과 (Description 필드)

메트릭	값
PII가 있는 레코드	1,247
PII 노출률	15.6%

스캔된 전체 Case 레코드: 8,000.

결과 읽기

PII 노출률부터 시작하십시오: 15.6%. 약 6개의 Case 설명 중 1개가 PII를 포함합니다. 이것은 AI 처리에 합리적인 임계값을 초과합니다.

PII가 있는 레코드는 정리 범위를 제공합니다: 1,247개 case를 검토해야 합니다. 이 숫자는 컴플라이언스 팀에게 해결 노력의 규모를 알려줍니다.

Standard 사전 설정은 SSN, 신용카드, 이메일, US 전화를 스캔합니다. Description 필드의 높은 일치 항목은 이메일 주소 (에이전트가 고객 이메일 붙여넣기)와 전화번호 (콜백 세부 사항)에서 발생할 가능성이 높습니다. SSN 및 신용카드 일치 항목이 컴플라이언스 중요 발견 사항입니다.

PII 유형별로 노출을 세분화하려면 개별 패턴이 활성화된 별도의 스캔을 실행하십시오. 먼저 SSN + 신용카드만으로 스캔하여 (Critical 사전 설정) 고심각도 발견 사항을 격리하십시오. 그런 다음 전체 Standard 스캔과 비교하여 노출이 연락처 정보 vs 금융 PII에 얼마나 해당하는지 확인하십시오.

다음 조치

컴플라이언스 팀에 두 가지 숫자를 제시하십시오: 영향받은 1,247개 레코드, 15.6% 노출률. SSN/신용카드 하위 집합이 0이 아니라면 이러한 레코드는 AI 배포 전에 해결이 필요합니다. 이메일 및 전화 일치 항목은 정책 결정이 필요합니다: 이러한 PII 유형이 AI 맥락에서 허용됩니까, 아니면 마스킹도 필요합니까?

시나리오 2: Lead에 대한 금융 컴플라이언스 빠른 확인

비즈니스 맥락

데이터팀이 50,000개의 Lead 레코드를 새로운 마케팅 자동화 플랫폼으로 마이그레이션하고 있습니다. 벤더의 DPA (데이터 처리 계약)는 SSN 또는 신용카드 번호 전송을 금지합니다. 빠른 예/아니오 답변이 필요합니다: Lead 데이터에 금융 PII가 포함되어 있습니까?

구성

Critical 사전 설정과 PII 스캔 모드를 사용하십시오. 두 가지 패턴, 빠른 스캔, 수만 출력합니다.

설정	값	이유
사전 설정	Critical (SSN, 신용카드)	두 가지 패턴만. 금융 PII를 위한 최소 스캔. 오탐률 거의 0.
분석 모드	PII 스캔	백분율이 아닌 수가 필요. 진행/중단 결정을 위한 빠른 스캔.
필드	Description (LongTextArea), Notes__c (TextArea), Company (String)	금융 PII가 나타날 수 있는 자유 텍스트 필드

샘플 결과 (Description 필드)

메트릭	값
PII가 있는 레코드	23

스캔된 전체 Lead 레코드: 50,000.

결과 읽기

50,000개 중 23개 레코드. SSN 패턴 (NNN-NN-NNNN)과 신용카드 패턴 (13-16자리 시퀀스)이 23개 Lead 설명에서 일치 항목을 찾았습니다.

작은 숫자이지만 DPA로 관리되는 마이그레이션의 경우 단 하나의 레코드도 중요합니다. 이 23개 레코드는 내보내기 전에 수동 검토가 필요합니다.

일부 일치 항목은 오탐일 수 있습니다, 특히 신용카드 패턴에서. Lead 설명의 긴 숫자 시퀀스 (추적 번호, 송장 ID)가 13-16자리 정규식을 트리거할 수 있습니다. 23개 레코드를 검토하여 확인된 PII와 오탐을 분리하십시오.

Notes__c 및 Company 필드도 일치 항목을 보인다면 이러한 항목도 검토 목록에 추가하십시오. Company 필드 (String 유형)는 짧은 텍스트이므로 신용카드 패턴의 오탐이 덜 가능하지만 여전히 가능합니다.

다음 조치

수동 검토를 위해 23개 레코드를 가져오십시오. 실제 SSN 또는 신용카드 번호 vs 오탐을 확인하십시오. 확인된 PII를 해결하십시오: 삭제, 마스킹 또는 내보내기에서 제외. 해결 후 스캔을 다시 실행하여 0개 일치를 확인하십시오. 벤더의 DPA 컴플라이언스 파일을 위해 깨끗한 스캔 결과를 문서화하십시오.

시나리오 3: 지원 조직을 위한 필드별 재정의 전략

비즈니스 맥락

지원 조직에는 Case 및 Contact 오브젝트에 걸쳐 6개의 텍스트 필드가 있습니다. 각 필드는 다른 PII 위험 특성을 가집니다. 단일 전역 패턴 세트는 일부 필드에서 너무 많은 오탐을 생성하고 다른 필드에서는 위험을 놓칩니다. 필드별 패턴 구성이 필요합니다.

구성

전역 기준선으로 시작한 다음 필드별로 재정의하십시오.

전역 구성:

설정	값	이유
사전 설정	Standard (SSN, 신용카드, 이메일, US 전화)	대부분의 필드에 적합한 기본값
분석 모드	PII 탐지 분석	분기별 거버넌스 보고서에 노출률 필요

필드별 재정의:

필드	오브젝트	유형	재정의 패턴	근거
Email	Contact	Email	SSN, 신용카드만	Email 필드에는 설계상 이메일 주소가 포함됩니다. 이메일 패턴을 스캔하면 100% 일치가 생성됩니다. 이 필드에 속하지 않는 금융 PII만 스캔하십시오.
Description	Case	LongTextArea	Extended (전체 8개)	무엇이든 나타날 수 있는 자유 텍스트. 에이전트가 전체 고객 커뮤니케이션을 붙여넣습니다. 가장 넓은 범위를 사용하십시오.
Subject	Case	String	Critical (SSN, 신용카드)	짧은 텍스트 필드. DOB와 같은 패턴에 대한 높은 오탐 위험. 두 가지 최고 심각도 유형만 스캔하십시오.
Internal_Comments__c	Case	LongTextArea	Standard (4개 패턴)	전역 기본값 유지. 내부 코멘트는 중간 PII 위험이 있습니다.
Phone	Contact	Phone	SSN, 신용카드만	Phone 필드에는 설계상 전화번호가 포함됩니다. Email과 같은 논리: 속하지 않는 PII 유형만 스캔하십시오.
Notes__c	Contact	TextArea	Standard + IP 주소	Notes 필드는 기본값에 IP 주소를 추가합니다. 지원 contact는 때때로 notes에 서버/네트워크 정보를 포함합니다.

샘플 결과

필드	PII가 있는 레코드	PII 노출률
Email (Contact)	3	0.04%
Description (Case)	1,847	23.1%
Subject (Case)	0	해당 없음
Internal_Comments__c (Case)	412	5.2%
Phone (Contact)	0	해당 없음
Notes__c (Contact)	89	2.8%

결과 읽기

Email 필드: 3개 레코드, 0.04%. 세 개의 Contact 이메일 필드에 SSN 또는 신용카드 패턴과 일치하는 내용이 있습니다. 이것은 예상치 못한 것이며 조사할 가치가 있습니다. 누군가가 이메일 필드에 SSN을 넣은 데이터 입력 오류일 가능성이 높습니다.

Description 필드: 1,847개 레코드, 23.1%. Case 설명의 거의 4분의 1에 PII가 포함됩니다. Extended 사전 설정이 모든 것을 포착합니다. 에이전트가 고객 커뮤니케이션을 붙여넣는 자유 텍스트 필드에서 높은 수는 예상됩니다. 이 필드가 해결의 최우선 목표입니다.

Subject 필드: 0개 레코드. 깨끗합니다. 짧은 텍스트 필드의 Critical 사전 설정은 노이즈 없이 0개를 생성합니다.

Internal Comments: 412개 레코드, 5.2%. 중간 노출. Standard 사전 설정은 DOB 오탐의 노이즈 없이 일반적인 패턴을 포착합니다. 412개 레코드는 관리 가능한 검토 범위입니다.

Phone 필드: 0개 레코드. 깨끗합니다. 전화 필드에 SSN 또는 신용카드가 없습니다.

Notes 필드: 89개 레코드, 2.8%. 낮은 노출. IP 주소 패턴 추가가 notes에서 일부 일치를 포착했습니다. 이것들이 지원 직원이 붙여넣은 서버 구성의 실제 IP 주소인지 검토하십시오.

다음 조치

먼저 Description 필드 해결에 집중하십시오 (가장 높은 노출). 필드별 결과를 사용하여 우선순위를 정하십시오: Description (23.1%) > Internal Comments (5.2%) > Notes (2.8%) > Email (0.04%). Subject 및 Phone 필드는 깨끗합니다.

분기별로 이 스캔을 실행하십시오. 필드별 재정의가 유지되므로 이후의 각 스캔은 동일한 타겟 구성을 사용합니다.

구성 선택

필요한 것…	시작점	핵심 설정
AI 프로젝트 전 PII 감사 실행	Standard 사전 설정, PII 탐지 분석	두 메트릭 모두 컴플라이언스 보고서를 위한 수 + 노출률 제공
데이터 마이그레이션 전 금융 PII 확인	Critical 사전 설정, PII 스캔	두 가지 패턴, 빠른 스캔, 오탐 거의 없음
첫 번째 감사를 위한 탐지 커버리지 극대화	Extended 사전 설정, PII 탐지 분석	8가지 패턴 모두. 더 높은 오탐률이지만 놓치는 것 없음.
오탐을 줄이기 위해 필드별 탐지 조정	Standard 전역 + 필드별 재정의	예상 내용 패턴 제거 (Email 필드의 이메일, Phone 필드의 전화)
특정 PII 유형에 대한 타겟 컴플라이언스 확인	커스텀 패턴 세트, PII 스캔	컴플라이언스 프레임워크에 관련된 특정 패턴만 활성화

8가지 탐지 패턴, 세 가지 사전 설정, 진단 흐름 작동 방식에 대한 전체 참조는 주요 PII 탐지 문서로 돌아가십시오.

PII 탐지가 더 넓은 AI 준비성 그림에 어떻게 맞는지 보려면 AI 준비성 평가를 받으십시오.