이 시나리오가 다루는 내용
이 페이지는 DQS 유효성 분석의 세 가지 실제 구성을 안내합니다. 각 시나리오는 특정 비즈니스 문제를 다루고, 사용할 정확한 설정을 보여주며, 결과를 읽는 방법을 설명합니다.
이 워크스루는 주요 유효성 문서의 개념을 기반으로 합니다. 유효성 메트릭, 진단 흐름, 또는 패턴 구성이 새로운 경우 먼저 그것을 읽으십시오.
시나리오 1: 사용자 정의 텍스트 필드의 보조 이메일 유효성 검사
문제
조직이 Contact 오브젝트의 사용자 정의 Secondary_Email__c 텍스트 필드에 보조 이메일 주소를 저장합니다. 표준 Salesforce Email 필드와 달리 텍스트 필드에는 내장 형식 유효성 검사가 없습니다. 사용자들이 무엇이든 붙여넣고, 입력하고, 가져옵니다. 마케팅은 재참여 캠페인에 이 보조 주소를 사용하려 하지만 아무도 얼마나 많은 것이 구조적으로 유효한지 알지 못합니다. 마케팅이 현실적인 캠페인 예측을 설정하고 운영팀이 정리 범위를 결정하기 위한 구체적인 숫자가 필요합니다.
왜 표준 Email 필드가 아닌가? Salesforce의 기본 Email 필드 유형은 입력 시 형식을 유효성 검사합니다. 표준 Email 필드의 값은 이미 기본 형식 확인을 통과합니다. DQS 이메일 유효성 검사는 Salesforce의 내장 적용 없이 이메일 주소를 저장하는 사용자 정의 텍스트 필드에 유용합니다.
구성
Secondary_Email__c 필드를 대상으로 Contact 오브젝트에서 형식 유효성 검사 모드를 사용하십시오. 헤드라인 유효성 비율과 사용 가능한 레코드 수가 필요합니다. 자리 표시자 탐지와 노이즈 분석은 여기서 관련이 없습니다. 이메일 주소는 형식에 맞거나 맞지 않습니다.
| 설정 | 값 | 이유 |
|---|---|---|
| 분석 모드 | 형식 유효성 검사 | 전체 유효하지 않은 분류가 아닌 일치율과 유효한 수가 필요 |
| 패턴 유형 | 이메일 | 내장 패턴: ^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$ |
| 공백 포함 | 끄기 | 빈 이메일은 완전성 문제이지 유효성 문제가 아닙니다. 이 분석에서 제외하십시오. |
| 대소문자 구분 | 끄기 | 이메일 주소는 정의상 대소문자를 구분하지 않습니다 |
이메일 패턴은 내장 사전 설정입니다. 정규식을 작성할 필요가 없습니다. 패턴 선택기에서 “이메일”을 선택하면 정규식이 자동으로 적용됩니다.
샘플 결과
| 메트릭 | 값 |
|---|---|
| 유효성 비율 | 71% |
| 유효한 수 | 35,500 |
평가된 전체 Contact 레코드: 50,000.
결과 읽기
헤드라인부터 시작하십시오: 71% 유효성. 즉, 보조 이메일 주소의 29%가 형식 확인에 실패합니다. 입력된 Secondary_Email__c를 가진 50,000개의 Contact 중 35,500개만 구조적으로 유효한 주소를 가집니다.
실제에서 29% 유효하지 않음의 모습: ”@” 기호가 없는 값 (john.company.com), 도메인 확장자가 없는 값 (john@company), 이중 점이 포함된 값 ([email protected]), 공백이 포함된 값 (john @company.com). 텍스트 필드이기 때문에 Salesforce가 입력 시 모두 수락했습니다. 이 주소로 전송되는 모든 캠페인이 반송됩니다.
캠페인 수학이 바뀝니다. 마케팅은 50,000개의 보조 주소를 기반으로 재참여 도달 범위를 예측해 왔습니다. 실제 도달 가능한 청중은 35,500개입니다. 오픈율, 클릭율, 전환 예측은 모두 부풀려진 합계가 아닌 유효한 기반을 기준으로 재계산되어야 합니다.
여기서 형식 유효성 검사로 충분한 이유. 이 시나리오에서는 고급 모드가 필요하지 않습니다. 질문이 간단합니다: “얼마나 많은 보조 이메일이 유효한 형식과 일치합니까?” 유효성 비율과 유효한 수가 그 질문에 답합니다. 나중에 정확한 유효하지 않은 수를 가진 정리 프로젝트의 범위를 정해야 한다면 전체 분류를 위해 고급 형식 유효성 검사로 전환하십시오.
다음에 할 일
캠페인 계획을 위한 실제 도달 가능한 청중으로 유효한 수 (35,500)를 사용하십시오. 나머지 14,500개 레코드에 대한 정리 프로젝트의 범위를 정하십시오: 내보내고, 가장 일반적인 형식 오류를 식별하고, 데이터 보강 또는 수동 수정을 통해 수정하십시오. 향후 항목에 이메일 형식을 적용하기 위해 Secondary_Email__c에 Salesforce 유효성 검사 규칙을 추가하거나 프로세스가 허용한다면 필드를 Email 유형으로 변환하는 것을 고려하십시오.
시나리오 2: 고정 길이를 사용한 제품 코드 유효성 검사
문제
귀사는 Opportunity Product 오브젝트의 사용자 정의 Product_Code__c 필드에 8자리 제품 코드를 사용합니다. 이 코드들이 재고 조회, 가격 규칙, ERP 통합을 구동합니다. ERP 동기화가 매주 약 5%의 레코드에서 실패하고 있으며 통합팀은 잘못 형성된 제품 코드를 의심합니다. 형식 확인에 실패하는 코드가 얼마나 되는지 확인하고 정리 범위를 정확하게 파악해야 합니다.
구성
Product_Code__c 필드를 대상으로 Opportunity Product 오브젝트에서 고급 형식 유효성 검사 모드를 사용하십시오. 통합팀이 해결 프로젝트를 위한 정확한 레코드 수를 갖기 위해 전체 유효/유효하지 않은 분류가 필요합니다.
| 설정 | 값 | 이유 |
|---|---|---|
| 분석 모드 | 고급 형식 유효성 검사 | 정리 범위를 결정하기 위해 유효하지 않은 수가 필요하며, 정크 항목을 확인하기 위해 노이즈 비율도 필요 |
| 패턴 유형 | 고정 길이 | 제품 코드는 항상 정확히 8자리 |
| 고정 길이 | 8 | 표준 코드 길이 |
| 공백 포함 | 켜기 | 빈 제품 코드는 ERP 동기화에 유효하지 않습니다. 실패로 계산하십시오. |
| 대소문자 구분 | 끄기 | 제품 코드는 시스템에서 대소문자에 의존하지 않음 |
고정 길이 패턴은 정규식 ^.{8}$를 자동으로 생성합니다. 정확히 8자리가 아닌 모든 값은 유효성 검사에 실패합니다.
샘플 결과
기본 메트릭:
| 메트릭 | 값 |
|---|---|
| 유효성 비율 | 94.2% |
| 유효한 수 | 9,420 |
고급 메트릭:
| 메트릭 | 값 |
|---|---|
| 유효하지 않은 비율 | 5.8% |
| 유효하지 않은 수 | 580 |
| 노이즈 비율 | 0.4% |
| 노이즈 레코드 수 | 40 |
평가된 전체 레코드: 10,000.
결과 읽기
5.8% 유효하지 않음이 통합팀의 추정을 확인합니다. 10,000개 중 580개의 제품 코드가 8자리 형식과 일치하지 않습니다. 이것들이 ERP 동기화를 깨는 레코드입니다.
유효하지 않은 수 (580)가 정리 범위입니다. 통합팀에게 이제 구체적인 숫자가 있습니다. 각 동기화 실패를 개별적으로 조사하는 대신 580개 레코드를 가져와 형식 오류를 범주화하고 일괄 수정할 수 있습니다. 제품 코드 필드의 일반적인 문제에는 잘린 코드 (복사-붙여넣기 오류로 인한 5-7자리), 후행 공백이 있는 코드 (보이지 않는 공백으로 인한 9자리), 사용자가 추가한 대시나 접두사가 있는 코드 (“PC-12345678”)가 포함됩니다.
노이즈 비율 (0.4%)은 낮지만 주목할 가치가 있습니다. 40개 레코드에 노이즈 패턴이 포함됩니다: 반복 문자 (“XXXXXXXX”), 키보드 항목 (“asdfghjk”), 또는 특수 문자 문자열. 이 40개 레코드는 형식 오류가 아닙니다. 길이 확인을 통과하는 정크 항목입니다. 유효성 비율이 그것들을 유효로 계산했지만 다른 이유로 ERP 조회에 실패할 쓰레기 데이터입니다. 노이즈 비율이 형식 확인이 놓치는 것을 포착합니다.
공백 포함 켜기가 여기서 중요합니다. 공백 포함이 활성화되면 Product_Code__c가 비어 있는 모든 레코드가 유효하지 않은 것으로 계산됩니다. 이 설정을 끄면 해당 빈 레코드가 평가에서 완전히 제외되고 유효하지 않은 수가 실제 ERP 동기화 실패 수보다 낮아질 것입니다. 빈 제품 코드가 잘못 형성된 코드와 같은 방식으로 통합을 깨기 때문에 공백을 포함하면 정확한 실패 범위를 얻을 수 있습니다.
다음에 할 일
통합팀을 위해 580개의 유효하지 않은 레코드를 내보내십시오. 오류를 유형별로 범주화하십시오: 잘린 코드, 추가 문자, 후행 공백. 데이터 업데이트 작업을 사용하여 일괄 수정하십시오. 40개의 노이즈 레코드에 대해서는 소스를 조사하십시오. 특정 가져오기 또는 사용자에서 발생했다면 해당 근본 원인을 해결하십시오. 정리 후 새로운 나쁜 항목을 방지하기 위해 Product_Code__c에 8자리 길이를 적용하는 Salesforce 유효성 검사 규칙을 추가하십시오. 새로운 유효성 비율을 확인하기 위해 재스캔하십시오.
시나리오 3: Web-to-Lead 회사 이름 노이즈 탐지
문제
Web-to-Lead 양식이 Company 필드를 필수로 요구합니다. Lead 볼륨이 강합니다: 분기당 20,000개의 새로운 lead. 하지만 SDR 팀은 많은 lead에 쓰레기 회사 이름이 있다고 보고합니다, “asdf”, “test”, “xxx”, 또는 “na na na”와 같은 항목. 이 lead들은 SDR 시간을 낭비하고 세분화를 오염시킵니다. 기본 완전성 확인은 lead의 98%에 Company 값이 있음을 보여줍니다. 98%가 기술적으로 “입력된” 정크 항목으로 오해를 불러일으킨다고 의심합니다.
구성
Company 필드를 대상으로 Lead 오브젝트에서 고급 형식 유효성 검사 모드를 사용하십시오. 건강한 완전성 점수 뒤에 숨어 있는 쓰레기를 정량화하기 위해 노이즈 비율이 필요합니다.
형식 패턴의 경우 회사 이름에 엄격한 형식 규칙이 없습니다. 회사 이름은 자유 텍스트입니다. 값에 최소한 하나의 영숫자 문자가 포함되어 있는지 확인하기 위해 최소 텍스트 유효성 검사를 사용하십시오.
| 설정 | 값 | 이유 |
|---|---|---|
| 분석 모드 | 고급 형식 유효성 검사 | 정크 항목을 정량화하기 위해 노이즈 비율 및 노이즈 레코드 수가 필요 |
| 패턴 유형 | 사용자 정의 | 내장 패턴이 자유 텍스트 회사 이름에 맞지 않음 |
| 사용자 정의 패턴 | ^.*[a-zA-Z0-9].*$ | 최소한 하나의 문자 또는 숫자를 포함하는 모든 값을 일치시킵니다. 순수 특수 문자만 있는 값을 포착합니다. |
| 공백 포함 | 켜기 | 빈 회사 이름도 문제입니다. 실패 수에 포함하십시오. |
| 대소문자 구분 | 끄기 | 이 패턴과 관련이 없지만 기본값으로 끄기 상태로 두십시오 |
이 스캔의 진정한 가치는 형식 유효성 검사가 아닌 노이즈 메트릭에 있습니다. 사용자 정의 패턴은 의도적으로 느슨합니다. 특정 회사 이름 형식을 적용하는 것이 아니기 때문입니다. 노이즈 비율 및 노이즈 레코드 수에 액세스하기 위해 고급 모드에서 스캔을 실행하고 있습니다.
샘플 결과
기본 메트릭:
| 메트릭 | 값 |
|---|---|
| 유효성 비율 | 97.5% |
| 유효한 수 | 19,500 |
고급 메트릭:
| 메트릭 | 값 |
|---|---|
| 유효하지 않은 비율 | 2.5% |
| 유효하지 않은 수 | 500 |
| 노이즈 비율 | 12% |
| 노이즈 레코드 수 | 2,400 |
평가된 전체 Lead 레코드: 20,000.
결과 읽기
97.5% 유효성은 예상되며 요점이 아닙니다. 패턴이 하나의 영숫자 문자만 필요하기 때문에 거의 모든 값이 느슨한 형식 확인을 통과합니다. 500개의 유효하지 않은 레코드는 특수 문자나 공백만 있는 항목, ”---”, ”…”, 또는 ”!!!”와 같은 값입니다. 이것들은 쉽게 식별하고 삭제할 수 있습니다.
노이즈 비율 (12%)이 진짜 발견입니다. 2,400개 lead에 노이즈 패턴을 포함하는 회사 이름이 있습니다. 반복 문자 (“aaaa”, “xxxxx”), 연속 특수 문자 (”!@#$%”), 또는 제어 문자가 있는 항목입니다. 영숫자 문자가 포함되어 있기 때문에 형식 확인을 통과하지만 값이 쓰레기입니다.
진정한 데이터 품질 그림:
| 범주 | 레코드 | 의미 |
|---|---|---|
| 깨끗하고 유효함 | 17,100 | SDR 아웃리치를 위한 실제 회사 이름 |
| 유효하지 않음 (순수 정크) | 500 | 영숫자 내용 전혀 없음. 삭제 또는 격리. |
| 노이즈 (숨겨진 정크) | 2,400 | 입력된 것처럼 보이지만 쓰레기 포함. 수동 검토 또는 자동 플래그. |
SDR 팀이 맞습니다: lead 품질 문제는 실제입니다. 20,000개 lead 중 2,900개 (14.5%)가 사용할 수 없는 회사 데이터를 가지고 있습니다. 즉, SDR 시간의 14.5%가 제대로 라우팅, 보강 또는 세분화될 수 없는 lead에 낭비됩니다.
완전성 vs 유효성 격차. 완전성은 lead의 98%에 Company 값이 있다고 말합니다. 유효성은 97.5%가 형식 확인을 통과한다고 말합니다. 노이즈 비율은 통과 값의 12%가 쓰레기라고 말합니다. 각 차원은 문제의 다른 계층을 보여줍니다. 완전성만으로는 노이즈 비율이 포착하는 정크를 놓칩니다.
다음에 할 일
2,900개의 유효하지 않은 레코드와 노이즈 레코드의 결합된 정리 대기열을 구축하십시오. 500개의 순수 유효하지 않은 레코드의 경우 자동 삭제 또는 격리하십시오. 2,400개의 노이즈 레코드의 경우 결정하십시오: 다른 유용한 데이터가 없는 lead를 자동 삭제하거나 전화 또는 이메일 데이터가 여전히 사용 가능한 경우 수동 검토를 위해 플래그하십시오.
소스를 수정하십시오. 정크가 웹 양식에서 오고 있습니다. 클라이언트 측 유효성 검사를 추가하십시오: 최소 문자 길이, 반복 문자 패턴 차단, 봇 방지를 위한 CAPTCHA 고려. 양식 변경 구현 후 다음 분기에 스캔을 다시 실행하고 이 기준선과 노이즈 비율을 비교하십시오.
구성 선택
이 표를 사용하여 유효성 분석에 맞는 시작점을 선택하십시오.
| 필요한 것… | 시작점 | 핵심 설정 |
|---|---|---|
| 사용자 정의 텍스트 필드의 이메일 형식 확인 | 형식 유효성 검사 | 패턴 유형: 이메일, 공백 포함: 끄기 |
| 고정 길이 코드 유효성 검사 (제품 코드, SKU, 우편 번호) | 고급 형식 유효성 검사 | 패턴 유형: 고정 길이, 문자 수 설정, 공백 포함: 켜기 |
| 웹 사이트 필드의 URL 형식 유효성 검사 | 형식 유효성 검사 | 패턴 유형: URL, 공백 포함: 끄기 |
| 사용자 정의 비즈니스 형식 (정규식) 적용 | 고급 형식 유효성 검사 | 패턴 유형: 사용자 정의, 정규식 패턴 입력 |
| 자유 텍스트 필드에서 정크 및 노이즈 탐지 | 고급 형식 유효성 검사 | 느슨한 형식 패턴 사용, 노이즈 비율 및 노이즈 레코드 수에 집중 |
| 통합을 위한 데이터 정리 프로젝트 범위 결정 | 고급 형식 유효성 검사 | 공백 포함: 켜기, 프로젝트 규모 결정을 위해 유효하지 않은 수 및 노이즈 레코드 수 사용 |
6가지 유효성 메트릭, 패턴 유형, 노이즈 탐지 세부 사항에 대한 전체 참조는 주요 유효성 문서로 돌아가십시오.
자체 데이터 품질을 측정할 준비가 되었습니까? 유효성 점수 및 그 이상을 보려면 AI 준비성 평가를 받으십시오.