Cosa coprono questi scenari
Questa pagina illustra tre configurazioni reali di coerenza, dalla configurazione iniziale alla lettura dei risultati della scansione. Ogni scenario utilizza un contesto aziendale e una modalita di analisi diversi.
Questi scenari si basano sui concetti e sulle metriche trattati nell’articolo principale sulla Coerenza. Si consiglia di leggerlo prima se termini come Conformance Rate, Variant Count e Dominant Values sono nuovi.
Scenario 1: standardizzazione del campo Country con Discovery
Il contesto aziendale
L’organizzazione dispone di 15.000 record Account provenienti da 3 aziende fuse. Il campo Country e testo libero. Le dashboard regionali mostrano dati frammentati: «United States» appare come una riga, «USA» come un’altra, «US» come una terza. Le regole di assegnazione del territorio perdono record perche filtrano per una singola grafia. E necessario standardizzare, ma non si sa quali valori esistano nei tre sistemi legacy.
Guida alla configurazione
Iniziare con Import from Field per scoprire cosa contengono effettivamente i dati prima di definire i valori consentiti.
- Aprire la configurazione Expected Values per il campo
Country. - Fare clic su Import from Field. DQS interroga i dati live e restituisce i valori distinti ordinati per frequenza.
- Esaminare la checklist. L’importazione rivela il quadro completo:
| Valore | Record |
|---|---|
| United States | 4.500 |
| USA | 2.300 |
| US | 1.800 |
| Canada | 1.400 |
| U.S.A. | 450 |
| United States of America | 150 |
| … (altre 41 variazioni) | … |
- Decidere lo standard. I codici paese ISO («US», «CA», «UK») sono compatti, standard di settore e non ambigui. Selezionare i codici ISO dall’elenco di importazione.
- Fare clic su Add Selected per popolare i valori consentiti.
Impostare la configurazione rimanente:
| Impostazione | Valore | Motivazione |
|---|---|---|
| Analysis Mode | Advanced Conformance Analysis | Servono i conteggi delle varianti e i valori dominanti per dimensionare il cleanup |
| Expected Values | US, CA, UK, DE, FR, AU, JP | Codici ISO per i mercati attivi |
| Case Sensitive | OFF | Intercetta «us», «Us» e «US» come lo stesso valore |
| Top N | 10 | Visualizza le variazioni piu comuni |
| Min Frequency | 5 | Filtra i refusi occasionali |
Cosa produce la scansione
| Metrica | Valore |
|---|---|
| Conformance Rate | 12% |
| Conformance Count | 1.800 |
| Non-Conforming Count | 13.200 |
| Variant Count | 47 |
| Dominant Values | I primi 10 valori con conteggi (vedere la tabella di importazione sopra) |
Lettura dei risultati
Il 12% di conformita e atteso. E stato definito un nuovo standard (codici ISO) a cui i dati non sono mai stati normalizzati. Solo i 1.800 record che contengono gia «US» corrispondono. Non si tratta di un punteggio negativo. E il punto di partenza.
47 varianti rivelano l’entita della frammentazione. Tre sistemi fusi hanno prodotto 47 modi diversi di esprimere i nomi dei paesi. Senza questo numero, si sottostimerebbe l’impegno di cleanup.
Dominant Values mostra dove concentrarsi. Le prime 3 variazioni («United States», «USA», «US») rappresentano 8.600 record. Standardizzare solo questi tre valori porta la conformita dal 12% al 69%. Partire da li.
Non-Conforming Count (13.200) e l’ambito esatto del cleanup. Il data steward dispone ora di una dimensione concreta del progetto, non di una stima.
Azione successiva
Costruire una tabella di mappatura dei valori utilizzando l’output dei Dominant Values. Mappare «United States» a «US», «USA» a «US» e cosi via. Eseguire la normalizzazione dei dati. Eseguire una nuova scansione per verificare il nuovo Conformance Rate.
Scenario 2: validazione del Lead Rating
Il contesto aziendale
Il campo Lead Rating (Rating__c) e un campo di testo che accetta «Hot», «Warm» o «Cold». I sales manager segnalano valori anomali nei report della pipeline. Un filtro per Rating = "Hot" restituisce meno record del previsto. Serve un audit rapido di conformita per scoprire cosa contiene il campo e quanti record necessitano di cleanup.
Guida alla configurazione
Iniziare con Import from Field per visualizzare i valori effettivi prima di configurare la scansione.
- Aprire la configurazione Expected Values per
Rating__c. - Fare clic su Import from Field. L’importazione restituisce:
| Valore | Record |
|---|---|
| Hot | 284 |
| Warm | 198 |
| Cold | 156 |
| Very High | 23 |
| 240 km/h | 12 |
| N/A | 8 |
I primi tre valori sono le valutazioni reali. «Very High» proviene da una picklist diversa (qualcuno ha incollato dal campo sbagliato). «240 km/h» e chiaramente un dato dal campo completamente sbagliato. «N/A» e un segnaposto.
- Selezionare «Hot», «Warm» e «Cold». Lasciare il resto deselezionato.
- Fare clic su Add Selected.
Impostare la configurazione rimanente:
| Impostazione | Valore | Motivazione |
|---|---|---|
| Analysis Mode | Conformance Check | Serve una risposta si/no, non un’analisi approfondita |
| Expected Values | Hot, Warm, Cold | Le tre valutazioni valide |
| Case Sensitive | OFF | Intercetta «hot», «HOT» e «Hot» come corrispondenti |
Cosa produce la scansione
| Metrica | Valore |
|---|---|
| Conformance Rate | 93,7% |
| Conformance Count | 638 |
Lettura dei risultati
Il 93,7% e conforme. Cio significa che 43 record contengono dati errati. Per un audit rapido, la modalita Conformance Check fornisce la risposta velocemente senza calcolare metriche avanzate.
Il passaggio Import from Field ha gia mostrato l’aspetto dei dati errati. «Very High» (23 record da un valore di picklist sbagliato), «240 km/h» (12 record con dati dal campo sbagliato) e «N/A» (8 voci segnaposto). Non servono i Dominant Values perche l’importazione ha fornito la suddivisione prima ancora dell’esecuzione della scansione.
43 record sono un cleanup gestibile. Non si tratta di un progetto di migrazione dati. E una correzione manuale di 30 minuti o un singolo job di aggiornamento dati.
Azione successiva
Correggere i 43 record non conformi. Quindi convertire Rating__c da campo di testo a picklist per prevenire problemi futuri. I record creati via API bypassano la validazione delle picklist, quindi eseguire scansioni periodiche di coerenza per intercettare nuove variazioni dalle integrazioni.
Scenario 3: conformita del Job Title per il targeting delle Persona
Il contesto aziendale
Il team marketing esegue campagne basate sulle Persona, rivolgendosi ai Contact con titolo «VP e superiori». Il campo Title e testo libero con migliaia di variazioni. Prima di ogni campagna, qualcuno cerca manualmente le parole chiave dei titoli, ne perde la meta e costruisce un elenco di audience incompleto. Il team necessita di una risposta basata sui dati a due domande: «Quanti contatti VP+ abbiamo?» e «Quali titoli hanno gli altri nostri contatti?»
Guida alla configurazione
- Aprire la configurazione Expected Values per il campo
Titlesui Contact. - Fare clic su Import from Field. L’importazione restituisce centinaia di valori. Troppi per controllarli singolarmente, ma i conteggi di frequenza sono utili per il contesto.
- Definire i valori consentiti in base alla mappatura delle Persona. Selezionare o digitare i valori dei titoli che il team considera «VP e superiori»:
VP, Vice President, SVP, Senior Vice President, EVP,
Executive Vice President, Director, Senior Director,
CEO, CFO, CTO, CIO, CMO, COO, President
- Fare clic su Add Selected.
Impostare la configurazione rimanente:
| Impostazione | Valore | Motivazione |
|---|---|---|
| Analysis Mode | Advanced Conformance Analysis | Serve la distribuzione completa dei valori per vedere quali titoli esistono |
| Expected Values | (16 valori di titolo elencati sopra) | La definizione della Persona VP+ |
| Case Sensitive | OFF | Intercetta «vp of sales», «VP of Sales», «VP OF SALES» |
| Top N | 20 | Visualizza un’ampia distribuzione di cio che esiste |
| Min Frequency | 5 | Filtra le voci occasionali come «Chief Happiness Officer» |
Cosa produce la scansione
| Metrica | Valore |
|---|---|
| Conformance Rate | 34% |
| Conformance Count | 3.400 |
| Non-Conforming Count | 6.600 |
| Variant Count | 312 |
Dominant Values (Top 20):
| Posizione | Valore | Conteggio |
|---|---|---|
| 1 | Manager | 820 |
| 2 | Sales Representative | 650 |
| 3 | Account Executive | 480 |
| 4 | Director of Marketing | 340 |
| 5 | VP of Sales | 290 |
| 6 | Senior Manager | 275 |
| 7 | Consultant | 240 |
| 8 | Engineer | 210 |
| 9 | CEO | 195 |
| 10 | Head of Operations | 180 |
| … | (altri 10) | … |
Lettura dei risultati
Il 34% di conformita non e un insuccesso. Non si tratta di un problema di qualita dei dati. Significa che il 34% dei Contact ha titoli VP+, e quello e il pubblico target della campagna. Il numero risponde alla domanda che il team marketing stava stimando a occhio.
312 Variant Count conferma che il Title in testo libero e altamente frammentato. 312 valori distinti di titolo su 10.000 Contact. Questo e normale per i campi a testo libero e spiega perche le ricerche manuali perdono persone.
Dominant Values mostra quali titoli hanno effettivamente i Contact. Molti dei valori in cima sono sotto il livello VP (Manager, Sales Rep, Account Executive). Questo e atteso. Questi contatti sono record validi con titoli validi. Rientrano al di fuori della Persona target.
Non-Conforming Count (6.600) NON e un ambito di cleanup. A differenza dello scenario Country, questi non sono record sporchi. Sono contatti con titoli al di fuori del filtro VP+. «Manager» e un titolo reale, non un errore nei dati. Trattare il Non-Conforming Count come «contatti al di fuori di questa Persona», non «record da correggere».
Il vero insight: ora si dispone di una dimensione dell’audience basata sui dati. 3.400 contatti VP+, verificati tramite la scansione dei dati reali. Niente piu ricerche manuali per parola chiave.
Azione successiva
Utilizzare il Conformance Count (3.400) come dimensione dell’audience per le campagne VP+. Esaminare l’elenco dei Dominant Values per i titoli eventualmente mancanti. «Senior Manager» (275 record) e «Head of Operations» (180 record) sono al limite. Se questi ruoli sono idonei per le campagne, aggiungerli ai valori consentiti e ripetere la scansione.
Scelta della configurazione
| Se e necessario… | Partire da | Impostazioni chiave |
|---|---|---|
| Verificare un campo controllato (picklist, rating, stato) | Import from Field, poi Conformance Check | Expected Values dall’importazione, Case Sensitive OFF |
| Standardizzare un campo frammentato (paese, settore) | Import from Field, poi Advanced Conformance Analysis | Expected Values come standard obiettivo, Top N 10+, Min Frequency 5+ |
| Dimensionare un’audience o un segmento da dati a testo libero | Import from Field, poi Advanced Conformance Analysis | Expected Values come definizione del segmento, Top N 20, Min Frequency 5 |
| Ottenere una baseline rapida prima di un progetto di cleanup | Import from Field, poi Conformance Check | Expected Values dal proprio standard dati |
Per una spiegazione completa di tutte le 6 metriche di coerenza, le modalita di analisi e gli input di configurazione, tornare all’articolo principale sulla Coerenza.
Pronti a misurare la qualita dei propri dati? Effettuare la Valutazione di preparazione all’IA per vedere i punteggi di coerenza e altro ancora.