Comprendere le cinque dimensioni
La qualità dei dati viene misurata attraverso cinque dimensioni chiave. Ogni dimensione risponde a una domanda specifica sui dati e, insieme, determinano se i dati sono idonei allo scopo.
DQS misura tutte e cinque le dimensioni nativamente all’interno di Salesforce.
| Dimensione | Domanda chiave | Esempio di problema |
|---|---|---|
| Completezza | I dati sono presenti? | Indirizzi e-mail mancanti |
| Validità | Il formato è corretto? | Numeri di telefono malformati |
| Unicità | Ogni record è distinto? | Contact duplicati |
| Tempestività | I dati sono aggiornati? | Date obsolete nelle Opportunity |
| Coerenza | I dati sono uniformi? | «USA» vs «United States» |
1. Completezza
La completezza misura se i valori dei dati richiesti sono presenti e non mancanti.
Cosa misura DQS
- Tasso di riempimento: percentuale di record con valori non vuoti
- Rilevamento vuoti: stringhe vuote e valori composti solo da spazi
- Rilevamento segnaposto: valori come «N/A», «TBD» o «Unknown»
Perché la completezza è importante
I dati incompleti interrompono l’automazione. Quando un workflow richiede un indirizzo e-mail che non esiste, il workflow fallisce. Quando un report filtra per Industry ma metà dei record non ha valori per il campo Industry, le analisi mostrano solo una parte del quadro.
Problemi comuni di completezza
| Problema | Esempio | Impatto |
|---|---|---|
| Campi vuoti | Phone del Contact vuoto | Impossibile chiamare i prospect |
| Valori segnaposto | «TBD» nel Company Name | Non valido per la reportistica |
| Solo spazi | « » in Description | Appare compilato ma non lo è |
Suggerimento: Si inizi dai campi più critici. Non è necessaria una completezza del 100% su ogni campo, solo su quelli che contano per il proprio caso d’uso.
2. Validità
La validità misura se i valori dei dati sono conformi ai formati e ai modelli previsti.
Cosa misura DQS
- Validazione del formato: modelli per Email, Phone, URL
- Corrispondenza a modelli: modelli regex personalizzati
- Validazione del dominio: elenchi di valori consentiti
Validità vs accuratezza
Validità e accuratezza sono concetti diversi. Un indirizzo e-mail può essere valido (formato corretto) ma inaccurato (persona sbagliata). DQS misura la validità perché la validazione del formato può essere automatizzata. L’accuratezza richiede una verifica esterna.
| Controllo | Valido? | Accurato? |
|---|---|---|
| [email protected] | Sì | Sconosciuto senza verifica |
| john@company | No | N/D (il formato è errato) |
| [email protected] | Sì | No (la persona ha lasciato l’azienda) |
Problemi comuni di validità in Salesforce
- Indirizzi e-mail senza «@» o dominio
- Numeri di telefono con conteggio di cifre errato
- URL senza protocollo (http/https)
- Testo libero dove sono previsti valori di picklist
3. Unicità
L’unicità misura se i valori dei dati sono distinti e non duplicati.
Cosa misura DQS
- Rilevamento duplicati: corrispondenze esatte tra record
- Conteggio distinti: totale di valori unici per campo
- Analisi dell’entropia: diversità e distribuzione dei valori
Il costo dei duplicati
I record duplicati sprecano spazio di archiviazione, confondono gli utenti e producono metriche gonfiate. Quando il reparto vendite ha due record per la stessa azienda, perde il contesto e rischia imbarazzanti contatti duplicati.
Le ricerche mostrano che:
- I database B2B contengono in media dal 10% al 30% di record duplicati
- Ogni duplicato costa alle organizzazioni in invii e-mail sprecati, reportistica confusa e cronologia cliente frammentata
Prevenzione vs rilevamento dei duplicati
DQS si concentra sul rilevamento, che aiuta a identificare i duplicati già esistenti. La prevenzione (impedire la creazione di duplicati) richiede Validation Rule e regole di corrispondenza nella configurazione di Salesforce.
4. Tempestività
La tempestività misura se i dati sono sufficientemente aggiornati per l’uso previsto.
Cosa misura DQS
- Tasso di freschezza: percentuale di record entro un’età accettabile
- Rilevamento dell’obsolescenza: record che superano la soglia impostata
- Età media: età media dei valori dei campi data
- Rilevamento date future: date non valide nel futuro
Definire le soglie di freschezza
Diversi tipi di dati hanno diversi requisiti di freschezza:
| Tipo di dato | Soglia tipica | Motivazione |
|---|---|---|
| Ultima attività Lead | 30 giorni | I Lead freddi perdono valore |
| Informazioni Contact | 90 giorni | Le persone cambiano lavoro |
| Data di chiusura Opportunity | Trimestre corrente | Accuratezza delle previsioni |
| Fatturato annuale Account | 1 anno | Aggiornamenti annuali previsti |
Perché la tempestività è importante per l’AI
I modelli di AI e ML apprendono dai dati. Quando i dati sono obsoleti, l’AI apprende modelli superati. Agentforce, ad esempio, utilizza i dati di Salesforce per informare le risposte. Informazioni di contatto obsolete portano a raccomandazioni errate.
5. Coerenza
La coerenza misura se i valori dei dati sono uniformi e standardizzati.
Cosa misura DQS
- Tasso di conformità: percentuale corrispondente ai modelli previsti
- Rilevamento delle varianti: diverse rappresentazioni dello stesso valore
- Analisi del valore dominante: valore più comune per campo
Tipi di incoerenza
| Tipo | Esempio | Problema |
|---|---|---|
| Variazione di formato | «USA» vs «United States» vs «US» | Interrompe filtraggio e raggruppamento |
| Variazione ortografica | «Acme Corp» vs «ACME Corporation» | Crea falsi duplicati |
| Variazione di maiuscole/minuscole | «new york» vs «New York» | Appare poco professionale nei report |
Perché la coerenza è importante per l’AI
I modelli di AI trattano «USA» e «United States» come valori diversi. Se i record utilizzano entrambi, l’AI non può raggrupparli correttamente. I dati incoerenti frammentano la comprensione dell’AI e producono output inaffidabili.
Raggiungere la coerenza
- Utilizzare picklist invece del testo libero dove possibile
- Standardizzare su un unico formato per ogni campo
- Importare i valori della picklist durante la configurazione dei controlli di coerenza DQS
Bilanciare le dimensioni
Non ogni dimensione è ugualmente importante per ogni caso d’uso. Si consideri ciò che serve:
| Caso d’uso | Dimensioni prioritarie |
|---|---|
| Campagne di marketing | Completezza, Validità (per la recapitabilità) |
| Previsioni di vendita | Tempestività, Completezza |
| Servizio clienti | Unicità (un’unica fonte di verità) |
| AI/Agentforce | Tutte e cinque, più i controlli di prontezza AI |
Copertura delle dimensioni DQS
DQS misura tutte e cinque le dimensioni con capacità complete:
| Dimensione | Cosa misura DQS |
|---|---|
| Completezza | Tasso di riempimento, rilevamento nulli, rilevamento vuoti, rilevamento segnaposto, logica contestuale |
| Validità | Validazione del formato, modelli regex personalizzati, identificazione record non validi |
| Unicità | Rilevamento duplicati, analisi dell’entropia, distribuzione di frequenza |
| Tempestività | Tasso di freschezza, rilevamento dell’obsolescenza, età media, rilevamento date future |
| Coerenza | Controllo di conformità, scoperta delle varianti, analisi del valore dominante |
Passaggi successivi
Ora che si comprendono le cinque dimensioni:
- Effettuare la Valutazione della prontezza AI per vedere i punteggi attuali
- Leggere la Preparazione per Agentforce per controlli aggiuntivi oltre la qualità dei dati di base
- Scoprire come utilizzare il Definition Builder per configurare la prima scansione