Definire la qualità dei dati
La qualità dei dati misura quanto bene i dati servono lo scopo previsto. Non si tratta di stabilire se i dati siano «corretti» in termini assoluti. Si tratta di stabilire se i dati sono idonei all’uso nel processo decisionale, nelle operazioni e nell’analisi.
Un indirizzo del cliente è di alta qualità se raggiunge il cliente. Un codice prodotto è di alta qualità se i sistemi lo riconoscono. La qualità dipende dal contesto.
Il principio dell’«idoneità allo scopo»
La qualità dei dati è contestuale. Un indirizzo di spedizione necessita di precisione a livello stradale. Una regione di marketing necessita solo del Paese o della regione. Entrambi possono essere «di alta qualità» a diversi livelli di precisione.
Quando si valuta la qualità dei dati, ci si chieda: cosa devono fare questi dati? Poi si misuri se possono farlo.
Il framework delle cinque dimensioni
La qualità dei dati viene misurata attraverso cinque dimensioni chiave. Questo framework è stato adottato in tutti i settori e costituisce la base degli standard ISO 8000 e DAMA.
| Dimensione | Cosa misura | Esempio |
|---|---|---|
| Completezza | I dati richiesti sono presenti | Tutti i campi obbligatori sono compilati |
| Validità | I dati sono conformi ai formati | Gli indirizzi e-mail hanno un formato valido |
| Unicità | Non ci sono record duplicati | Un record per cliente |
| Tempestività | I dati sono aggiornati | Informazioni di contatto aggiornate entro 90 giorni |
| Coerenza | I dati sono uniformi | «USA» utilizzato in modo coerente, non «US» o «United States» |
Ogni dimensione risponde a una domanda specifica sui dati. Insieme forniscono un quadro completo della salute dei dati.
Per una guida dettagliata su ogni dimensione, consultare:
Standard e framework di settore
ISO 8000
Lo standard ISO 8000 definisce i requisiti di qualità dei dati per lo scambio di dati master. Stabilisce i principi per l’accuratezza, la completezza e la coerenza dei dati tra le organizzazioni.
DAMA-DMBOK
Il Body of Knowledge della Data Management Association (DAMA-DMBOK) definisce la qualità dei dati come una delle undici aree di conoscenza nella gestione dei dati. Fornisce indicazioni sui processi di misurazione, monitoraggio e miglioramento.
La regola 1-10-100
Questo principio illustra il costo crescente della scarsa qualità dei dati:
| Fase | Costo | Esempio |
|---|---|---|
| Prevenzione | 1 $ | Validazione all’inserimento dei dati |
| Correzione | 10 $ | Pulizia dei dati dopo l’inserimento |
| Fallimento | 100 $ | Impatto aziendale dei dati errati |
Investire nella qualità dei dati alla fonte consente risparmi significativi a valle.
Qualità dei dati vs concetti correlati
Qualità dei dati vs gestione dei dati
La gestione dei dati è la pratica più ampia di raccolta, archiviazione e manutenzione dei dati. La qualità dei dati è una componente della gestione dei dati, focalizzata specificamente sull’idoneità all’uso.
| Concetto | Ambito | Focus |
|---|---|---|
| Gestione dei dati | Tutte le pratiche sui dati | Archiviazione, accesso, sicurezza, ciclo di vita |
| Qualità dei dati | Idoneità allo scopo | Completezza, validità, unicità, tempestività, coerenza |
| Governance dei dati | Politiche e responsabilità | Chi possiede i dati, chi può modificarli, quali regole si applicano |
Qualità dei dati vs accuratezza dei dati
L’accuratezza chiede: questo valore riflette la realtà? La qualità chiede: questi dati funzionano per il loro scopo?
Un indirizzo e-mail può essere valido (formato corretto) ma inaccurato (la persona non lo utilizza più). DQS misura la qualità perché il formato e la completezza possono essere automatizzati. L’accuratezza richiede tipicamente una verifica esterna.
Come si misura la qualità dei dati
Metriche quantitative
La qualità dei dati si esprime attraverso indicatori misurabili:
| Tipo di metrica | Esempio | Calcolo |
|---|---|---|
| Percentuale | Tasso di riempimento | (Record popolati / Record totali) x 100 |
| Conteggio | Conteggio duplicati | Numero di record con valori corrispondenti |
| Punteggio | Punteggio di validità | Media ponderata delle regole di validazione |
| Rapporto | Tasso di conformità | Valori conformi / Valori totali |
Soglie e obiettivi
Le organizzazioni stabiliscono soglie in base ai requisiti aziendali:
| Livello | Soglia | Caso d’uso |
|---|---|---|
| Critico | 99%+ | Campi di reportistica regolamentare |
| Alto | 95%+ | Dati rivolti al cliente |
| Standard | 85%+ | Dati operativi |
| Basso | 70%+ | Dati storici o di archivio |
Misurazione continua vs puntuale
La misurazione puntuale fornisce un’istantanea. La misurazione continua monitora le tendenze e rileva il degrado precocemente.
DQS supporta entrambi gli approcci:
- Eseguire scansioni ad hoc per una valutazione immediata
- Pianificare scansioni ricorrenti per un monitoraggio continuativo
Perché le organizzazioni hanno difficoltà
1. Silos di dati
Quando i dati risiedono in sistemi disconnessi, le incoerenze si verificano naturalmente. Il reparto vendite ha una versione del record cliente. L’assistenza ne ha un’altra. Nessuno dei due sa quale sia corretta.
2. Errori di inserimento manuale
L’inserimento manuale dei dati è soggetto a errori di battitura, formattazione incoerente e informazioni mancanti. Senza Validation Rule, questi errori si accumulano nel tempo.
3. Nessun responsabile chiaro
Quando nessuno è responsabile della qualità dei dati, diventa un problema di tutti e una priorità di nessuno. La gestione dei dati richiede un’assegnazione esplicita.
4. Mancanza di misurazione
Non si può migliorare ciò che non si misura. Molte organizzazioni presumono che i loro dati siano sufficientemente buoni senza stabilire riferimenti di base o monitorare le metriche.
5. Progetti di pulizia una tantum
Trattare la qualità dei dati come un progetto anziché come un processo porta a miglioramenti temporanei che si degradano nel tempo.
L’impatto aziendale
La scarsa qualità dei dati colpisce ogni funzione:
| Funzione | Impatto |
|---|---|
| Marketing | Campagne inviate a indirizzi errati, spesa sprecata |
| Vendite | Tempo sprecato su Lead duplicati, contesto perso |
| Finanza | Report inaccurati, rischi di conformità |
| Operazioni | Decisioni basate su dati errati |
| AI/ML | Modelli addestrati su dati errati producono output errati |
Quantificare il costo
Le ricerche del MIT Sloan e gli studi di settore mostrano che:
- Le organizzazioni perdono dal 15% al 25% del fatturato annuo a causa della scarsa qualità dei dati
- Oltre il 25% delle organizzazioni perde più di 5 milioni di dollari all’anno per problemi di dati (IBM 2025)
- I dipendenti dedicano fino al 27% del loro tempo a correggere dati errati
Connessione con la prontezza AI
La qualità dei dati tradizionale (le cinque dimensioni) prepara i dati per la reportistica e l’automazione. Le applicazioni AI come Agentforce dipendono dalle stesse fondamenta: record completi, formati validi, valori coerenti, dati aggiornati e nessun duplicato.
Oltre alle cinque dimensioni, il deployment dell’AI introduce un’ulteriore preoccupazione: l’esposizione di dati sensibili. Prima di collegare agenti AI ai dati di Salesforce, è necessario sapere dove risiedono i dati PII per poterli mascherare o escludere.
DQS misura sia la qualità dei dati tradizionale che la prontezza AI in un’unica piattaforma:
- Cinque dimensioni della qualità dei dati: completezza, validità, unicità, tempestività, coerenza
- Rilevamento PII: scansione dei campi di testo alla ricerca di dati sensibili (codici fiscali, carte di credito, informazioni personali) prima dell’esposizione all’AI
Costruire una pratica di qualità dei dati
Una qualità dei dati efficace richiede tre elementi:
1. Misurazione
Stabilire riferimenti di base prima del miglioramento. Conoscere la propria posizione in ogni dimensione e campo.
2. Processo
Definire flussi di lavoro per la manutenzione continuativa dei dati:
- Validation Rule per l’inserimento dati
- Pianificazioni regolari di pulizia
- Procedure di escalation dei problemi
- Protocolli di gestione del cambiamento
3. Cultura
Costruire un impegno a livello organizzativo:
- Assegnare responsabili dei dati per ogni dominio
- Includere la qualità dei dati nelle metriche di performance
- Celebrare i miglioramenti e condividere i successi
- Rendere la qualità visibile attraverso le dashboard
Iniziare con DQS
DQS fornisce le fondamenta di misurazione per la pratica di qualità dei dati:
- Selezionare le capacità: scegliere quali dimensioni misurare
- Definire l’ambito: selezionare gli oggetti e i campi da analizzare
- Configurare le soglie: impostare gli standard di qualità
- Eseguire le scansioni: avviare l’analisi sui dati
- Esaminare i risultati: identificare i problemi e assegnare le priorità
Il primo passo è comprendere lo stato attuale. Effettuare la Valutazione della prontezza AI per valutare la maturità della qualità dei dati in 3 minuti.
Passaggi successivi
- Approfondire la Completezza, la prima dimensione
- Leggere Le cinque dimensioni per una panoramica completa
- Scoprire la Preparazione per Agentforce per i requisiti specifici dell’AI
- Effettuare la Valutazione della prontezza AI per vedere i punteggi attuali