Skip to main content

Le cinque dimensioni della qualità dei dati

Le cinque dimensioni misurate da DQS: completezza, validità, unicità, tempestività e coerenza.

Comprendere le cinque dimensioni

La qualità dei dati viene misurata attraverso cinque dimensioni chiave. Ogni dimensione risponde a una domanda specifica sui dati e, insieme, determinano se i dati sono idonei allo scopo.

DQS misura tutte e cinque le dimensioni nativamente all’interno di Salesforce.

DimensioneDomanda chiaveEsempio di problema
CompletezzaI dati sono presenti?Indirizzi e-mail mancanti
ValiditàIl formato è corretto?Numeri di telefono malformati
UnicitàOgni record è distinto?Contact duplicati
TempestivitàI dati sono aggiornati?Date obsolete nelle Opportunity
CoerenzaI dati sono uniformi?«USA» vs «United States»

1. Completezza

La completezza misura se i valori dei dati richiesti sono presenti e non mancanti.

Cosa misura DQS

  • Tasso di riempimento: percentuale di record con valori non vuoti
  • Rilevamento vuoti: stringhe vuote e valori composti solo da spazi
  • Rilevamento segnaposto: valori come «N/A», «TBD» o «Unknown»

Perché la completezza è importante

I dati incompleti interrompono l’automazione. Quando un workflow richiede un indirizzo e-mail che non esiste, il workflow fallisce. Quando un report filtra per Industry ma metà dei record non ha valori per il campo Industry, le analisi mostrano solo una parte del quadro.

Problemi comuni di completezza

ProblemaEsempioImpatto
Campi vuotiPhone del Contact vuotoImpossibile chiamare i prospect
Valori segnaposto«TBD» nel Company NameNon valido per la reportistica
Solo spazi« » in DescriptionAppare compilato ma non lo è

Suggerimento: Si inizi dai campi più critici. Non è necessaria una completezza del 100% su ogni campo, solo su quelli che contano per il proprio caso d’uso.

2. Validità

La validità misura se i valori dei dati sono conformi ai formati e ai modelli previsti.

Cosa misura DQS

  • Validazione del formato: modelli per Email, Phone, URL
  • Corrispondenza a modelli: modelli regex personalizzati
  • Validazione del dominio: elenchi di valori consentiti

Validità vs accuratezza

Validità e accuratezza sono concetti diversi. Un indirizzo e-mail può essere valido (formato corretto) ma inaccurato (persona sbagliata). DQS misura la validità perché la validazione del formato può essere automatizzata. L’accuratezza richiede una verifica esterna.

ControlloValido?Accurato?
[email protected]Sconosciuto senza verifica
john@companyNoN/D (il formato è errato)
[email protected]No (la persona ha lasciato l’azienda)

Problemi comuni di validità in Salesforce

  • Indirizzi e-mail senza «@» o dominio
  • Numeri di telefono con conteggio di cifre errato
  • URL senza protocollo (http/https)
  • Testo libero dove sono previsti valori di picklist

3. Unicità

L’unicità misura se i valori dei dati sono distinti e non duplicati.

Cosa misura DQS

  • Rilevamento duplicati: corrispondenze esatte tra record
  • Conteggio distinti: totale di valori unici per campo
  • Analisi dell’entropia: diversità e distribuzione dei valori

Il costo dei duplicati

I record duplicati sprecano spazio di archiviazione, confondono gli utenti e producono metriche gonfiate. Quando il reparto vendite ha due record per la stessa azienda, perde il contesto e rischia imbarazzanti contatti duplicati.

Le ricerche mostrano che:

  • I database B2B contengono in media dal 10% al 30% di record duplicati
  • Ogni duplicato costa alle organizzazioni in invii e-mail sprecati, reportistica confusa e cronologia cliente frammentata

Prevenzione vs rilevamento dei duplicati

DQS si concentra sul rilevamento, che aiuta a identificare i duplicati già esistenti. La prevenzione (impedire la creazione di duplicati) richiede Validation Rule e regole di corrispondenza nella configurazione di Salesforce.

4. Tempestività

La tempestività misura se i dati sono sufficientemente aggiornati per l’uso previsto.

Cosa misura DQS

  • Tasso di freschezza: percentuale di record entro un’età accettabile
  • Rilevamento dell’obsolescenza: record che superano la soglia impostata
  • Età media: età media dei valori dei campi data
  • Rilevamento date future: date non valide nel futuro

Definire le soglie di freschezza

Diversi tipi di dati hanno diversi requisiti di freschezza:

Tipo di datoSoglia tipicaMotivazione
Ultima attività Lead30 giorniI Lead freddi perdono valore
Informazioni Contact90 giorniLe persone cambiano lavoro
Data di chiusura OpportunityTrimestre correnteAccuratezza delle previsioni
Fatturato annuale Account1 annoAggiornamenti annuali previsti

Perché la tempestività è importante per l’AI

I modelli di AI e ML apprendono dai dati. Quando i dati sono obsoleti, l’AI apprende modelli superati. Agentforce, ad esempio, utilizza i dati di Salesforce per informare le risposte. Informazioni di contatto obsolete portano a raccomandazioni errate.

5. Coerenza

La coerenza misura se i valori dei dati sono uniformi e standardizzati.

Cosa misura DQS

  • Tasso di conformità: percentuale corrispondente ai modelli previsti
  • Rilevamento delle varianti: diverse rappresentazioni dello stesso valore
  • Analisi del valore dominante: valore più comune per campo

Tipi di incoerenza

TipoEsempioProblema
Variazione di formato«USA» vs «United States» vs «US»Interrompe filtraggio e raggruppamento
Variazione ortografica«Acme Corp» vs «ACME Corporation»Crea falsi duplicati
Variazione di maiuscole/minuscole«new york» vs «New York»Appare poco professionale nei report

Perché la coerenza è importante per l’AI

I modelli di AI trattano «USA» e «United States» come valori diversi. Se i record utilizzano entrambi, l’AI non può raggrupparli correttamente. I dati incoerenti frammentano la comprensione dell’AI e producono output inaffidabili.

Raggiungere la coerenza

  • Utilizzare picklist invece del testo libero dove possibile
  • Standardizzare su un unico formato per ogni campo
  • Importare i valori della picklist durante la configurazione dei controlli di coerenza DQS

Bilanciare le dimensioni

Non ogni dimensione è ugualmente importante per ogni caso d’uso. Si consideri ciò che serve:

Caso d’usoDimensioni prioritarie
Campagne di marketingCompletezza, Validità (per la recapitabilità)
Previsioni di venditaTempestività, Completezza
Servizio clientiUnicità (un’unica fonte di verità)
AI/AgentforceTutte e cinque, più i controlli di prontezza AI

Copertura delle dimensioni DQS

DQS misura tutte e cinque le dimensioni con capacità complete:

DimensioneCosa misura DQS
CompletezzaTasso di riempimento, rilevamento nulli, rilevamento vuoti, rilevamento segnaposto, logica contestuale
ValiditàValidazione del formato, modelli regex personalizzati, identificazione record non validi
UnicitàRilevamento duplicati, analisi dell’entropia, distribuzione di frequenza
TempestivitàTasso di freschezza, rilevamento dell’obsolescenza, età media, rilevamento date future
CoerenzaControllo di conformità, scoperta delle varianti, analisi del valore dominante

Passaggi successivi

Ora che si comprendono le cinque dimensioni:

  1. Effettuare la Valutazione della prontezza AI per vedere i punteggi attuali
  2. Leggere la Preparazione per Agentforce per controlli aggiuntivi oltre la qualità dei dati di base
  3. Scoprire come utilizzare il Definition Builder per configurare la prima scansione