Skip to content

APPROFONDIMENTI

I costi legati al concetto di qualità dei dati

28/06/2011

I costi legati al concetto di qualità dei dati

Nella società moderna, le tecnologie dell’informazione hanno ormai un ruolo fondamentale per una moltitudine di attività, legate al business ma anche allo svago, alla sfera privata e del tempo libero. La “conditio sine qua non” delle tecnologie dell’informazione è, ovviamente, la disponibilità delle informazioni stesse.
L’unità base con la quale si costruisce l’informazione è il dato; è, infatti, combinando insieme diversi dati (che per natura sono poco “loquaci”, ossia poco ci possono dire se considerati singolarmente) che otteniamo l’informazione. In altre parole possiamo dire che, come in un puzzle ogni pezzo non ha di per sè alcun significato, allo stesso modo possiamo considerare i dati. Il puzzle completo corrisponde invece all’informazione.

Da ciò deriva che, per avere un’informazione di qualità, è necessario disporre di “pezzi” che ben si assemblino tra loro: è necessario cioè avere dati di qualità.
Quando si va ad utilizzare le informazioni ottenute in maniera produttiva, si raggiunge allora la conoscenza. Quest’ultimo step è in realtà quello che può realmente influenzare un business e la sua efficienza/efficacia.
L’enorme vantaggio dato dalle tecnologie dell’informazione è che la conoscenza derivante dall’elaborazione elettronica dei dati prima, e delle informazioni poi, beneficia di una velocità e profondità di analisi una volta impensabili. Esistono molti strumenti software in grado di dare un output di conoscenza partendo da un input di dati. Si pensi a tutto l’ambito della business intelligence e al supporto (principalmente di tipo decisionale) che questi strumenti danno al business: al giorno d’oggi la gran parte delle organizzazioni non può pensare di fare a meno di un tale ausilio.
Ci sono differenti e numerose modalità di analisi dei dati (citiamo per esempio l’OLAP, On Line Analytical Processing, oppure il Data Mining) orientate al supporto decisionale al business, ma tutte, per poter offrire il miglior risultato, hanno un prerequisito comune: l’analisi deve partire da dati di qualità.

Il concetto di qualità dei dati è multidimensionale e legato al contesto di applicazione.
Si parla di dimensioni di qualità perché esistono diversi aspetti che vanno verificati per poter esprimere un giudizio legato alla qualità di un dato: accuratezza, completezza, livello di aggiornamento (o currency) e consistenza.
Il legame con il contesto deriva dal fatto che, a seconda dell’impiego, potrebbe assumere maggiore rilevanza una dimensione piuttosto che un’altra. In generale, comunque, si può ragionevolmente affermare che l’accuratezza è fondamentale nella pressoché totalità dei processi che impiegano i dati stessi.

L’implementazione di un sistema di acquisizione, controllo e correzione dei dati in ingresso è ovviamente un’operazione costosa. Un progetto di Data Quality Management presenta sostanzialmente due tipologie di costi:
- costi della qualità: sono quella parte di costi che si possono considerare come “preventivi”, ossia da sostenere per creare un ambiente che permetta di limitare l’acquisizione di dati di scarsa qualità. Questi si configurano sia a livello di dati, sia a livello di processo.

I costi del primo tipo sono essenzialmente legati al progetto informatico che deve sorreggere il sistema (quindi i costi per le tecnologie, i costi per il personale e per eventuali servizi aggiuntivi affidati a terzi).
A livello di processo, i costi da sostenere sono quelli che consentiranno di operare in maniera tale da mantenere un livello di qualità desiderato e che impediranno l’acquisizione di dati di scarsa qualità. Devono essere previste procedure standardizzate ed eventuali workaround per la risoluzione dei problemi attraverso procedure straordinarie;

- costi della non qualità: questi si presentano nel momento in cui emerge un problema di scarsa qualità dei dati durante il loro impiego nei processi. Esistono varie categorizzazioni di tali costi, ognuna delle quali cerca di aggregare e disaggregare le tipologie secondo diversi aspetti. Per le metriche di quantificazione di questi costi, si vedano le soluzioni proposte nella tesi “Una metodologia per la valutazione dei costi della non qualità dei dati” presente sul sito Tesionline.

Altro aspetto controverso nella valutazione dei costi (principalmente di non qualità) è la loro quantificazione. Normalmente si adotta un approccio che tende a distinguere tali costi in diverse categorie: monetizzabili (per i quali è più semplice giungere ad un termine monetario), quantitativi (dei quali è intuibile l’ordine di grandezza dell’entità di impatto, ma meno il valore effettivo di tale costo) e qualitativi, che vengono normalmente considerati a parte in quanto non direttamente traducibili numericamente...

Scarica il file per leggere integralmente l'articolo: Concetto di qualità dei dati.pdf


Tesi dell'autore: