Spesso nelle attività di validazione di strumenti software, che le aziende che operano nel settore medicale devono necessariamente eseguire ad esempio per garantire la loro conformità al punto 4.1.6 della norma UNI EN ISO 13485:2021, ci si imbatte nella necessità di effettuare una convalida non solo delle applicazioni software ma anche della base dati che contiene i dati gestiti da tali applicazioni sia come elementi di ingresso sia come  risultati delle loro elaborazioni.

Questo tipo di intervento è necessario perché, nella nostra era digitale, i dati assumono un ruolo di primaria importanza per le strutture mediche. La gestione efficiente e accurata di informazioni sensibili come cartelle cliniche, referti, dati di laboratorio e anagrafiche pazienti è fondamentale per garantire la qualità del servizio sanitario, la sicurezza dei pazienti e l’ottimizzazione delle risorse.

In questo contesto, la validazione del database si configura come un processo imprescindibile per garantire aspetti quali :

  1. Accuratezza dei dati: in modo che i dati contenuti nel Database siano completi, coerenti, precisi e aggiornati. Informazioni errate o incomplete possono portare a diagnosi errate, ritardi nei trattamenti e persino a gravi conseguenze per la salute dei pazienti.
  2. Efficienza del sistema: in modo che siano facilitate le operazioni di accesso e  di analisi dei dati, favorendo la ricerca rapida e precisa di informazioni, la refertazione tempestiva e la condivisione efficiente dei dati tra i diversi operatori sanitari
  3. Sicurezza e Conformità: per la protezione dei dati sensibili dei pazienti da accessi non autorizzati, violazioni informatiche e perdite di dati in modo da salvaguardare la piena aderenza alle normative vigenti in materia di privacy e sicurezza dei dati
  4. Migliore processo decisionale in modo da permettere di prendere decisioni cliniche più informate e tempestive

La validazione di un Database da parte di un utilizzatore si può dividere in due processi distinti ma entrambi indispensabili:

  1. Validazione della struttura la cui convalida andrebbe eseguita prima che le applicazioni software, che lo utilizzano, siano rese operative ed eventualmente ripetuta solo in caso di modifica significativa di tale struttura. Generalmente viene effettuata in simbiosi con le qualifiche IQ,OQ,PQ di tali applicazioni
  2. Validazione del contenuto, detta anche Verifica della Qualità dei Dati, è invece un processo continuo che va eseguito dall’organizzazione  in modo sistematico per avere la certezza della permanente affidabilità del Database stesso

1 VALIDAZIONE DELLA STRUTTURA DI UN DATA BASE

La primo aspetto da tener presente, in un processo di validazione di un Database, è quello di verificare che la sua struttura sia corretta ed appropriata alle esigenze dell’utilizzatore

In genere la struttura di un Database , che dipende dal tipo  e dal modello dati utilizzato. E’  sommariamente formata da:

  • Tabelle sono l’elemento fondamentale e sono costituite da una matrice di righe e colonne dove sono riportati, ad esempio i dati clinici di pazienti
  • Record che generalmente si identifica con la riga della tabella e rappresenta un paziente
  • Campi o attributi che sono le colonne di una tabella e rappresentano i diversi tipi di dati che possono essere memorizzati per ogni record della tabella (Informazioni Paziente, Storia Clinica, Esami di Laboratorio , Test Clinici, Trattamenti e Prescrizioni, Appuntamenti e Visite, Documentazione Clinica, Informazioni Amministrative, ecc.)
  • Chiavi (primarie, secondarie, esterne) che permettono di identificare i record in una tabella
  • Relazioni che  definiscono le modalità con cui i dati in una tabella sono correlati ai dati in un’altra tabella e sono utilizzate per modellare e rappresentare le interazioni complesse tra i vari aspetti dei dati clinici e per garantire la coerenza e la loro l’integrità

Inoltre un Database clinico i contenuti si possono suddividere in:

  • Dati : che rappresentano i contenuti principali del database clinico e costituiscono le informazioni che vengono memorizzate e gestite per scopi clinici, diagnostici e terapeutici.
  • Metadati: che rappresentano descrizioni strutturate che forniscono il contesto e le informazioni aggiuntive che aiutano a comprendere e a gestire i dati stessi all’interno del database clinico.
PROCESSO DI VALIDAZIONE

Poiché la validazione non è solo un controllo di correttezza, ma è soprattutto una verifica di appropriatezza, un utilizzatore di un applicazione software basata su un Database dovrebbe:

  1. Definire i requisiti di utilizzo : Questo passaggio permette di stabilire quali dati devono essere memorizzati nel database e come devono essere strutturati.
  2. Verificare lo schema del database : L’utente dovrebbe controllare che le tabelle, le relazioni e gli attributi siano definiti correttamente e siano coerenti con le necessità.
  3. Verificare i vincoli di integrità referenziale che garantiscono che le relazioni tra le tabelle siano mantenute e che i dati rimangano consistenti.
  4. Controllare le operazioni sui dati attraverso test che permettano di verificare, ad esempio, che le operazioni di inserimento, aggiornamento e cancellazione dei dati funzionino correttamente e che i risultati siano conformi alle aspettative
  5. Valutare la Sicurezza: Assicurandosi che siano state implementate  misure  adeguate per proteggere i dati sensibili e garantire l’accesso autorizzato al database
  6. Valutare le Performance: per assicurarsi che il Database possa gestire il carico di lavoro previsto e che le query vengano eseguite in modo efficiente

Un utilizzatore, che ovviamente spesso non dispone dei dettagli tecnici su come è stato implementato un Database, può effettuare comunque efficaci verifiche di validazione attraverso anche solo Controlli Visivi che possono mettere in evidenza, popolando opportunamente il Database:

  1. Errori ed incongruenze nei dati rispetto alle aspettative dell’utente (es. date impossibili, valori numerici negativi per un campo che dovrebbe essere positivo ecc.)
  2. Aspetti funzionali quanto, ad esempio, le operazioni di inserimento, aggiornamento e cancellazione dei dati funzionino correttamente e che i risultati siano conformi al quanto atteso
  3. Coerenza trasversale quanto i dati anagrafici di un paziente sono coerenti in tutte le tabelle del database dove essi compaiono
  4. Dipendenza referenziale : se creando, modificando e eliminando record in tabelle correlate a quella primaria,  la dipendenza referenziale sulle corrispondenti tabelle venga applicata correttamente
  5. Sicurezza se il database è protetto da accessi non autorizzati

Per alcune tipologie di controlli, come quelli di Performance , è però in genere necessario utilizzare appositi strumenti software. Tali strumenti permettono, ad esempio, di eseguire test di carico e stress, simulando un grande numero di utenti o transazioni, per valutare come il Database si comporti sotto carichi di lavoro intensi. Tale valutazione può essere eseguita attraverso il monitoraggio dei tempi di risposta delle query , i throughput, l’utilizzo della CPU, della memoria, del disco, ecc. che possono essere confrontati  con benchmark di performance relativi a database simili o con standard di settore.

2 VALUTAZIONE DELLA QUALITÀ DEI DATI DI UN DATA BASE

Una volta avviato l’utilizzo del database, la gestione dei dati sanitari diventa una questione di estrema importanza in quanto la Qualità dei Dati, all’interno di un database medico, non è soltanto un’opzione auspicabile, ma un requisito imprescindibile poiché la scarsa qualità può portare a conseguenze estremamente pericolose quali ad esempio:

  1. Scelte cliniche errate: Informazioni inaccurate possono portare a diagnosi errate e trattamenti inappropriati, con gravi rischi per la salute dei pazienti.
  2. Ritardi nei trattamenti: L’accesso a dati incompleti o non aggiornati può ritardare l’inizio di un trattamento tempestivo, con possibili conseguenze negative per la salute del paziente.
  3. Ricerca medica compromessa: Studi condotti su dati di scarsa qualità possono generare risultati inaffidabili, ostacolando il progresso scientifico e la scoperta di nuove cure.

Inoltre Gestire la qualità dei dati é importante per varie ragioni. Infatti serve ad esempio a :

  • favorire la gestione della crescente disponibilità di dati;
  • acquisire dati da fonti esterne la cui qualità é sconosciuta;
  • rimuovere le cause che determinano dati errati;
  • ridurre duplicazioni di dati;
  • gestire le informazioni in modo efficace diminuendo i costi della non qualità;
  • far convivere i dati di vari sistemi;
  • contenere la dispersione di dati nei sistemi e tra sistemi;
  • incrementare i dati riusabili
ERRORI ASSOCIABILI ALLA GESTIONE DEI DATI

In una gestione non accurata di un Database clinico, ci si può imbattere in diverse categorie di errori associate ai dati inseriti quali ad esempio:

  1. Errori di immissione dati: Questi errori si verificano durante l’inserimento dei dati nel sistema. Possono derivare da errori di digitazione, omissioni o inserimenti accidentali di informazioni inesatte.
  2. Errori di registrazione: Questi errori riguardano la registrazione errata di informazioni cliniche, come date, sintomi, diagnosi, trattamenti prescritti, dosaggi dei farmaci, ecc.
  3. Errori di interpretazione: Questi errori si verificano quando gli operatori sanitari interpretano erroneamente i dati disponibili nel database, quali, ad esempio, malintesi dei risultati degli esami di laboratorio o delle immagini diagnostiche.
  4. Errori di trasferimento dati: Questi errori si verificano quando i dati vengono trasferiti da un sistema a un altro e possono derivare da problemi di compatibilità o da errori nel processo di migrazione dei dati.
  5. Errori di integrità dei dati: Questi errori si verificano quando i dati nel database vengono corrotti o danneggiati, ad esempio a causa di malfunzionamenti del sistema o di errori durante l’archiviazione dei dati.
  6. Errori di duplicazione: Questi errori si verificano quando vengono inseriti più record duplicati per lo stesso paziente o quando i dati vengono duplicati accidentalmente durante il processo di trasferimento o di aggiornamento del database.
  7. Errori di sicurezza: Questi errori riguardano la sicurezza e la privacy dei dati nel database medico, ad esempio accessi non autorizzati o violazioni della privacy dei pazienti.
  8. Errori di aggiornamento: Questi errori si verificano quando i dati nel database non vengono aggiornati correttamente per riflettere le modifiche nelle condizioni cliniche dei pazienti o nelle procedure mediche.
  9. Errori di backup e ripristino: Questi errori si verificano durante il processo di backup e ripristino dei dati nel database medico e possono portare alla perdita o alla corruzione dei dati.

Per minimizzare gli errori nei database medici è quindi fondamentale:

  1. Implementare procedure di controllo accurate per l’inserimento e la codifica dei dati.
  2. Fornire formazione adeguata al personale sanitario.
  3. Eseguire audit regolari per identificare e correggere gli errori.
  4. Adottare tecnologie avanzate per la gestione e l’analisi dei dati
MODALITÀ DI VALUTAZIONE DELLA QUALITÀ DEI DATI

Per poter impostare un corretto processo di Valutazione della Qualità dei Dati in ambito clinico è molto utile seguire le indicazioni riportate all’interno dello standard ISO/IEC 25012, il quale definisce un modello di riferimento per tale  valutazione, che si basa su 13 caratteristiche chiave:

  1. Accuratezza: I dati devono essere privi di errori e corrispondere alla realtà.
  2. Completezza: Tutti i dati necessari devono essere presenti.
  3. Coerenza: I dati devono essere coerenti tra loro e con le diverse fonti.
  4. Tempestività: I dati devono essere aggiornati e disponibili al momento opportuno.
  5. Unicità: Ogni record deve essere univoco e non duplicato.
  6. Accessibilità: I dati devono essere facilmente accessibili agli utenti autorizzati
  7. Usabilità: I dati devono essere comprensibili e facili da utilizzare.
  8. Interpretabilità: I dati devono essere interpretabili in modo univoco e non ambiguo
  9. Rilevanza: I dati devono essere pertinenti per l’uso previsto
  10. Conformità: I dati devono essere conformi alle normative e agli standard di settore
  11. Sicurezza: I dati devono essere protetti da accessi non autorizzati, uso improprio e perdita.
  12. Efficienza: I dati devono essere gestiti in modo efficiente e con un buon rapporto costi-benefici.
  13. Mantenibilità: I dati devono essere facili da aggiornare, correggere e modificare

Un ulteriore standard, la ISO/IEC 25024, fornisce invece un framework per la misurazione delle 13 caratteristiche di qualità dei dati definite nella ISO/IEC 25012 attraverso 63 metriche

Ad esempio la caratteristica qualitativa della Accuratezza viene misurata attraverso tre sotto caratteristiche:

Accuratezza dei Valori, che misura la discrepanza tra i valori memorizzati nel database e i valori reali e cioé se i dati riflettono correttamente la situazione o l’oggetto che stanno registrando.

Accuratezza del Dominio, che misura la conformità dei valori memorizzati nel database con quelli  ammissibili per l’attributo in esame. Si tratta di verificare se i valori immessi in un campo rispettano le regole e i vincoli definiti per quel campo

Accuratezza della Rappresentazione che misura la precisione con cui i dati sono rappresentati e presentati all’interno del database. Include aspetti come la formattazione corretta dei dati, la rappresentazione delle unità di misura, la corretta gestione di caratteri speciali ecc.

PROCESSO DI VALUTAZIONE DELLA QUALITÀ DEI DATI

La valutazione della qualità dei dati è quindi un processo continuo per garantire l’affidabilità dei dati clinici e la sicurezza dei pazienti.

L’adozione di un processo di valutazione rigoroso e l’implementazione di azioni correttive mirate possono contribuire a migliorare significativamente la qualità dei dati di un database di dati clinici.

Le principali fasi di questo processo riguardano:

Fase 1: Definizione degli obiettivi e delle metriche che contiene, fra le altre indicazioni, l’Identificazione degli scopi della valutazione e la selezione delle caratteristiche qualitative da verificare e delle pertinenti metriche

Fase 2: Raccolta dei dati  che riguarda l’attività di raccolta dati dopo averne identificato le fonti

Fase 3: Analisi dei dati   che riguarda il Calcolo delle metriche di qualità dei dati selezionate, l’identificazione delle aree di criticità, l’analisi delle cause dei problemi della qualità dei dati

 Fase 4: Definizione del piano di miglioramento che consiste nello sviluppare azioni correttive per le aree di criticità, assegnare responsabilità e tempistiche, implementare le azioni correttive

Fase 5: Monitoraggio e revisione che consiste nel monitorare l’andamento della qualità dei dati nel tempo e revisionare periodicamente il processo di valutazione

STRUMENTI PER LA VALUTAZIONE DELLA QUALITÀ DEI DATI

Strumenti e tecniche per la valutazione della qualità dei dati possono essere:

Audit Manuali  condotto da un revisore umano che, dopo aver definito un piano di campionamento, esamina dei dati a campione e li confronta con criteri predefiniti per identificare eventuali errori o anomalie

Strumenti di Data Profiling che sono tools software che automatizzano il processo di analisi e valutazione dei dati e che possono essere utilizzati per identificare le caratteristiche dei dati, e, attraverso specifiche metriche, calcolare e identificare i problemi di qualità dei dati, e visualizzare i dati in modo da facilitarne l’analisi

Tecniche di Machine learning  che possono essere utilizzate per la valutazione della qualità dei dati attraverso, ad esempio, l’identificazione dei dati che si discostano dalla norma, per classificare i dati come “corretti” o “errati”,  per prevedere i valori mancanti in base ai dati disponibili, per correggere automaticamente gli errori identificati

GRAZIE PER L’ATTENZIONE

De Martino Antonio

De Martino Antonio

Laurea in matematica presso l’Università degli Studi di Milano. Sono cresciuto professionalmente nell’ ambito della Informatica Industriale all’interno di progetti per le Telecomunicazioni e di Automazione e dal 1990 mi occupo di consulenza aziendale sia su temi di compliance normativa, di processo e di prodotto, sia su temi di gestione aziendale. Negli ultimi tempi mi sto occupando soprattutto di Sistemi Integrati, di Marcature CE e di Dispositivi Medici su tematiche che riguardano la Validazione del Software per ISO13485, Regolamenti FDA, MDR , ANNEX 11 e GAMP Ho all’attivo interventi che riguardano più di 100 aziende sia manifatturiere sia di servizi di diverse dimensioni

Leave a Reply