INTRODUZIONE
2
persone e cose circostanti. Un simile evento può essere scongiurato se
l’autista viene informato con sufficiente anticipo delle condizioni del tempo
e della strada, regolando opportunamente il suo stile di guida alla
particolare situazione: è evidente che ciò può avere conseguenze
catastrofiche dal punto di vista dell’impatto ambientale, ma anche
dell’impatto economico (si pensi ai danni provocati all’ambiente e a cui
bisogna porre rimedio e alla perdita di immagine della ditta proprietaria
dell’autocisterna).
Consideriamo ancora l’automezzo dell’esempio precedente: supponiamo
che questa volta si verifichi un malfunzionamento al motore o all’impianto
frenante (ABS, per esempio) che costringe l’autista ad interrompere le
consegne pianificate per quel giorno; questa è evidentemente un’altra
failure del sistema, che comporta dei costi non paragonabili a quelli
dell’esempio precedente, ma comunque significativi: costo dell’autista, del
carburante presente nella cisterna e non consegnato, della manutenzione da
effettuare sul luogo, nonché le difficoltà che si verranno a creare con il
cliente destinatario del carico a causa dell’inefficienza del servizio. È
possibile fare molti altri esempi; numerose sono le variabili da controllare
in quanto il TMP è un sistema dinamico molto complesso e un
malfunzionamento può verificarsi in tante circostanze differenti: nella fase
di scarico del carburante quando non viene eseguita l’esatta procedura di
attacco dei bocchettoni, oppure quando si verifica l’apertura ingiustificata
dei bocchettoni di scarico al di fuori delle soste consentite (frode sulla
merce), e ciò si ripercuote negativamente sull’azienda ancora una volta in
termini di costi e di inefficienza.
INTRODUZIONE
3
Ed è qui che entrano in gioco i Sistemi Neuro-Fuzzy, in grado di emulare le
capacità decisionali e di apprendimento di un operatore umano: grazie alla
loro natura, sono in grado di fornire in uscita la soluzione ottima ad un
problema anche se in ingresso hanno informazioni poco precise.
Il presente lavoro di tesi è stato concepito come un approccio originale al
problema della diagnosi del servizio “Trasporto di Merci Pericolose”
(TMP), attività oggi estremamente importante per le singole economie
nazionali.Quanto detto giustifica il ricorso ad una diagnosi accurata della
risorsa, che nel caso del TMP consiste nel monitorare e nell’analizzare in
modo automatico i fault della flotta di autocisterne.
Impiegando le reti Neuro-Fuzzy, si è progettato un “agente di diagnosi”:
concettualmente è un algoritmo capace di stabilire quali sono le cause che
hanno determinato uno specifico malfunzionamento, emulando la perizia
decisionale di un operatore umano. Esso infatti sa prendere in
considerazione quei fattori empirici e poco analitici che gli usuali sistemi
automatici di rilevamento dei malfunzionamenti trascurano, e che rendono
invece così efficiente il ragionamento umano.
L’agente fa parte del sottosistema di diagnosi di PROMADAT, un sistema
capace di effettuare il controllo e la diagnosi da remoto di una flotta di
autocisterne. Il sistema è applicato in forma di prototipo ad alcuni
automezzi della flotta del CTQ, consorzio impegnato da anni nel settore del
Trasporto di Merci Pericolose.
4
PARTE PRIMA:
STATO DELL’ARTE
CAPITOLO 1 La diagnostica dei sistemi
CAPITOLO 1
La diagnostica dei sistemi
1.1 Concetti di base
La diagnostica è tradizionalmente definita come “l’abilità di individuare
tramite monitoraggio e isolare, se possibile, componenti difettosi o
condizioni di anomalia”. Il termine diagnosi deriva dal greco dia
(attraverso) e gnosis (conoscenza).
E’ stata accumulata una conoscenza molto vasta riguardo al monitoraggio e
alla diagnosi dei guasti; ciò è stato possibile principalmente per due motivi:
in primo luogo, l’uomo mostra da tempo particolare interesse alle
conseguenze derivanti dal suo operato o da cause naturali; in secondo
luogo, il rischio che si verifichino eventi indesiderati cresce in maniera più
che proporzionale al progredire della tecnologia e all’aumentare della
complessità dei sistemi. L’unione di questi due fattori ha portato alla
realizzazione di impianti tecnologicamente così sofisticati, da renderne
molto ardua, se non impossibile, la gestione e il controllo da parte di
operatori umani e quindi alla realizzazione di sistemi automatici di
monitoraggio dei guasti o di supporto alle decisioni (operator aiding).
Quanto detto interessa la maggior parte delle discipline scientifiche, come
la bioingegneria (ad es. il rilevamento di aritmie), le scienze
meteorologiche (ad es. rilevamento di perturbazioni atmosferiche), il
5
CAPITOLO 1 La diagnostica dei sistemi
controllo del traffico (ad es. il rilevamento di incidenti), insomma, ogni
area in cui i fenomeni dinamici provocano variazioni nel tempo dei
parametri caratteristici.
Si danno, ora, le definizioni di alcuni concetti fondamentali che trovano
largo impiego nel corso del lavoro di tesi:
• change : il termine, qui usato in senso di “cambiamento”, significa
qualsiasi discrepanza tra il valore assunto da un parametro
monitorato e il valore misurato, stimato o predetto; tale divario può
essere il risultato di eventi naturali, oppure, ed è il caso di maggiore
interesse pratico, la conseguenza di un malfunzionamento;
• fault : è un’anomalia di comportamento ovvero un
malfunzionamento. Riferendoci al componente di un sistema si
verifica spesso che esso assuma un atteggiamento ben lontano da
quello previsto, constatando delle anomalie di comportamento cioè
delle discrepanze tra le prestazioni attese e quelle rilevate in
esercizio. In tal senso è, per esempio, un’anomalia la deformazione
di un componente. Non è detto che l’anomalia pregiudichi il
comportamento e quindi l’utilizzo del componente, ma è indubbio
che in molti casi essa conduca al breackdown del sistema in cui il
componente è inserito.
• failure : è la situazione che può verificarsi a seguito di un fault.
Quando un componente del sistema opera non correttamente in modo
permanente può verificarsi la rottura dello stesso e l’incapacità del
sistema ad eseguire le sue funzioni richieste entro requisiti di
6
CAPITOLO 1 La diagnostica dei sistemi
prestazioni specificate. Una failure, dunque, è intesa come
breakdown del sistema.
Quando si verifica il malfunzionamento di un componente, si viene a
determinare un cambiamento nelle sue specifiche di performance (le
vibrazioni causate da un rotore calettato su di un albero che, per alcuni
motivi, diviene non perfettamente bilanciato); il sistema in cui è inserito
continua a funzionare, ma si avverte nel complesso che qualcosa non va per
il verso giusto. La differenza tra il funzionamento rilevato e quello atteso
può essere molto sottile, allora, si dice che il sistema opera nei “limiti di
specifica”: il malfunzionamento c’è, ma esso non pregiudica il
comportamento del sistema (nel caso del rotore, quando si hanno vibrazioni
di modesta entità). Il vero problema sorge quando la succitata differenza
non è più trascurabile: il malfunzionamento provoca un cambiamento così
forte che si viene a creare una vera e propria anomalia nel comportamento
del componente (nell’esempio suddetto la comparsa di cricche sull’albero).
Il protrarsi nel tempo di questa condizione può comportare gravi
conseguenze, come il breakdown del sistema in cui è inserito il
componente (nell’esempio, la rottura dell’albero su cui il rotore è calettato
e dunque l’arresto del sistema di cui fa parte).
Un fault può verificarsi in tutti i componenti di un sistema, come sensori,
attuatori, controllori hardware e software, ovvero il processo stesso e le
strutture (involucri, tubazioni, travi etc.); proprio per questo, è strettamente
necessario che da parte del sistema vi sia una certa “tenacia” nei confronti
di un malfunzionamento, che in questo contesto viene definita fault
tolerance, ovvero, l’abilità di un sistema a resistere al sopraggiungere di un
7
CAPITOLO 1 La diagnostica dei sistemi
fault e a perpetrare un livello di prestazioni ancora accettabile, rimanendo
nei limiti di specifica.
La fault tolerance include il monitoraggio e la diagnosi dei
malfunzionamenti, nonché la capacità del sistema di riorganizzare o
ristrutturare se stesso a seguito dell’identificazione di uno o più
malfunzionamenti.
1.2 I sistemi di monitoraggio
I sistemi di monitoraggio dei malfunzionamenti (Fault Monitoring Systems,
FMS) [1] operano svolgendo le seguenti fasi in cascata:
• rilevamento ed isolamento del malfunzionamento (dall’inglese Fault
Detection and Isolation, FDI);
• diagnosi della causa, dell’effetto e dell’importanza dei
malfunzionamenti nei componenti del sistema;
• riconfigurazione o ristrutturazione delle appropriate leggi di
controllo, tale da consentire al sistema di continuare ad operare in
maniera accettabile: ove ciò non fosse possibile, emissione di un
segnale di allerta o, al limite, di un segnale di shutdown.
Inoltre, devono possedere i seguenti requisiti:
• devono essere in grado di rilevare i fault con un’accuratezza
sufficientemente elevata: ciò significa ridurre al minimo
8
CAPITOLO 1 La diagnostica dei sistemi
l’innescarsi di un falso allarme (che nella pratica comune è molto
frequente);
• il tempo che intercorre tra il manifestarsi di un fault e l’emissione
di un segnale d’allarme deve essere molto contenuto;
• devono possedere una elevata accuratezza nello stimare i
parametri caratteristici di un fault (ubicazione, dimensione,
istante in cui si è manifestato, ecc.);
• se il sistema è supportato da un modello matematico, è necessario
che non sia inficiato dalle imprecisioni che possono derivare da
tale modello, come errori di semplificazione derivanti dalla
linearizzazione, oppure, la presenza di componenti non lineari (ad
es. frizione o fenomeni esterni come rumori, variazioni di carico,
etc.).
L’incorporamento di un FMS nell’ambito di un processo industriale
comporta dei benefici significativi, che si manifestano in termini di un
miglioramento dell’affidabilità, della manutenibilità e della sopravvivibilità
del processo. Questi concetti sono di seguito esposti:
• affidabilità (reliability): è l’abilità di completare un compito (task) in
modo soddisfacente, ed entro il periodo di tempo in cui tale abilità è
richiesta;
• manutenibilità (maintanability): è il concetto che caratterizza la
facilità di fare manutenzione o procedere alla riparazione. In
particolare, la si può definire come la distribuzione di probabilità
associata al tempo di realizzazione della manutenzione;
9
CAPITOLO 1 La diagnostica dei sistemi
• sopravvivibilità (survivability): concerne la capacità di effettuare
un’operazione in modo sicuro, senza danni agli operatori o al
sistema.
Passiamo, ora, in rassegna i principali tipi di failure che, per quanto detto,
possono compromettere il funzionamento di un processo tecnico e che un
sistema di monitoraggio realizzato “a regola d’arte” dovrebbe individuare:
• failure nei componenti del sistema causati da fault chimici o fisici;
• failure nel rifornimento di energia, causati da un sovraccarico del
generatore;
• disturbi ambientali ed interferenze esterne;
• errori umani;
• errori di manutenzione e failure causate da errate azioni di
riparazione;
• failure del sistema di controllo.
Poiché “una catena non è più forte del proprio anello più debole”, è
necessario, per fare in modo che il sistema sia valido, seguire un approccio
basato sulla Total System Availability (che letteralmente significa validità
del sistema nel suo complesso ). L’approccio si basa sull’implementazione
della Life-Cycle Maintenance, definita come quell’insieme di azioni mirate
alla manutenzione di una risorsa, in modo da mantenerla nelle condizioni di
lavoro più appropriate, durante tutto il suo ciclo di vita.
Nella Life-Cycle Maintenance devono essere considerati due fondamentali
problemi. Il primo è come il sistema deve comportarsi al sopraggiungere di
10
CAPITOLO 1 La diagnostica dei sistemi
fault o failure imprevisti. Il secondo è comprendere come le attività di
manutenzione devono essere adattate ai possibili cambiamenti, i quali
possono riguardare sia direttamente la risorsa, sia ciò che le sta intorno; a
ciò si aggiunga un importante concetto: la Life-Cycle Maintenance deve
basarsi sulla previsione su basi statistiche dei fault, poiché è proprio in
questo che consiste l’ottimo delle strategie di manutenzione.
1.2.1 Un esempio di FMS
Da quanto detto traspare che essendo notevole la quantità di informazioni
da tenere in considerazione è necessario il supporto di un computer (il solo
mezzo che, peraltro, consente di processare una tale mole di informazioni).
La struttura di un sistema di manutenzione predittiva assistita da
calcolatore, (dall’inglese Computer Assisted Predictive Maintenance
System, CAPMS)[1], è riportata in figura 1.
Il sistema consta di due sottosistemi e due data bases:
• lo Strategic Plannig Sub-System (SPSS), ha il ruolo di selezionare la
strategia ottima di manutenzione per ciascun componente della
risorsa. In primo luogo, esso predice i fault che possono verificarsi in
ognuno dei componenti, stabilendone un modello progressivo; ciò
viene effettuato prelevando informazioni dall’esterno (ovvero, dalla
conoscenza proveniente da altri impianti o ricerche), e dal Common
Data Base (CDB), dando luogo ad una valutazione circa l’efficacia
delle tecnologie di manutenzione, e degli effetti causati dal
sopraggiungere di un fault.
11
CAPITOLO 1 La diagnostica dei sistemi
12
Deterioration
phisics & cases
Maintenance
tecnologies
Facility model
Enviroment
model
Operation and
maintenance
record
Prediction
of
deteriora-
tion
mode
&
pattern
Maintenance
technology
effectiveness
evaluation
Deteriration
effect
evaluation
Maintenanc
e
Strategy
planning
- installation
-modification
-knowledge
from other
plants or
researches
Deterioration &
failure
evaluation
Maintenance
planning
Maintenance action
Managing predicted failure
Unexpected
deterioration/
failure
Optimum
maintenance
strategy
Common Data Base
Facility Data Base Strategic Planning Sub-System
Maintenance Management Sub-System
Figura 1.1 - Architettura di un Computer Assisted Predictive Maintenance System (CAPMS)
CAPITOLO 1 La diagnostica dei sistemi
Questi elementi stanno alla base della pianificazione di una strategia
di manutenzione. Gli effetti di un fault sono valutati da un punto di
vista della sicurezza, dell’impatto economico e della degradazione
funzionale in cui può incorrere il sistema.
• il Facility Data Base (FDB). In questo data base sono contenute
informazioni specifiche sulla risorsa che si sta analizzando,
necessarie per poter effettuare una corretta previsione circa l’avvento
di un guasto: consiste, in sostanza, in un modello della risorsa,
dell’ambiente ad essa circostante, ed include un registratore di
funzionamento e manutenzione.
• le elaborazioni dell’SPSS vengono recepite dal secondo sottosistema,
il Maintenance Management Sub-System (MMSS): tale sottosistema
dirige e controlla le azioni di manutenzione in corso, basate sulla
strategia selezionata dallo SPSS. Grazie alle suddette azioni si
individuano i fault e le failure, i quali vengono analizzati: se questi
corrispondono a quanto previsto dallo SPSS, il MMSS mantiene la
stessa strategia, elaborando un piano per il prossimo ciclo di
manutenzione.
• il Common Data Base, che contiene informazioni sulle operazioni
manutentive da effettuare e sui principali tipi di failure.
È possibile che si verifichino alcuni fault o failure non previsti dallo
Strategic Planning Sub-System: in questo caso si da luogo ad un feedback
attraverso cui le informazioni vengono rielaborate dallo SPSS; il succitato
13
CAPITOLO 1 La diagnostica dei sistemi
ciclo di previsione viene, in tal modo, ripetuto più volte per correggere il
Maitenance Strategy Plan (MSP).
In sintesi, due sono i feedback presenti nel CAPMS. Il primo è il feedback
di routine, il cui ruolo è fornire le informazioni raccolte durante le azioni di
manutenzione che andranno ad alimentare il bagaglio informativo per il
successivo piano di manutenzione; il secondo è il feedback attivato quando
emerge un’inconsistenza tra i dati attualmente disponibili e lo scenario
assunto dalla strategia di manutenzione.
1.2.2 Le caratteristiche di un FMS
Per realizzare un FMS, devono essere approfonditi i seguenti punti:
• previsione del fault: come già menzionato, questa è una funzione
essenziale di un sistema di monitoraggio;
• valutazione dell’effetto di un fault: gli effetti che a causa dei fault si
propagano nella risorsa, portano alla degradazione funzionale della
stessa, nonché alla nascita di failure. Per valutare tali effetti con
l’ausilio di un calcolatore, occorrono modelli funzionali della risorsa:
in merito a questo argomento, numerosi sono stati gli studi condotti
tramite l’utilizzo di sistemi esperti di diagnostica;
• monitoraggio e diagnosi: sebbene siano numerose le tecnologie
sviluppate per fornire un ausilio al monitoraggio e alla diagnosi,
occorrono tecniche che siano in grado di rilevare il sopraggiungere di
un fault dallo stadio iniziale del suo processo di formazione;
14
CAPITOLO 1 La diagnostica dei sistemi
• selezione delle strategie di manutenzione: questa, per quanto detto, è
un’altra funzione chiave di un FMS;
• classificazione e memorizzazione delle informazioni: la realizzazione
di un FMS richiede l’utilizzo di data base sofisticati, in modo da
ottenere un elevato grado di efficienza nella previsione dei fault; in
particolare, il modello proposto dell’FDB dovrebbe essere usato
come fondamenta per ogni sistema di monitoraggio.
Data la sostanziale complessità di un FMS, l’uso di tecniche tradizionali
per realizzarlo richiederebbe un’enorme sforzo. È possibile suddividere il
sistema in due livelli: un primo livello, che racchiude i compiti base del
processo di automazione, quali il controllo in feed-forward, ovvero il
controllo a ciclo aperto, e in feedback, ovvero il controllo a ciclo chiuso; un
secondo livello, nel quale sono racchiuse le funzioni specifiche di
supervisone del processo. Tali funzioni di supervisione hanno il ruolo di
indicare gli stati indesiderati del processo e di intraprendere le azioni
appropriate, onde evitare un danno al processo od incidenti alle persone.
Un’ipotesi di fondo è che i fault incidano tanto sul processo tecnico, quanto
sul suo controllo.
Come sopra menzionato, un fault deve essere interpretato come una
deviazione non permessa di una proprietà caratteristica del processo stesso,
degli attuatori, dei sensori e dei controllori. Se queste deviazioni
influenzano le variabili controllate del processo, esse possono essere
rilevate da un opportuno segnale.
15