58
Capitolo 3: La Reliability Centered Maintenance
La Reliability Centered Maintenance fornisce un approccio strutturato per
analizzare malfunzionamenti o possibili modi di guasto di un sistema complesso
o di un dispositivo (per esempio può essere applicata ad una linea di produzione
così come ad un’automobile) ed è una delle analisi più usate nell’ambito avionico
per a sua elevata efficienza. Lo scopo principale di questo tipo di analisi non è
quello di aumentare la vita utile del dispositivo/sistema, ma quello di mantenere il
corretto funzionamento. Supera i limiti dell’anlisi dei rischi fornita dalla Matrice
Probabilità-Impatto, in quanto permette di risalire alle cause dei failure modes dei
vari dispositivi e di di classificarli secondo parametri nettamente distinti, in modo
che sia chiaro dove agire se si vuole diminuire il rischio ad essi legato, ed anche
rispetto la Fault Tree analisys ha il vantaggio di individuare gli effetti per ogni
modo di guasto, non solo quello generale (Top Event). L’utilizzo di questa tecnica
mira a cercare il compromesso ottimo tra livello di rischio, efficienza massima,
costi minimi attraverso un’analisi mirata e precisa all’individuazione degli
interventi prioritari, più efficaci ed evidenti per il rendimento e la disponibilità
produttiva.
3.1 La tecnica RCM (Reliability Centered Maintenance)
Questa tecnica è stata sviluppata negli USA in ambito avionico con l’intento di
realizzare un piano di manutenzione attraverso un percorso logico-decisionale che
tiene conto dell’ottimizzazione dei tempi, della disponibilità del sistema e dei
costi, e che sia in grado di assicurare l’affidabilità del sistema per un determinato
periodo di tempo. (13) Le attività principali descritte nel Risk Assessment (analisi
del rischio) sono coincidenti con la tecnica RCM, ma la seconda ha come scopo
di raggiugere passo dopo passo la scelta e la definizione di un piano di
manutenzione specifico ed efficace per ogni componente o asset del sistema, fino
59
alla raccolta dei feedback sui piani aggiornati. I passi in cui si scompone la tecnica
RCM sono i seguenti:
1. Definizione del sistema;
2. Classificazione dei macchinari in base alla criticità;
3. Raccolta e analisi dei dati;
4. Failure Mode Effects & Criticality Analysis (FMECA);
5. Individuazione e selezione delle attività di manutenzione, compresi gli
interventi migliorativi;
6. Definizione del piano di manutenzione;
7. Implementazione del piano di manutenzione;
8. Raccolta dati ed aggiornamento dei piani (Follow up);
I primi 5 passi coincidono con quelli del Risk Assessment, mentre dal sesto
punto in poi si passa alla fase proattiva della RCM.
Nella definizione del sistema si tiene conto di alcuni aspetti principali nella
scelta della politica manutentiva:
• Il tasso di guasto associato al sistema complesso o all’elemento preso in
considerazione. Infatti, come esposto nel Capitolo 2, è indispensabile conoscerne
l’andamento nel tempo per sapere quale politica manutentiva sia più efficace;
• I costi e i tempi associati ad un eventuale fermo macchina: si deve tenere conto
che i tempi di fermo non sono solo quelli legati al guasto, ma ci sono anche quelli
di diagnosi del guasto, di approvvigionamento del pezzo di ricambio e di
installazione dello stesso, quindi se le perdite produttive associate al fermo sono
ingenti è conveniente adottare una politica di prevenzione, piuttosto che
correttiva qualora le ispezioni risultassero particolarmente onerose ed il ricambio
tempestivo;
• Il rischio che il guasto si verifichi (quindi la frequenza di accadimento e i danni
ad essa associati);
60
• La prevedibilità della degradazione/ danneggiamento;
L’analisi FMEA, come si vede in figura 24 viene applicata per realizzare un
piano manutentivo proattivo, volto quindi al miglioramento della produzione
attraverso degli interventi non strettamente necessari ma migliorativi (investimenti
mirati ad aumentare la produzione mantenendo i costi costanti). I dati di analisi, i
progressi, gli interventi manutentivi effettuati o individuati, così come tempi, costi
e risultati, vengono raccolti e gestiti attraverso un database informatico
(“Computer Maintenance Management System”) consultabile per essere utilizzato
anche in altri sistemi simili, che raccoglie informazioni e casi relativi a varie
situazioni, in modo tale da costituire una fonte consultabile ampia e varia. La
tecnica RCM ha l’obiettivo di concentrare l’attenzione sugli elementi che
influenzano di più affidabilità, disponibilità e performance del sistema; a seconda
di confronti con dati ottenuti da esperienza passata propone una manutenzione
studiata attraverso un approccio globale e mira alla definizione di un programma
di manutenzione preventiva per l’intero sistema. È un insieme di metodi e
procedure per incrementare rapidamente e sostenere una crescita della produzione
degli impianti in modo efficiente.
Un grande punto a favore dell’implementazione di questo metodo è che seppur
non è disponibile una quantità di dati tale da procedere ad una valutazione del
Figura 24: Diagramma logico-decisionale RCM
61
sistema dettagliata e precisa, è possibile valutare le conseguenze dei guasti in
modo da tener conto nelle scelte delle politiche manutentive della sicurezza, dei
costi e delle perdite legate al malfunzionamento. Permette di sviluppare una
ricerca sui modelli di comportamento al guasto di sistemi anche complessi,
combinando l’ottimizzazione delle politiche manutentive con minimi costi e
massimi profitti.
3.2 I passi del Risk Assessment
Il processo completo di analisi e valutazione dei rischi si chiama Risk
Assessment. Si svolge attraverso i passi seguenti (la risk analysis si fermerebbe al
terzo passo di quelli sotto elencati):
1. Individuazione del sistema da esaminare
2. Identificazione dei rischi
3. Stima dei rischi (risk estimation)
4. Valutazione dei rischi (risk evaluation).
5. Individuazione di azioni per la riduzione del rischio, compresi interventi
migliorativi
6. Raggiunto il rischio tollerabile, predisposizione di informazioni per gli utenti sui
rischi residui e, se del caso, sulle misure appropriate per ridurli
Quest’analisi permette di rilevare i principali rischi di un sistema e sulla base
di questi ultimi, di progettarne uno più sicuro o trovare delle soluzioni
implementabili che lo rendano tale.
L’analisi richiede una prima fase in cui si classificano i componenti o le
apparecchiature: è necessario tracciare una Machine Breakdown Structure del
sistema, ossia scomporlo per semplificare l’individuazione dei componenti critici,
individuare le condizioni a contorno in cui si trovano ad operare e le loro
dipendenze funzionali ed approfondire la loro analisi singolarmente. La
scomposizione del sistema può avvenire a diversi livelli, per esempio per singoli
62
gruppi funzionali che assolvono funzioni specifiche oppure per sottoinsiemi di
componenti che concorrono allo svolgimento di attività elementari. Per rendere i
controlli e gli interventi preventivi più veloci ed efficienti per esempio, si può
realizzare una scomposizione dei componenti in “famiglie tecniche” con
caratteristiche funzionali simili, in modo da programmare una singola ispezione
ed estenderla a tutta la famiglia, standardizzando il lavoro sia teorico che pratico
dei tecnici specializzati. Una volta individuate. A seconda della complessità degli
impianti e della loro struttura verranno quindi creati uno o più alberi di guasto
relativi al sistema totale, a un sottoinsieme dello stesso oppure ad un singolo
dispositivo se molto complesso.
Poiché ogni piano di manutenzione verte ad assicurare il corretto
funzionamento del sistema ed una produttività elevata, è utile stabilire una
classifica di “importanza” delle attrezzature in modo da riconoscere gli interventi
di prioritaria necessità, quelli a cui applicare metodologie avanzate di gestione
della manutenzione, come la FMEA (Failure Mode Effect Analysis), e anche quali
pezzi di ricambio è conveniente avere in stock in quanto indispensabili all’attività
e difficili da sostituire tempestivamente se non disponibili, perché caratterizzati da
lunghi tempi di approvvigionamento. L’importanza delle varie attrezzature è
definita attraverso la Valutazione dei rischi (punto 4), sulla base della frequenza
di malfunzionamento e delle conseguenze da esso generate, dunque attraverso
un’analisi di criticità di diversi parametri come qualità, produzione, manutenzione,
sicurezza (“Multicriterion Classification of Critical Equipment”). In questo modo
si selezionano i componenti per cui l’applicazione dell’analisi FMEA risulta
vantaggiosa per le Performance, l’Affidabilità e la Disponibilità d’impianto a
livello globale.
63
3.3 Failure Mode Effect Analysis (FMEA)
La FMEA venne proposta e sviluppata per la progettazione affidabilistica di
vettori aerospaziali e di manufatti ad alto rischio per la vita umana, fino a divenire
gradualmente una procedura comunemente usata per la garanzia della qualità nella
progettazione di prodotti (FMECA di prodotto) e processi di produzione (FMECA
di processo). La differenza tra FMEA e FMECA consiste nel fatto che con la
tecnica originaria, la FMEA, si può condurre un’analisi solo qualitativa di difetti
o malfunzionamenti (risk estimation). La FMECA completa il processo con una
valutazione della criticità di ogni difetto o malfunzionamento (risk evaluation).
Nella prassi comune si usa il termine FMEA anche per indicare l’intero processo
di analisi. (14) E’ un tipo di analisi qualitativa e quantitativa che si applica per
individuare i possibili miglioramenti ad un sistema di gestione e manutenzione
preesistente; valuta l’affidabilità di un sistema attraverso un approccio induttivo ai
fenomeni ed ha lo scopo di individuare i diversi failure modes dei componenti, le
loro cause e il loro effetto sul sistema, calcolando il rischio ad essi associato in
base alla loro gravità, frequenza e facilità di rilevamento. Mentre la FTA segue un
approccio “backward”, la FMEA si basa sull’approccio “forward”, con cui si
valuta cosa può accadere al sistema partendo dai difetti dei singoli componenti. La
Failure Mode Effects Analysis permette di ottenere una classifica dei possibili
modi di guasto degli apparecchi principalmente coinvolti nel processo produttivo
e indispensabili allo stesso e fornisce un approccio strutturato per risalire alle cause
e agli effetti rispettivamente che generano e generati da questi malfunzionamenti.
Permette di concentrare l’attenzione dove c’è più ampio margine di miglioramento
poiché ad indici di criticità più elevati, corrispondono possibili soluzioni
migliorative implementabili con risultati vantaggiosi, e di dare più importanza alle
operazioni correttive il cui corretto svolgimento riduca indici di rischio notevoli e
quindi particolarmente dannosi per il sistema. Dopo aver individuato le priorità
d’intervento attraverso l’Indice di Priorità del Rischio (RPN) è possibile andare ad
analizzare i parametri che lo costituiscono in modo da valutare dove intervenire e
quali proposte migliorative fare per ridurre quello con influenza maggiore. La
64
FMEA è la parte più importante e centrale per i risultati di questo tipo di analisi; i
passi per l’esecuzione della FMEA sono i seguenti:
1. Identificazione tutti i possibili malfunzionamenti o difetti dei componenti del
prodotto;
2. Per ogni modo di malfunzionamento/difetto dei componenti descrizione degli
effetti e delle possibili cause;
3. Definizione delle scale di punteggio dei tre parametri P, S, D con i relativi criteri
di assegnazione dei punteggi;
4. Attribuzione dei punteggi ai parametri;
5. Per ogni modo di malfunzionamento/difetto base calcolare il RPN;
6. Per ogni modo di malfunzionamento/difetto ricerca delle azioni possibili per
ridurne gli effetti, in modo da portare tutti i RPN al di sotto di un valore di soglia
prefissato, in funzione del criterio di giudizio scelto. Dovendo definire delle
priorità è opportuno intervenire dapprima dove i RPN sono più alti. (FMEA
conclusa).
La FMEA è un procedimento analitico, è necessario considerare ogni
componente, ed ogni modo di guasto ad esso associabile, separatamente (lo stesso
vale per i processi). Si compilano quindi delle schede strutturate, come quella
mostrata in figura 25, che prevedono l’elenco dei componenti del sistema più
sensibili.
Figura 25: Esempio di una Scheda FMEA
65
Una volta costruita una simil MBS, si passa all’individuazione dei possibili
modi di guasto che il determinato componente può subire, e si associa ad ogni
failure mode una precisa causa ed un determinato effetto conseguente, sia sul
dispositivo difettato, sia eventualmente sull’intero sistema. Per classificare tutti i
modi di guasto dal più al meno grave, è necessario a questo punto andare ad
inserirli in una scala di valutazione formata appunto dai parametri O, S e D, la cui
composizione permette il calcolo dei rispettivi RPN. (14) Questi parametri, che
contengono tutte informazioni utili per la scelta di una politica manutentiva
adeguata, hanno bisogno di essere definiti all’interno di una scala quantitativa o
qualitativa di valori.
Mediante quest’analisi delle criticità si quantifica il rischio (RPN= Indice di
Priorità del Rischio) e lo si correla con il guasto/difetto di base e con gli effetti
indesiderati che porta sul prodotto. Ai tre parametri che concorrono nella
determinazione del RPN si attribuiscono dunque punteggi sulla base di scale di
valori predefinite.
Per attribuire i punteggi di O, S e D in modo qualitativo si procede secondo i
seguenti passi:
1. Individuazione di elementi di giudizio per valutare i tre parametri;
2. Caratterizzazione degli elementi di giudizio.
3. Attribuzione dei punteggi ai singoli parametri considerando solamente le
combinazioni tra i vari elementi di giudizio ritenute ammissibili. (14)
La scala di valutazione potrebbe andare, per esempio, da 1 a 10, oppure da 1 a
5, dove 1 rappresenta una modalità di guasto Improbabile (O) oppure
Insignificante (S) oppure con Rilevamento automatico (D), mentre 10 (oppure 5)
è usato per un evento molto Frequente (O) oppure Catastrofico (S) oppure
Impossibile da Rilevare (D), come indicato per esteso nelle tabelle Appendici A e
B. Per l’attribuzione dei punteggi ai parametri P, S e D si possono seguire criteri
che si fondano su basi sia quantitative che qualitative, e nonostante nel primo caso
i risultati siano senza dubbio più affidabili, per definirli è sufficiente la
66
collaborazione con esperti in grado di esprimere un giudizio qualitativo sul loro
valore associato ai diversi modi di guasto e validarli, se possibile, con dati storici
di riferimento da utilizzare come confronto. È impossibile definire dei criteri di
applicazione di valenza assolutamente generale in quest’analisi e in particolare,
nell’attribuzione di questi valori; nonostante si basi sull’acquisizione di dati anche
storici, questi vanno sempre adattati alla situazione presente che si analizza e in
funzione del dispositivo o del processo che si sta considerando. I punteggi sono
assegnati in modo originale a discrezione di chi svolge l’analisi, delle situazioni a
contorno attraverso la definizione di una scala che viene ritiene idonea al momento
dell’assegnazione.
Una volta parametrizzati i parametri O, S, D, questi vengono assegnati ad ogni
modo di guasto dell’apparato, componendo così gli indici RPN che vengono
classificati. L’RPN (Risk Priority Number) è il prodotto di Frequenza, Gravità e
possibilità di Rilevamento dal valore del quale è possibile stabilire gli interventi
manutentivi prioritari da effettuare sul sistema (maggiore è il livello di pericolosità
dell’incidente, più alta sarà la priorità).
= ∗ ∗
con:
• O= Occurrence (Frequenza o Probabilità di accadimento del guasto);
• S= Severity (Gravità degli effetti del guasto);
• D= Detection Index (Facilità di rilevazione del guasto);
Una volta compilata la scheda FMEA del sistema, si classificano gli indici RPN
dal maggiore al minore, e dando appunto priorità ai modi di guasto che presentano
l’indice più elevato, si passa alla ricerca delle azioni possibili per ridurne gli effetti,
in modo da portare tutti i RPN al di sotto di un valore di soglia prefissato o
comunque diminuire i più alti.