1. INTRODUZIONE
1.1 Premesse
Il progetto dei sistemi di controllo delle macchine volanti, in passato, e` stato dominato
da tecniche classiche quali, ad esempio, il controllo proporzionale-integrale-derivativo.
Sebbene cio` abbia prodotto molti sistemi di controllo precisi ed efficaci, gli ultimi
anni hanno visto un interesse crescente verso l’applicazione di teorie avanzate quali il
controllo robusto, il controllo non lineare ed il controllo adattativo. Questo sviluppo
e` stato in parte motivato dalle nuove possibilita` offerte dal controllo digitale e dalla
sempre crescente potenza di calcolo disponibile.
Un altro fattore che accresce l’interesse per metodologie di controllo avanzate e`
lo sviluppo di velivoli diversi da quelli convenzionali, tra i quali i velivoli pilotati a
distanza (Unmanned Aerial Vehicles, UAV) e i velivoli autonomi, in particolare ad
ala rotante. Non avendo un operatore umano a bordo, essi possono volare anche in
condizioni operative o su profili di missione molto diversi da quelli possibili con veli-
voli piu` tradizionali con pilota, o per limiti fisiologici o perche´ l’impiego umano puo`
rivelarsi problematico o pericoloso. Piccoli elicotteri autonomi sono oggi impiegati
da molti centri di ricerca ed universita`, da un lato per sperimentare in volo possibili
algoritmi per migliorarne la qualita` di volo, la sicurezza e la capacita` operativa, dal-
l’altro perche´ piccoli velivoli VTOL (Vertical Take-off and Landing), ovvero capaci
del volo a punto fisso, sembrano gli unici potenzialmente in grado di compiere mis-
sioni specifiche in ambienti ristretti, quali quello urbano oppure un edificio. I velivoli
autonomi ad ala rotante pongono quindi nuove ed interessanti sfide alla robustezza,
efficacia ed alle prestazioni dei sistemi di controllo.
In questo lavoro il problema del controllo di velivoli e` affrontato in un senso
piu` ampio: una soluzione progettuale del sistema di controllo, basata su tecniche
ampiamente diffuse e radicate, e` presa come riferimento. Il sistema di controllo e`
quindi aumentato con termini adattativi che, in una qualche norma, migliorano le
prestazioni ottenute e l’affidabilita` del modello impiegato. In questo senso, questa
ricerca risponde a problematiche simili a quelle individuate in [7, 8, 9]: l’idea e` quella
di trovare una soluzione di controllo che si basa su tecniche e modelli noti e faccia da
tramite tra questi e metodi piu` moderni. Il concetto di identificazione dei difetti ed
aumento di soluzioni di riferimento, proposto nella presente tesi, appare in particolare
vantaggioso: in pratica, ci si limita a compensare il difetto tra il modello di riferimento
ed il sistema, e tra la legge di controllo di riferimento e quella che offre la prestazione
desiderata, rendendo potenzialmente meno difficoltoso il processo di identificazione
1. Introduzione 3
ed adattamento, ed eliminando di fatto la fase di taratura a priori (off-line) degli
elementi adattativi. Inoltre, nell’applicazione al vero, e` sempre possibile monitorare
il comportamento ed eventualmente disattivare i termini adattativi, tornando alla
soluzione di controllo di riferimento. Cio` risponde in parte alla necessita` di garantire
il comportamento del sistema di controllo nei casi in cui i termini adattativi non siano
in grado di compensare come dovuto i difetti in condizioni particolarmente critiche.
Alcune strategie di controllo, quali il controllo predittivo non lineare (Nonlinear
Model Predictive Control, NMPC [10]), sono caratterizzati da prestazioni particolar-
mente elevate, poiche´ sfruttano appieno il modello non lineare disponibile per calcolare
gli ingressi che controllano il sistema, ottimizzando una cifra di merito data. Tut-
tavia, per sistemi caratterizzati da scale temporali non molto lunghe, l’applicazione
in tempo reale di queste metodologie e` ancora estremamente costosa computazional-
mente. Nel presente lavoro la cifra di merito e le equazioni del controllo ottimo del
problema predittivo non lineare sono invece utilizzate per guidare l’adattamento del
controllore. Cio` rende disponibile una soluzione che migliora il comportamento del
controllore di riferimento approssimando la soluzione NMPC ad un costo ragionevole.
In questo capitolo analizzeremo, attraverso una breve panoramica, alcune soluzioni
proposte negli ultimi anni per risolvere il problema del controllo di un velivolo auto-
nomo, in particolare ad ala rotante. Esporremo quindi gli obiettivi del lavoro ed i
suoi principali contributi. Infine riporteremo l’organizzazione di questo lavoro di tesi.
1.2 Stato dell’arte nel controllo di velivoli autonomi ad ala rotante
Tecniche di controllo tradizionali nel settore aeronautico richiedono la linearizzazione
del sistema attorno ad alcune condizioni operative lungo tutto l’inviluppo di volo, il
progetto di un controllore lineare per ogni condizione, che garantisca la stabilita` e
le prestazioni richieste, e l’unione ideale di questi controllori attraverso uno schema
d’interpolazione (il cos`ı detto scheduling del controllore). Varie metodologie di con-
trollo piu` moderne possono in generale risultare superiori sotto alcuni punti di vista,
pur presentando possibili inconvenienti [22].
Le tecniche di controllo non lineare, ad esempio, fanno in generale affidamento su
un’accurata conoscenza del sistema controllato. A titolo di esempio, in [4] le equazioni
di moto di un elicottero modello sono ricondotte ad un sistema quasi-lineare, nel quale
cioe´ le matrici di stato e di controllo sono funzioni esplicite dello stato corrente. Nel
lavoro si utilizza il cos`ı detto metodo SDRE (State Dependent Riccati Equation),
ovvero si congelano ad ogni istante le due matrici, valutandole nello stato corrente,
e si calcolano i controlli ottimi per il sistema lineare ottenuto, risolvendo in tem-
po reale la relativa equazione di Riccati. D’altro canto, per essere ridotto in forma
quasi-lineare, il modello matematico dell’elicottero deve essere in parte semplifica-
to. Questo, a detta degli autori, comporta a volte una differenza significativa tra il
comportamento previsto dal modello e quello del sistema controllato. Nel lavoro si
cerca quindi di tenere conto di questo effetto con un apposito termine non lineare di
compensazione sul controllo. In pratica, quindi, alcune caratteristiche fisiche, come
1. Introduzione 4
ad esempio quelle aerodinamiche nel caso dei problemi di meccanica del volo, pos-
sono risultare difficilmente stimabili o complesse da modellare analiticamente, specie
se non lineari, e penalizzare tecniche non lineari di controllo.
D’altro canto controllori robusti, lineari o meno, possono essere disegnati per
rigettare disturbi esogeni [12] o possibili errori di modellazione, ma si rivelano in
alcuni casi conservativi, limitando le prestazioni raggiungibili dal sistema controllato.
In [22] gli autori paragonano un controllore robusto lineare multi-variabile ad altre
metodologie, concludendo che esso e` certamente in grado di tener conto di incertezze
e disturbi, ma anche che la sua operativita` e` limitata a condizioni di volo prossime
all’hover.
I sistemi di controllo adattativi, in grado di compensare possibili non linearita` o
dinamiche non modellate, permettono di raggiungere elevate prestazioni lungo tutto
l’inviluppo di volo con buona robustezza ai disturbi esterni. Essi vengono in genere
distinti in metodi di controllo adattativo indiretto (indirect adaptive control) se l’al-
goritmo identifica e compensa errori di modellazione mantenendo invariata la legge
di controllo, e diretto (direct adaptive control) se l’adattamento non avviene modifi-
cando il modello ma compensando direttamente gli ingressi del sistema. Pur avendo
proprieta` diverse, queste due metodologie sono spesso difficilmente distinguibili in
termini di prestazioni [23]. Il controllo diretto e` in genere preferibile perche´ la sua
complessita` e` indipendente dall’ordine del sistema e puo` essere legata semplicemente
agli ingressi ed alle uscite [14, 15, 16]. D’altro canto i metodi indiretti forniscono
una informazione piu` ricca perche´ puntano ad identificare l’intero sistema e possono
fornire, ad esempio, una valida predizione del suo comportamento [25]. In [9] e` discus-
sa l’applicazione di controllori critici adattativi in due fasi: nella prima fase avviene
l’adattamento a priori (off-line) del controllore, utilizzando una legge di controllo
di riferimento che garantisce prestazioni e sicurezza adeguati; nella seconda fase, il
controllore adattativo e` addestrato in linea, migliorando le prestazioni e compen-
sando eventuali differenze tra il modello assunto ed il sistema. Gli esempi riportati
dimostrano la capacita` di preservare le conoscenze acquisite dal controllore durante
l’adattamento, tuttavia la prima fase di addestramento e` certamente fondamentale
per il corretto comportamento del controllore e necessita di adeguati dati. Inoltre,
l’addestramento in linea e` abbastanza articolato e complesso.
1.3 Obiettivi e contributi del lavoro
L’obiettivo di questo lavoro e` la costruzione di un controllore adattativo non lineare
che approssimi la soluzione del problema NMPC. Rispetto a precedenti ricerche su
questa tematica, i principali contenuti e contributi di questa tesi sono i seguenti:
• Il problema di controllo e` suddiviso in un controllore di riferimento e nell’au-
mento di questo tramite: (a) un elemento adattativo che identifica il difetto di
modello e (b) un secondo termine adattativo che approssima la soluzione del
problema predittivo non lineare. Cio` consente prestazioni analoghe o superiori
al riferimento e assicura buona robustezza ad incertezze e disturbi.
1. Introduzione 5
• Il concetto di identificazione dei difetti elimina potenzialmente la necessita`
di pre-addestrare off-line gli elementi adattativi, semplificando notevolmente
l’applicazione del controllore a differenti sistemi.
• L’adattamento dei due elementi introdotti e` disaccoppiato: l’uno infatti agisce
unicamente a livello del modello, usando le misure del difetto della sua risposta
rispetto a quella del sistema; l’altro aumenta semplicemente la legge di controllo
di riferimento in base ad una cifra di merito, considerando congelato il modello
disponibile all’istante di attivazione.
• La legge di controllo e` non lineare e prevede il calcolo del controllo di riferimento
e l’applicazione dei due processi di adattamento. Questi ultimi comportano
un numero finito di operazioni di calcolo. Il costo computazionale e` quindi
determinato e valutabile, e risulta possibile applicare il controllore al vero su
una piattaforma hardware adeguata. Tipicamente, i controllori predittivi non
lineari, esatti o approssimati, prevedono la soluzione per via iterativa di un
problema non lineare, percio` non possono garantire che il tempo necessario al
calcolo sia a priori noto.
1.4 Organizzazione della tesi
Questo lavoro di tesi e` organizzato come segue. Nel capitolo 2 si esporra` teoricamente
e si derivera` la metodologia di controllo proposta. Il capitolo 3 analizzera` le carat-
teristiche di stabilita`, prestazioni e robustezza del controllore attraverso un problema
modello. Applicheremo il metodo al controllo di un velivolo autonomo ad ala rotante
nel capitolo 4, utilizzando il simulatore di un modello virtuale per verificarne l’effi-
cacia. Infine, nel capitolo 5 indicheremo le conclusioni del lavoro e alcuni possibili
sviluppi futuri.
2. METODO PROPOSTO PER IL CONTROLLO PREDITTIVO
TRAMITE IDENTIFICAZIONE DEI DIFETTI
In questo capitolo verra` illustrato il metodo proposto partendo da un’introduzione ed
un’analisi del controllo predittivo non lineare, illustrandone le proprieta`, i vantaggi e
gli svantaggi. Si procedera` poi a derivare formalmente la legge di controllo che verra`
poi applicata nei capitoli successi.
2.1 Controllo predittivo non lineare
Il principio fondamentale del controllo predittivo [10] e` illustrato in figura 2.1. Il
controllore predice, utilizzando un modello ridotto, il comportamento dinamico del
sistema per un periodo di tempo chiamato finestra di predizione e indicato col simbolo
Tp, basandosi sulle informazioni note al tempo t e determina i controlli tali da otti-
mizzare una determinata cifra di merito. Se il sistema non fosse affetto da disturbi o
non ci fossero difetti di modellazione e la finestra di predizione fosse infinita, l’insieme
dei controlli calcolati al tempo t = 0 sarebbe la soluzione ottima anche per gli istanti
di attivazione successivi, e potrebbe quindi essere applicata al sistema garantendone
la stabilita`. Questa situazione ideale non corrisponde pero` alla realta`, a causa di
possibili approssimazioni, difetti o disturbi esogeni che rendono il comportamento del
sistema diverso da quello predetto. Si opera quindi in genere applicando i controlli
calcolati al tempo t fino al tempo t+ δ, in cui divengono disponibili nuove misure ed
Valorediriferimento
Predizionex
Sistemax
Controlli u
d du/ t=0
Passato Futuro
t
t+T Finestradipredizionep
t+d
t+T Finestradicontrolloc
Fig. 2.1: Schema del controllo predittivo.
2. Metodo proposto per il controllo predittivo tramite identificazione dei difetti 7
e` quindi possibile risolvere un nuovo problema di predizione. L’intervallo di tempo δ
puo` in teoria essere variabile, ma e` piu` spesso assunto fissato.
In generale, finestre di predizione finite non garantiscono la stabilita` del sistema
controllato. D’altra parte, per poter ottenere una soluzione numerica del problema
di controllo ottimo non lineare con un tempo di calcolo ragionevole, e` necessario
utilizzare finestre di tempo abbastanza ridotte. Si cerca quindi il valore di Tp che
risulti il miglior compromesso tra le esigenze contrastanti di garantire una risposta
stabile del sistema controllato e quella di avere disponibile il risultato del controllore
NMPC in tempi accettabili nella pratica.
I vantaggi di una procedura di controllo predittivo non lineare sono notevoli. In
particolare essa permette: di utilizzare modelli non lineari del sistema, eventualmente
adattativi, per effettuare la predizione; di agire su una cifra di merito per ottimizzare
la prestazione del controllore; di tenere conto esplicitamente di possibili vincoli su
stati e controlli. Gli svantaggi sono, per quanto detto in precedenza: la mancan-
za di garanzia di stabilita` del sistema in anello chiuso nel caso di finestre finite di
predizione e l’onere computazionale, poiche´ bisogna risolvere in linea un problema di
ottimizzazione non lineare. Questa viene ottenuta facendo uso di metodi iterativi,
che non permettono di determinare a priori il numero di iterazioni necessarie per la
convergenza. Questo ultimo aspetto ostacola notevolmente la diffusione di questa
tecnica in ambito real-time.
D’altro canto, esistono diversi metodi per garantire la stabilita` dei controllori
NMPC anche nel caso di finestre di predizione finite, ad esempio aggiungendo oppor-
tuni vincoli di uguaglianza o disuguaglianza e/o degli opportuni termini di penaliz-
zazione sullo stato finale della predizione.
Per quanto riguarda l’onere computazionale del metodo, bisogna dire che a dif-
ferenza del controllo predittivo lineare, per il quale il problema di controllo ottimo
puo` essere risolto efficientemente anche in linea, il controllo non lineare comporta una
procedura numerica molto piu` complessa. Le tecniche utilizzate nella pratica possono
essere distinte in [2]:
• metodi indiretti, basati sulla derivazione e soluzione delle equazioni del controllo
ottimo;
• metodi diretti, che riconducono il problema NMPC ad un convenzionale proble-
ma di ottimizzazione non lineare (Non Linear Programming, NLP) vincolata.
In conclusione quindi il controllo predittivo fornisce eccellenti soluzioni di controllo
sia teoriche che pratiche. L’inserimento di un modello non lineare aggiunge una serie
di difficolta` computazionali, ma fornisce ottime aspettative per applicazioni pratiche.
La metodologia proposta cerca di mantenere i vantaggi del controllo predittivo
non lineare classico, limitando al tempo stesso l’onere computazionale. Siamo quindi
interessati ad utilizzare una metodologia che impieghi modelli non lineari adattativi,
e che cerchi diversamente la soluzione del problema di ottimo diminuendo i tempi
di calcolo e rendendoli deterministici. In questo lavoro si propone, in particolare, di
2. Metodo proposto per il controllo predittivo tramite identificazione dei difetti 8
addestrare un secondo elemento adattativo per approssimare la soluzione del problema
di controllo ottimo, evitando l’utilizzo di tecniche iterative.
2.2 Forma variazionale del problema di controllo predittivo
Nel controllo predittivo non lineare, ad ogni istante t di attivazione del controllore, i
controlli da applicare al sistema vengono calcolati risolvendo il seguente problema di
controllo ottimo:
minimizzare la funzione costo J (inversa della cifra di merito), definita come
J =
∫
t+Tp
t
L(x,u) dτ , (2.1)
su una finestra di predizione di durata Tp, soddisfacendo le equazioni di moto
x˙(τ) = f(x(τ),u(τ),pm), ∀τ ∈ [t, t + Tp], (2.2)
e le condizioni iniziali
x(t) = x0, (2.3)
dove x e u sono rispettivamente il vettore degli stati e dei controlli, mentre pm e` un
vettore, per ora assunto assegnato, di parametri del modello.
Nel problema esposto non sono considerati vincoli sugli stati o sui controlli: l’impo-
sizione esatta di questi, infatti, comporta in genere un forte incremento delle variabili
e delle dimensioni del problema di controllo ottimo NMPC. Percio`, anche nelle ap-
plicazioni documentate in bibliografia [3, 6, 25], essi sono spesso esclusi dal problema
di controllo. Cio` rappresenta una notevole mancanza dei controllori predittivi attual-
mente impiegati su velivoli autonomi. D’altro canto, il controllo NMPC, pur senza
considerare vincoli, consente di trattare in modo semplice e diretto l’ottimizzazione
delle prestazioni nel controllo di sistemi altamente non lineari.
Tipicamente, la funzione costo e` assunta come
L(x,u) = 1
2
(∆xTQ∆x+∆uTR∆u), (2.4)
ovvero una funzione quadratica degli stati e dei controlli, con Q e R matrici di peso
opportune, e ∆x = x−x∗,∆u = u−u∗ scostamenti rispetto agli stati e ai controlli
di riferimento x∗ e u∗.
Formalmente, il procedimento per la soluzione del problema consiste nel costruire
una funzione costo aumentata Jˆ con il metodo dei moltiplicatori di Lagrange [19],
come segue:
Jˆ = J +
∫
t+Tp
t
λT [x˙− f(x,u,pm)] dτ + λ(t)T [x(t)− x0]. (2.5)
Come noto, e` possibile dimostrare che la soluzione del problema di ottimizzazione
non vincolata di Jˆ (nelle variabili x, u e λ) corrisponde esattamente alla soluzione
2. Metodo proposto per il controllo predittivo tramite identificazione dei difetti 9
del problema di ottimo vincolato di J esposto in partenza (nelle variabili x ed u). La
soluzione del problema di controllo ottimo iniziale si trova quindi risolvendo il sistema
di equazioni che si ottiene imponendo la stazionarieta` della funzione costo aumentata
Jˆ :
δJˆ = δJ +
∫
t+Tp
t
[δλT (x˙− f) + λT (δx˙− δf)] dτ+
+ δλ(t)T [x(t)− x0] + λ(t)T δx(t) = 0.
(2.6)
Differenziando la funzione costo e le equazioni dinamiche, si ha:
δJˆ =
∫
t+Tp
t
[LTx δx+ LTu δu+ δλT (x˙− f) + λT (δx˙− fx δx− fu δu)] dτ+
+ δλ(t)T [x(t)− x0] + λ(t)T δx(t) = 0.
(2.7)
Integrando ora per parti il termine
∫
t+Tp
t
λT δx˙ dτ = λT (t + Tp)δx(t + Tp)− λT (t)δx(t)−
∫
t+Tp
t
λ˙T δx dτ , (2.8)
si ottiene infine la forma variazionale del problema
δJˆ =
∫
t+Tp
t
[δλT (x˙− f) + δxT (Lx − fTx λ− λ˙) + δuT (Lu− fTu λ)] dτ+
+ λ(t + Tp)T δx(t + Tp) + δλ(t)T [x(t)− x0] = 0,
(2.9)
che deve essere soddisfatta per ogni variazione arbitraria degli stati δx, dei controlli
δu e dei moltiplicatori δλ.
Devono essere quindi nulli, presi singolarmente, i termini che moltiplicano le
differenti variazioni. Questo porta al sistema di equazioni:
x˙− f(x,u,pm) = 0, ∀τ ∈ [t, t + Tp], (2.10)
λ˙+ fTx λ− Lx = 0, ∀τ ∈ [t, t + Tp], (2.11)
x(t)− x0 = 0, (2.12)
λ(t + Tp) = 0, (2.13)
Lu− fTu λ = 0, ∀τ ∈ [t, t + Tp], (2.14)
dove la prima equazione rappresenta le equazioni della dinamica del sistema, la secon-
da e` la cos`ı detta “equazione aggiunta”, la terza e la quarta sono le condizioni iniziali
e finali rispettivamente sugli stati e sui moltiplicatori, e l’ultima equazione e` la cos`ı
detta “condizione di trasversalita`”.
Il sistema (2.10-2.14) rappresenta un problema ai valori al contorno che e` general-
mente risolto discretizzando opportunamente le variabili e le equazioni nell’intervallo
[t, t+ Tp] e risolvendo il problema “quadrato” non lineare che ne deriva. Come detto
in precedenza, questo e` nel complesso il procedimento seguito con i metodi di tipo
indiretto, coi quali si derivano prima le condizioni necessarie di ottimo e se ne cerca
poi la soluzione.