4
INTRODUZIONE
In Italia, come in molti dei Paesi industrializzati ed emergenti, una delle principali
trasformazioni nelle relazioni tra i diversi livelli di governo consiste nell’attuazione del
decentramento attraverso il trasferimento del potere legislativo o regolamentare e della
responsabilità di spesa ai livelli subcentrali. La teoria del federalismo fiscale suggerisce che
tale processo possa incrementare l’efficacia e l’efficienza del settore pubblico. In particolare,
secondo l’impostazione della First-Generation Theory, l’esistenza dei livelli decentrali di
governo dipende dalle differenti preferenze circa la fornitura di beni pubblici, una differenza
che o è assunta da Oates (1972) nel Teorema del decentramento, o è rilevata da Tiebout
(1956) attraverso il meccanismo del voto con i piedi. Tale visione, che trae origine dagli studi
di Samuelson (1954, 1955), Musgrave (1959), Arrow (1969), si basa sul concetto di dittatore
benevolente, in base al quale ogni livello di governo cerca di massimizzare il benessere
sociale del proprio collegio elettorale attraverso la fornitura di livelli efficienti di beni
pubblici. L’approccio della teoria economica tradizionale è stato criticato da una serie di
contributi successivi (Brennan e Buchanan 1980, Salmon 1987, Breton 1987), sviluppati dalla
scuola di public choice, che evidenziano come il vantaggio di una struttura federale vada
ricercato nei meccanismi di concorrenza che si sviluppano tra diversi enti subcentrali e tra gli
stessi e il governo centrale e permettono di limitare il potere di sfruttamento fiscale del livello
centrale e dei livelli inferiori di governo nei confronti dei cittadini. Dalla critica all’assunzione
del dittatore benevolente e dalla letteratura sui problemi di asimmetria informativa trae
origine il lavoro di Qian e Weingast (1997) che ha dato il via ad un nuovo filone di ricerca
che prende il nome di Second-Generation Theory. Assunzione principale di tali contributi è
che il settore pubblico debba rispettare due forme di incentivi di mercato:
1. ricompensare il successo economico per evitare problemi di state predation;
2. punire il fallimento economico per non incentivare il fenomeno del soft budget
constraint.
Affinché queste due condizioni siano rispettate è necessario un appropriato decentramento
dell’informazione e del potere. Questo, infatti, aumentando la credibilità delle azioni svolte
dall’operatore pubblico, potrebbe generare una concorrenza disciplinante tra enti locali e
stimolare il rispetto degli incentivi di mercato da parte dei governanti locali.
Parallelamente allo sviluppo della letteratura sul federalismo fiscale ed alla sua
applicazione nei diversi contesti nazionali, è cresciuta la necessità di misurare le prestazioni
5
del settore pubblico e di valutarne l’efficienza. Le motivazioni alla base di tale studio vanno
ricercate non solo nel bisogno di valutare empiricamente l’impatto del decentramento sul
benessere della collettività (Ahmad, Brosio e Zanola, 2010) e sulla spesa pubblica (Ashworth,
Galli e Padovano, 2009), ma anche nell’urgenza di mettere ordine nei conti pubblici e
nell’idea che una Pubblica Amministrazione efficiente sia uno strumento indispensabile per
l’effettiva attuazione della democrazia. Un’attenta valutazione dei costi e degli sprechi
derivanti dall’uso illegittimo o non corretto delle risorse pubbliche costituisce, infatti, il primo
passo per porvi rimedio e rendere più efficace l’azione del settore pubblico.
Scopo del presente lavoro è analizzare l’efficienza dei Capoluoghi di Regione italiani,
valutata attraverso indicatori di performance (output) e di spesa (input). Pur passando in
rassegna i principali metodi di stima dell’efficienza e, in particolare, le tecniche di frontiera,
nell’analisi empirica si utilizzerà solo un approccio di tipo statistico. Il fatto di non utilizzare
le metodologie che consentono la costruzione di frontiere produttive non limita le possibilità
di valutare l’efficienza da un punto di vista relativo e, data anche la scelta del campione di
Comuni, di stabilire eventuali differenze tra le diverse aree geografiche del Paese. Un simile
studio costituisce la base per successive analisi delle cause delle inefficienze e per il
miglioramento delle performance delle amministrazioni locali, un obiettivo, questo, che
dovrebbe essere alla base dell’agire dei rappresentanti politici. L’aumento dell’efficienza
attraverso un migliore uso delle risorse, infatti, rappresenta un’alternativa, valida e non più
trascurabile, sia ai tagli ai servizi pubblici locali sia alla privatizzazione degli stessi.
L’esposizione che segue è organizzata in tre capitoli. Nel primo capitolo, dopo aver
definito il concetto di efficienza e le tecniche maggiormente utilizzate per la sua stima, si
analizzeranno le principali caratteristiche della letteratura economica e, in particolare, i
contributi di Afonso, Schuknecht e Tanzi (2003, 2005) e di Boetti, Piacenza e Turati (2009,
2010), che sono alla base del lavoro svolto in questa tesi. Nel secondo capitolo si passeranno
in rassegna i principali provvedimenti del processo evolutivo del governo locale e si fornirà
un quadro delle funzioni e dei servizi comunali. Nell’ultimo paragrafo, dopo aver analizzato il
contesto normativo della finanza locale, si presenteranno alcuni dati finanziari riferiti al 2008,
anno su cui è stata condotta l’analisi empirica. Nel terzo capitolo si fornirà una descrizione
della metodologia e dei dati utilizzati e si procederà all’analisi degli stessi. Nelle conclusioni
si traccerà un bilancio della ricerca svolta evidenziano i principali risultati ottenuti dall’analisi
empirica.
6
CAPITOLO 1
EFFICIENZA DEL SETTORE PUBBLICO:
BREVE RASSEGNA DELLA LETTERATURA
1.1. Il concetto di efficienza
Un’attività economica, pubblica o privata, volta alla fornitura di un servizio può essere
valutata in termini sia di efficacia, sia di efficienza. L’efficacia si misura in relazione al
raggiungimento di un dato obiettivo, mentre l’efficienza è data dal rapporto tra prodotto
ottenuto e risorse impiegate. La differenza tra il settore privato e quello pubblico consiste
nell’esistenza o meno di un mercato in grado di fornire una misura dell’efficacia dell’attività.
Quest’ultima, infatti, nel settore privato è automaticamente rilevata dall’acquisto del prodotto
da parte dei consumatori, dal profitto ricavato dall’impresa e dalla conquista di quote di
mercato da parte della stessa. Nel settore pubblico, invece, non esistono indicatori specifici
dell’efficacia dell’azione svolta e la costruzione degli stessi si scontra con:
1. problemi legati alla simultaneità degli obiettivi perseguiti dai servizi pubblici e
alla conseguente necessità di criteri di ponderazione;
2. la non misurabilità dei risultati e il differimento degli stessi rispetto
all’erogazione del servizio;
3. l’eterogeneità degli utenti. Quest’ultimo problema sarebbe risolvibile
utilizzando sistemi di indagine della soddisfazione degli utenti, ma si
incorrerebbe nelle problematiche derivanti dai meccanismi di rilevazione
imperfetta delle preferenze.
La valutazione dell’efficienza risulta, invece, meno complessa. Si tratta, infatti, di
stabilire se sia possibile produrre di più con le stesse risorse o utilizzare meno risorse per
produrre la stessa quantità di prodotto. Più precisamente, dato un insieme di produzione P ed
un piano produttivo (x, y) P, con x che indica il vettore degli input, misurati come quantità
negative, e y che indica il vettore degli output, la valutazione dell’efficienza consiste nel
verificare se esista un piano (x’, y’) P tale che (x, y) ≤ (x’, y’). Il piano si dice output-
efficiente se non esiste un altro processo che con gli stessi input realizzi un output maggiore.
Il piano si dice input-efficiente se non esiste un altro processo che realizzi il medesimo output
utilizzando una quantità inferiore di input.
7
Le difficoltà che si riscontrano in questo tipo di analisi derivano dall’individuazione
delle componenti dei vettori di input ed output e dalla stima dello scarto tra ciò che si osserva
e i valori teorici ottimi. Nel settore pubblico, poi, bisogna tener conto del fatto che la
disomogeneità della qualità di beni e servizi erogati non è rilevata attraverso il meccanismo
del prezzo. Questo fa sì che sia necessario definire anche i requisiti qualitativi standard che
devono caratterizzare il prodotto da esaminare.
La letteratura economica sulla misurazione dell’efficienza si è sviluppata a partire dal
lavoro di Farrell (1957), a cui si deve la definizione dei concetti di efficienza tecnica ed
efficienza allocativa. La prima riflette la capacità di ottenere il massimo livello di output da
un dato livello di input; la seconda riflette la capacità di utilizzare gli input in proporzioni
ottimali. La combinazione di queste due misurazioni fornisce il livello di efficienza
complessiva.
Per spiegare questi due concetti, Farrell ipotizza l’esistenza di un’impresa, o unità
produttiva, che utilizza due input, x
1
e x
2
, per produrre un output, y, sotto l’assunzione di
rendimenti di scala costanti. La figura sottostante illustra il grado di efficienza tecnica ed
allocativa di tale impresa.
Fig. 1.1. – Efficienza tecnica ed efficienza allocativa
L’isoquanto y
0
A
indica tutte le combinazioni di input che producono un output unitario
in modo efficiente, mentre la retta dell’isocosto, C
1
, rappresenta le combinazioni di input che
determinano lo stesso livello di spesa. Trascurando i segni negativi, la pendenza
8
dell’isoquanto misura il tasso marginale di sostituzione tra i fattori della produzione,
MP
1
/MP
2
, dove MP
i
indica la produttività marginale di x
i
, quella dell’isocosto è pari al
rapporto tra i prezzi dei fattori p
1
/p
2
, con p
i
che
indica il prezzo del fattore x
i
.
L’efficienza allocativa si ottiene nel punto di tangenza tra l’isoquanto e l’isocosto,
punto C. In tale punto si verifica l’equivalenza tra la pendenza delle due curve, per cui il
saggio marginale di sostituzione tra i fattori è uguale al rapporto tra i prezzi dei fattori:
MP
1
/MP
2
= p
1
/p
2
.
La condizione descritta comporta che la combinazione degli input sia tale da minimizzare il
costo di produzione per un dato livello di output, o da massimizzare il livello di output per un
dato livello di input.
L’efficienza tecnica si ottiene, invece, quando non vi è un utilizzo eccessivo dei fattori.
Graficamente questo è verificabile attraverso la maggiore vicinanza all’origine dell’isoquanto.
Supponendo, dunque, che gli isoquanti y
0
A
e y
0
B
siano entrambi associati allo stesso livello di
output, i punti dell’isoquanto y
0
B
individuano situazioni di inefficienza tecnica.
Se l’impresa si trovasse nella situazione descritta dal punto A, che corrisponde ad una
combinazione non ottimale di input per produrre l’unità di output, essa opererebbe in
condizione di inefficienza sia tecnica, sia allocativa. Se, invece, l’impresa fosse caratterizzata
solamente da inefficienza allocativa, sarebbe rappresentata dal punto B, che si trova sulla
curva dell’efficienza tecnica, y
0
A
, ma non su quella dell’efficienza allocativa, C
1
.
Date queste premesse, il grado di efficienza tecnica è dato dal rapporto OB/OA, che
misura la porzione di input utilizzati effettivamente necessari per la produzione del livello di
output considerato. Di contro, l’inefficienza tecnica è pari a 1 - (OB/OA) ed indica di quanto
potrebbe essere ridotto il costo di produzione del livello di output osservato, mantenendo
invariato il rapporto tra i fattori. Il livello di efficienza allocativa è, invece, dato dal rapporto
OD/OB, che rappresenta il costo che si sarebbe sostenuto in caso di efficienza allocativa in
rapporto a quello effettivo. L’inefficienza allocativa è pari a 1 – (OD/OB). L’efficienza
complessiva è data dal rapporto OD/OA e, di conseguenza, l’inefficienza complessiva è pari a
1 – (OD/OA) e misura l’eccedenza dei costi rispetto al loro minimo potenziale.
La misurazione dell’efficienza proposta da Farrell considera come data la funzione di
produzione, che indica, per ogni quantità dei fattori produttivi, la quantità massima di
prodotto ottenibile. Nella realtà è necessario derivare tale funzione da un insieme di dati. Nel
prossimo paragrafo si illustreranno le principali tecniche che consentono di misurare
l’efficienza delle varie unità produttive rispetto ad un riferimento ottimo.
9
1.2. La stima dell’efficienza: metodologie a confronto
Le tecniche proposte in letteratura per formulare giudizi sull’efficienza delle unità
produttive si distinguono in metodologie non di frontiera e metodologie di frontiera.
Le metodologie non di frontiera misurano l’efficienza di ogni singola unità come
scostamento rispetto al risultato medio del campione utilizzato. Uno dei primi contributi sulla
misurazione dell’efficienza attraverso le tecniche di regressione standard è stato proposto da
Feldstein (1967), il quale, utilizzando una funzione di produzione di tipo Cobb-Douglas,
valuta l’efficienza sia tecnica, sia allocativa, sia quella complessiva. Considerando la
funzione:
n
ln y
i
= β
0
+ ∑ β
j
ln x
ij
+ u
i
j=1
con y
i
che rappresenta l’output dell’unità produttiva i, x
ij
gli input utilizzati, u
i
il termine di
errore e i coefficienti β
j
che misurano l’elasticità del prodotto a variazioni nell’input,
l’inefficienza tecnica può essere misurata utilizzando i residui û
i
calcolati sulla base della
stima dei coefficienti β
j
. In particolare, se û
i
= 0 il livello di inefficienza tecnica è pari a quello
medio, se û
i
> 0 l’inefficienza è inferiore alla media, se û
i
< 0 l’inefficienza è superiore alla
media. L’efficienza allocativa implica che, per ciascuna coppia di input, il rapporto tra le
spese per i due fattori sia pari al rapporto tra le elasticità del prodotto rispetto a tali fattori:
β
k
/ β
j
= (p
k
x
k
/ p
j
x
j
).
Poiché il primo membro dell’eguaglianza può essere considerato come dato in quanto il
valore dei coefficienti β non varia al variare dell’ammontare degli input utilizzati, qualsiasi
differenza tra i due membri può essere attribuita ad un uso non corretto di uno o più input.
L’efficienza complessiva può essere valutata utilizzando una funzione di costo del tipo:
n
c
i
= β
0
+ ∑ β
j
ln x
ij
+ u
i
j=1
dove c
i
è il costo totale o medio dell’unità i, x
j
include variabili come il livello dell’output e i
prezzi degli input e u
i
è il termine di errore. L’efficienza può essere valutata confrontando il
costo effettivo con il costo atteso sulla base della funzione di costo. Anche in questo caso, le
unità con residui positivi sono meno inefficienti rispetto alla media e le unità con residui
negativi sono relativamente meno efficienti. Uno dei limiti della tecnica proposta da Feldstein
deriva dal fatto che le deviazioni dalla media possono derivare da fattori diversi
dall’inefficienza, quali errori di misurazione o di specificazione delle variabili, che però non
vengono posti in evidenza.
10
Le metodologie di frontiera misurano l’efficienza delle varie unità produttive rispetto
ad un riferimento ottimo definito o dalla stima di una frontiera delle possibilità di produzione
teorica (frontiera assoluta) o come miglior risultato conseguito nell’ambito del campione di
unità produttive considerato (frontiera di best practice). All’interno di questa categorie di
metodologie, si distinguono le tecniche parametriche da quelle non parametriche.
Le tecniche parametriche definiscono a priori la forma funzionale della frontiera di best
practice attraverso parametri stimati con metodi statistico-econometrici. La definizione
parametrica delle frontiere può essere condotta seguendo due approcci: quello deterministico,
che attribuisce le deviazioni rispetto alla frontiera unicamente alle scelte del decision maker e
le imputa, dunque, ad inefficienza; quello stocastico, secondo cui le devianze possono essere
giustificate anche da circostanze al di fuori del controllo del decision maker. Tra le tecniche
parametriche, il modello maggiormente utilizzato segue l’approccio stocastico. Si tratta dello
Stochastic Frontier Model (SFM), proposto per la prima volta da Aigner, Lovell e Schmidt
(1977), in cui il termine di errore è scomposto in due parti: la prima componente cattura gli
effetti di errori di misurazione, altri disturbi di natura statistica e shock esogeni; l’altra cattura
gli effetti dell’inefficienza. Il modello può essere così formalizzato:
ln y
i
= ln f(x
i
) + v
i
+ u
i
.
La frontiera di produzione stocastica è data da ln y
i
= ln f(x
i
) + v
i
, dove v
i
rappresenta la prima
componente del termine di errore. L’inefficienza tecnica rispetto alla frontiera stocastica è
misurata da u
i
: la condizione u
i
≤ 0 assicura che tutte le osservazioni si collochino in
corrispondenza della frontiera stocastica o sotto di essa.
Nelle tecniche non parametriche ciò che viene specificato a priori non è un’esplicita
forma funzionale, ma solo alcune proprietà che i punti appartenenti alla frontiera devono
soddisfare. La frontiera viene, dunque, assunta ed i dati sono valutati determinando, con
tecniche di programmazione matematica, se ciascuna osservazione può essere considerata un
elemento della frontiera oppure no, date le ipotesi fatte. Le due principali tecniche non
parametriche sono la metodologia Free Disposal Hull (FDH) e la Data Envelopment Analysis
(DEA).
L’approccio FDH per la costruzione di frontiere di efficienza, definito dal lavoro di
Tulkens (1986), si basa sul criterio di dominanza discreta fra differenti tecniche di
produzione, che permette di costruire delle frontiere a gradini. Tale tecnica consente di
affrontare il problema della valutazione dell’efficienza relativa di ogni osservazione sia
rispetto all’impiego degli input per ottenere un dato output, sia rispetto all’output ottenuto da
un dato input. Considerando ancora una volta due piani di produzione (x, y) e (x’, y’), con x