La programmazione � la fase preliminare dell�indagine e consiste
nella specifica degli obiettivi da perseguire e degli strumenti da
utilizzare nella ricerca.
Durante la programmazione:
• si formulano le ipotesi di ricerca;
• si individua la popolazione ed i caratteri oggetto d�interesse;
• si determinano le modalit� di raccolta delle informazioni;
• si precisano le modalit� di analisi statistica dei dati;
• si definiscono i tempi di svolgimento e le risorse necessarie al
compimento dell�indagine.
Le modalit� di raccolta dei dati, sopra citate, sono riconducibili a
cinque categorie principali: l�analisi storica, l�esperimento, la simulazione,
l�indagine diretta e l�osservazione esterna. Le ultime due sono le pi�
utilizzate nelle indagini sociali e presuppongono l�uso di un questionario,
cio� di uno strumento di supporto costituito da una serie di domande.
Le domande inserite non sono casuali ma collegate al quadro teorico di
riferimento ed alle ipotesi poste alla base della ricerca. L�insieme delle
risposte, opportunamente elaborate, fornisce un�informazione completa del
fenomeno utile alla verifica ed al controllo delle ipotesi stesse.
La rilevazione, che segue la programmazione, pu� operarsi su tutte le
unit� statistiche della popolazione (indagine esaustiva o censuaria) o su
una parte di essa idonea a rappresentarla, detta campione (indagine
campionaria o parziale). La stessa pu� essere ancora diretta (mediante
ricorso ad osservatori o intervistatori) e indiretta (mediante il ricorso a
riviste, registri ecc.).
Le tecniche di rilevazione diretta pi� usate sono l�osservazione
dall�esterno delle unit� statistiche e l�indagine diretta.
L�osservazione dall�esterno viene effettuata quando il ricercatore � in
grado di rilevare autonomamente le caratteristiche e le relazioni tra i
fenomeni in analisi.
L�indagine diretta (con intervista) � invece usata quando si vogliono
acquisire informazioni attraverso un contatto diretto (face to face, postale,
telefonico).
2. La customer satisfaction e l�analisi comportamentale
Lo studio dei comportamenti delle persone, permette talvolta di
suggerire orientamenti da seguire per le strategia di segmentazione e di
posizionamento dei prodotti, per la definizione di politiche di prezzo, di
vendita, di distribuzione e di pubblicit�.
L�orientamento al consumatore �presuppone� l�acquisizione di
informazioni su di esso e la ricerca della sua soddisfazione.
La logica della customer satisfaction, vista come obiettivo principale
della ricerca di mercato, pu� essere riassunta in 5 punti:
- comprensione della strutturazione del mercato e della sua
articolazione in segmenti;
- messa in evidenza delle caratteristiche dei comportamenti di acquisto
e delle preferenze rispetto all�offerta;
- individuazione dei bisogni insoddisfatti;
- identificazione degli users di un prodotto e delle caratteristiche a loro
connesi.
Nell�ambito di una ricerca di mercato pu� essere individuato il
cosiddetto processo di acquisto, generato da una pluralit� di variabili che
lo condizionano.
La scelta finale (nell�ambito sempre del processo di acquisto) � frutto di
una serie di esperienze maturate precedentemente dall�individuo, nonch� di
una serie di percezioni, esigenze e motivazioni diverse.
Secondo il tipo di offerta, cos� la soddisfazione di un bisogno nasce da
una valutazione di alternative: le varie opzioni vengono ordinate dal
consumatore in base ad una serie di attributi relativi alla funzionalit� del
prodotto, alla prestazione ottenuta, ed alle aspettative nei suoi confronti. Il
confronto successivo tra prestazione ottenuta e le aspettative precedenti
influenza il comportamento del dopo-acquisto.
In relazione a quanto sopra affermato si ricava che un�analisi completa e
corretta della domanda di mercato non pu� trascurare n� i fattori personali
(et�, sesso, titolo di studio, ecc.) che determinano la struttura del consumo,
n� i fattori psicologici (motivazioni, convinzioni, sensazioni, ecc.) che
contribuiscono indirettamente al risultato finale dell�atto d�acquisto.
L�esigenza di mettere in evidenza i punti di contatto tra offerente e
consumatore ha richiesto l�impiego di indagini campionarie, per la
comprensione dei molteplici comportamenti e delle loro complessit� ci si �
avvalsi delle tecniche di Analisi Multidimensionale dei dati, che si
utilizzano a loro volta evoluti supporti informatici.
3. Gli obiettivi dell�indagine
L�indagine condotta si muove nell�ottica della rilevazione dei punti di
contatto tra clienti e negozianti dei centri commerciali napoletani, con una
valutazione comparativa della domanda e dell�offerta tramite la
somministrazione di questionari.
L�indagine � stata condotta nell�ambito di quattro centri commerciali di
Napoli e con precisione al Vomero, a Via Roma/Chiaia, al Corso Umberto
ed a Via dei Mille.
La ricerca � stata realizzata su un campione di 320 unit� statistiche, di
cui 160 negozianti e 160 clienti, ripartiti equamente nei quattro centri
commerciali sopra citati. Per i negozianti � stato adottato un
campionamento per quote, mentre per i clienti � stato adottato un
campionamento di tipo stratificato. Il questionario � stato somministrato
con la tecnica del face to face.
L�analisi statistica ha permesso di mettere di evidenza numerose variabili
statistiche interessanti grazie all�uso di tecniche come l�Analisi
Multidimensionale dei dati eseguita con il metodo delle Corrispondenze
Multiple e della Cluster analysis.
Le metodologie, le logiche ed i risultati sono riportati in questo lavoro
come di seguito:
PARTE I
Nella prima parte (Cap1, Cap2, Cap3) sono state presentate le
metodologie di analisi statistiche usate nella ricerca.
In particolare il Cap.1 introduce Il concetto di indagine, le tecniche di
campionamento e le modalit� di esecuzione di queste ultime.
Nel Cap.2 si introduce la differenza tra analisi qualitativa e
quantitativa. Il rilievo � posto in particolare sui questionari, dove �
analizzato il processo di progettazione e di redazione degli stessi.
Nel Cap.3 l�interesse � posto sugli strumenti di analisi dei dati, con
riferimento particolare all�Analisi delle Corrispondenze Multiple ed alle
tecniche di Classificazione.
PARTE II
Nella seconda parte c�� la spiegazione dell�analisi, dal momento della
progettazione all�analisi dei risultati.
In particolare nel Cap.1 si parte dalla definizione degli obiettivi e dal
modo in cui verr� condotta l�analisi, per finire al tipo di campionamento,
alla progettazione, redazione e codifica del questionario.
Nel Cap.2 si analizzano le caratteristiche della domanda e
dell�offerta, si fa un�analisi generale del processo di vendita e di acquisto,
tramite l�analisi di tabelle incrociate.
Nel Cap.3 si fa riferimento all�Analisi delle Corrispondenze Multiple,
ed alla Cluster Analysis, mediante le quali sono stati analizzati i dati
oggetto di studio. Le analisi sono condotte dapprima sui negozianti e
successivamente sui clienti.
Ringraziamenti
La realizzazione del seguente lavoro � stata eseguita grazie all�aiuto di
alcune persone, alle quali sento di dover porgere i miei pi� sentiti
ringraziamenti.
In particolare vorrei porgere i miei ringraziamenti al Prof. Lauro che in
tutto il lavoro � stato il mio maestro, il referente per eccellenza e
disponibilit�.
Al dott. Oreste Costantini la cui competenza e disponibilit� mi hanno
permesso di poter realizzare un lavoro estremamente coerente con
l�evolversi della realt�.
A tutto il Dipartimento di Matematica e Statistica che ha contribuito
comunque al buon esito del lavoro.
Ai negozianti ed ai clienti dei centri commerciali Vomero, Vai dei Mille,
Corso Umberto, Via Roma/Chiaia, per la partecipazione che ha reso
materialmente possibile la ricerca.
Ai miei genitori che in tutti questi anni mi hanno sostenuto nelle scelte
ed incoraggiato nei momenti difficili.
PARTE PRIMA
METODOLOGIE DI ANALISI STATISTICA PER LE
RICERCHE DI MERCATO
CAPITOLO PRIMO
IL CAMPIONAMENTO
1. L�indagine esaustiva o campionaria?
Quando si parla di campionamento non si pu� prescindere dalla
distinzione tra rilevazione esaustiva (totale) e rilevazione campionaria (o
parziale).
L�indagine campionaria si prefigge di restringere l�analisi del fenomeno
ad un numero limitato di unit� statistiche, in modo da ottenere
un�informazione che, pur riferendosi ad una conoscenza parziale, sia
generalizzabile all�intero universo con un grado accettabile di precisione.
E� necessario ricorrere al campionamento quando la rilevazione
complessiva � impossibile, ma � anche preferibile ricorrervi quando la
popolazione � numerosa, � insediata su un territorio vasto o quando si deve
osservare la sua evoluzione nel tempo.
La rilevazione campionaria presenta:
• Vantaggi nei tempi di raccolta dati e di elaborazione;
• Vantaggi nei costi di rilevazione;
• Vantaggi organizzativi;
• Vantaggi di approfondimento e di accuratezza, in quanto la minore
complessit� organizzativa, permette di concentrare risorse sul controllo
della qualit� della rilevazione.
Chiamiamo campionamento un procedimento attraverso il quale si
estrae, da un insieme di unit� (popolazione) costituenti l�oggetto di studio,
un numero ridotto di casi (campione) scelti con criteri tali da consentire la
generalizzazione all�intera popolazione dei risultati ottenuti studiando il
campione.
Una volta selezionate le unit� statistiche per il campione, occorre
affrontare il problema dell�utilizzazione dei dati campionari a disposizione.
Per conoscere le caratteristiche di una popolazione si impiegano degli
indici o parametri (ad es. media, varianza, ecc.) che permettono di disporre
di un quadro descrittivo di sintesi della popolazione stessa. Se il campione
deve rappresentare l�universo da cui � stato estratto si possono, dunque,
rilevare su di esso le corrispondenti informazioni.
2. Disegno di campionamento
Nel disegno di campionamento si evidenziano:
• La definizione della popolazione e la struttura del campione;
• Le regole di identificazione delle unit� da selezionare (metodo di
campionamento);
• La probabilit� di selezione delle singole unit�
• Le modalit� di determinazione della numerosit� campionaria.
Per effettuare il campionamento � essenziale disporre di una lista, non
necessariamente nominativa, delle unit� che compongono l�universo da
osservare. La predisposizione della lista pu� creare problemi, perch�
quest�ultima � spesso di difficile reperimento, non aggiornata, incompleta o
ridondante. La struttura del campione � determinata dall�insieme delle liste
che si utilizzano per formarlo. La scelta della struttura (semplice o a �lista
unica� oppure complessa o a �liste multiple�) dipende dagli obiettivi, dai
vincoli finanziari ed organizzativi dell�indagine, dalla popolazione e dal
territorio su cui � insediata.
Nella fase di selezione del metodo di campionamento si pone la
distinzione tra campione probabilistico (o casuale) e non probabilistico
(o a scelta ragionata).
Per utilizzare i campioni casuali si deve disporre di un elenco delle unit�
dell�universo, attribuire a ciascuna di esse una probabilit� positiva di essere
selezionata
1
ed utilizzare in modo appropriato le tecniche di selezione
casuale.
I campioni, le cui unit� sono invece scelte con criteri che riflettono
l�orientamento del ricercatore, sono detti non probabilistici.
Nel disegno di campionamento viene indicata anche la numerosit�
ottima
2
del campione da estrarre, che consiste nel pi� piccolo numero in
base al quale le stime raggiungono il livello di attendibilit� richiesto o, in
diversi termini, che permette di raggiungere gli obiettivi dell� indagine al
minimo costo.
1
La probabilit� di selezionare un�unit� dalla lista � fissata dal ricercatore. Le probabilit�
possono essere costanti ( quando sono uguali per tutte le unit� della lista) o variabili ( quando ad
ognuna di esse si assegna una propria probabilit� di estrazione ).
La probabilit� di selezione p
i
varia tra 0 e 1 con ∑ pi = 1.
2
Si rimanda, per l�ampiezza del campione, al campionamento casuale semplice.
3. Le diverse tecniche di campionamento
Nell�ambito del campionamento probabilistico sopra citato possiamo
distinguere:
• Campionamento casuale semplice
• Campionamento casuale stratificato
• Campionamento casuale a grappoli
• Campionamento a due stadi
• Campionamento sistematico
Nel campionamento non probabilistico abbiamo:
• Campionamento per quote
3.1 Campionamento casuale semplice
E� il campionamento per eccellenza e si distingue in campionamento
senza ripetizione e con ripetizione.
Nel primo caso ogni campione di dimensioni n � formato estraendo
casualmente n unit�, senza che queste vengano , poi, rimesse nella
popolazione.
Nel secondo caso ogni campione di dimensioni n � formato estraendo
casualmente n unit� dalla popolazione e rimettendo nella popolazione,
prima di ogni nuova estrazione, l�unit� precedentemente estratta.
Il campionamento casuale semplice � raramente utilizzato nelle indagini
perch�, nel caso di ricerche su vasta scala, non � considerato conveniente in
termini di costi di rilevazione e tempi di organizzazione del lavoro. Esso � ,
invece, alla base della teoria dell�inferenza statistica, nonch� delle tecniche
di campionamento.
3.2 L�errore di campionamento
Se il campionamento � casuale semplice, la statistica ci mette in
condizione di determinare l�errore di campionamento. Nel caso che il
parametro da stimare sia la media
3
, l�errore di campionamento � dato da:
e = z s/n
1/2
(1-f)
1/2
dove :
z = coefficiente dipendente dal livello di fiducia della stima;
s = deviazione standard campionaria della variabile studiata;
n = ampiezza del campione;
1-f =fattore di correzione per popolazioni finite, dove f = frazione di
campionamento = n/N.
Il termine z � un coefficiente che dipende dal livello di fiducia che il
ricercatore vuole avere nella stima. Questo coefficiente dipende dal grado
di certezza - cio� dall�affidabilit� - che si vuole dare alle stime
accontentandosi di una probabilit� del 95% di essere nel giusto, esso
assume il valore z=2,58.Ovviamente aumentando la probabilit� di essere
nel giusto, aumenter� l�ampiezza dell�intervallo di fiducia, cio� il margine
di errore concesso.
Quanto a s, esso rappresenta la deviazione standard campionaria della
variabile studiata, della quale si vuole stimare la media. La deviazione
standard � una misura di dispersione (o variabilit�) della distribuzione di
una variabile; essa consiste nella media degli scarti dei valori dei singoli
3
Ci riferiamo qui alla medi aritmetica.
casi dalla media e dice quanto i valori assunti dalla variabile sui singoli casi
sono prossimi al valore medio oppure variabili attorno ad esso.
Il termine n rappresenta l�ampiezza del campione. Esso si trova ad essere
collocato al denominatore dell�espressione, il che sta a significare che tanto
pi� numeroso � il campione, tanto minore � l�errore di campionamento.
Infine, il termine (1-f)
1/2
definito come fattore di correzione per
popolazioni finite, dove, f= frazione di campionamento, cio� il rapporto fra
ampiezza del campione ed ampiezza della popolazione (n/N). Si noti che se
la popolazione � infinita, o comunque molto maggiore di n (quando il
campione � inferiore al 5% della popolazione), il fattore di correzione
diventa talmente vicino ad 1 che si pu� trascurare.
Comune � il caso variabili nominali (partito votato, favorevoli o contrari
ad una certa affermazione ecc.), per le quali la misura sintetica pi� comune
� rappresentata dalla proporzione ( proporzione di voti al partito A,
proporzione di favorevoli, di cattolici, ecc.)
4
in questo caso la formula
dell�errore di campionamento si modifica leggermente e diventa:
e = z (pq/n-1)
1/2
(1-f)
1/2
dove:
z, n, f hanno lo stesso significato della formula precedente, mentre:
p = proporzione nel campione per la categoria in esame
q = 1-p
4
Una proporzione � una frequenza relativa, cio� numero di casi appartenenti ad una certa categoria diviso
il numero di casi totali. Il valore di una proporzione sta fra 0 e 1.
si noti che la seconda formula � uguale alla prima ove si consideri che
per variabili nominali abbiamo che la deviazione standard σ = (PQ)
1/2
.
Poich� P e Q, si riferiscono alla popolazione, non sono noti, sono stati
sostituiti nella formula dai corrispondenti valori p e q trovati nei dati
campionari.
In conclusione, l�errore di campionamento � direttamente proporzionale
al livello di fiducia che vogliamo avere nella stima ed alla variabilit� del
fenomeno studiato, mentre � inversamente proporzionale all�ampiezza del
campione.
3.3 L�ampiezza del campione
La determinazione preventiva � sia pure approssimata � dell�ampiezza
del campione rappresenta uno dei criteri base per la definizione dell�entit�
della ricerca e la previsione dei suoi costi.
Dalla formule precedenti � facile risalire alle dimensioni del campione:
basta sostituire ad e l�errore che siamo disposti ad accettare, e risolvere
l�equazione rispetto ad n. Si supponga per il momento che la popolazione
sia talmente grande rispetto al campione che si possa trascurare il fattore di
correzione per popolazioni finite; in tal caso risolvendo rispetto ad n nel
caso della stima di una media o di una proporzione si ha:
n = (z s/e)
2
n= n-1= z
2
pq/ e
2
dove:
z= coefficiente dipendente dal livello di fiducia che vogliamo avere nella
stima;
s oppure (p q)
-2
= variabilit� del fenomeno studiato;
e = errore della stima.