6
possiedono sequenze di ripetizioni multiple che legano la proteina CsrA, presenti anche su
mRNA. L’ultimo meccanismo d’azione, il più comune e maggiormente caratterizzato,
prevede l’appaiamento degli sRNA con sequenze complementari al messaggero target
regolando così l’espressione genica (Storz et al., 2004).
1.2 Approcci sperimentali per identificare gli sRNA nei procarioti
Ad oggi, sono noti circa 80 sRNA non codificanti in E.coli, la maggior parte dei
quali sono stati identificati negli ultimi sei anni come risultato dello screening di interi
genomi che sono basati su: marcatura diretta, predizioni computazionali, analisi del
trascrittoma (microarrays), isolamento diretto (attraverso la metodica dello “shotgun
cloning”o RNomics) e co-immunoprecipitazione con proteine. Ognuno di questi approcci
utilizza specifici parametri che permettono di identificazione diversi tipi di geni. Ad
esempio l’approccio computazionale che si basa sulla conservazione di sequenze e
strutture degli sRNA, non permette di identificare sRNA specie specifici. Allo stesso
modo, sRNA che sono espressi solo in particolari condizioni fisiologiche non possono
invece essere rivelati in condizioni di crescita normali, come l’RNA OxyS che è indotto da
stress ossidativo (Altuvia, 2007).
1.2.1 Marcatura diretta e sequenziamento
I primi sRNA sono stati identificati attraverso frazionamento su gel di estratti di
RNA totale marcato con
32
P-ortofosfato. Le bande di interesse sono state escisse da gel e
sottoposte a digestione con nucleasi per poter poi essere sequenziate. Una forte limitazione
di questa tecnica è dovuta al fatto che permette di isolare sRNA presenti in grande quantità
all' interno della cellula. Ad esempio gli sRNA BS190 e BS203 di B.subtilis e tre sRNA
altamente espressi in di S.aureus sono stati scoperti usando questo approccio (Ando et al.,
2002; Suzuma et al., 2002).
1.2.2 Approcci computazionali
Ad aprire la strada all'identificazione degli sRNA, basata sull’analisi di regioni
intergeniche conservate, sono stati i gruppi di ricerca di Argman et al., di Wassarman et
al., e di Rivas et al., che nel 2001, portarono alla scoperta di più di 42 sRNA in E.coli. Gli
7
algoritmi computazionali sviluppati da Argman e Wassarman si basavano non solo
sull'analisi di sequenza ma anche sui segnali di trascrizione, restringendo la lunghezza
degli RNA predetti tra 50 e 400 ntd. Rivas et al., al contrario, utilizzarono un approccio di
studio improntato sulla conservazione di elementi strutturali degli sRNA piuttosto che sulle
sequenze primarie conservate. I risultati ottenuti furono poi confermati tramite Northern
blot su estratti di RNA totale a diversi tempi e condizioni di crescita batterica .
In seguito Chen et al. nel 2002, restrisero la lunghezza degli sRNA predetti da 45 a
370 nucleotidi lavorando sui segnali trascrizionali quali promotori e terminatori. Nel
2006 grazie a nuovi algoritmi come sRNAPredict, sono stati identificati in P.aeuruginosa
17 nuovi sRNA utilizzando come percursori terminatori Rho-indipendenti codificati a valle
di regioni di sequenza conservate (Livny et al., 2006). Tuttavia centinaia di sRNA
aspettano ancora di essere esaminati.
1.2.3 Scoperta degli sRNA attraverso analisi del trascrittoma (microarrays)
La tecnica del “DNA microarrays” sviluppata negli anni '90, è un potente strumento
che permette l'analisi dell'espressione genica monitorando in una sola volta gli RNA
prodotti da migliaia di geni. Per l'identificazione degli sRNA è necessario l'utilizzo di
“arrays” contenenti sonde per le regioni intergeniche, dove vengono codificati la maggior
parte degli sRNA. Questa tecnica seguita da un'analisi comparativa del genoma, ha
permesso di identificare sia sRNA espressi in differenti fasi di crescita in E.coli e in
S.aureus sia sRNA che controllano il processo di sporulazione in B.subtilis (Wassarman et
al., 2001; Pichon et al. 2005; Silvaggi et al., 2006)
1.2.4 La metodica dello “ shotgun cloning”(RNomics)
L’approccio dello “shotgun cloning” è stato impiegato per lo studio di sRNA in molti
organismi eucariotici e in organismi procariotici quali E.coli e Archaeoglobus fulgidis . In
E.coli, in una sola analisi, l’RNA totale estratto da tre differenti fasi di crescita della
cellula batterica e successivamente selezionato in base alla grandezza dei frammenti isolati
(50-500 ntd), è stato retrotrascritto per costruire delle librerie di cDNA. Questa metodica
ha permesso di identificare non solo sRNA codificati da geni indipendenti ovvero
caratterizzati da una proprio promotore e terminatore, ma anche sRNA che sono processati
dalle regioni a monte o a valle degli mRNA (Volgel et al., 2003). Un’ulteriore analisi, in
8
cui sono stati clonati frammenti di RNA della lunghezza di 30-65 ntd, ha portato alla
scoperta di sRNA codificati da regioni geniche al 3’e 5’ UTR o in direzione opposta
rispetto a geni codificanti per proteine (Kawano et al., 2005). Una forte limitazione di
questo approccio risulta nella necessità di analizzare un elevato numero di sequenze.
Recentemente è stato identificato un metodo di sequenziamento, applicabile ad oggi
solo nelle piante, che potrebbe portare alla scoperta di un numero maggiore di sRNA se
associato a studi di RNomics. Un esempio è il sequenziamento in presenza di pirofosfato
che permette di sequenziare in parallelo centinaia di frammenti di cDNA (Altuvia, 2007;
Meyers et al., 2006).
1.2.5 Isolamento degli sRNA da complessi RNA-proteina: co-purificazione e SELEX
Molti sRNA sono stati trovati associati a proteine, sia perché essi richiedono
quest’ultime per la loro attività, sia perché essi agiscono modulando le proteine target. E’
stato osservato che la proteina Hfq è importante per la funzionalità di un gran numero di
sRNA che agiscono come regolatori antisenso. Di conseguenza, molti sRNA legano Hfq e
possono quindi essere co-immunoprecipitati utilizzando anticorpi contro la proteina stessa
(Zhang et al., 2003). Nel caso di E.coli l’identificazione di sRNA co-immunoprecipitati
con Hfq, è stata condotta attraverso un’analisi di microarray, mentre in Listeria
monocytogenes si è utilizzata la strategia del sequenziamento enzimatico dell’RNA.
L’approccio SELEX è stato recentemente adottato per identificare nuovi sRNA legati
a Hfq, costruendo una libreria di sequenze random di 50-500 bp del genoma di E.coli che è
stato trascritto in vitro dalla RNA polimerasi di T7, incubato con Hfq e in seguito
selezionato per il legame con la proteina su un filtro. L’RNA trattenuto su filtro è stato poi
retrotrascritto in cDNA e sottoposto a cicli addizionali di selezione e amplificazione.
Specifiche interazioni con Hfq sono state poi analizzate in vivo con la tecnica del triplo
ibrido in lievito (Lorenz et al., 2006). Il vantaggio di questa procedura e quello di
permettere l’identificazione di sRNA in vitro indipendentemente da particolari condizioni
di crescita, che normalmente sono richieste da altre metodiche.
9
1.3 Gli sRNA di Escherichia coli
Ad oggi sono noti circa 80 sRNA in E.coli che rappresentano il 2% dei geni
codificanti per proteine; questi probabilmente comprendono solo una porzione della
vastissima popolazione di sRNA codificati dal batterio che devono ancora essere validati
sperimentalmente (Altuvia, 2007).
1.3.1 La distribuzione degli sRNA lungo il genoma di E.coli
La maggior parte dei geni di E.coli codificanti per sRNA sono localizzati in regioni
intergeniche “vuote” dove nessun altro gene viene espresso in entrambi gli orientamenti.
La distribuzione di questi geni è stata analizzata a partire dall’origine di replicazione di
E.coli che è bidirezionale e inizia a livello di un'unica forca di replicazione creando due
repliconi: un replicone di sinistra e uno di destra (Blattner et al., 1997). Mentre il 51%
delle ORF è localizzato nel replicone di sinistra e il 49% nel replicone di destra, i geni
degli sRNA mostrano una distribuzioni asimmetria poiché il 64% di loro sono localizzati
nel replicone sinistro (Fig.1).
Fig.1: Distribuzione dei geni codificanti per sRNA lungo il genoma di E.coli. In rosso sono indicati i
geni collocati sul filamento “ritardato” mentre in azzurro quelli localizzati sul filamento “leader” (Hershberg
et al., 2003).
Non sono però state evidenziate significative differenze nel numero e nella lunghezza delle
regioni intergeniche e quindi nessuna ovvia ragione che spieghi questa differenza nella
10
distribuzione tra i due repliconi del numero di geni codificanti gli sRNA (Hershberg et al.,
2003).
Nel complesso il genoma di E.coli è abbastanza compatto, ci sono solo 33 regioni
intergeniche, più lunghe di 900 ntd, molte delle quali contengono sequenze ripetute
(Blattner et al., 1997). La maggior parte delle regioni intergeniche sono relativamente
corte: 155 sono minori di 50 ntd, 1889 sono comprese tra i 50e i 300 ntd e circa 478 sono
lunghe dai 300 ai 500 ntd. Degli sRNA, il 71% risiede in regioni intergeniche che si
estendono da 300 fino a 900 ntd, mentre il 21% è localizzato in regioni intergeniche corte
(50-300 ntd) quindi, nelle regioni al di sotto dei 50 ntd non si trova alcun gene codificante
uno sRNA. E’ stato inoltre osservato che la lunghezza degli sRNA varia tra i 50 e i 250
nucleotidi con qualche eccezione al di sopra dei 400 nucleotidi (Hershberg et al., 2003).
1.3.2 La composizione in basi degli sRNA
La composizione in basi degli sRNA è stata analizzata confrontandola con quella
delle ORF, dei geni per tRNA e rRNA e con quella delle regioni intergeniche. Sembra che,
il contenuto in GC del gruppo di sRNA sia leggermente più ricco (48.2%), rispetto alla
percentuale (42.4%) riscontrata nelle regioni intergeniche che non codificano per alcun
sRNA. Inoltre questa analisi ha rivelato che il contenuto in GC degli sRNA è minore
rispetto a quello dei tRNA (59%) e degli rRNA (54%).
I geni che codificano per gli sRNA si dividono a seconda dello loro funzione in due
classi: quelli regolatori dell’espressione genica e quelli housekeeping (o costitutivi), che
controllano diversi aspetti del metabolismo cellulare. L’analisi del contenuto in GC di 12
sRNA ha permesso di osservare che la composizione in basi degli sRNA costituivi (57.6%)
è simile a quella dei tRNA (59%) e degli rRNA (54%), mentre la composizione degli
sRNA regolatori ha un minor contenuto in GC (Fig.2).
Al contrario, nonostante dicF sia un piccolo RNA regolatorio, risulta ricco in GC
(55%); probabilmente questa differente composizione in basi rispetto agli sRNA di E.coli è
dovuta alla sua presunta derivazione fagica. Un’ipotesi convincente per spiegare questa
eterogeneità nucleotidica, è che i tRNA e gli rRNA necessitano di determinate strutture per
la loro funzionalità, per cui le loro sequenze sono ricche in GC, caratteristica che
conferisce rigidità alle strutture secondarie.
11
Fig.2: Composizione in basi degli sRNA con funzione nota. Gli sRNA costitutivi sono indicati in
rosso, quelli regolatori in blu (Hershberg et al., 2003).
Anche gli sRNA costitutivi hanno un elevato contenuto in GC, indicando quindi
l’esigenza di una struttura più stabile rispetto a quella degli sRNA regolatori. Alcuni di
questi, come OxyS e DsrA, controllano l’espressione di diversi geni: in questo contesto la
presenza di una struttura secondaria più flessibile potrebbe facilitare le interazioni con
diverse regioni regolatrici (Hershberg et al., 2003).
1.3.3 Gli sRNA costitutivi
Il genoma di E.coli codifica tre sRNA costitutivi (RNasiP, tmRNA e l’RNA 4.5S) che
svolgono importanti funzioni nel metabolismo cellulare.
L’RNasiP: Tutti i tRNA dei batteri sono trascritti come precursori e sono necessari
per generare estremità 5’e 3’ mature. L’endoribonucleasi responsabile della formazione
dell’estremità 5’ è chiamata RNasiP, un enzima composto da due subunità l’RNA M1 e la
proteina C5 in E.coli. Questo enzima risulta altamente conservato in tutte le specie
batteriche (Gerhart and Voel, 2003).
Il tmRNA: Generalmente un messaggero tronco o danneggiato provoca lo stallo dei
ribosomi durante la traduzione e ciò rappresenta un problema importante per la cellula. Un
sRNA housekeeping, chiamato tmRNA (transfert-messenger RNA), è in grado di risolvere
questo problema grazie alle sue proprietà strutturali. Esso possiede infatti un dominio
strutturale (tRNA domain), che viene riconosciuto e acetilato in un residuo di lisina dalla
tRNA sintetasi, e che si lega poi al fattore di allungamento Tu entrando così in un sito del
ribosoma stallato privo di A e permettendo al messaggero o di essere liberato, o di essere
indirizzato verso il proteasoma per la degradazione (Gillet et al., 2001).
12
L’RNA 4.5S: I batteri possiedono una particella di riconoscimento del segnale
costituita dalla proteina Ffh e da 114 ntd dell’RNA 4.5S che sembra possedere sia una
funzione essenziale, non ancora ben definita, nella secrezione delle proteine, sia un ruolo
secondario nella traduzione, interagendo col fattore G di allungamento (Nakamura et al.,
2001).
1.3.4 Gli sRNA regolatori
La maggior parte degli sRNA in E.coli, al contrario dei pochi esempi di sRNA
housekeeping, regola l’espressione genica modulando le risposte fisiologiche delle cellule
agli stimoli ambientali. Questi regolatori posso agire o legandosi ad una proteina bersaglio
di cui influenzano l’attività, o possono appaiarsi a sequenze complementari presenti su
RNA target ed essere chiamati RNA antisenso poichè codificati dal filamento opposto al
filamento codificante il messaggero target. Questi antisenso inducono nella maggioranza
dei casi l’inibizione della traduzione del bersaglio stesso (Wagner and Simons, 1994).
Il primo RNA antisenso regolatorio è stato scoperto nel 1981 studiando il controllo
del numero di copie del plasmide ColE1 e si osservò che questo processo era affidato ad
una piccola molecola regolativa definita RNAI, codificata dal plasmide stesso (Tomiza et
al., 1981). Sono state identificate due classi di queste piccole molecole regolatorie
antisenso : quelli codificati in cis (cis-encoded antisense RNA) e quelli in trans (i trans-
encoded antisense RNA) (Fig.3). I primi si appaiano in maniera perfettamente
complementare ai loro target, poichè sono trascritti dallo stesso locus codificante l’RNA
bersaglio, ma in direzione opposta.
Fig.3: Visione schematica di un RNA antisenso codificato in cis rispetto all’RNA bersaglio e di uno
codificato in trans. Nelle porzioni inferiori delle figure sono schematizzate le interazioni tra l’RNA antisenso
e l’RNA bersaglio (Gerhart and Voel, 2003).
13
Al contrario, i trans-encoded RNA e i loro target sono codificati da locus separati, e
quindi presentano solo una parziale complementarietà per il messaggero, infatti
generalmente le regioni di appaiamento sono corte e non contigue. Sembra che la maggior
parte degli sRNA antisenso codificati dal cromosoma batterico appartengano a questa
seconda categoria.
1.4 La regolazione per appaiamento di basi : alcuni esempi
L’appaiamento di basi tra sRNA e il messaggero target può regolare l’espressione
genica inducendo repressione o attivazione trascrizionale oppure favorendo la
degradazione o la stabilità del messaggero. Il primo sRNA cromosomale caratterizzato in
E.coli è stato MicF, una piccola molecola di 43 ntd, la cui espressione è indotta da stress
ambientali, inclusi i cambiamenti di temperatura e l’esposizione ad agenti tossici come ad
esempio il paraquat. MicF è codificato in trans rispetto al suo target ompF, che codifica per
una porina della membrana esterna del batterio. E’ stato visto che, l’appaiamento di MicF
al suo messaggero blocca la traduzione della porina (Aiba et al., 1987)
Altri due sRNA codificati in trans rispetto al loro messaggero target, sono OxyS e
DsrA: l’espressione di OxyS è indotta dalla presenza di perossido di idrogeno mentre
quella di DsrA dalle basse temperature. OxyS si lega al suo messaggero target fhlA, che
codifica per un attivatore trascrizionale del metabolismo del formiato, e ne reprime la
traduzione (Fig.4). Al contrario, l’appaiamento di DsrA con rpoS, che codifica per un
fattore sigma alternativo, provoca un incremento della traduzione prevenendo la
formazione di una struttura secondaria che normalmente impedirebbe al trascritto di rpoS
di legarsi ai ribosomi per iniziare la traduzione (Fig.4).
Un altro sRNA di 90 ntd RyhB, è soggetto a repressione dalla proteina Fur (Ferric
Uptake Regulator) e perciò si esprime solamente in condizioni di mancanza di ferro. La
scoperta di questo piccolo RNA, mostra come alcuni geni possono regolati positivamente
dal repressore Fur. In condizioni limitanti di ferro, RyhB è espresso e promuove la
degradazione di uno dei suo target, il messaggero sodB, che codifica per una superossido
dismutasi del ferro (Fig.4).
14
Fig.4: Differenti tipi di regolazione dell’appaiamento di uno sRNA al suo messaggero target (Storz et
al., 2004).
In presenza di alte concentrazione di ferro invece, Fur reprime l’espressione di RyhB,
prevenendo la degradazione di sodB, che viene quindi trascritto ad elevati livelli (Massè et
al., 2002).
Infine, l’appaiamento di un piccolo RNA non codificante col suo messaggero target,
può impedire l’accesso della ribonucleasi e portare quindi alla stabilizzazione dell’mRNA
(Fig.4).
1.4.1 OxyS: un piccolo antisenso indotto da stress ossidativo
In E.coli è presente un piccolo antisenso di 109 nucleotidi chiamato OxyS, che si
esprime in risposta a condizioni di stress ossidativo. OxyS agisce come un regolatore
pleiotropico portando all’attivazione o alla repressione di più di 40 geni e proteggendo la
cellula da mutazioni spontanee o indotte chimicamente. Sono stati identificati 8 target,
regolati da OxyS, che includono fhlA codificante per un attivatore trascrizionale di geni
coinvolti nel metabolismo del formiato, e rpoS che codifica per la subunità σ
s
dell’RNA
polimersi. Entrambi i messaggeri sono repressi da OxyS, di conseguenza questi due geni
15
sono derepressi in ceppi deleti per oxyS e trattati con perossido di idrogeno (Altuvia et al.,
1997).
La struttura secondaria di OxyS contiene tre regioni “stem and loop” di cui due più
grandi e una più piccola, intervallate da una regione non strutturata di 27 nucleotidi (Fig.5)
(Wassarman et al., 1999).
Fig.5: Struttura secondaria dell’ RNA OxyS: in arancione sono evidenziate le regioni complementari
al messaggero target (Wassarman et al., 1999).
E’ stato osservato che due diversi domini di OxyS sono richiesti per la repressione dei geni
fhlA e rpoS, suggerendo così che il piccolo antisenso può regolare l’espressione di questi
geni attraverso meccanismi differenti. Infatti, poichè le molecole di RNA sono
estremamente flessibili, è plausibile che esista più di un meccanismo d’azione.
Nel caso dell’mRNA di fhlA, le anse delle due forcine più grandi di OxyS si
appaiano a due regioni non contigue al 5’ del messaggero impedendo così l’accesso dei
ribosomi al sito d’inizio per la traduzione di fhlA (Fig.6). Questo meccanismo è stato
confermato effettando mutazioni puntiformi sia nell’ansa che nello stelo di OxyS, che
hanno dimostrato come l’ansa sia direttamente coinvolta nel legame al “ribosome-binding
side” di fhlA (Altuvia and Wagner, 2000).
Fig.6: Meccanismi d’azione di OxyS nella regolazione di fhlA e rpoS. In rosso è indicato l’antisenso
OxyS, in blu il messaggero target, il simbolo (-) indica l’inibizione della traduzione (Altuvia and Wagner,
2000).