In questi appunti forniremo una solida base di conoscenze riguardanti la struttura molecolare e la funzione delle proteine. Inoltre una particolare attenzione sarà rivolta alla descrizione di come una funzionalità cellulare dipenda anche da una serie di eventi dinamici, che si realizzano in modo altamente regolato negli specifici contesti cellulari a partire dalla sintesi alla distruzione e alle modificazioni della catena polipeptidica. Vengono inoltre fornite le basi teoriche di metodologie e tecniche di uso corrente per l’identificazione e l’analisi dei diversi livelli di organizzazione strutturale delle proteine (struttura primaria, secondaria, terziaria e quaternaria).
Struttura molecolare
delle proteine
Appunti di Simone Pisu
Università: Università degli Studi di Cagliari
Facoltà: Biologia
Corso di Laurea Magistrale in Biologia Cellulare e Molecolare
Esame: Struttura molecolare delle proteine
Docente: Prof. Pintus
Anno Accademico 2011/2012Lezione 1 14/01/11
Ci occuperemo del Folding delle proteine, ovvero dei problemi legati al ripiegamento delle proteine
verso la conquista della struttura nativa. Alcune cose che vedremo nelle prime diapositive saranno
un ripasso di cose già acquisite.
Iniziamo con il presentare l'immagine di una cellula.
Quando voi pensate alla cellula, oltre che pensare all'unità fondamentale di qualsiasi organismo
vivente, quindi eucarioti e procarioti, dovete pensare al fatto che le cellule presentano una
morfologia e soprattutto all'interno delle cellule si sviluppano intense attività metaboliche; diciamo
che affinché una cellula possa vivere, ovviamente deve produrre attività metaboliche e l'attività
metabolica è affidata a proteine enzimatiche e non enzimatiche.
Se voi dovreste andare a valutare il contenuto di proteine presenti all'interno della cellula, giusto per
rimanere bassi come valori (non termina la frase); quindi andare a valutare il numero di proteine
espresse all'interno della cellula, vi rendereste conto che il 50% del peso secco di una cellula è
rappresentato dal peso delle proteine; quindi evidentemente se le proteine sono così abbondanti
all'interno delle cellule, c'è un motivo e il motivo è che le proteine all'interno delle cellule svolgono
delle specifiche funzioni e per poter svolgere una specifica funzione una proteina deve presentare
una struttura nativa; quindi il binomio struttura e funzione è un binomio strettamente associato
quando si parla di proteine: proteine enzimatiche e non enzimatiche, perché lo sapete benissimo che
ad una determinata struttura di una proteina corrisponde una specifica funzione, e qui in questa slide
ci sono degli esempi molto familiari su come la struttura di una proteina può condizionare la sua
funzione.
Sulla vostra sinistra vedete un anticorpo; voi sapete che gli anticorpi hanno strutture idonee per
interagire con gli antigeni. Sulla destra vedete il tetramero dell'emoglobina la quale presenta, grazie
alla presenza dell'eme, una struttura che può legare e cedere un ossigeno. Sotto vedete, anche se
schematizzata, una proteina enzimatica. V oi sapete che tutti gli enzimi presentano una specifica
struttura e tutti hanno un sito catalitico dove si colloca in maniera molto precisa un substrato o un
inibitore, il quale, se parliamo di substrati, può essere trasformato in un prodotto di reazione. Quindi
pur essendo 3 tipologie di proteine diverse, come vedete, a prescindere dalla funzione che svolgono,
vi rendete conto che comunque hanno strutture tridimensionali molto diverse tra loro e la struttura
tridimensionale è importante ai fini della funzione che dovrà svolgere quella proteina.
Struttura: quando parliamo di struttura ci riferiamo ad una struttura tridimensionale, quindi per
esempio l'emoglobina ha una struttura quaternaria costituita da 2 catene alfa e 2 beta.
Le proteine enzimatiche possono avere o non avere questa struttura quaternaria quindi possono
essere costituite da più monomeri o no, e anche le molecole degli anticorpi possono essere costituite
da catene pesanti e leggere che possono associarsi oppure no; quindi quando si parla di struttura ci
si riferisce ai 4 livelli strutturali delle proteine, ovvero:
struttura primaria che è la sequenza, l'ordine, con il quale sono disposti gli Aa lungo la
catena peptidica
struttura secondaria che è la disposizione che assumono tratti di una proteina; disposizione
che può essere elicoidale o distesa. Le strutture secondarie più diffuse sono le eliche e i
foglietti , tralasciando la struttura del collagene che è tipica solo del collagene
struttura terziaria come si evince dalla diapositiva, è la disposizione nello spazio di tratti
di proteina che sono avvolti ad elica o sono rimasti distesi come i foglietti .
struttura quaternaria è l'associazione di più subunità per costituire una proteina diciamo
funzionalmente attiva. Le proteine possono avere una struttura quaternaria oppure no. La
struttura quaternaria è tipica di tutte quelle proteine che sono costituite da più subunità; sub
unità che possono essere identiche o diverse.
Ad una determinata struttura corrisponde una specifica funzione, ma quante funzioni conosciamo
relativamente alle proteine? (le proteine sono le molecole più versatili presenti all'interno della
cellula).
Le proteine strutturali: come ad esempio la cheratina; anche il collagene è una proteina
strutturale.
Proteine di trasporto: l'emoglobina è l'esempio classico di proteina deputata al trasporto o al
rilascio delle molecole di ossigeno.
Proteina di riserva: sono anche queste ubiquitarie; ad esempio la ferritina nel ferro, l'ovoalbumina
nell'uovo, proteine nei semi che serviranno per la germinazione (quindi stiamo parlando di proteine
vegetali).
Proteine recettoriali: che possono essere localizzate sulla membrana delle cellule o
intracellularmente e svolgono ruoli fondamentali ad esempio in meccanismi di trasduzione del
segnale.
Proteine contrattili: quelle che sono presenti nei muscoli
Proteine di difesa: abbiamo visto prima gli anticorpi
Proteine ormonali: regolano il metabolismo
Proteine enzimatiche.
Come vedete le proteine sono le molecole veramente più versatili, svolgono un grandissimo numero
di funzioni che possono svolgere in funzione di una struttura che possiedono.
Quando parliamo di struttura non bisogna dimenticarsi che la struttura primaria ossia la sequenza in
cui sono localizzati gli Aa all'interno di una molecola proteica, detta rigorosamente le regole di base
per il ripiegamento della proteina.
Quindi a partire da una sequenza di Aa, quindi da una struttura primaria ecco qua che, la struttura
secondaria terziaria e quaternaria avrà una significato solo se esiste una determinata struttura
primaria.
Se andiamo ad osservare la struttura primaria, abbiamo detto che è data dalla sequenza di Aa, ma
sappiamo che gli Aa, quelli che rientrano nella costituzione delle proteine, sono tutti caratterizzati
dall'avere un atomo di C alfa al quale è legato: sempre un gruppo amminico, sempre un atomo di H,
sempre un gruppo carbossilico, quello che cambia è la catena laterale R, catena laterale che può
essere, come c'è scritto all'interno delle etichette colorate, idrofilica o idrofobica; idrofilica carica o
con nessuna carica. Spieghiamoci meglio, facciamo un piccolo ripasso, esaminiamo gli Aa in base
alle caratteristiche del gruppo R.
Catena laterale R non polare, idrofobica: all'interno di questa lista ci sono proteine che
presentano ovviamente delle catene laterali legate al C alfa che sono idrofobiche quindi non
interagiscono favorevolmente con le molecole di acqua, e tra queste troviamo: la glicina che è un
po' borderline tra idrofilica e idrofobica perché ha una catena laterale costituita da un atomo di H,
poi abbiamo sicuramente: alanina, valina, leucina, isoleucina, metionina, prolina, fenilalanina e
triptofano.
Tra gli AA non carichi ma con gruppo polare, quindi gruppi che interagiscono favorevolmente
con l'acqua, abbiamo: serina, treonina, asparagina, glutammina, tirosina, cisteina.
Tra i gruppi polari però stavolta carichi, troviamo: la lisina, l'arginina e l'istidina possono avere
cariche positive; acido glutamico e ac. aspartico che hanno invece carica negative e sono questi Aa,
come c'è scritto in diapositiva, i principali responsabili della carica complessiva di una proteina.
Perché secondo voi sono indicati in verde? Quindi l'alanina triptofano e istidina; in questa
diapositiva ho voluto mettere in evidenza quelli che sono gli Aa aromatici, quindi in verde sono gli
Aa aromatici.
Come si indicano gli Aa per convenzione? forse questo non lo sapete, siccome utilizzeremo molto
le sigle degli Aa, sarebbe il caso di iniziare a studiarle.
Gli Aa possono essere indicati con una piccola abbreviazione che include le prime tre lettere
dell'Aa, oppure possono essere indicati con una sola lettera.
La glicina si indica con Gly (si utilizza la terminologia inglese), se usiamo una sola lettera si indica
con G; l'alanina si può indicare con Ala o A; la valina con Val o V; la leucina con Leu o L;
isoleucinca Ile o I; Metiona Met o M; prolina con Pro o P; fenilalanina con Phe o F, triptofano con
Trp o W. Serina Ser o S, Treonina Trh, o T, Asparagina Asn o N, glutammina Gln o Q, tirosina Tyr
o Y , cisteina Cys o C. Per quanto riguarda la lisina Lys o K, arginina Arg o R, istidina His o H,
acido aspartico Asp o D, acido glutammico glu o E.
Questi gli dovete memorizzare.
Ritorniamo alla nostra struttura primaria. Torniamo a focalizzare la nostra attenzione sui gruppi R
che identificano un Aa da un altro. I gruppi R abbiamo visto che possono essere idrofilici, a
prescindere dalla carica, o idrofobici, e sarà proprio la catena laterale R a svolgere un ruolo
importante quando la proteina dovrà andare incontro al suo processo di folding, ossia al
ripiegamento verso la struttura nativa.
Questa non è la scoperta dell'acqua calda ma solo per ricordarvi che le molecole polari sapete che
reagiscono favorevolmente con le molecole dell'acqua, mentre le apolari tendono a sfuggire il
contatto con l'acqua. Se voi prendete dell'olio e lo buttate dentro un bicchiere d'acqua vedete che le
goccioline tendono ad accorparsi e questo perché tutte le molecole idrofobiche tendono ad evitare il
contatto con le molecole di acqua. Quindi possiamo dire che la tendenza dell'acqua e dei residui
amminoacidici non polari, a evitarsi, avrà un effetto davvero considerevole su quella che sarà la
struttura finale di una proteina, quella che sarà la struttura nativa di una proteina.
In questa diapositiva (quella sotto) è rappresentata, anche se in maniera schematica, un polipeptide
senza struttura quindi solo la struttura primaria, e sono messe in evidenza le catene polari in blu (in
verità sono in rosa) e le catene non polari in verde.
Quando il polipeptide dovrà conquistare la sua struttura nativa avrà la tendenza a spingere verso il
core proteico tutti gli Aa apolari. Quindi qui vedete (nella slide) c'è un nucleo di colore verde
relativo a tutti gli Aa apolari che sono presenti lungo la sequenza, lungo la proteina, all'esterno
rimarranno invece gli Aa polari. Quindi riepilogando: gli Aa apolari tendono a sfuggire il contatto
con l'ambiente acquoso e tenderanno ad occupare le parti interne della proteine, quindi il core
proteico. Gli Aa polari invece si trovano frequentemente sulla superficie esterna della proteina
proprio per il fatto che possono interagire favorevolmente con le molecole d'acqua. Questi sono
concetti che conoscete.
Struttura primaria: facciamo un piccolo ripasso e vediamo quali sono le caratteristiche principali
dei vari livelli di struttura delle proteine.
Sulla struttura primaria non c'è bisogno di soffermarsi più di tanto. Avete studiato che la struttura
primaria ovviamente, seguita dalla sequenza di Aa, è contraddistinta dal presentare un legame
peptidico con parziale carattere di doppio legame che unisce un Aa con un altro. Quindi vogliamo
usare un termine non proprio scientifico: il legame peptidico è un legame ingessato, gli unici
movimenti che può assumere la molecola sono quelli intorno al legame azoto-carbonio , quindi
l'angolo (si legge fi), e quello (si legge psi) ovvero il legame C -C carbossilico. Ovviamente
molecola può muoversi intorno a questi legami però tenendo conto del fatto che le catene laterali
possono avere ingombri sterici e quindi i movimenti possono essere limitati proprio dall'ingombro
sterico della molecola; così come sapete che il legame peptidico genera una polarità negli scheletri
proteici; ovviamente esiste una estremità aminoterminale, una estremità carbossiterminale e
diciamo che tutto lo scheletro è tappezzato da cariche negative e positive che sono le cariche
presenti sui gruppi ammidici e sui gruppi carbonilici.
Sulla struttura primaria non credo sia il caso di soffermarsi, soffermiamoci invece sulla struttura
secondaria.
La struttura secondaria è stabilizzata dalla formazione dei legami idrogeno; i legami idrogeno che
stabilizzano la struttura secondaria delle proteine, sono quelli che si stabiliscono tra il gruppo
ammidico NH e il carbonilico C=O, quindi per quanto riguarda la struttura secondaria non entrano
in gioco legami idrogeno tra i gruppi R.
La struttura secondaria: abbiamo parlato di eliche e foglietti , quindi strutture secondarie molto
diverse. Per quanto riguarda i legami idrogeno che stabilizzano queste strutture diciamo che i
legami idrogeno, per quanto riguarda l'elica, si stabiliscono all'interno della stessa molecola, per
quanto riguarda i foglietti i legami idrogeno si stabiliscono tra catene polipeptidiche diverse,
quindi sono legami intercatena a differenza dei legami intracatena tipici della strutture ad elica.
Affinché possa stabilirsi il legame idrogeno tra questi gruppi chimici, la distanza tra i gruppi non
deve superare 3 Å.
Sapete qual è la caratteristica del legame idrogeno? Si forma quando l'idrogeno si trova tra due
atomi molto elettronegativi, come può essere in questo esempio,
quindi un atomo di idrogeno, in questo caso tra un atomo di N e un atomo di O, a patto che la
distanza non superi i 3 Å.
Per quanto riguarda la formazione sempre dell' elica i legami idrogeno si stabiliscono tra Aa che
distano 3-4 residui. Considerate che un giro di elica è costituito da 3-4 residui aminoacidici; quindi
ogni 3-4 residui si stabilisce un legame idrogeno tra un gruppo amminico e un gruppo carbossilico e
il giro di elica è formato da circa 3-4 residui aminoacidici.
Detto questo mettiamo in evidenza un aspetto che possono presentare le eliche. Abbiamo detto che
un giro di elica è costituito da 3-4 residui, quindi è ovvio che (se voi date un occhiata a questo
disegno) i residui distanti 3-4 posizioni lungo la sequenza, giacciono sullo stesso lato dell' elica;
questa è una conseguenza normale, è logico che tutti gli AA che distano 3-4 residui si trovino sullo
stesso lato.
Immaginiamo che ogni 3-4 residui capiti sempre di trovare nell' elica un Aa apolare da una parte,
quindi su un lato dell' elica, e un Aa polare sull'altro lato, in questo caso l' elica prende il nome di
elica anfipatica. Le eliche anfipatiche sono quelle che presentano un lato costituito da residui Aa
apolari, mentre sull'altro lato giacciono tutti i residui aminoacidi polari.
Foglietti :
I foglietti beta possono essere chiamati anche strand (si pronuncia strend). In questo caso non ci
può essere una struttura spiralizzata per il fatto che i legami idrogeno non sono all'interno della
stessa catena ma sono tra catene differenti, come mostra la diapositiva.
Quindi qui vedete una serie di catene polipeptidiche tipiche di un foglietto , in cui i gruppi
ammidici e carbonilici interagiscono con i gruppi ammidici e carbonilici di catene polipeptidiche
che non hanno niente a che vedere con quella catena.
Le catene polipeptidiche vi ricorderete che possono avere una disposizione parallela oppure
antiparallela; cosa significa disposizione parallela o antiparallela? Significa che, come mostrato in
diapositiva in basso, per esempio nella disposizione parallela le catene polipeptidiche sono orientate
nella stessa direzione: amminoterminale-amminoterminale.
I legami idrogeno si stabiliscono, in caso di foglietti paralleli, in questa maniera, quindi ogni
residuo stabilisce un legame idrogeno con altri due. Nel caso invece dei foglietti antiparalleli,
ovvero una catena orientata secondo l'estremità amino-carbossi e l'altra carbossi-ammino, i legami
idrogeno in questo caso si stabiliscono: un residuo prende contatto soltanto con un altro residuo. Ci
viene da fare una considerazione: quando i foglietti sono orientati secondo una disposizione
parallela, ovviamente....il fatto che un residuo amminoacidico debba stabilire legami con altri due
immediatamente non è una struttura molto stabile. A differenza dei residui di quei foglietti in cui
le catene peptidiche sono orientate in maniera antiparallela.
La lunghezza minima affinché possa formarsi un foglietto , in termini aminoacidici, è di circa 6
residui; ma un foglietto può essere costituito anche da 15 residui aminoacidici, quindi da un
minimo di 6 ad un massimo di 15.
Abbiamo detto che le strutture secondarie principali, lasciando perdere il collagene, sono l' elica e
il foglietto, ma manca un altro tipo di struttura secondaria a questo elenco, quale può essere l'altra
struttura secondaria? Che poi non è una vera e propria struttura; provate a pensare ad una proteina
nella sua struttura secondaria, sono presenti solo eliche e foglietti? Io aggiungerei i -turn.
Sono ripiegamenti, detti anche gomiti. Sono quelle regioni presenti nelle proteine in cui non esiste
ne una struttura ad elica ne una a foglietto. Sono delle porzioni limitate a 4-5 Aa in cui la
proteina assume una forma di gomito o di ansa. Qui vedete un turn e qui lo scheletro del -turn.
Nel turn questi gomiti si formano perché un Aa forma legami idrogeno con un altro residuo
aminoacidico distante almeno 3 posizioni, però mentre nelle eliche ci sono una serie di Aa che
interagiscono per formare una struttura spiralizzata, nel turn è limitato solo ad un pezzettino di
porzione polipeptidica. E in questa diapositiva vedete le 3 strutture secondarie possibili: le eliche,
i foglietti e i turn che mettono in collegamento foglietti con foglietti , foglietti con eliche,
quindi sono i punti diciamo di snodo, nelle proteine.
Struttura terziaria: ecco che entrano in gioco le catene laterali.
Abbiamo parlato solo di gruppi amminici e gruppi carbossilici, ecco qua che la struttura terziaria,
ossia la disposizione nello spazio delle eliche e dei foglietti , deriva dalle interazioni che si
stabiliscono tra le catene laterali degli Aa.
Qui vedete si tratta quasi sempre di interazioni non covalenti, tranne ponti disolfuro che rientrano
nelle formazioni di strutture terziare ma sono interazioni covalenti tra i gruppi SH delle cisteine. Per
quanto riguarda diciamo i legami che si possono stabilire tra i residui aminoacidici in previsione di
una struttura terziaria, sono: i legami idrogeno, le interazioni idrofobiche che ovviamente si
stabiliscono tra catene laterali idrofobiche, i legami ionici, a parte i ponti disolfuro.
I legami ionici si stabiliscono tra una catena laterale carica positivamente e una catena laterale
carica negativamente, quindi tra un Aa basico e uno acido. Qui vedete il caso di un legame idrogeno
che si stabilisce tra un Aa acido e un Aa che presenta una catena laterale con un gruppo ossidrilico.
Quindi queste sono le interazioni che rafforzano la struttura di una proteina. Quindi legami idrogeni
a patto che la distanza di legame non superi i 3 Å, il legame ionico a patto che la distanza tra i
gruppi non superi i 2,8 Å, e le interazioni idrofobiche o di van der Waals a patto che i gruppi non si
trovino ad una distanza superiore di 3,5 Å.
Struttura quaternaria: non tutte le proteine presentano una struttura quaternaria è esclusiva di
quelle proteine formate da più monomeri che possono essere uniti fra loro da interazioni non
covalenti o covalenti e nel momento che si separano, nel secondo caso (interazioni covalenti), i
monomeri, la proteina non ha più attività biologica, quindi quando le interazioni tra i monomeri
sono covalenti, la proteina evidentemente deve trovarsi in quella struttura quaternaria per svolgere
la propria funzione.
Casi di interazioni non covalenti ne avete visti tantissimi, ad esempio in biologia molecolare avete
studiato le importine che sono quelle proteine che legano le sequenze di localizzazione nucleare,
quindi proteine destinate al nucleo. Le importine sono costituite da due subunità: e , che si
uniscono tramite interazioni non covalenti solo quando devono svolgere la loro funzione e si
dissociano nel momento in cui la proteina invece non deve veicolare dentro il nucleo le proteine o le
sequenze di localizzazione del segnale.
Le proteine con strutture quaternarie i cui monomeri sono uniti mediante interazioni non covalenti,
diciamo acquistano un attività biologica nel momento in cui i monomeri si assemblano, le proteine
invece che sono tenute insieme da interazioni covalenti perdono l'attività nel momento in cui i
monomeri vengono separati e molto spesso non la riacquistano più.
Come si rappresentano schematicamente le strutture secondari e delle proteine. Vi faccio vedere:
Come avete visto poco fa le eliche possono essere rappresentate o come cilindri o come frecce e
qui vedete la struttura tridimensionale di una proteina in cui sono evidenti le eliche mostrate come
cilindri, i foglietti mostrati come frecce e i turn che collegano i vari elementi di struttura
secondaria tra di loro. Però liche e foglietti possono essere rappresentati anche come: fettucce
per quanto riguarda i foglietti , o come spirali per quanto riguarda le eliche. Quindi qui accanto a
questo riquadro vedete la stessa proteina rappresentata stavolta utilizzando la rappresentazione ad
elica o la rappresentazione con questa sorta di string che si riferiscono ai foglietti . Quindi
eliche: eliche e cilindri; foglietti frecce o rettangoli.
Rappresentazione terziaria delle proteine, struttura terziaria delle proteine.
In questo riquadro c'è scritto: l'unità fondamentale della struttura terziaria è il dominio.