Genetica molecolare:
Nell'ultimo decennio l'analisi del DNA ha rappresentato un valido metodo d'indagine sia in campo clinico sia nella diagnostica di un numero sempre maggiore di malattie genetiche. Soprattutto nel campo dei disordini monofattoriali, cioè nelle sindromi causate dall'alterazione di un singolo gene, come le talassemie, la fibrosi cistica, la distrofia muscolare e le emoglobinopatie, le tecniche della biologia molecolare si sono rivelate vincenti. Il numero delle malattie genetiche identificabili mediante l'analisi del DNA cresce parallelamente alla determinazione di nuovi geni responsabili della malattia. Il metodo di scelta per la diagnosi di molte malattie genetiche è attualmente la Polymerase Chain Reaction (PCR) soprattutto per i suoi vantaggi di accuratezza e sensibilità.
Dettagli appunto:
-
Autore:
Simone Pisu
[Visita la sua tesi: "Caratterizzazione molecolare ed eterogenicità delle varianti emoglobiniche in Sardegna"]
- Università: Università degli Studi di Cagliari
- Facoltà: Biologia
- Corso: Biologia Cellulare e Molecolare
- Esame: Genetica molecolare
- Docente: Prof. Marchi
Questa è solo un’anteprima: 47 pagine mostrate su 238 totali. Registrati e scarica gratis il documento.
Genetica molecolare Appunti di Simone Pisu Università: Università degli Studi di Cagliari Facoltà: Biologia Corso di Laurea Magistrale in Biologia Cellulare e Molecolare Esame: Genetica molecolare Docente: Prof. Marchi Anno Accademico 2011/2012Genetica Molecolare Lezione 1: 06/03/12 Noi parleremo di quella che si può definire “ la genetica moderna” voi avete fatto la genetica classica: le leggi di Mendel, Hardy-Weinberg e qualche altra cosa. La genetica moderna nasce negli anni ’50 con il modello a doppia elica di Watson e Crick per cui hanno anche vinto il premio nobel, c’è da dire che questo è un modello che in realtà dovrebbe avere 3 nomi, nel senso che partecipò alla creazione di questo modello anche una ricercatrice, Rosalin Franklin, non fu nemmeno ringraziata nonostante lei avesse partecipato e non in misura irrilevante alla creazione del modello della doppia elica di DNA. Cosa succede, dal 1953 ad oggi ci sono stati tutta una serie di percorsi che ci hanno portato alla costruzione di quello che viene definito “progetto genoma umano”. Le basi del progetto genoma sono state messe appunto nel 1991 per arrivare al 2001 con la pubblicazione della prima bozza che risulta essere una totalità di circa 99% per quanto riguarda il genoma umano. Strada facendo ovviamente ci sono determinati tipi di scoperte che sono state fatte da ricercatori di vari paesi, si è scoperto dopo la doppia elica che il numero di cromosomi sono 46 quindi la presenza di un cromosoma in più o di un cromosoma in meno dava luogo a quelle che sono alterazioni del numero di cromosomi, quindi si è scoperta strada facendo l’associazione della trisomia 21 alla sindrome di Down, prima di allora non si sapeva che la sindrome di Down era dovuta alla presenza di 3 cromosomi 21 piuttosto che due e quindi di 47 cromosomi totali. Mary Lyon una delle poche donne che si è fatta valere durante il corso della storia, ha spiegato come lavora il cromosoma X, quindi l’inattivazione del cromosoma X, la presenza dei corpi di Bar e quindi il “processo di lyonizzazione”. Vengono scoperti gli enzimi di restrizione. Cosa sono gli enzimi di restrizione? Gli enzimi di restrizione sono quegli enzimi che riconoscono determinate sequenze del DNA e che procurano un taglio del DNA in quelle determinate sequenze. I tagli che procurano fondamentalmente sono di due tipi: un taglio netto piuttosto che un taglio segmentato; questo lo vedremo magari quando si parlerà del perché e come sono stati utilizzati gli enzimi di restrizione e poi tante altre tecniche, il Southern Blot e così via, non so quale indicarvi, diciamo che sono fondamentalmente 1991 inizia il progetto genoma umano, si conclude nel 2001, si conclude per modo di dire, perché va sempre avanti, ovviamente non ci si ferma mai nell’analisi. Quello che faremo noi è studiare il genoma eucariotico, quindi il genoma di tutti quegli esseri uni o pluricellulari che presentano un nucleo. Quindi per quanto riguarda la presenza di un genoma a DNA di tipo procariote l’abbiamo già fatto, l’avete già fatto da qualche altra parte, questa è una parte che non mi interessa. Cosa si può dire del genoma eucariotico, innanzitutto bisogna dare la definizione di genoma: “Il genoma è l’insieme di tutte le molecole del DNA che sono presenti all’interno di tutte le cellule nucleate di un organismo eucariote”. Quindi non stiamo parlando di una cellula eucariote con i suoi 46 cromosomi, stiamo parlando di tutte le cellule di quel determinato organismo. La totalità di questo DNA, di questi cromosomi all’interno di queste cellule da luogo a quello che viene definito genoma eucariote. Quindi il genoma umano è così costituito. Tra parentesi c’è scritto ad eccezione degli eritrociti, dei globuli rossi, che non hanno nucleo. Quasi tutto il DNA è localizzato nel nucleo, che tipo di DNA è il DNA localizzato nel nucleo? E’ un DNA a doppio filamento di tipo lineare. Qui c’è un esempio del numero di paia di basi di cui è costituito il DNA di ogni organismo eucariote, quindi abbiamo Escherichia Coli, Drosophila Melanogaster e Homo Sapiens. Come vediamo c’è un aumento del numero di coppie di paia di basi, si va da 4 milioni di paia di basi, dove 4 milioni di coppie significa 4000 kilo basi o 4 mega basi e si parla di copie perché appunto il DNA è sempre a doppia elica, quindi abbiamo ciascun nucleotide che è sempre associato ad un altro, A con T e G con C. Quindi, cosa si è pensato? Si è pensato che il numero delle paia di basi fosse in relazione all’evoluzione di quell’organismo. In realtà non è esattamente così, perché si arriva ad organismi quali ad es. alcuni organismi vegetali che contengono un numero di copie di basi che risulta essere molto elevato, parliamo di alcune piante che arrivano a 120 miliardi di paia di basi, dove, se prima vi dicevo che il genoma è l’insieme di tutto il DNA di tutte le cellule in questo caso io sto parlando di una singola cellula e del corredo aploide. Quindi quando io vi parlo dell’uomo e vi dico che presenta 3 miliardi e 200 milioni di coppie di basi, io vi parlo di 23 cromosomi all’interno di una singola cellula. Se parliamo del corredo diploide sono 6 miliardi e qualcosa, e qualcosa perchè l’uomo ha il cromosoma Y quindi non sarà perfetto, risulta essere decisamente più corto. Si è pensato che la lunghezza del codice genetico umano fosse relativo anche al numero di possibili geni che quel determinato essere vivente poteva avere al suo interno. Questo perché, poi lo vediamo, ovviamente il genoma non è costituito solamente da geni ma anche da parti che sono trascrizionalmente non attive poi le vediamo. Quindi si era fatta l’ipotesi tramite alcuni calcoli di tipo empirico, che non ricordo, ma che sono sorpassati, quindi se non li ritrovo nemmeno ve li chiedo, si era pensato che potesse esserci una associazione tra il numero di geni e la lunghezza del corredo genetico del determinato individuo. Questo si è visto che non è così, facendo una stima, perché si tratta sempre di stima di geni che sono contenuti all’interno del corredo genetico di quell’individuo si vede che il numero non corrisponde esattamente a quello di quelli possibili, di quelli attesi. Per quanto riguarda E. Coli non c’è differenza, si passava da 4000 possibili geni a 4400geni stimati, però le differenze maggiori si sono avute per quanto riguarda ad es. l’Homo Sapiens si parlava di 3 milioni di possibili geni in realtà sono tra i 20 e i 40 mila, in base al testo che prenderete si parla di 20-30 mila, da 25 mila a 35 mila, siamo in quell’ordine lì insomma. Quindi ci sono due ordini di grandezza di differenza da 3 milioni a 30 mila, questo è indicativo del fatto che probabilmente non tutto il corredo genetico, non tutto il nostro DNA è trascrizionalmente funzionale, ma ci sono determinate altre parti che sono non trascrizionali, ma non per questo non hanno una funzione o sono meno importanti. A molte di queste sequenze ancora non si è in grado di dare una definizione, sono quelle che vengono chiamate le “sequenze spaziatura” che separano un gene da un altro, possono essere molto lunghe o molto corte che sono soggette a notevoli mutazioni, ma non si sa effettivamente quale sia il loro ruolo. Probabilmente è quello di tenere una adeguata distanza tra un gene e l’altro, affinché quel gene o quell’altro gene, a seconda del tessuto in cui ci si trovi, perché bisogna ricordarsi che non tutti i geni sono trascrizionalmente attivi in tutti i tessuti. Alcuni sono attivi in tutti i tessuti, altri solamente in alcuni a seconda della funzione del tessuto stesso. Bisogna dire che quando si parla di genoma eucariotico, non si parla solamente di genoma di tipo nucleare, esistono degli organelli citoplasmatici che contengono al loro interno un altro tipo di genoma, sempre a doppia elica ma di tipo circolare. Per quanto riguarda gli organismi di tipo animale si parla solo ed esclusivamente di mitocondri, per quanto riguarda gli organismi vegetali abbiamo i mitocondri e i cloroplasti. Com’è possibile che ci sia del DNA in questi organelli citoplasmatici? E’ la teoria del simbionte, che in teoria avreste dovuto aver fatto in genetica, quindi questo organismo che si è introdotto all’interno di una cellula eucariote ancestrale, e hanno iniziato a dar luogo ad una mutua assistenza. L’organismo in questo caso quello dei mitocondri forniva l’energia necessaria all’organismo probabilmente unicellulare eucariote per poter svolgere quella che era la sua vita, e l’organismo eucariote ha dato al mitocondrio probabilmente protezione. Quindi la teoria è la teoria del simbionte. Non si sa bene come sia successo questo diciamo che bisogna quasi darlo per scontato. Allora parliamo dell’organizzazione del DNA: Io ho preparato due distinte modalità di organizzazione del DNA a seconda di quello che ci interessa. Se per esempio noi vogliamo parlare di DNA ripetuto o DNA non ripetuto, quindi quel DNA che si presenta una sola volta all’interno dei nostri cromosomi, all’interno delle nostre sequenze, possiamo dire che circa 60 % del totale risulta essere DNA a singola sequenza, ossia si parla di sequenze di poche, molte o moltissime paia di basi che risultano essere più o meno uniche nello stesso genoma. Non parliamo solo di geni trascrizionalmente attivi, solamente il 3% risultano essere sequenze codificanti, quindi geni codificanti proteine, ma non solo proteine perché i geni bisogna ricordare che non codificano solo proteine. Ci sono per esempio geni che sono situati per es. a livello telomerico in quasi tutti i cromosomi degli eucarioti che danno ad esempio luogo alla traduzione del rRNA o del tRNA che comunque hanno una funzione che è molto diversa rispetto a quella del mRNA. Quindi quando si parla di geni non si parla solamente di sequenze codificanti proteine ma di sequenze codificanti diversi tipi di RNA: - L’mRNA che darà origine a tutti i vari processi che portano alla formazione proteine di diverso tipo. - Al rRNA. - Al tRNA. Bisogna dire che all’interno di questi DNA a singola sequenza sono presenti anche gli introni, sono presenti in quasi tutti i geni. Ci sono dei geni che non lo presentano, come i geni per le proteine istoniche, che quindi non sono soggetti ad un processo di maturazione e quindi sono già degli RNA maturi, pronti alla trascrizione e qui abbiamo il DNA spazzatura, o spaziatore dipende dalla traduzione in inglese che è stata fatta. Abbiamo il DNA ripetuto, abbiamo il DNA altamente ripetuto che è solamente il 10% e il DNA mediamente ripetuto che è circa il 30% del totale. Quindi perché è importante il gene? E’ importante perché modifiche funzionali all’interno di quel gene potrebbero dar luogo a dei fenotipi di tipo alterato. Quindi noi cosa sappiamo, un gene è costituito da una sequenza più o meno variabile di paia di basi. Mutazioni di vario tipo, come gli SNP, delezioni e inserzioni, inversioni, qualsiasi tipo di mutazione può dar luogo ad una variazione di quel gene che potrebbe riflettersi sul fenotipo finale. Bisogna dire che il gene da solo non influisce sul fenotipo finale, ci sono altri meccanismi, di tipo ambientale, meccanismi epigenetici che interverranno per vedere qual è questo fenotipo. Diciamo che, in linea di massima, se noi partiamo dal fatto che in una sequenza di un gene vediamo che c’è una mutazione in uno di quelli che viene definito “punti caldi” allora quasi sicuramente il prodotto sarà alterato e quel fenotipo sicuramente sarà differente da quello che ci si attende.. non si parla solamente di patologie, quali ad es. l’anemia falciforme che sarà data da una singola mutazione puntiforme; però mutazioni di questo tipo possono dar luogo ad altre variazioni che possono rientrare nel caso della fisiologia. Ad es. tutti noi abbiamo nel nostro DNA delle sequenze che danno luogo ad enzimi che intervengono nel metabolismo dei farmaci, giusto per farvi un esempio, questi enzimi sono molto variabili, quindi noi abbiamo delle mutazioni che daranno luogo a delle proteine enzimatiche che hanno una conformazione strutturale differente, ma non per questo danno luogo ad un processo patologico, ossia avremo diversi tipi di enzimi che lavorano in modo diverso ma che rientrano nella normale fisiologia. Questo perché, giusto per farvi un esempio, all’interno delle sequenze di questi geni che producono questi enzimi le mutazioni sono notevoli. In linea di massima funziona così, diciamo che per quanto riguarda le maggiori mutazioni si trovano spesso e volentieri all’interno di sequenze codificanti enzimi. Questa è un’altra classificazione del genoma umano: Abbiamo detto che sono 3 milioni di Kb all’incirca, cioè i 3 miliardi paia di basi e le 3 mila mega paia di basi, possiamo dividere per quanto riguarda il genoma in geni che sono associati effettivamente a sequenze associate ai geni, cosa significa geni associati a sequenze associate ai geni: non si parla solo degli esoni, ma anche degli introni, delle regioni terminali, le regioni di poliadenilazione, regioni promotrici che si trovano in 5’; quindi non solo il gene in sé e per sé ma tutta la regione che darà luogo all’attività, alla funzionalità, all’attivazione di quel gene. Quindi possiamo dire che all’interno di queste sequenze ci sono: il DNA codificante, che è quello che verrà trascritto e darà luogo alla proteina e quello non codificante, costituito dagli pseudo geni, dagli introni e da tutte le sequenze che vi ho detto prima. E poi abbiamo un 70-80% che riguarda il DNA extragenico, quindi abbiamo delle sequenze che risultano avere una bassa ripetitività nel genoma e sequenze che risultano essere altamente ripetute, possono essere ripetute disperse oppure ripetute associate, poi vediamo cosa sono questi mini e micro satelliti e gli altri tipi di sequenze. Una cosa di fondamentale importanza è che i geni, quindi le sequenze codificanti all’interno del genoma non sono mai uguali gli uni agli altri, diciamo che possiamo trovare somiglianza, chiamiamola così, solamente quando si parla di famiglie geniche, ossia geni che per es. sono derivati da un unico progenitore ancestrale che abbia dato luogo a tutto quell’insieme di sequenze geniche, come per esempio le sequenze per le globine. Quindi possiamo dire che innanzitutto sono molto variabili, sono variabili tra i vari organismi, all’interno di un organismo abbiamo una notevole variazione, per esempio gli istoni sono delle sequenze non molto lunghe ma che non presentano le sequenze introniche, quindi possono essere costituiti da un unico grande esone. Le sequenze per le alfa-globine risultano essere molto corte 800 paia di basi, all’interno di queste 800 paia di basi, che sono niente rispetto alla totalità delle sequenze, abbiamo la presenza di 3 introni; oppure i geni per la distrofina sono 2 milioni e 400mila paia di basi ed hanno al loro interno 79 introni che se vogliamo non sono neanche tanti rispetto alla totalità della sequenza. Giusto per farvi degli esempi se guardate in alto vedete una sequenza di 50Kb, che sono 50 mila paia di basi, se guardate la sequenza umana vedete che all’interno di queste 50Kb ci sono solamente 3 geni e le sequenze effettivamente codificanti sono ancora ridotte a causa degli introni, tra l’altro vi è quello che probabilmente in epoche ancestrali era un gene funzionalmente attivo, che poi è andato incontro a particolari mutazioni, ed è quello che viene definito uno “pseudogene”, qui vediamo anche come vengono indicati. Se prendete l’ Escherichia Coli, vedete che all’interno di queste 50 paia di basi è quasi tutto geni e sono tutti geni che non presentano introni, quindi non solo all’interno di un organismo i geni hanno una lunghezza variabile e presentano degli introni, ma abbiamo una variabilità che risulta essere ancora maggiore se si passa da un organismo all’altro. In modo particolare ci sono degli organismi, come abbiamo visto prima l’ E.coli, che hanno un genoma molto ridotto rispetto a quello umano però questo genoma è praticamente quasi tutto codificante, quasi il 90%, mentre nell’uomo le parti codificanti sono solo il 2-3%. Quindi diciamo che si può associare la grandezza del genoma all’evoluzione ma non si possono associare il numero di sequenze codificanti, anzi diciamo che le sequenze di spaziatura che ci sono, quindi quelle sequenze unicamente ripetute ma che sembrerebbero essere al momento.. l’evoluzione sembrerebbe essere maggiormente correlata a queste sequenze spaziature che distano i geni gli uni dagli altri. Questo è quello che dicevo prima, ci sono geni e sequenze associate ai geni, cosa vuol dire? Che noi quando parliamo di regioni trascrizionalmente attive ci riferiamo sia al gene ma anche a tutte quelle regioni che sono associate al gene stesso, quindi agli esoni di quel gene e che permettono la trascrizione e poi la produzione della proteina finale. Quindi per quanto riguarda il gene stesso abbiamo appunto il punto d’inizio, il codone ATG, gli introni e gli esoni, di fondamentale importanza sono i siti di splicing per la rimozione degli introni, questo perché la presenza di mutazioni in siti di splicing danno luogo alla produzione di mRNA che può essere modificato, oppure dare luogo ad una proteina che risulta essere conformazionalmente funzionale, non funzionale, inattiva, soggetta a degradazione, dipende da molte cose. Diciamo che fanno sempre parte delle sequenze geniche anche i codoni di stop e la coda di poliadenilazione ma c’è tutta una serie di sequenze che si trovano in 5’, quindi a monte del gene, che sono di fondamentale importanza affinché avvenga l’inizio della trascrizione di quel gene. Quindi per es. abbiamo le regioni TATA box che si trova a circa 30paia di basi dal codone di inizio, poi quasi sempre la regione CAAT box che si trova in linea di massima tra gli 80-100 paia di basi prima del codone d’inizio e poi si possono trovare delle altre sequenze come la GC e la Oct box. Queste diciamo che sono un pochettino più variabili, non sempre ci sono prima di un gene trascrizionalmente attivo. Particolare è la sequenza ENHACER, sequenza di riconoscimento del sito di attivazione, qui è indicata a monte del gene, in realtà potrebbe essere molte ma molte paia di basi prima, ma potrebbe anche trovarsi a valle del gene stesso quindi in 3’ e per ripiegamento del DNA stesso questa regione potrebbe avvicinarsi al sito d’inizio della trascrizione e dare luogo a quella che è appunto l’inizio della trascrizione stessa. Diciamo che questo è un ripasso (per biologia cellulare e molecolare) come si passa dal DNA al RNA maturo, l’RNA polimerasi II, l’inizio della trascrizione, maturazione.. degli introni e la presenza del mRNA maturo che col cappuccio in 5’ e la coda di poliA può passare la membrana nucleare, va nel citoplasma e via dicendo. Quindi quando si parla di geni, non si parla quasi mai, o comunque si parla di geni che sono isolati che danno luogo alla produzione di una determinata proteina, di un determinato enzima, per esempio il gene per la G6PD. Diciamo che è un gene che può essere definito come un gene unico che si trova nel cromosoma X e non fa parte di quella che invece è una famiglia di geni. Cosa sono le famiglie di geni? Sono dei geni trascrizionalmente attivi e funzionali e che trascrivono per molecole, in questo caso si parla di globine, che sono fra loro molto simili, questi geni che appartengono alla famiglia di geni in linea di massima fanno parte di quello che viene definito cluster genico. Che cos’è un Cluster genico? E’ quell’insieme, quel numero di geni che sono presenti all’interno di quella sequenza di DNA in modo particolare quando tutti questi geni sono presenti all’interno dello stesso cromosoma. In questo caso per esempio parliamo del cluster genico delle beta- globine che si trovano tutte sul cromosoma 11, o del cluster genico delle alfa globine che invece si trovano sul cromosoma 16. Come si arriva ad avere questi geni molto simili tra di loro? Probabilmente nell’evoluzione ci sono stati quei fenomeni che vengono definiti duplicazione, dovuta a più fattori, il più comune è quello del crossing over ineguale, dove porzioni di un cromosoma vengono trascritte sull’altro, quindi abbiamo fondamentalmente un cromosoma che resta senza quelle sequenze geniche e un cromosoma che si trova ad averle duplicate. Ora i meccanismi possono essere tanti, non è neanche il caso di elencarli tutti. Diciamo che in linea di massima c’è un gene ancestrale, la duplicazione di questo gene ancestrale sullo stesso cromosoma o anche su cromosomi diversi, da luogo a quei geni che appartengono tutti alla stessa famiglia genica. Quindi geni che in linea di massima trascrivono per derivati proteici che hanno più o meno la stessa funzionalità, questi geni successivamente sono stati soggetti a mutazioni, capita, e quindi per questo motivo alcuni di questi geni vanno a produrre, in questo caso si parla di globine, globine che differiscono per es. in lunghezza, per es. in amminoacidi oppure mutazioni in un gene particolarmente importanti, come possono essere le regioni di riconoscimento in 5’, oppure del codone d’inizio, questi geni diventano trascrizionalmente inattivi però presentano tutte le caratteristiche di un gene, quindi se noi andiamo a studiare le sequenze di quello pseudo gene vedremo che ci sono i siti per la rimozione degli introni, i siti di splicing, vedremo che c’è la sequenza che da origine alla coda di poliA, ma questi geni non vengono trascritti e vengono appunto definiti pseudo geni e in linea di massima si trovano nello stesso cluster, quindi nello stesso cromosoma dove sono presenti i geni funzionali. Le famiglie di geni sono tante, questo è solo per farvi alcuni esempi, se parliamo di organismi eucarioti nella fattispecie abbiamo queste: actina, cheratina, tubulina, miosina, giusto per farvi degli esempi. Oppure se parliamo in modo particolare di vertebrati, visto che non tutti gli eucarioti sono i vertebrati, vediamo che le famiglie di geni sono altre, le globine, le immunoglobuline, le proteine chinasi e così via. Questo è giusto per farvi un esempio del cluster delle globine, inoltre abbiamo quello che è il cluster delle alfa globine quindi ci troviamo cromosoma 16, braccio corto, posizione 13: Che cosa abbiamo? Abbiamo quelli che sono i 3 geni funzionali. Quindi i due geni per le alfa globine alfa1 e alfa2 e poi i geni per la globina….e abbiamo in mezzo a loro anche gli pseudogeni che vengono indicati con la lettera greca psi. Quindi la presenza di queste sequenze che sono molto simili alle sequenze per le globine di tipo alfa sono pseudo geni, non sono trascrizionalmente attivi, sono molto simili e vengono indicate con psi. A differenza nel cromosoma 11, braccio corto, in posizione 15 abbiamo i cluster per quanto riguarda le beta globine. Qui il cluster risulta essere molto più variegato, abbiamo i geni per le globine epsilon, per le globine gamma, le G e le A, e due pseudo geni indicati come pseudo geni beta1 beta2 questo perché molto simili alla sequenza del gene effettivamente beta. Ma quello che vi ho detto prima, che forse mi sono dimenticato di dirvi prima è che prima vi ho detto che ci sono tutta una serie di geni, i geni non sono trascrizionalmente attivi nelle cellule di tessuti di cui stiamo parlando però vi sono anche geni che sono attivi in diverse fasi della vita, quindi ci sono geni che sono attivi allo stato fetale, allo stato embrionale o allo stato adulto appunto come in questo caso le globine. Se parliamo di emoglobine fetali vediamo che non sono le stesse di quelle adulte, anche se poi quando si fa una analisi per esempio delle globine adulte si vede che ci sono sempre tracce delle globine fetali.. embrionali; in linea di massima ci sono come residui più che altro vengono prodotte in misura molto minore. Diciamo che quando troviamo tracce di queste emoglobine, soprattutto alte, ci troviamo a che fare con delle emoglobinopatie, quindi quando abbiamo delle carenze delle globine alfa e delle globine beta, quindi della alfa e della beta talassemia in cui intervengono delle altre globine a sopperire a questa mancanza. Qui giusto per vedere un esempio dell’omologia, se prendete le sequenze beta e le sequenze delta sono simili al 90%, le sequenze delle globine beta, le gamma e le G hanno una omologia che supera l’80 %. Allora prima abbiamo parlato di sequenze geniche trascrizionalmente inattive, qui abbiamo delle sequenze che risultano essere non necessariamente ripetute nel genoma e sono queste ripetute in tandem, e sono le sequenze per l’RNA di tipo ribosomiale e di tipo transfer che si trovano in particolare nelle regioni telomeriche del DNA, quelle che sono le porzioni satellite dei cromosomi, poi ci arriviamo. Qui è giusto un esempio per quanto riguarda gli istoni, si fa la precisazione che gli istoni appartengono a geni ripetuti in tandem negli organismi eucarioti ma non nei vertebrati. Nei vertebrati gli istoni non sono sequenze ripetute in tandem. Abbiamo parlato poi di DNA che viene ripetuto nel genoma, quindi DNA altamente ripetuto, prima veniva indicato il 10%, qui il 6%, dipende sempre dal tipo di testo con cui avete a che fare. Dal mio punto di vista se tu parli nel genoma totale è il 6%, perché a seconda del libro di testo (es. genomi 3) ti parla del 10%, ma in quel momento non ti sta più parlando del DNA totale, ti sta per esempio parlando del genoma non trascrizionalmente attivo. Io preferisco che voi mi diciate un 6-7%. Quindi come può essere classificato questo DNA altamente ripetuto? Può essere classificato come minisatellite : numero variabile di ripetizioni in tandem, oppure micro satelliti che vengono indicati come ripetizioni brevi in tandem, ma ripetizioni di sequenze semplici. Potete trovare gli acronimi VNTR o STR piuttosto che SSR.. anche in questo caso dipende sempre dal libro di testo a cui si fa riferimento. STR o SSR è semplicemente un modo diverso per chiamare i microsatelliti. Diciamo che dal mio punto di vista la dicitura corretta è STR, soprattutto per differenziarle dal numero variabile delle ripetizioni in tandem, però anche ripetizioni di sequenze semplici va bene. Quindi in cosa differiscono, le prime sono delle sequenze di 15 -100 paia di basi che sono ripetute nel genoma per una sequenza di 500-2000Paia di basi. Quindi all’interno di questa sequenza che va da 500 a 2000 paia di basi, voi trovate 15-100 paia di basi che vengono ripetute un numero vario di volte. Dalle 50 se si tratta di 10 sequenze, alle 5 volte se si tratta di una sequenza di 100 paia di basi. Ovviamente non è che all’interno di questa sequenza c’è solamente il minisatellite, però per esempio ci possono essere all’interno di 500 paia di basi 3 minisatelliti abbastanza distanziati tra di loro, lungo ciascuno 15 paia di basi. Vengono comunque indicati come minisatelliti. Per quanto riguarda i microsatelliti, la differenza fondamentale con i minisatelliti è che i minisatelliti si trovano prevalentemente nei telomeri, mentre per quanto riguarda i microsatelliti si trovano più sparsi nel genoma. Quindi non solo nelle sequenze telomeriche, ma anche in altri punti caldi, addirittura all’interno di alcune sequenze geniche. Quindi diciamo che quando poi faremo i metodi per la mappatura genica i micro satelliti sono i satelliti che vengono maggiormente utilizzati, questo perché sono delle sequenze molto corte, quindi dalle 2 alle 5 paia di basi che sono ripetute, 10, 15, 30 volte in una sequenza più o meno di 150 paia di basi. Questo per quanto riguarda il DNA altamente ripetuto. Per quanto riguarda il DNA mediamente ripetuto abbiamo le corte sequenze intersperse e le lunghe sequenze intersperse. Le prime sono presenti nel 13% del genoma, le seconde nel 21%. Per quanto riguarda queste corte sequenze hanno una lunghezza di circa 150-300 paia di basi e sono inserite in varie posizioni nel genoma eucariote, quindi per esempio a differenza con i mini e i micro satelliti non sono ripetute tutte nell’arco di una lunga sequenza. Questi sono ripetuti tot volte nel genoma, quindi li possiamo trovare in varie posizioni. Una delle sequenze più importanti è la sequenza ALU, una sequenza di 290 paia di basi ripetute dalle 500 alle 5 milioni di paia di volte e che quindi rappresenta circa l’1% del genoma. E’ importante perché la prima di questo tipo di sequenze che sia stata utilizzata; viene chiamata sequenza ALU perché presenta dei siti di riconoscimento per l’enzima di restrizione ALU, che sono questi siti qua, quindi 4A e 4T che vengono riconosciuti da questo enzima di restrizione e che quindi taglierà il DNA in quel determinato punto. Diverso è invece il discorso per quanto riguarda invece le lunghe sequenze intersperse, queste sono sequenze molto più grandi quindi da 1 a 5Kb, se poi andiamo a guardare la sequenza 1 è una sequenza di 6Kb quindi anche lì entriamo nella variabilità. Queste sono diverse rispetto alle prime perché hanno praticamente quella che è una sequenza simile di geni, quindi presentano le ORF. Che cosa sono le ORF? Le ORF sono queste fasi di lettura che servono a riconoscere la presenza di un gene e che appunto vengono utilizzate nella mappatura genica. Che cosa sono e per cosa vengono utilizzate lo vedremo nelle lezioni che riguardano la mappatura genica. Quindi queste sono anche degli elementi trasponibili, quindi cosa fa pensare questo? Che siano delle sequenze derivate da qualche retrovirus che si è introdotto nell’organismo eucariote e che ha rilasciato il suo DNA che si è fuso con quello dell’organismo eucariote e questo DNA continua a replicarsi con il DNA degli organismi eucarioti appunto. Questo perché? Perché appunto presenta oltre queste sequenze cds, o chiamatele come preferite, presenta anche tutta una serie di cose che lo fanno avvicinare a quello che potrebbe sembrare un gene, come la presenza di ciò che trascriverà per la coda di poliadenilazione e si pensa che derivi appunto dall’azione dovuta ad un retrovirus dovuta ad elementi di tipo trasponibile. Questo è giusto per farvi un esempio delle sequenze ripetute. Ad esempio nella drosophila abbiamo delle sequenze ripetute che variano dalle 5 alle 7-10 paia di basi, mentre nell’individuo umano possono essere anche 171. Prima vi ho detto che non tutto il DNA è trascrizionalmente attivo e diciamo che la percentuale del DNA trascrizionalmente attivo, quindi la percentuale non la quantità va a diminuire man mano che l’individuo si evolve, man mano che si passa da un organismo meno evoluto ad uno più evoluto. Escherichia coli ha una lunghezza di 400 mila paia di basi, di queste 400mila paia di basi circa l’ 88% risultano essere associate a geni trascrizionalmente attivi, quindi diciamo che l’88% del genoma d E. coli è attivo. L’Homo sapiens che ha un genoma che presenta una lunghezza di 3 miliardi e passa di paia di basi, di questo, solamente il 3% risulta essere attivo, mentre le regioni non trascrizionalmente attive sono il 55%. Quindi diciamo che forse la presenza di questo DNA spaziatore tra un gene e l’altro è sinonimo di evoluzione piuttosto che avere poco genoma e tutto funzionalmente attivo. Questo è giusto per farmi un esempio del genoma extranucleare: Quindi prima vi ho detto, quando si parla di genomi di organismi eucarioti non parliamo solamente del genoma nucleare ma anche di quello che è il genoma citoplasmatico, per quanto riguarda gli organismi animali parliamo di mitocondri, per quanto riguarda gli organismi vegetali parliamo sia di mitocondri che di cloroplasti. Se prendiamo come riferimento i mitocondri, giusto perché stiamo parlando di genetica umana, vediamo che nei mitocondri sono presenti una totalità di 37 geni. Come sono distribuiti questi 37 geni? Abbiamo 13 geni che codificano per diversi tipi proteine enzimatiche, quindi tutte quelle proteine che, o meglio enzimi che catalizzano le reazioni di energia, di attività della cellula. In più abbiamo 22 geni che trascrivono per tRNA e solo 2 geni (in alto) indicati in arancione che trascrivono per l’rRNA. Quindi diciamo che anche i geni dei mitocondri risultano presentare delle regioni codificanti, ma codificanti proteine e non codificanti proteine, codificanti altri tipi di mRNA. Quindi quello che abbiamo visto per il momento era il DNA, come si organizza il DNA? Ripasso (non lo chiede), abbiamo il DNA a doppia elica, intervengono gli istoni gli istoni che legandosi danno origine ad primo grado di condensamento del DNA stesso, gli istoni che si ripiegano tra loro daranno luogo ai nucleosomi, successivamente la spiralizzazione fino ad ottenere un cromosoma. Ora questo si vede durante le analisi cromosomiche al vetrino. Che tipo di cromosoma è? E’ un cromosoma che si trova in metafase, presenta un centromero e i due cromatidi. Quindi noi vediamo i cromosomi così costituiti solamente in questa fase, in linea di massima questo è sempre il solito discorso che i libri a volte non si spiegano bene. Quando si parla di cromosomi spesso si parla non di questi cromosomi, ma si parla di cromosoma con un solo cromatidio. Noi ci troviamo di fronte a cromosomi con due cromatidi solamente in questa fase della divisione mitotica in cui un cromosoma è costituito da due cromatidi fratelli e quindi pronto ad essere suddiviso in due cromosomi figli costituiti ciascuno da un cromatidio. Abbiamo quindi questo cromosoma che si trova costituito da due cromatidi a livello della metafase della divisione meiotica poi se vi ripassate la meiosi, si ritrova anche nella divisione meiotica perché la divisione meiotica è una doppia divisione che porta alla formazione di 4 cellule figlie di tipo aploide, quindi non di due. Mentre nella mitosi abbiamo 2 cellule di tipo diploide. Nella meiosi intervengono due tipi di divisioni, una che effettivamente meiotica e una mitotica. Rappresentazione di una piastra cromosomica umana, qui avete 46 cromosomi, in questo caso in un vetrino che viene visto al microscopio con una particolare tecnica, che si chiama tecnica in fluorescenza. I 46 cromosomi risultano sparpagliati. Com’è costituito un cromosoma? Questi sono sempre cromosomici metafasici che si trovano costituiti da due cromatidi fratelli uniti per il centromero a seconda della posizione del centromero abbiamo la classificazione di 4 tipi di cromosomi: metacentrici; submetacentrici; acrocentrici; e telocentrici. Per quanto riguarda l’Homo sapiens, non ci troviamo a che fare con cromosomi di tipo acrocentrico. Quindi cosa abbiamo il centromero, a seconda della localizzazione del centromero abbiamo la suddivisione dei cromosomi in base alla sua posizione, poi abbiamo le sequenze telomeriche che caratterizzano le estremità dei cromosomi e sono quelle che vanno incontro a denaturazione/degradazione, diciamo che sono delle sequenze che con l’avanzare del tempo, dell’invecchiamento della cellula vanno perse, quindi si presume che l’invecchiamento cellulare sia causato dalla perdita delle sequenze telomeriche, o viceversa la perdita delle sequenze telomeriche determinano l’invecchiamento cellulare, bisogna capire che cosa provoca l’altro. Questo è l’esempio del cariotipo umano: questi sono cromosomi costituiti da un solo cromatidio, quindi sono cromosomi che sono andati incontro alla divisione mitotica e sono quelli che in linea di massima ci troviamo ovviamente in questo caso di una cellula di tipo aploide… questa è giusto una schematizzazione di tutti i cromosomi. Cos’è rappresentato in questa slide? Innanzitutto abbiamo le bande cromosomiche, quindi la presenza di bande chiare e bande scure indica che in quel determinato luogo abbiamo una concentrazione maggiore di sequenze di A/T piuttosto che di C/G che siano bianche o nere dipende dal tipo di colorazione che si andrà ad utilizzare, perché sono a volte una il negativo dell’altra. Poi ci sono altre regioni, abbiamo quelle evidenziate in celeste che sono appunto i centromeri. Come vi ho detto prima vi sono delle regioni telomeriche dove a livello di queste regioni telomeriche vi è la sequenza del rDNA, ossia quel DNA che trascritto darà luogo al RNA ribosomiale, queste sequenze si trovano in quei cromosomi che presentano i satelliti, quindi il cromosoma 13, 14, 15, 21 e 22. La presenza dei satelliti indica una abbondanza di sequenze che sono adibite alla trascrizione di RNA di tipo ribosomiale, quindi sono sequenze non codificanti proteine. In linea di massima possiamo dire che sia il centromero che le regioni satellite sono ricche di eterocromatina, che cos’è l’eterocromatina? E’ quella regione del DNA che risulta essere molto compatta ma non trascrizionalmente attiva o meglio non risulta trascrizionalmente attiva ma nella quale ci sono pochi o nessun gene, quindi diciamo che è tutto quell’insieme di DNA che può essere definito spaziatura e non si trova solamente nei centromeri o nelle sequenze telomeriche o comunque nei satelliti ma si trova anche in altre porzioni, non lo so se vi guardate il cromosoma 1 si trova nel braccio lungo poco sotto il centromero, è quella parte che risulta essere leggermente evidenziata. Oppure giusto per farvi un esempio se guardate il cromosoma Y è quasi tutto il braccio lungo costituito da eterocromatina, quindi quasi ad indicare non l’inutilità, ma la poca quantità di lavoro che deve svolgere il cromosoma Y per il suo compito. Giusto per farvi qualche esempio negli organismi eucarioti non esistono solamente i cromosomi come li vediamo noi, come li abbiamo noi nel nostro corredo cromosomico umano, ma esistono altri tipi di cromosomi. Questo per esempio è il cariotipo del pollo, ha 33 cromosomi, questo è giusto per farvi un esempio di alcuni cromosomi, ci sono effettivamente quelli che sono i macrocromosomi, cioè i cromosomi veramente grandi, come quelli umani o più grandi. Poi ci sono i microcromosomi, cromosomi che appunto risultano essere molto piccoli. Giusto per ricordarvi una cosa, la coppia di cromosomi sessuali, perché bisogna ricordarsi che negli uccelli a differenza dei mammiferi il sesso è al contrario, quindi non è l’individuo maschile a determinare il sesso ma è l’individuo femminile, ossia in questo caso l’individuo maschile sarà ZZ la gallina ZW. I cromosomi olocentrici sono quelli che contengono nella loro struttura, e poi questi che vengono definiti cromosomi B, che si trovano in alcuni organismi di vario tipo (animali, vegetali e alcuni funghi) praticamente questi sono dei cromosomi che si vengono a trovare per frammentazioni dei cromosomi principali, se noi andiamo ad analizzare il cariotipo di queste specie con ad es. mais troveremo questi cromosomi di tipo B che risultano essere funzionalmente inattivi o poco attivi, sembrerebbero quasi non avere nessuna funzione, ad eccezione del mais dove si è visto che non presentano solamente eterocromatina costitutiva ma eucromatina, si presume diano luogo alla modifica di qualche particolare gene. Possiamo dire che questi cromosomi forse non sono attivi però come la presenza di DNA spaziatura che si trova nel genoma eucariote, probabilmente la presenza di questi cromosomi potrebbe essere associata ad uno scambio di tipo evolutivo. Questo è giusto un esempio per quanto riguarda il nostro corredo cromosomico. Quindi i nostri cromosomi vengono elencati dal numero 1 al numero 22 sono quelli autosomici e sono in duplice copia, uno deriva da un genitore e l’altro dall’altro genitore, e sono indicati in questo ordine in base alla loro lunghezza. Ora bisogna dire che la lunghezza effettiva è stata trovata quando questi cromosomi sono stati messi in fila, ossia quando abbiamo avuto la prima piastra cromosomica, si sono messi i cromosomi in fila in base alla lunghezza, poi facendo una analisi della lunghezza si è visto che, se per esempio prendete il cromosoma 20 è più lungo del cromosoma 19 e così via.. il 22 è più lungo del cromosoma 21, ma ormai la classificazione era quella e quella è rimasta. Questo è il cariotipo umano: E’ costituito da dei cromosomi omologhi anche in questo caso ci troviamo un cromosoma paterno e un cromosoma materno e sono cromosomi che si trovano in metafase con i due cromatidi fratelli uniti dal centromero. L’organismo femminile è indicato con la doppia X e l’organismo maschile con la coppia XY e diciamo che abbiamo una classificazione dei cromosomi non solo in base alla lunghezza ma anche per es. una classificazione in base alla posizione del centromero, quindi i primi 3 sono i grandi metacentrici, poi abbiamo i grandi submetacentrici e così via. Noi ci dobbiamo costruire il cariogramma, come si costruisce il cariogramma? Dobbiamo prima di tutto trovarci la materia prima, la materia prima ce la procuriamo attraverso il sangue di un individuo. Questo sangue viene trattato con fitoemoagglutinina, che è di origine vegetale e cosa stimola la fitoemoagglutinina nel sangue? Stimola la moltiplicazione delle cellule nucleate, ossia dei globuli bianchi ma non dei globuli rossi, tanto i globuli rossi non ci interessano, non contengono nucleo, non contengono i cromosomi quindi li lasciamo perdere. Si fa una incubazione a 37° per tot tempo e si aggiunge la colchicina. La colchicina cosa fa? Blocca i cromosomi in metafase perché inibisce la formazione del fuso mitotico, quindi è per questo che noi ci troviamo i cromosomi con i due cromatidi fratelli uniti per il centromero. Questo è giusto per dirvi un attimino qual è la tecnica che viene utilizzata per poi ricavarci i cromosomi. Quindi, abbiamo delle centrifugazioni, abbiamo il deposito delle cellule ematiche, il pellet; dopo la prima centrifugata il surnatante (quello che non contiene le cellule ematiche) viene eliminato, si aggiunge una soluzione ipotonica che tende a far esplodere i globuli bianchi e quindi manda in soluzione i nostri cromosomi; si effettua una seconda centrifugata, viene aggiunto del colorante, il nostro preparato cromosomico viene messo su un vetrino, il vetrino si analizza poi con il microscopio e tramite un programma informatico si avrà l’appaiamento dei cromosomi per grandezza, quindi per ordine e per appaiamento dei cromosomi omologhi. Per poter evidenziare i cromosomi abbiamo diverse tecniche di bandeggio, il primo usato in assoluto è il bandeggio di tipo C, costituito da una soluzione alcalina, però questo bandeggio di tipo C che cosa faceva? Rendeva visibile solamente alcune porzioni del centromero e dei telomeri, quindi sono state modificati tipi di colorazione, con la colorazione ad es. di (GIEMSA) con le bande G. Qui avremo con la colorazione di Giemsa, avremo le bande chiare e scure che indicano l’abbondanza delle coppie A/T piuttosto che delle coppie C/G, per quanto riguarda le bande Q che invece utilizzano la quinacrina vedremo la stessa tipologia di bande, quindi bande chiare ass. ad A/T e bande scure associate a G/C, però è un metodo di misurare queste bande che viene fatto attraverso l’emissione di fluorescenza, ossia la quinacrina una volta messa a contatto con il nostro preparato cromosomico sul nostro vetrino emetterà, tramite particolare dispositivi, una luce che arriva ad una particolare lunghezza d’onda che viene assorbita da un microscopio elettronico piuttosto che da un particolare strumento, non so come descriverlo, è come se fosse una camera oscura all’interno del quale si mette il vetrino, la camera oscura viene richiusa, viene fatta emettere la fluorescenza e quindi attraverso lo schermo del computer si vede la fluorescenza. E poi abbiamo il bandeggio R che è un tampone di tipo fosfato e che fondamentalmente colora in modo negativo rispetto al bandeggio C, cioè le bande che prima erano chiare diventano scure e viceversa. Questo è di nuovo il cariotipo maschile e il cariotipo femminile tramite un bandeggio G: Qui si vedono un pochettino meglio forse le bande chiare e le bande scure .. questo è un esempio del bandeggio Q, quindi emissione di fluorescenza, quindi abbiamo bande che emettono più fluorescenze (gialle) e quelle che sono più scure (arancione). Questo è giusto un esempio di come viene usato il cromosoma, abbiamo il centromero e abbiamo i due bracci del cromosoma, il braccio corto che viene definito braccio p, e il braccio lungo che viene definito braccio q. Questo è di fondamentale importanza quando ci sarà poi l’associazione genica e si riuscirà a capire dove si trovano i geni che volete analizzare. Un es. il gene … da luogo alla patologia che viene chiamata fenilchetonuria si trova sul cromosoma 12, il braccio lungo q in posizione 24-1, in questa posizione qua si trova questo gene. Ovviamente non tutti i geni lavorano da soli, prima vi ho detto che c’è il gene per la G6PD che da luogo alla fosfato deidrogenasi che svolgerà un particolare compito enzimatico, però ci sono altri effetti fenotipici che vengono dati dalla collaborazione di più geni, che sono tanti, si passa dal colore degli occhi al colore dei capelli, ad alcune patologie. Quindi cosa sappiamo, che dal genotipo si arriva fenotipo. Ovviamente un gene non basta, e nemmeno più geni, abbiamo tutta una serie di fattori esterni al gene che possono intervenire, fattori di tipo ambientale, abbiamo l’intervento di altri geni che non intervengono in quel particolare meccanismo, ma che sono geni coinvolti in meccanismi che coadiuvano quel meccanismo stesso; fenomeni epigenetici. L’espressione fenotipica però viene modificata anche da altri fattori, per es. abbiamo l’eterogeneità genetica. Ci sono patologie che pur presentando o pur avendo lo stesso fenotipo sono dovute all’azione di geni diversi, alcune patologie mentali, mi sembra l’epilessia. Fenotipicamente si presenta l’epilessia, ma se si va a vedere il corredo genetico di un determinato individuo si vedrà che la patologia epilettica in quell’individuo è dovuta a mutazioni che intercorrono in un gene piuttosto che in un altro. Quindi a volte il genoma non è predittivo di quella patologia. Oppure abbiamo quella che ha dominanza incompleta ed espressività variabile. Magari lo vediamo meglio quando ripassiamo gli alberi genealogici, ossia se noi all’interno di un albero genealogico vediamo individui che sicuramente hanno lo stesso corredo genetico vediamo che alcuni di questi presentano la patologia ed altri no. Questo può voler dire che affinché vi sia quella patologia siano necessari anche altri tipi di fattori, oppure espressività variabile quando quella patologia si presenta, il corredo genetico è esattamente lo stesso però abbiamo che la patologia che è variabile. Il fenomeno dell’anticipazione, per es. nella patologia di Huntington, si sa che individui portatori di quella determinata sequenza genica dovrebbero essere malati della patologia di H. ma non lo sono perché sono intervenuti particolari fattori di tipo ambientale o altri fattori genetici o fenomeni epigenetici che hanno impedito lo sviluppo della malattia. Ma questi individui sono sicuri quasi al 90 % che i loro figli saranno malati di quella patologia. E poi l’imprinting genomico che è dovuto ad alterazioni genetiche che derivano da un genitore piuttosto che da un altro.
Forse potrebbe interessarti:
Biologia dei microrganismi
PAROLE CHIAVE:
DNAPCR
Distrofia muscolare
malattie genetiche
Fibrosi Cistica
emoglobinopatie
talassemie
disordini monofattoriali