Storia e geografia dei geni umani 8845915883, 9788845915888

L'opera fondamentale per chi vuole cominciare a capire il rapporto fra il nostro patrimonio genetico e la storia de

228 58 60MB

Italian Pages 814 [853] Year 2000

Report DMCA / Copyright

DOWNLOAD PDF FILE

Recommend Papers

Storia e geografia dei geni umani
 8845915883, 9788845915888

  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

gli Adelphi 180

Luigi Luca Cavalli-Sforza è professore di Geneùca alla Stanford University, in California. Di lui Adelphi ha pubblicato Geni, popoli e lingue (1996). Paolo Menozzi è professore di Ecologia all'Università di Parma, Alberto Piazza di Geneùca umana all'Università di Torino.

LUIGI LUCA CAVALLI-SFORZA PAOLO MENOZZI ALBERTO PIAZZA

Storia e geografia dei geni umani

ADELPHI EDIZIONI

TITOLO ORIGINALE:

The History and Geography of Human Genes

Traduzione di Rosaria Maria Griffo, Giuseppe Matullo, Sabina Rendine, Nazario Cappello

© 1994

PRINCETON UNIVERSITY PRESS

Published by agreement with Princeton University Press Ali rights reserved. No part of this book may be reproduced or transmitted

in any form or by any information storage and retrieval system, without permission in writing from the Publisher © 1997 ADELPHI

EDIZIONI S.P.A. MILANO

I edizione gli Adelphi: novembre 2000 ISBN 88-459-158S.3

INDICE

Prefazione all'edizione italiana Ringraziamenti l l. l 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 1.1 O 1.11 1.12 1.12.a 1.12.b

INTRODUZIONE A CONCETTI, DATI E METODI

In traduzione Definizioni genetiche Tecniche per identificare i marcatori polimorfici L'evoluzione delle frequenze geniche Tentativi classici di distinguere «razze" umane Fallimento scientifico del concetto di razza nell'uomo Identificazione delle unità di popolazione Classificazione linguistica Natura e fonti dei dati Metodi di analisi Distanze genetiche Analisi di alberi filogenetici Definizioni Metodi per ricostruire alberi filogenetici in base ai dati di frequenze geniche 1.12.c Il numero di alberi possibili 1.12.d La posizione della radice 1.12.e Sequenze di DNA, massima parsimonia e minima evoluzione 1.12.f Errore statistico nella costruzione degli alberi filogenetici 1.12.g La treeness e la scoperta delle deviazioni dal modello · più semplice di evoluzione 1.12.h Le ragioni delle scelte fatte

xv XXI

3 3 7 lO 18 28 33 35 40 43 46 51 54 54 56 59 60 63 65 66 69

l.l2.i 1.13 1.14 1.14.a 1.14.b

Conclusioni sull'utilità degli alberi filogenetici Analisi delle componenti principali (CP) e metodi derivati Mappe delle frequenze geniche Scelte da compiere Metodi per adattare le superfici geografiche a dati . di frequenze geniche 1.14.c Il metodo adottato per calcolare le superfici delle frequenze geniche l.l4.d Linee isogeniche (isoplete) 1.14.e Le superfici delle frequenze geniche: implicazioni evolutive 1.15 Mappe geografiche sintetiche 1.16 Isolamento dovuto alla distanza geografica 1.17 Le mescolanze: come le si stima e quale effetto hanno sulla struttura ad albero

102

2

STORIA GENETICA DELLE POPOLAZIONI DEL MONDO

113

2.1 2.l.a 2.l.b 2.l.c 2.l.d 2.l.e 2.2 2.3

Quadro paleoantropologico Il genere HOJTW La specie Homo sapiens Sostituzione totale o sostituzione parziale? Inizio della produzione di cibo Dimensioni delle popolazioni: qualche numero I primi studi filogenetici quantitativi Analisi dei marcatori classici in quarantadue popolazioni selezionate Aspetti tecnici L'albero delle quarantadue popolazioni Analisi di nove raggruppamenti Analisi delle coordinate principali Differenze tra marcatori genetici Breve riassunto Analisi dei dati del DNA Caratterizzazione del DNA mitocondriale mediante l'analisi di restrizione Sequenziamento di m tONA Il cromosoma Y Polimorfismi del DNA nei geni nucleari Confronto con i dati archeologici Confronto con classificazioni linguistiche

113

2.3.a 2.3.b 2.3.c 2.3.d 2.3.e 2.3.f 2.4 2.4.a 2.4.b 2.4.c 2.4.d 2.5 2.6

72 74 80 81 83 85 88 89 94 96

113 116

122 I27 129 129 138 138 144 148 153 154 155 156 156 166 166 167 176 181

2.6.a Problemi delle classificazioni linguistiche 2.6.b Confronto tra albero genetico e albero linguistico 2.6.c Perché tra l'albero linguistico e quello genetico vi è una stretta somiglianza? 2.6.d Sostituzioni linguistiche 2.6.e Possibili tempi di origine delle famiglie linguistiche 2.7 Importanza delle espansioni demografiche nell'evoluzione umana 2.7.a Le espansioni potrebbero aver punteggiato la storia dell'uomo moderno 2.7.b Dalla raccolta del cibo alla sua.produzione 2.7.c Espansione demica o diffusione culturale? 2.7.d Il modello dell'" onda di avanzamento» 2.7.e Tipi di espansione 2.8 Misura della variabilità genetica mediante l'analisi del parametro Frr 2.8.a Alcune semplici proprietà del parametro Frr 2.8.b I valori di Frr dipendono dal livello di raggruppamento delle popolazioni 2.8.c La distribuzione teorica del parametro Frr e una sua applicazione ai polimorfismi del DNA 2.8.d Variazione del parametro Frr nei polimorfismi non DNA 2.8.e La media delle Frr di tutti i geni nel mondo e nelle regioni principali 2.8.f Possibili effetti della selezione naturale sulla costruzione degli alberi filogenetici 2.9 Variabilità genetica e distanza geografica 2.10 Mappe dei singoli geni 2.11 Mappe sintetiche del mondo 2.12 Omozigosità 2.13 Correlazioni con il clima 2.14 Aree e tempi di origine dei principali mutanti, con particolare attenzione alle emoglobine 2.15 Breve riassunto dell'evoluzione umana

181 186

3

AFRICA

293

3.1 3.2 3.2.a 3.2.b

Geografia e ambiente Preistoria e storia Il Paleolitico Il Neolitico neli'Mrica settentrionale

293 295 295 298

191 193 195 199 199 200 204 205 208 213 213 214 216 222 225 229 230 237 250 258 264 270 286

3.2.c 3.2.d 3.2.e 3.2.f 3.2.g 3.3 3.3.a 3.3.b 3.4 3.5 3.6 3.7 3.8 3.9 3.10 3.ll 3.12

Sviluppo del Neolitico nel Sahara Sviluppo del Neolitico a sud del Sahara L'Età dei Metalli e l'espansione bantu I primi stati dell'Africa subsahariana e dell'Etiopia Dimensioni numeriche delle popolazioni Linguistica Classificazione generale Le lingue bantu Antropologia fisica degli africani moderni Analisi genetica del continente Gli Etiopi, alcuni dei loro vicini e i nordafricani l Khoisanidi I Pigmei Gli africani subsahariani Studio dei singoli geni Mappe sintetiche dell'Africa Riassunto della storia genetica dell'Africa

299 300 301 303 305 306 306 308 314 315 320 327 333 338 347 355 361

4

ASIA

367

4.1 4.2 4.3 4.3.a 4.3.b 4.4 4.4.a 4.4.b 4.4.c 4.4.d 4.5 4.5.a 4.5.b 4.5.c 4.5.d 4.5.e 4.6 4.6.a 4.6.b

Introduzione generale, geografia e ambiente Preistoria e storia dell'Asia settentrionale Preistoria e storia dell'Asia centrale e intermedia Il Neolitico nell'Asia centrale e nell'Iran settentrionale Il nomadismo pastorale nelle steppe dell'Asia Preistoria e storia dell'Asia ori e n tale Giappone e Corea: archeologia e primordi della storia Cina: dal Paleolitico alla storia Dimensioni della popolazione in Cina Ti be t Preistoria e storia dell'Asia sudorientale Paleoantropologia Fine del Paleolitico e inizio del Neolitico Tardo Neolitico ed Età del Bronzo Gli imperi delle foreste I gruppi tribali Preistoria e storia dell'Asia meridionale Il Neolitico e la civiltà indù India

367 370 373 373 374 379 379 382 386 387 387 387 388 390 390 391 391 392 395

4.6.c 4.6.d 4.7 4.7.a 4.7.b 4.7.c 4.7.d 4.7.e 4.7.f 4.7.g 4.8 4.9 4.10 4.11 4.12 4.13 4.14 4.15 4.16 4.17 4.18

Le caste I gruppi tribali Preistoria e storia dell'Asia occidentale L'origine dell'agricoltura nel Vicino Oriente L'irrigazione e lo sviluppo delle città L'Età del Bronzo nel Vicino Oriente L'Età del Ferro nel Levante Iran La penisola arabica Le espansioni arabe Linguistica Antropologia fisica Quadro genetico generale dell'Asia Genetica delle popolazioni artiche Genetica dell'Asia orientale e centrale Genetica dell'Asia sudorientale Genetica dell'Asia meridionale (il subcontinente indiano) Genetica dell'Asia occidentale Mappe geografiche dei singoli geni Mappe sintetiche dell'Asia Riassunto della storia genetica dell'Asia

397 398 402 402 405 407 408 410 411 413 414 419 423 426 431 439 447 453 458 464 472

5

EUROPA

479

5.1 5.2 5.3 5.4 5.5 5.6 5.6.a 5.6.b 5.6.c 5.6.d 5.7 5.8 5.9 5.10 5.11

Geografia ed ecologia Preistoria e storia Linguistica Antropologia fisica Il quadro genetico Principali valori erratici: Lapponi, Sardi, Baschi e Islandesi Lapponi e altre popolazioni di lingua uralica Sardegna Baschi Islanda Italia Francia Penisola iberica Mappe dei singoli geni Mappe sintetiche dell'Europa

479 481 493 498 502 509 510 512 517 518 519 526 536 541 547.

5.12 5.13

1nterazioni tra informazione genetica, archeologia e linguistica 557 564 Riassunto della storia genetica dell'Europa

6

AMERICA

569

6.1 6.2 6.3 6.4 6.5 6.6 6.7 6.8 6.9 6.10 6.11 6.12 6.13 6.14

Geografia e ambiente Preistoria: l'occupazione dell'America L'inizio dell'agricoltura Lo sviluppo nell'America settentrionale Lo sviluppo nell'America centrale Lo sviluppo nell'America meridionale Antropologia fisica Linguistica Analisi filogenetica dell'America Analisi. filogenetica delle singole tribù Genetica, linguistica e geografia Mappe geografiche dei singoli geni Mappe sintetiche dell'America Riassunto della storia genetica dell'America

569 572 580 585 589 591 596 598 603 614 621 625 633 641

7

AUSTRALIA, NUOVA GUINEA E ISOLE DEL PACIFICO

645

7.1 7.l.a 7.l.b 7.l.c 7.2 7.2.a

Geografia e ambiente Australia Nuova Guinea Isole del Pacifico Preistoria e storia L'allevamento di animali e la coltivazione di piante in Nuova Guinea 7.2.b L'occupazione del Pacifico Antropologia fisica 7.3 Linguistica 7.4 7.5 Struttura genetica delle popolazioni dell'Oceania Genetica delle popolazioni dell'Australia 7.6 e relative mappe sintetiche 7.7 Genetica delle popolazioni della Nuova Guinea e relative mappe sintetiche 7.8 Genetica delle popolazioni di Melanesia, Micronesia e Polinesia 7.9 Mappe dei singoli geni dell'Australia e della Nuova Guinea

645 645 646 647 648 650 651 654 656 659 663 669 679 687

7.10 7.11

Mappe dei singoli geni delle isole del Pacifico Riassunto della storia genetica del Pacifico

690 693

8

EPILOGO

8.1 8.2 8.3 8.4 8.5

L'approccio multidisciplinare Genetica e storia evolutiva dell'uomo Differenti metodi di analisi genetica a confronto Il futuro di questa ricerca Evoluzione genetica e linguistica

697 697 698 700 706 713

Aggiornamento per l'edizione italiana

717

Bibliografia

723

Indice analitico

765

Tavole e mappe genetiche

793

l

INTRODUZIONE A CONCETTI, DATI E METODI

1.1

INTRODUZIONE

Da tempo ài genetisti era nota l'esistenza di una certa variabilità genetica tra gli individui appartenenti a una stessa specie, ma fino a circa venticinque anni fa l'entità di questa variazione non era stata valutata appieno. In molte popolazioni umane, caratteri evidenti quali il colore degli occhi e dei capelli variano da un individuo all'altro: sono differenze che anche i profani notano con facilità, come pure le variazioni di altezza, di peso, di costituzione corporea e dei tratti facciali, anch'esse in parte determinate geneticamente. La loro trasmissione ereditaria è tuttavia complessa, e questi caratteri contribuiscono ben poco a farci comprendere l'entità delle variazioni. Il primo esempio di variazione genetica ben caratterizzata, quella del gruppo sanguigno ABO, fu descritto agli inizi del secolo (Landsteiner, 1901). Le differenze tra individui, riguardanti variazioni del gruppo sanguigno ABO, sono dovuté a piccole differenze chimiche in molecole che si trovano sulla superficie dei globuli rossi. Questi studi furono presto estesi ad altri sistemi di gruppi sanguigni: si accumulò una gran quantità di dati che dimostravano come, in popolazioni umane diverse, i gruppi sanguigni fossero presenti in proporzioni diverse; tuttavia solo in seguito, a partire dagli anni Cinquanta ma soprattutto negli anni Sessanta, è stato possibile intravedere la sorprendente entità della variazione genetica, grazie allo studio sistematico delle differenze nelle proteine degli individui. Un a proteina è una molecola complessa, costituita da una sequenza lineare di componenti chiamati amminoacidi; le varie proteine hanno composizione amminoaçidica che cambia molto dall'una all'altra e assolvono funzioni assai diverse. Le relazioni tra struttura e funzione sono state descritte per molte proteine. Tra un individuo e un altro, la stessa proteina può presentare piccole differenze che si trasmettono per via ereditaria. Il primo esempio è stato osservato nella proteina emoglobina, nella quale si è visto che la sostituzione di uno specifico amminoacido con un altro determina una malattia ereditaria conosciuta come anemia falciforme. Questo primo caso di «patologia molecolare" è stato

4

Storia e geografia dei geni umani

idenùficato sottoponendo la proteina a un campo elettrico con un metodo chiamato elettroforesi (Pauling e coli., 1949; Ingram, 1957). La sosùtuzione amminoacidica coinvolta nell'anemia falciforme provoca nella molecola emoglobinica un cambiamento di carica elettrica, che permette di separare l'emoglobina normale da quella falciforme. Ulteriori perfezionamenò della tecnica elettroforeùca hanno permesso di individuare un gran numero di varianù proteiche. Oggi si sa che la maggior parte delle decine di migliaia di proteine di un organismo può presentarsi sotto più di una forma, cosicché alcuni individui possono avere una variante della proteina, mentre altri possono averne un'altra. La variabilità delle proteine rappresenta solo la punta dell'iceberg. Le reali dimensioni della variabilità genetica tra gli individui hanno cominciato a emergere solo quando è stato possibile effettuare le analisi allivello dello stesso materiale ereditario, l'acido desossiribonucleico (DNA). Questa tecnica è divenuta accessibile a molù solo negli anni Ottanta; così, i confronù tra segmenù di DNA in individui diversi, per quanto ancora rari, stanno diventando sempre più comuni e bastano a convincerci che la variazione al livello del DNA è molto maggiore di quanto si sospettasse quando si potevano analizzare solo proteine e gruppi sanguigni. Le tecniche di analisi del DNA sono tuttora in corso di rapido sviluppo; in futuro, senza dubbio, si presterà sempre maggiore attenzione alla variabilità individuale al livello del DNA. Nel frattempo si va accumulando un'enorme quanùtà di informazioni sulla variabilità individuale studiata con tecniche immunologiche (come per i gruppi sanguigni) o con l'elettroforesi di proteine. Sapendo che esistono diversi ùpi geneùci di una specifica proteina, o di un altro carattere ereditario, è possibile contare gli individui portatori di un ùpo o dell'altro e così stabilire la proporzione di quella variante nella popolazione in esame. Queste proporzioni variano da una popolazione all'altra, in quanto in ciascuna popolazione mutano nel tempo in modo piuttosto imprevedibile. Il cambiamento delle proporzioni di queste varianù nel tempo è il processo evolutivo stesso, che avanza lentamente ma incessantemente, generazione dopo generazione. L'analisi di popolazioni che vivono oggi in luoghi diversi ci dà una visione sincronica di questo processo conùnuo, che è inevitabilmente diverso nelle varie parti della terra abitata. Comprendere questo meccanismo evoluùvo è il nostro interesse principale. Esso ci impone, come primo compito, quello di descrivere la variabilità esistente, uùlizzando diverse tecniche che permettano di valutare i modelli evoluùvi più importanù. Ci siamo Jimitaù a considerare le popolazioni aborigene, che definiamo come quelle già vivenù nell'area geografica studiata nel 1492 d.C. Dopo questa data, le scoperte geografiche stimolarono l'espansione e le migrazioni delle popolazioni economicamente più avanzate in tutto il pianeta. Già prima avevano avuto luogo alcuni movimenù, ma su scala assai più modesta. In genere, le popolazioni che migrarono dopo il 1492 si mescolarono solo parzialmente con quelle locali, ed è facile nconoscerle sulla base del loro aspetto fisico e di conoscenze storiche. Queste, e alcune altre popolazioni che sono molto isolate oppure hanno avuto

Introduzione a concetti, dati e metodi

5

una storia complessa (come Samaritani, Ebrei, Zingari e parecchie altre). richiedono studi speciali; in questo libro non vengono prese in considerazione. I Samaritani, come pure molte popolazioni ebraiche, sono stati oggetto di analisi da parte di Batsheva Bonné-Tamir (1980; Bonné-Tamir e coli., 1992). Agli Ebrei sono stati dedicati molti libri e articoli generali (per esempio Mourant, 1978; Cannelli e Cavalli-Sforza, 1979; Karlin e coli., 1979; Morton e coli., 1982; Livshits e coli., 1991). Un modo efficace per studiare le popolazioni viventi è analizzarne la distribuzione geografica dei dati. A questo scopo, consideriamo in primo luogo ciascun gene (un segmento di DNA dotato di una funzione specifica) singolarmente, e per ciascun gene analizziamo separatamente le diverse forme che si possono riconoscere: gli alleli di quel gene. L'informazione grezza sulla quale si basa questo modo di analizzar~ i dati genetici è la proporzione di un dato allele in diverse popolazioni. E ben documentato che essa varia da luogo a luogo in modo considerevole; tuttavia la variazione maggiore si osserva a grandi distanze, mentre di solito è piccola la differenza tra popolazioni geograficamente contigue. Quando sia stato analizzato un numero sufficiente di popolazioni, si possono preparare mappe geografiche che rappresentino, per un particolare allele, queste proporzioni (chiamate anche frequenze all.eliche, o semplicemente frequenze geniche). La procedura normalmente utilizzata consiste nel tracciare curve isogeniche, owero linee che uniscono i punti con frequenze geniche uguali. Le mappe geografiche di un solo allele sono utili per comprendere processi che riguardano in modo specifico quell'allele: ad esempio la sua storia evolutiva, o gli effetti diJattori evolutivi quali la mutazione e la selezione naturale. La distribuzione geografica di un particolare allele può fornire informazioni sul luogo di origine del cambiamento genetico ( mutazione) che lo ha generato. Le correlazioni a livello geografico tra distribuzioni di frequenze geniche e parametri ambientali sono state particolarmente utili nella scoperta di specifici adattamenti genetici. Il primo esempio di questo tipo è stato il gene responsabile dell'anemia falciforme, in quanto la sua distribuzione geografica ha mostrato una correlazione con quella della malaria (Haldane, 1949). In seguito, prove più dirette hanno confermato l'ipotesi che questo gene potesse conferire una resistenza alla malaria. Per molto tempo gli antropologi si sono sforzati di ricostruire la storia e le relazioni evolutive sulla base di un singolo carattere o gene. Uno dei preferiti, per più di cento anni, fu l'indice cefalico (il rapporto percentuale tra larghezza e lunghezza del cranio), introdotto poco prima della metà dell'Ottocento. Tuttavia, considerando un singolo carattere, due popolazioni di origini diverse potrebbero facilmente risultare più o meno identiche. Caratteri antropometrici di questo tipo presentano anche un altro inconveniente molto serio: non vi è alcuna garanzia che il carattere sia sotto completo controllo genetico, e le variazioni osservate potrebbero essere interpretate come «risposte» a breve termine a cambiamenti ambientali. Ciò è stato dimostrato da Boas (1940) già agli inizi del secolo, ma questa lezione è stata- ed è ancora- molto spesso dimenticata. Il vantaggio principale offerto da tali caratteri, e cioè la disponibilità di dati de-

6

Stmia e geografia dei geni umani

sunti da ossa fossili, è stato quindi ridimensionato dalla natura non chiara delle differenze osservate. Dopo la scoperta del primo sistema di gruppi sanguigni (ABO), le frequenze degli alleli A, B, e O divennero presto le più usate per classificare le popolazioni. Le informazioni così ottenute sono comunque inadeguate, anche se sono in buona misura esenti dalle limitazioni dovute a eventuali cambiamenti a breve termine provocati direttamente da effetti ambientali. Ciascuna frequenza genica varia nel tempo in modi che si possono ritenere, almeno in apparenza, pressoché casuali. Non meraviglia, quindi, che popolazioni con storie evolutive palesemente diverse possano mostrare frequenze geniche simili. Si può aggirare l'ostacolo cumulando le informazioni relative a più geni. Quando aumenta il numero di geni considerati simultaneamente, diventa sempre più bassa la probabilità che ambiguità di questo genne rimangano irrisolte. Nel 1963 è stato mostrato che è possibile tentare di ricostruire con successo l'evoluzione umana anche con solo venti alleli relativi a cinque polimorfismi genetici (CavalliSforza e Edwards, 1964). L'esperienza successiva ha dimostrato che sarebbe preferibile, o addirittura necessario, un numero maggiore di alleli. Per riassumere le informazioni relative a molti geni in indici statistici appropriati sono disponibili diversi metodi, di solito chiamati multiua~iati per distinguerli da quelli ( uniuariati) che impiegano caratteri o geni singoli. L'analisi multivariata è utile, in particolare, per capire le forze evolutive che tendono ad agire su tutti i geni in modo parallelo: la migrazione e la deriva genetica casuale (la fluttuazione casuale delle frequenze geniche nel tempo, che verrà descritta meglio più avanti). Questi e altri metodi vengono applicati ai dati esistenti in letteratura con lo scopo di ottenere informazioni di interesse genetico ed evoluzionistico. Considerando le fissioni, le migrazioni più importanti e il ruolo della mutazione, della deriva genetica e della selezione naturale, ricostruire l'evoluzione umana è impresa spesso difficile e incerta. Non si può sperare di applicare alla nostra specie un approccio sperimentale, che permetta di riprodurre e condizionare in modi noti il processo evolutivo. Questo fatto, assieme all'attuale quasi assoluta mancanza di dati fossili sulla variabilità genetica di popolazioni vissute in tempi passati, determina la necessità di prove esterne che possano confermare le conclusioni dell'analisi genetica. Fortunatamente, le informazioni tratte da altre fonti possono darci alcuni chiarimenti: infatti la validità delle nostre conclusioni viene di molto rafforzata se queste sono confermate nell'ambito di un'impostazione interdisciplinare. I risultati ottenuti dai dati genetici andranno paragonati con le conoscenze provenienti da altri campi: in particolare la paleoanu·opologia, la preistoria, la storia, il contesto geografico ed ecologico e le testimonianze culturali che derivano indirettamente da studi linguistici. Abbiamo considerato i riscontri ottenibili da discipline diverse che hanno per oggetto l'evoluzione dell'uomo come parte essenziale della nostra analisi, e abbiamo strutturato il libro in modo da soddisfare questa esigenza metodologica. La parte successiva del·capitolo è dedicata a introdurre concetti specifici, dati, modelli e metodi.

1.2

DEFINIZIONI GENETICHE

In questo paragrafo si daranno alcune definizioni elementari per i lettori privi di conoscenze generali di genetica. L'informazione genetica è contenuta, in ciascuna cellula di un organismo, nei cromosomi: nella specie umana ne esistono 23 coppie per cellula. Ogni coppia è composta da un cromosoma di origine paterna e uno di origine materna, che sono indistinguibili dal punto di vista morfologico, ma che presentano sottili differenze rilevabili a livello chimico. Il principale costituente dei cromosomi, depositario dell'informazione genetica, è l'acido desossiribonucleico (DNA), una lunga catena che consiste di una sequenza lineare di molecole relativamente piccole chiamate nucleotidi, o semplicemente basi. Vi sono quattro nucleotidi diversi: adenina, citosina, guanina, timina (indicati dai simboli A, C, G, T). Un segmento di DNA è costituito da una sequenza di nucleotidi apparentemente casuale, per esempio TAACATGCCAT... L'ordine dei nucleotidi è in realtà responsabile del funzionamento specifico del DNA e viene copiato quasi senza errori al momento della riproduzione di cellule e individui. Così la progenie possiede un DNA che ha una sequenza essenzialmente identica a quella del genitore, e questo è il meccanismo che assicura il mantenimento delle proprietà biologiche degli organismi viventi da una generazione all'altra. La catena del DNA molto probabilmente è continua lungo tutto un cromosoma ed è estremamente lunga, dato che il numero medio di nucleotidi per cromosoma supera i cento milioni. Nonostante tale continuità, nel DNA si possono riconoscere segmenti più corti (i geni) che hanno funzioni specifiche. I geni più facili da riconoscere sono quelli che determinano la struttura e la forma (e quindi anche la funzione) delle proteine, molecole biologiche complesse che compiono uno spettro assai ampio di attività specifiche. Un cromosoma può contenere, in media, molte migliaia di geni, ciascuno costituito da migliaia di nucleotidi. Al momento della divisione cellulare, il DNA viene replicato in modo che ciascuna delle due cellule figlie, generate dalla divisione di una cellula, contenga un DNA praticamente identico a quello della cellula madre, con pochissimi errori di replicazione. Tali errori vengono trasmessi alla progenie, in quanto il nuovo DNA è lo stampo dal quale saranno prodotte tutte le copie future. Gli errori che awengono nella replicazione del DNA sono chiamati mutazioni: possono consistere nella sostituzione di un nucleotide da parte di un altro, o nella inserzione o delezione di nucleotidi. Le mutazioni possono avere conseguenze modeste o rilevanti per l'intero organismo, a seconda dell'alterazione awenuta nella funzione dello specifico gene che ha subito la mutazione. Le mutazioni che awengono nelle cellule in divisione di un organismo multicellulare (come l'uomo) possono determinare alterazioni di parte dell'organismo, ma non sono trasmesse ai discendenti, a meno che non si verifichino nelle cellule germinali (gameti). I gameti sono deputati alla creazione degli individui della generazione successiva, e le mutazioni che in essi avvengono possono essere trasmesse alla progenie e quindi avere conseguenze evolutive. I gameti maschili (spermi) e femminili (uova) conten-

8

Storia e geografia dei geni umani

gono solo 23 cromosomi. La riduzione del numero cromosomico awiene atu·averso un meccanismo molto preciso di assortimento casuale, in modo che ogni gamete riceva solo un elemento di ogni coppia di cromosomi. L'unione di uno spermio e di un uovo genera una nuova cellula (zigote) che ha ancora 46 cromosomi, e cioè 23 coppie, in ciascuna delle quali un elemento è di origine paterna e l'altro di origine materna (fig. 1.2.1). Il risultato di una mutazione è un nuovo gene che differisce di poco da quello precedente: i due tipi sono chiamati alleli di quel gene. Nella prima generazione dopo la mutazione c'è un solo individuo portatore del nuovo allele «mutante>> in una data popolazione. Se il primo individuo che porta la mutazione raggiunge l'età adulta e ha molti figli, è maggiore la probabilità che il nuovo allele originato dalla mutazione si ritrovi nelle generazioni seguenti; tuttavia molte nuove mu~azioni vanno perdute nelle generazioni immediatamente successive. E anche possibile che, per l'influenza di forze evolutive che saranno descritte più avanti, un nuovo allele diventi, in media, sempre più frequente nelle generazioni successive; dopo molte generazioni, potrebbero non rimanere copie del vecchio allele in nessuno degli individui che formano la popolazione in esame. Questa sostituzione di un allele da parte di uno nuovo (la «fis-

MASCHI (2N)

FEMMINE (2N)

Q]

Q]

~

~

CD

Spermio (N)

Uovo (N)

ZIGOTE (2N)

Fig. 1.2.1 Il meccanismo di riduzione dei cromosomi mediante il quale si formano i gameti. Dai gameti si sviluppa una cellula uovo fecondata (zigote). Per semplicità è rappresentata solo una coppia di cromosomi. Nell'uomo il numero di cromosomi per cellula (N) è 23.

Introduzione a concetti, dati e metodi

9

sazione» di un nuovo mutante) costituisce il processo elementare dell'evoluzione. Esso può richiedere, in media, un gran numero di generazioni: decine o centinaia di migliaia. Anche se le mutazioni sono rare, in ogni gamete- considerando tutti i diversi geni che contiene- ci saranno almeno alcune decine di mutazioni differenti. Il numero totale di nucleotidi in un gamete è molto alto (dell'ordine di 3 miliardi), e il tasso di mutazione per generazione può essere dell'ordine di l su 200 milioni di nucleotidi. La maggior parte delle mutazioni awiene in geni diversi, ma, nel tempo, lo stesso gene può essere di nuovo interessato da un'altra mutazione. In questo modo possono originarsi e coesistere, in una popolazione, molti alleli dello stesso gene. Quando in una popolazione si riscontra la presenza di due o più alleli di un gene, questo viene detto polimorjico. I geni polimorfici, o polimorfismi, costituiscono i marcatori usati in tutti i tipi di studi genetici, inclusi quelli riguardanti l'evoluzione: i tipi di polimorfismi normalmente analizzati sono esposti nel paragrafo seguente. Dato che, per ogni tipo di gene, le cellule di ciascun individuo possiedono un gene (lo stesso per tutte le cellule) di origine paterna e uno di origine materna, alcuni individui possono aver ricevuto dai genitori alleli differenti di un gene polimorfico. Questi individui sono chiamati eterozigot~ mentre individui che hanno ricevuto gli stessi alleli da entrambi i genitori sono chiamati omozigoti. La percentuale di individui che sono eterozigoti per un determinato gene si definisce come l' eterozigosità di quel gene, ed è la misura più semplice del grado di polimorfismo di un gene: se il gene non è polimorfico essa è uguale a zero, perché non esistono eterozigoti. Assumendo che vi siano solo due alleli- M e m -di un gene, un individuo può essere MM, mm (omozigote), o Mm (eterozigote): questi sono i tre possibili genotipi. Se è possibile distinguerli mediante osservazione diretta o analisi di laboratorio, diventa facile determinare la frequenza genica di M o m; a tale scopo è sufficiente contare gli alleli. Se ci sono, per esempio, 5 individui M M, 6 individui M m, 3 individui m m su un totale di 14 individui, ci saranno allora 2 x 5 = 10 geni M negli omozigoti MM e 6 negli eterozigoti, per un totale di lO+ 6 = 16 geni M. Ci sono anche 6 geni m negli eterozigoti e 2 x 3 = 6 geni m negli omozigoti m m, per un totale di 6 + 6 = 12 geni m. In complesso ci sono 16 + 12 = 28 geni, owero il doppio del numero degli individui contati. La frequenza genica di M è 16/28 = 0,57 (57%) e quella di m è 12/28 = 0,43 (43%). La somma delle frequenze di tutti gli alleli di un gene è l (l 00%). Contare i geni in modo diretto può essere impossibile: se gli individui M M sono in distinguibili da quelli M m, ed entrambi sono diversi da m m, non si possono contare separatamente gli individui portatori di due o di un solo gene M. Questo fenomeno è conosciuto come dominanza e i tipi che si possono distinguere sono chiamati fenotipi (che significa « distinguibili dall'aspetto»). Anche se la dominanza rende impossibile contare separatamente gli individui M M e M m, in certe condizioni si possono ancora determinare le frequenze geniche. L'ipotesi principale è che i matrimoni siano casuali per quel particolare gene. Chiamiamo p la frequenza genica di M; se ci sono solo due alleli, quella di m sarà (I- p). In

IO

Stmia e gpogmfia dci geni umani

una popolazione dove i matrimoni sono casuali, ci aspettiamo che gli omozigoti per un dato allele abbiano una frequenza uguale al quadrato della frequenza genica di quell'allele, cioè Pz per MM e (1- p)z per mm. Gli eterozigoti avranno una frequenza pa1i a due volte il prodotto delle frequenze geniche dei due alleli che li compongono, in questo caso 2p (l- p). Così, i tre genotipi MM, Mm, mm dovrebbero avere rispettivamente frequenze uguali a pz, 2p (l- p), (l- p)z. Questa è la legge di Hardy- Weinberg, così chiamata dal nome dei suoi scopri tori: è facile estenderla a più di due alleli. Do\1·emo ricorrervi spesso, ma la sua validità è limitata a popolazioni e geni per i quali i matrimoni siano casuali (come discusso nel par. 1.7). In questo libro non si danno frequenze di genotipi o di fenotipi, ma solo frequenze geniche calcolate direttamente a partire da questi, o mediante conta genica o tramite l'applicazione della legge di Hardy- Weinberg. Per caratteri visibili come l'altezza, il colore dei capelli, della pelle o degli occhi, i matrimoni generalmente non sono casuali e quindi la legge non sarebbe applicabile. In ogni caso la loro determinazione genetica è poco chiara o addirittura complessa (per ulteriori letture su questi argomenti si vedano Cavalli-Sforza e Bodmer, 1971 a; Bodmer e Cavalli-Sforza, 1976 a; Christiansen e Feldman, 1986). Oggi si pensa all'evoluzione soprattutto in termini di frequenze geniche e di cambiamenti di tali frequenze. A differenza dei fenotipi, i geni sono essenzialmente stabili, in quanto le mutazioni sono rare. Le loro frequenze sono stabili nel tempo, se non si considerano i fattori evolutivi (che esamineremo più avanti): mutazione, migrazione, selezione e deriva genetica casuale. Lo studio genetico dell'evoluzione è essenzialmente un'analisi della funzione di questi fattori nei cambiamenti osservati. Lo studio delle frequenze geniche restringe la nostra analisi al comportamento di singoli nucleotidi o di segmenti molto corti di DNA. Estendendo le nostre conoscenze, saremo in condizione di analizzare con sempre maggiore attenzione e frequenza la su·uttura di segmenti sempre più lunghi: più un segmento è lungo, maggiore è il numero di polimorfismi che può ospitare. Aumenterà la quantità di informazione, ma aumenterà anche la sua complessità. Nella loro evoluzione, le sequenze di DNA di una certa lunghezza non si comportano in modo rigido, ma possono scambiarsi segmenti. Di recente è divenuto facile "leggere" la sequenza nucleotidica del DNA, e ciò renderà sempre più accessibile lo studio diretto di lunghi segmenti; ma la maggior parte dei dati attuali consente poco più di un'analisi dei cambiamenti genetici awenuti in uno o pochi nucleotidi.

1.3

TECNICHE PER IDENTIFICARE l MARCATORI POLIMORFlCl

Il termine polimurji.smo si riferisce alla presenza di più alleli di un gene in una popolazione. Di solito si considerano campioni relativamente piccoli,

Introduzione a concelli, dali e metodi

11

come numero di individui, e quindi si tende a definire polimorfico un gene se l'allele più raro non è troppo raro- per esempio non meno dell'l%- in modo che ci sia uqa buona probabilità di osservare un polimorfismo in un campione di 100 o più individui (l'ordine di grandezza della maggior parte dei campioni). Qua.Si tutti i geni, se esaminati al massimo livello di risoluzione, owero al livello del DNA, sono molto polimorfici; ma questa affermazione è basata per il momento su pochi dati. È noto che alcune regioni del DNA sono molto più polimorfiche di altre: è perciò più difficile stimare la variazione media individuale al livello del DNA. In due cromosomi presi a caso da una popolazione, e quindi anche nei due membri di una coppia di cromosomi di un individuo qualunque, circa un nucleotide su 500 è, in media, diverso. Siccome i geni sono di solito composti da molte migliaia di nucleotidi, ogni gene probabilmente è polimorfico se analizzato in modo completo. Sappiamo, tuttavia, che nel corso dell'evoluzione alcuni segmenti di DNA (in particolare quelli che codificano le proteine) si sono conservati molto più di alu·i, e perciò possiamo prevedere che presentino una variazione individuale molto inferiore. I geni sono polimomci perché si trovano in uno stadio intermedio del processo che va dalla comparsa di una mutazione al suo probabile destino finale: la fissazione o l'estinzione. Questa ·transizione è molto lunga, e il più delle volte non si può identificare quale sia l'allele vecchio e quale l'allele nuovo, il «mutante" per definizione. Nella specie umana possiamo ottenere qualche informazione a questo riguardo osservando la presenza di uno o dell'alu·o allele nelle specie più vicine, scimpanzé o gorilla. In ogni caso, che si conosca o no la loro storia, i polimorfismi fungono da indicatori della variazione di specifici segmenti cromosomici: sono, cioè, marcalori genetici e quindi costituiscono la chiave per comprendere e misurare la variazione genetica. I marcatori che analizziamo sono classificati per comodità in base alla tecnica impiegata per identificarli e ai tessuti ai quali si riferiscono. Possiamo trovare polimorfismi in quasi tutti i tipi cellulari o liquidi biologici, ma il sangue è di gran lunga il preferito, perché si ottiene molto facilmente e perché si presta a numerose possibilità di analisi. La tabella 1.3.1 mostra l'elenco dei marcatori che abbiamo analizzato in un'area geografica sufficientemente ampia per i nostri scopi. Le categorie più importanti di marcatori genetici sono le seguenti. Gruppi sanguigni I gruppi sanguigni si identificano nei globuli rossi del sangue con tecniche immunologiche. Le sostanze presenti sulla superficie dei globuli rossi agiscono come antigeni: esse, cioè, inducono la produzione di anticorpi, se iniettate in altri individui della stessa specie o di una specie diversa. Gli anticorpi sono proteine (le immunoglobuline) che ogni individuo è potenzialmente in grado di produrre, ma che sono sintetizzate in grandi quantità solo quando l'organismo è stimolato con l'antigene corrispondente; essi reagiscono con gli antigeni in modo spe-

Tab. 1.3.1 Marcatori genetici analizzati in questo libro. La selezione è awenuta in base alla disponibilità delle frequenze geniche per molte popolazioni. Nome del focus

Simbolo

Gruppo sanguigno ABO Fosfatasi acida 1 Adenosin deaminasi Adenilato chinasi 1 Fosfatasi alcalina placentale a-1-antitripsina

Alleli analizzati

ABO ACP1 ADA AK1

Posizione sul cromosoma 9q34, 1+34,2 2p25 20q13,11 9q34, 1+34,2

ALPP P/

2q37 14q32,1

81, F1 M,F

A, B, O, Al, A2 A,B,C 1 1,2

~-lipoproteina,

sistema Ag

x

AG

~-lipoproteina,

sistema Lp Ceruloplasmina Colinesterasi 1 Colinesterasi 2 Componente 3 del complemento Gruppo sanguigno Diego Gruppo sanguigno Duffy Esterasi D 6-glucoso-fosfato deidrogenasi Glutammico-piruvico transaminasi ~-glicoproteina ricca in glicina, fattore B Gliossilasi 1 Componente gruppospecifica Aptoglobina Emoglobina a Emoglobina ~ Emoglobina 1:\ Emoglobina y HLA-A, sistema di istocompatibilità

HLA-8, sistema di istocompatibilità

LPA CP CHE1 CHE2

6q26+27 3q23+25 3q26+qter 2q

+

C3

19p13,3+ 13,2

S,F

DI

FY

Lp(a+) A

u

A

ESD

1q21+25 13q14,1+14,2

A, B. O 1

G6PD

Xq2B

A-, B-. def

GPT

Bq24,2.;.qter

1

BF GL01

6p21,3 6p21,3+21,1

S, F, F1, 80.7 1

GC HP HBA HBB HBD HBG

4q12+13 16q22,1 16p13,3 11p15,5 11p15,5 11p15,5

1, 1F, 18, 2 1, 1F, 18, 2

HLAA

6p21,3

1, 2, 3, 9, 10, 11, 28, 29, 30, 31, 32, 33

HLAB

6p21 ,3

5, 7, 8, 12, 13, 14, 15, 16, 17, 18, 21, 22, 27, 35, 37, 40, 41

Immunoglobuline• GM1; GM3

IGHG1G3

14q32,33

za;g zax;g f;bOb 1b3b4b5 za;bOb 1b3b4b5 za;b0b1c3c5 za;bOb 1c3b4b5 za;b0stb3b5 fa;bOb 1b3b4b5 zx;g za;b0sb3b5

IGKC, KM KEL JK LDH LE

2p12

1&1,2 K, k, Kpa, Jsa A, B, O varianti A e B Le, le, Le(a+)

LU MDH1 MNS

19q12+13 2p23 4q28+31

p Peptidasi A Peptidasi B Peptidasi C Sensibilità alla feniltiocarbammide Fosfoglucomutasi 1 Fosfoglucomutasi 2 Foslogluconico deidrogenasi Fosfoglicerato chinasi 1 Gruppo sanguigno Rhesus

P1 PEPA PEPB PEPC

22q11 ,2.;-qter 18q23 12q21 1q42 o 1q25

PTC PGM1 PGM2

1p22, 1 4p14+q12

PGD PGK1

1p36,2+36, 13 Xq13

A, C 1,2

RH

1p36,2+34

Secretore Superossido dismutasi 1 Transferrina

FUT2(SE) SOD1 TF

19q 21 q22, 1 3q21

D, C, E, fJ', O", CDE, CDe, CdE, Cde, cDE, cDe, cdE, cde, V Se 1 C, D

Immunoglobulina KM (lnv) Gruppo sanguigno Kell Gruppo sanguigno Kidd Lattaio deidrogenasi Gruppo sanguigno Lewis Gruppo sanguigno Lutheran Malato deidrogenasi Gruppo sanguigno MNS

1Bq11+12 19

A M, N, S, s, SU, MS, Ms, NS, Ns, He 1 1 1 1 T 1

• t marcatori GM vengono descritti anche con un simbolo numerico. La corrispondenza Ira tale codifica e quella alfanumerica da noi utilizzata è descritta in Steinberg e Cook (1981 ).

Storia e geografia dei geni nmani

14

Gruppo sanguigno

Anti-A

Anli-B

o

A

B

AB

Fig. 1.3.1 Reazioni dei globuli rossi di individui di gruppo O, A, B c AB in presenza di anticorpi an ti-A e anti-B.

cifico anche in provette da laboratorio e la reazione può essere facilmente resa visibile. Il primo sistema di "gruppi sanguigni, scoperto fu chiamato ABO: A e B sono gli antigeni presenti sulla superficie dei globuli rossi che vengono riconosciuti rispettivamente dagli anticorpi anli-A e anti-B. Un individuo può avere l'antigene A o l'antigene B, entrambi, o nessuno dei due; si definiscono così quattro gruppi di individui, che possono essere caratterizzati in modo preciso (fig. 1.3.1). Gli individui con lo stesso gruppo sanguigno ABO presentano la stessa reazione se analizzati con gli stessi reagenti e, se sottoposti a trasfusione, possono scambiarsi i globuli rossi senza conseguenze nocive. La scoperta del sistema ABO e della sua trasmissione ereditaria precede la prima guerra mondiale; dopo I'ABO furono scoperti molti altri sistemi di gruppi sanguigni, ma solo pochi di essi (specialmente l'RH: Landsteiner e Wiener, 1940; Levine e Stetson, 1939) sono importanti nella pratica clinica. II sistema RH (in precedenza chiamato Rh) ha un grande numero di alleli e probabilmente si tratta di una famiglia di geni adiacenti. Oltre ai gruppi sanguigni ABO e RH, solo il gruppo MN e pochi altri sono stati molto studiati. Elettrofuresi di proteine Le proteine; il prodotto principale dei geni, si muovono in un campo elettrico con una mobilità che dipende dalla loro carica elettrica di superficie, a sua volta dipendente dalla loro struttura chimica. Si studiano principalmente i polimorfismi delle proteine presenti

Introduzione a concetti, dati e metodi Quadro Fenotipo

Genotipo

Tipi di emoglobina presenti

elenroloretico emogloblnlco origine

Normale

AA

Tratto talassemieo

A5

(portatore

eterozigote) Anemia

falciforme

55

15

~

l Il l

+ A

5eA

5

Fig. 1.3.2 Elettroforesi di una proteina (emoglobina): le due varianti alleliche sono identificabili come bande che nel campo elettrico migrano a velocità diverse. Gli omozigoti (AA e SS) presentano una sola banda, l'eterozigote (AS) le presenta enLrambe.

nella parte liquida del sangue (siero o plasma) o nei globuli rossi. La prima scoperta del polimorfismo di una proteina del sangue fu quella relativa all'emoglobina (Pauling e coli., 1949), che mostrò la natura molecolare della mutazione responsabile dell'anemia falciforme; subito dopo si scoprì che molte proteine del siero (per esempio l'aptoglobina) sono polimorfiche. Le proteine che agiscono come catalizzatori specifici di particolari reazioni biochimiche (enzimi) sono presenti nel sangue a basse concentrazioni: quando si scoprì come evidenziarli attraverso reazioni colorimeuiche molto sensibili e specifiche, gli enzimi fornirono la prima prova statistica che i polimorfismi sono molto più comuni di quanto si pensasse. Ciò è stato scoperto contemporaneamente nell'uomo e nella Drosophila, nell966 (Harris, 1966; Lewon ti n e Hubby, 1966). La figura 1.3.2 mostra un esempio di due varianti alleliche individuate con l'elettroforesi. Antigeni umani linfocitari Gli antigeni umani linfocitari, HLA (conosciuti nei vertebrati come sistema MHC, complesso maggiore di istocompatibilità), hanno aperto nuove possibilità di studio dei polimorfismi genetici. Essi sono proteine situate sulla superficie dei globuli bianchi, che partecipano alla produzione di anticorpi e hanno un'importanza pratica nei trapianti d'organo. Lo studio di questa superfamiglia di geni, iniziato nei primi anni Sessanta, ha dimostrato che il suo livello di polimorfismo è quasi pari a quello di tutti gli altri marcatori non DNA noti, presi assieme: si tratta del sistema genetico più informativo oggi conosciuto. Immunoglobuline Le immunoglobuline sono i normali "anticorpi». Le varianti delle immunoglobuline (CM, KM, AM, ecc., chiamate in precedenza Cm, Km, Am, ecc.) presenti nel plasma o nel siero si analizzano mediante tecniche immunologiche particolari e forniscono una ricca fonte di variabilità genetica. Con tecniche immunologiche simili si caratterizzano altre varianti proteiche.

16

Sto1ia e geografia dei geni umani

Alt1i polimmjìsmi Vi sono alcuni altri polimorfismi il cui fenotipo è identificabile mediante tecniche specifiche, come I'immunodiiTusione, spesso uùlizzata per le lipoproteine, l'immunoelettroforesi, l'autoradiografia, ecc. Per uno di questi polimorfismi, che è stato molto studiato e viene analizzato facendo assaggiare una sostanza chiamata feniltiocarbammide (PTC), si è a lungo sospettato che avesse una trasmissione ereditaria in·egolare. Di recente questo polimorfismo è stato nuovamente analizzato: Reddy e Rao (1989) hanno posto in evidenza che la penetranza dell'eterozigote è incompleta e che potrebbe esservi coinvolto più di un gene. Perciò le frequenze geniche di questo marcatore così comunemente studiato potrebbero essere in parte inesatte, ma sarebbe stato troppo complicato escluderlo dall'analisi: pensiamo tuttavia che l'approssimazione che ne deriva sia trascurabile. Tutti i marcatori finora descritti rivelano variazioni al livello delle proteine o dei prodotti proteici; essi sono stati scoperti da diverso tempo e sono gli unici per i quali possediamo informazioni abbondanti. In genere, più tempo passa dalla scoperta di un marcatore, più sono disponibili dati a livello geografico (fig. 1.3.3), tranne che per alcuni geni la cui caratterizzazione presenta difficoltà pratiche.

10000

1000

100

10

~

Gruppi sanguigni

f::: ~

Plasmaproteine

[ili] Enzimi

D

Altri marcatorì

Fig. 1.3.3 Anno della scoperta dei principali marcatori genetici (in ascissa) e numero di osservazioni presenti nella nostra banca dati.

Introduzione a concetti, dati e metodi

17

l polimorfismi del DNA Si può prevedere che in futuro ci sarà un netto aumento delle conoscenze relative alla variabilità genetica grazie ai polimorfismi evidenziabili tramite l'analisi diretta del DNA. In questo momento (1994), per molte popolazioni del mondo i dati sui marcatori del DNA sono assai pochi (essi sono riassunti brevemente nel cap. 2, par. 2.4). Un metodo usato per lo studio del DNA allivello delle popolazioni è l'analisi di restrizione: enzimi specifici, chiamati enzimi di restrizione, tagliano il DNA in siti specifici (siti di restrizione), definiti da sequenze di piccole dimensioni - quattro, sei o, meno comunemente, più di sei nucleotidi. Una mutazione in queste sequenze renderà impossibile il taglio mentre mutazioni che avvengono altrove possono generare nuovi siti di restrizione. I frammenti che derivano dal taglio del DNA di un individuo vengono quindi sottoposti a elettroforesi e separati in base alle loro dimensioni; quelli che appartengono alla regione di interesse vengono evidenziati grazie alloro legame specifico con «sonde" di DNA. Una sonda è un segmen-

3

4

7

8

9

Kb

--e• I l ·-·

-4,8

· ••••

-3,3 -2,2

-1,5

1 2 3 4 5 6 7 B 9

Fig. 1.3.4 Polimorfismi del DNA relativi al gene CDB, identificati mediante l'analisi della lunghezza dei frammenti di restrizione ottenuti con l'enzima Ora!. Gli alleli di 3,3 e 2,2 kb (chilobasi) si comportano come caratteri mendeliani codominanti. Il DNA è stato digerito con l'enzima di restrizione Dral; i frammenti sono stati separati mediante elettroforesi su gel di agarosio, trasferiti su un supporto di nylon con il metodo di Southern (1975) e ibridati con una sonda di cONA marcata radioattivamente, che riconosce il gene CDB.

18

Stm"ia r geografia dei geni umani

to di DNA umano pmveniente dalla regione cromosomica studiata, che viene moltiplicato in battei; e marcato con nucleotidi radioattivi o altre sostanze che ne permettano l'identificazione. Un polimorfismo si manifesta perciò come la variazione in lunghezza dei frammenti riconosciuti dalla sonda in individui diversi (fig. 1.3.4) e viene chiamato RFLP (dall'inglese Reslliclion Fmgmenl Length Polymmphism, "polimorlìsmo di lunghezza dei frammenti di resu·izione,). Con questa tecnica si possono evidenziare centinaia di migliaia o forse milioni di polimorfismi: al momento sono disponibili più di 2000 sonde in grado di identificare questo tipo di polimorfismo. Il metodo di analisi definitivo è lo studio della sequenza del DNA, ma le sequenze esistenti sono quasi sempre limitate a uno o pochi individui. Alcune tecniche particolarmente potenti, in particolare la PCR (Polymerase Clwin Reaclion,