LIETUVIŲ GENOMAI: PRAEITYJE IR DABAR LMA n.e., prof. habil. dr. Vaidutis Kučinskas Vilniaus universiteto Medicinos fakulteto Žmogaus ir Medicininės Genetikos Katedra; VUL SK Medicininės genetikos centras 2010 m. spalio 20 d.
ŽMOGAUS GENOMO TYRIMŲ ISTORIJA 2
1865 Gregor Mendel nustatė, kad paveldimumas perduodamas diskrečiais vienetais. Suformuluoti paveldimumo principai.
Ryšys tarp šiuolaikinės genetikos ir Gregoro Mendelio atliktų bandymų Gregoro Mendelio Naudotos Alternatyvių Požymių Poros Aleliai Šiuolaikinėje Terminologijoje Vieta Chromosomoje Sėklos spalva: geltona – žalia I – i 1 Sėklos luobelė ir žiedai: spalvoti - balti A – a Prinokusios ankštys: lygios pailgos – raukšlėtos dantytos V – v 4 Žydėjimas: iš lapų ašies –augalo viršūnėje (skėtinis) Fa – fa Augalo aukštis: 0,5 – 1,0 m Le – le Neprinokusios ankštys: žalios - geltonos Gp – gp 5 Prinokusios sėklos: lygios - raukšlėtos R – r 7
Iš ląstelių išskirta DNR 1865 Paveldimumo vienetai 1865 Paveldimumo vienetai 1869 Frederick Miescher Iš ląstelių išskirta DNR
Genas Genotipas Fenotipas 1909 1865 Paveldimumo vienetai 1869 Išskirta DNR 1902 Chromosominė paveld. teorija 1909 Genas Genotipas Fenotipas Danų biologas Wilhelm Johannsen pasiūlo pagrindinius genetikos terminus: – geną, kaip paveldimumo vienetą, – genotipą kaip organizmo genetinę konstituciją, – fenotipą kaip organizmo paveldėtų charakteristikų visumą.
1865 Paveldimumo vienetai 1869 Išskirta DNR 1902 Chromosominė paveld. teorija 1911 1909 Geno sąvoka Thomas Hunt Morgan su bendrad., tirdami drozofilą, nustatė, kad genai yra chromosomose ir atrado genetinę sankibą.
1865 Paveldimumo vienetai 1869 Išskirta DNR 1902 Chromosominė paveld. teorija 1944 1909 Geno sąvoka 1911 Genai yra chromosomose 1920 Genomo sąvoka Oswald Avery, Colin MacLeod, Maclyn McCarty nustatė, kad paveldimumo medžiaga yra DNR, o ne baltymai.
James Watson, Francis Crick nustatė DNR molekulės struktūrą 1865 Paveldimumo vienetai 1869 Išskirta DNR 1902 Chromosominė paveld. teorija 1909 Geno sąvoka 1911 Genai yra chromosomose 1953 1920 Genomo sąvoka 1944 DNR – paveldimumo medžiaga James Watson, Francis Crick nustatė DNR molekulės struktūrą
1865 Paveldimumo vienetai 1956 1869 Išskirta DNR Žmogaus chromosomos metafazėje, iš originalaus Tjio ir Levan straipsnio, kur rodomos 46 chromosomos. 1902 Chromosominė paveld. teorija 1909 Geno sąvoka 1911 Genai yra chromosomose 1920 Genomo sąvoka 1944 DNR – paveldimumo medžiaga 1953 DNR molekulės struktūra Joe Hin Tjio, A. Levan ir kt. nustatė, kad žmogus turi 46 chromosomas, o ne 48 kaip buvo manyta anksčiau
1865 Paveldimumo vienetai 1869 Išskirta DNR 1959 1902 Chromosominė paveld. teorija 1909 Geno sąvoka 1911 Genai yra chromosomose 1920 Genomo sąvoka 1944 DNR – paveldimumo medžiaga 1953 DNR molekulės struktūra 1956 Žmogaus chromosomos – 46 Jerome Lejeune su bendrad. nustatė pirmąją žmogaus chromosmų anomaliją: Dauno liga yra 21-mos chromosomos trisomija
1865 Paveldimumo vienetai 1869 Išskirta DNR 1966 1902 Chromosominė paveld. teorija 1909 Geno sąvoka 1911 Genai yra chromosomose 1920 Genomo sąvoka 1944 DNR – paveldimumo medžiaga 1953 DNR molekulės struktūra 1956 Žmogaus chromosomos 46 Marshall Nirenberg, Har Khorana, Severo Ochoa su bendradarbiais iššifravo genetinį kodą. 1959 Pirmoji chromosmų anomalija
1970 Hamilton O. Smith Atrasta pirmoji specifinė restrikcijos 1967 Somatinių ląstelių hibridizacija 1865 Paveldimumo vienetai 1869 Išskirta DNR 1902 Chromosominė paveld. teorija 1909 Geno sąvoka 1911 Genai yra chromosomose 1920 Genomo sąvoka 1944 DNR – paveldimumo medžiaga 1953 DNR molekulės struktūra 1956 Žmogaus chromosomos 46 1959 Pirmoji chromosmų anomalija 1966 Iššifruotas genetinis kodas HindII 1970 DNR Hamilton O. Smith HindII Atrasta pirmoji specifinė restrikcijos endonukleazė (Hind II)
1967 Somatinių ląstelių hibridizacija 1865 Paveldimumo vienetai 1869 Išskirta DNR 1902 Chromosominė paveld. teorija 1909 Geno sąvoka 1911 Genai yra chromosomose 1920 Genomo sąvoka 1944 DNR – paveldimumo medžiaga 1953 DNR molekulės struktūra 1956 Žmogaus chromosomos 46 1959 Pirmoji chromosmų anomalija 1966 Iššifruotas genetinis kodas 1970 Pirmoji restrtiktazė 1972 Paul Berg su bendraradarbiais sukuria pirmąsias rekombinantinės DNR molekules
1967 Somatinių ląstelių hibridizacija 1865 Paveldimumo vienetai 1869 Išskirta DNR 1902 Chromosominė paveld. teorija 1909 Geno sąvoka 1911 Genai yra chromosomose 1920 Genomo sąvoka 1944 DNR – paveldimumo medžiaga 1953 DNR molekulės struktūra 1956 Žmogaus chromosomos 46 1959 Pirmoji chromosmų anomalija 1966 Iššifruotas genetinis kodas 1968 Pirmoji restriktazė 1972 Pirmoji rekombinantinė DNR 1973 Klonuotas gyvūno genas 1975 Sekvenuotas MS2 genomas 1977 DNR sekvenavimas 1981 Fred Sanger su bendradarbiais sekvenavo žmogaus mitochondrijų genomą (16 569 np)
Kas yra genomas? Genomas yra gyvybės kodas. Kiekvienas organizmas, įskaitant žmones, turi genomą kuris saugo visą reikiamą biologinę informaciją, reikalingą suformuoti ir palaikyti to organizmo gyvybines funkcijas. Turima biologinė informacija genome yra užkoduota deoksiribonukleorūgšties (DNR) grandinėje ir yra suskirstyta į diskrečius vienetus vadinamus genais. Genai turi visą reikalingą informaciją baltymų, baltymus nekoduojančių RNR (ncRNR), rRNR ir kitų tipų RNR sintezei, kurie yra būtini normaliam organizmo funkcijų palaikymui. Baltymai lemia pagrindines organizmų fizines savybes (ūgį, plaukų arba akių spalvą ir kitas), o taip pat ligas ar netgi charakterio bruožus.
Mokslininkai tiria ne tik žmogaus genomą, bet taip pat ir visų kitų rūšių genomus, nuo mikrobų iki gyvūnų kaip pvz., pelės ar kiaulės. Kuo daugiau sužinome apie kitų rūšių genomus, tuo daugiau mes sužinosime apie mūsų pačių genomą.
Žmogaus Genomo Projekto pradžia 1990 Žmogaus Genomo Projekto pradžia
2002-06-26: paskelbiama, kad baigta “juodraštinė” žmogaus genomo seka 1983 PGR 1973 Klonuotas gyvūno genas 1972 Pirmoji rekombinantinė DNR 1968 Pirmoji restriktazė 1967 Somatinių ląstelių hibridizacija 1975 Sekvenuotas MS2 genomas 1977 DNR sekvenavimas 1981 Sekvenuota žmogaus mtDNR 1983 Kartografuota Hantingtono liga 1986 Automatiz. DNR sekvenatorius 1987 Pirmasis žmogaus genolapis 1865 Paveldimumo vienetai 1869 Išskirta DNR 1902 Chromosominė paveld. teorija 1909 Geno sąvoka 1911 Genai yra chromosomose 1920 Genomo sąvoka 1944 DNR – paveldimumo medžiaga 1953 DNR molekulės struktūra 1956 Žmogaus chromosomos 46 1959 Pirmoji chromosmų anomalija 1966 Iššifruotas genetinis kodas 2002 J. Craig Venter President Clinton Francis Collins 2002-06-26: paskelbiama, kad baigta “juodraštinė” žmogaus genomo seka
Ką sužinojome iš Žmogaus Genomo Projekto? Žmogaus genomą sudaro 3164,7 milijonai nukleotidų porų (A, C, T ir G); Žmogaus genome yra apie 30 000 genų, daugiau nei pusės genų funkcijos yra nežinomos; Žmogaus genome genai sudaro apie 2% viso genomo; Bet kurių dviejų individų genomai daugiau negu 99,9% yra identiški. Genetiniai skirtumai tarp žmonių sudaro tik 0,1%.
BRANDUOLYS MITOCHONDRIJOS LĄSTELĖ ŽMOGAUS GENOMAS
ŽMOGAUS GENOMO ORGANIZACIJA BRANDUOLYS MITOCHONDRIJOS LĄSTELĖ ŽMOGAUS GENOMO ORGANIZACIJA Y chromosoma BRANDUOLIO GENOMAS 3100 Mb >26 000 genų Chromosomos ŽMOGAUS GENOMAS MITOCHONDRIJŲ GENOMAS mtDNR 16,6 kb 37 genai
ŽMOGAUS GENOMO ORGANIZACIJA Mitochondrijų genomas Branduolio genomas itin konservatyvios sekos mažai konservatyvios sekos Baltymus koduojantys genai transpozonų kartotinės sekos RNR genai, reguliacinės sekos heterochromatinas kitos sekos
Mitochondrijų ir branduolio genomų palyginimas Branduolio genomas Mitochondrijų genomas Dydis 3,1 Gb 16,6 kb Skirtingų DNR molekulių skaičius 23 (XX ląstelėse) ar 24 (XY ląstelėse) 1 žiedinė DNR molekulė Bendras DNR molekulių skaičius ląstelėje 46 diploidinėse ląstelėse (įvairuoja priklausomai nuo ploidiškumo) Dažniausiai keletas tūkstančių kopijų (kopijų skaičius varijuoja skirtingų ląstelių tipuose Asocijuoti baltymai Keletas histoninių ir nehistoninių baltymų klasių Dažniausiai neasocijuotas su baltymais Genų skaičius ~ 26 000 37 Genų tankis ~1/120 kb 1/0,45 kb Kartotinė DNR > 50% genomo Labai mažai Transkripcija Monocistroniai transkripcijos vienetai Policistroniniai transkripcijos vienetai Intronai Būdingi daugumai genų Nebūdingi Koduojanti DNR (%) ~ 1,1 % ~ 66 % Rekombinacija Kiekvienoje homologų poroje bent vienas rekombinacijos atvejis mejozės metu Neįrodyta Paveldimumas X ir autosomų sekų mendelinis; Y sekų – tėvinis Išimtinai motininis
Žmogaus genų, egzonų, transkriptų skaičius iš įvairių duomenų bazių 1,4 9,4 211 546 31 957 22 410 2 044 20 366 RefSeq 2,1 7,7 246 775 66 802 32 163 9 155 23 008 UCSC 2,3 10,9 297 252 62 877 27 148 5 732 21 416 Ensembl 2,7 45 428 17 052 CCDS Transkriptų vid. skaičius vienam genui Egzonų vidurkis viename gene Egzonų skaičius Transkriptų skaičius Genų skaičius RNR koduojantys genai Baltymus koduojantys genai Duomenų Bazės (Birželio 2009) Genų dydis ir egzonų skaičius labai kinta. Vidutinis genų dydis genome yra 27 kb. Maži genai gali užimti mažiau nei 1 kb, o dideli genai – daugiau nei 2 400 kb genomo. Vidutinis transkriptų skaičius,tenkantis 1 genui – 2,0 (ENCODE nustatė, kad 1 genui tenka 5.7 transkripto) Neatitikimas tarp skirtingų duomenų bazių atspindi tebevykstančią ir nebaigtą genomo anotaciją.
Baltymus koduojančių genų histograma ( 2009 m. Liepos 5 d Baltymus koduojančių genų histograma ( 2009 m. Liepos 5 d.) skirtingose rūšyse iš Ensembl naršyklės Šie skaičiai gali keistis
CpG salelių skaičius / Mb Genų tankis chromosomoje ir koreliacija su CpG turtingomis genomo dalimis CpG salelių skaičius / Mb Genų skaičius / Mb Chromosomos 22, 17 ir 19 turi daug genų, o chromosomos 13, 18 ir X turi paliginti mažą genų skaičių.
Nustatytų genomo segmentų tarp žmogaus ir pelės genomų reprezentacija Žmogaus chromosomų spalvų kodas atitinka skirtingas pelės chromosomas parodytas apačioje. Pavyzdžiui, žmogaus 20 chromosoma yra homologiška pelės 2 chromosomai; žmogaus 21 chromosoma yra homologiška pelės 16, 17 ir 10 chromosomoms. Centromerinės ir heterochromatininės sritys bei akrocentriniai p-pečiai yra pažymėti juodai.
ŽMOGAUS GENOMO SEKŲ CHARAKTERISTIKA
– egzoninė-introninė daugumos genų struktūra Eukariotams būdinga: – egzoninė-introninė daugumos genų struktūra 5’reguliuojančiosios sritys Promotorius 1-as, 2-as, 3-ias egzonai 1-as, 2-as intronai 3’ NTS 5’ NTS Stiprintuvas Slopintuvas Dvigrandė DNR 5’ geno galas 3’ geno galas
Referentinė žmogaus genomo nukleotidų seka ~3,1 × 109 np …ACCGTAAATGGGCTGATCATGCTTAAACCCTGTGCCCCGGTTTATAGCACTTAAATCCTACTG…
Referentinė žmogaus genomo nukleotidų seka …ACCGTAAATGGGCTGATCATGCTTAAACCCTGTGCCCCGGTTTATAGCACTTAAATCCTACTG… 41% C G A T 53% Pasikartojančios sekos Unikalios sekos 0% 100% 21% 34% 42% 48% LINEs SINEs Į retrovirusus panašūs elementai DNR transpo-zonų „iškase-nos“ Nuoseklūs trumpi pasikartojimai Segmentų padvigu-bėjimai Išsibarstę pasikartojimai 66,5% 92% Hetero-chroma-tinas GENAI Kitos sekos Polipeptidus koduojančios sritys (egzonai) Intronai 90,5% 850 000 1 500 000 45% ~3,1 × 109 np Ypač konservatyvios nekoduojančios sekos
Mitochondrijų genomas OHOL replikacijos pradžia ir sintezės kryptis H ir L grandinių Promotoriai ir transkripcijos kryptis H ir L grandinių rRNR genai baltymus koduojantys genai tRNR genai
mtDNR D kilpa HVI HVII D kilpa Phe PS PL OS 16024 16383 00057 00372 CYB ND6 Pro Val D kilpa Phe HVI HVII PS PL OS 16024 16383 00057 00372 mtDNR D kilpa
Žmogaus Y chromosoma Yp cen Yq 11–25 (CA)n YCAII 7–23 (GAAA)n DYS385 9–17 (GATA)n DYS393 6–16 (ATT)n DYS392 7–14 DYS391 17–28 (GATA)n(GACA)n DYS390 25–35 DYS389II* DYS389I* 37 85 9 11 8 12 10 10–19 DYS19 Kartotinis motyvas Sritis Žinomų alelių skaičius Pasikartojimų skaičius (n) Dažniausiai tiriamos Y chromosomos mikrosatelitinės sritys * Daugumos populiacijų DYS389I ir DYS389II (GATA)n blokas yra monomorfiškas, n = 3
Genų raiškos reguliacija DNR RNR Baltymas Epigenetinis paveldimumas 2 3 4 5 1 1 Genų raiškos kontrolė chromatino ir genomo sandaros lygyje; 2 Genų raiškos kontrolė nurašymo (transkripcijos) lygyje; Genų raiškos kontrolė potranskripcijos pradžioje įskaitant nurašymo ilgėjimą (elongaciją), iRNR stabilumą ir alternatyvų sukirpimą (splaisingą); 3 4 Genų raiškos kontrolė transliacijos lygyje; 5 Genų raiškos kontrolė potransliacijos lygyje.
Genų raiškos reguliacija Metilinimas RNR Raiška Reguliacija Viso Genomo Vieno geno Endogeninė (miRNR) Egzogeninė (siRNR) Citozinas Metilcitozinas 2 The Concept of Epigenetics DNA methylation is involved in the regulation of many cellular processes, including X chromosome inactivation, chromosome stability, chromatin structure, embryonic development and transcription. Aberrant DNA methylation has been associated with many human diseases, including cancer. Patterns of DNA methylation are set during embryogenesis and re‐established during early development by DNA methyltransferase and demethylase enzymes. ‘ ‘CpG islands’ (cytosine‐phospho‐guanine) are 300‐3000 base pair stretches of DNA that are CpG rich. CpG islands are often located in the promoter regions of genes where in the normal cell they are typically unmethylated, thus allowing transcription. In contrast, CpGs found outside promoter regions are commonly methylated, and are believed to be responsible for silencing the transcription of repetitive sequences and parasitic sequence elements, such as viral DNA. Consequently, aberrant methylation can lead to either silencing of critical genes or increased expression of detrimental factors.
Pagrindiniai epigenetinių pokyčių mechanizmai DNR metilinimas metilo grupės, prisijungusios prie tam tikrų bazių, slopina genų veiklą Histonų modifikacija įvairios molekulės gali prisijungti prie histonų uodegų, taip įtakodamos DNR aktyvumą chromosoma histonai histonų uodegos DNR metilinimas Chromatino struktūros pokyčiai dėl histonų modifikacijos Mažosios RNR
LIETUVOS POPULIACIJOS GENŲ FONDO TYRIMAI
EUROPOS GENŲ DAŽNIŲ ŽEMĖLAPIS, APIBENDRINTAS PAGAL PIRMĄJĄ PAGRINDINĘ KOMPONENTĘ 0% 100%
EUROPOS GENŲ DAŽNIŲ ŽEMĖLAPIAI, APIBENDRINTI PAGAL PAGRINDINES KOMPONENTES 0% 100% 1PK 2PK 3PK
LIETUVOS GYVENTOJAI Prieš maždaug 11 tūkst. metų artimuosiuose rytuose prijaukinti gyvūnai bei pradėta auginti javai Prieš 7500 metų ūkininkai pasiekė didžiąją dalį Centrinės Europos Pagal archeologinius duomenis, anatomiškai šiuolaikiniai žmonės pakeitė Neandartaliečius prieš 30-40 tūkst. metų Ledynmečio pabaigoje, 9600 m. prieš Kr., Mezolito palikuonys iš naujo kolonizavo dideles neapledėjusias šiaurinių platumų dalis 6400 metų pr. Kr. medžiotojai-rinkėjai pradėjo plėtoti ūkininkavimą. Šis laikotarpis dar vadinamas “Neolito Revoliucija.” Manoma, kad pirmieji gyventojai dabartinės Lietuvos teritorijoje galėjo kurtis prasidėjus pirmajam vėlyvojo ledynmečio atšilimui, maždaug prieš 13-12 tūkst.metų. Prieš 5-4 tūkst.metų, neolito laikotarpiu, šioje teritorijoje pasirodė indoeuropiečiai. Tai sparčios Lietuvos gyventojų kultūrų raidos laikas, siejamas su keramikos ir gamybinio ūkio atsiradimu. Šiuo laikotarpiu sąveikaujant autochtoninėms ir ateivių kultūroms atsiranda baltai. 42
Populiacijos genų fondą apibūdina įvairių genetinių žymenų alelių dažniai, o alelių dažnių kitimas laike parodo populiacijoje vykstančius mikroevoliucinius procesus. 43
LWb ALELIS (Landsteiner–Wiener kraujo grupių sistema) 2,5 4,0 2,0 6,0 5,7 1,0 0,3 ŠVEDAI (žemynas) SUOMIAI ESTAI LATVIAI LIETUVIAI LENKAI RUSAI ŠVEDAI (Gotlando sala) a) Dažnis Baltijos jūros regione b) Dažnis kitose populiacijose: Šveicarai Belgai Japonai Afrikiečiai – 0,1 – 0,0
TRANSFERINO TF*DCHI ALELIS SUOMIJA ŠVEDIJA 90 Dažnis (10 000 gyventojų) Baltijos jūros regione ESTIJA 70 51 LATVIJA 57 LIETUVA
TRANSFERINO TF*FIN ALELIS SUOMIJA ŠVEDIJA 5 Dažnis (10 000 gyventojų) Baltijos jūros regione ESTIJA 13 19 22 LATVIJA 32 LIETUVA
LWb ALELIS (Landsteiner–Wiener kraujo grupių sistema) Dažnis (%) Lietuvoje Šiaurės Dažnis (%) Lietuvoje 6,6 5,1 2,7 6,0 7,5 5,5 Rytų ŽEMAIČIAI Vakarų Pietų A U K Š T A I Č I A I Vakarų Vidurkis: 5,7% Pietų
R252W G272X A300S A403V R408W Y414C PAH geno mutacijos F55fs IVS2-13T>G A104D R158Q R261Q R261X E280K P281L IVS7+ 1G>A IVS10- 11G>A E390G L48S IVS12+1G>A 0% 10% 20% 70% 80% Dažnis PAH GENO MUTACIJŲ DAŽNIS, BŪDINGAS LIETUVOS, PIETŲ IR VAKARŲ EUROPOS SERGANTIESIEMS FKU Mutacijos yra vienas svarbiausių populiacijų evoliucijų veiksnių. In common with other rare, highly penetrant pathogenic alleles, PAH mutations have been used to infer human population history through the history of specific mutant alleles. The observation of different clinal distributions of the two R408W mutations in Europe as the result of human dispersal raises the possibility of using them to probe the history of the European population. 48
R408W mutacijų, susijusių su kitais PAH haplotipais, dalis PAH GENO R408W MUTACIJOS, SUSIJUSIOS SU RFIP 2 HAPLOTIPU IR VNTR 3 ALELIU, DAŽNIO GRADIENTAS EUROPOJE R408W-2,3 dalis R408W mutacijų, susijusių su kitais PAH haplotipais, dalis The shape of the correlogram is consistent with an allele frequency distribution resulting from human migration 49
CFTRdele2,3(21kb) R553X (1789C>T) N1303K (4041C>G) 3849+10kbC>T W1282X (3978G>A) G542X (1756G>T) 394delTT G551D 1717-1G>A CFTR geno mutacijos Dažnis 1 2 3 4 5 6 (%) F508del 10 20 30 40 50 60 70 80 90 100 (%) CFTR GENO MUTACIJŲ DAŽNIS, BŪDINGAS EUROPOS SERGANTIESIEMS CISTINE FIBROZE 50
Net 32.2% mtDNA (HVI) sekų yra unikalios Lietuvos populiacijoje. MITOCHONDRIJŲ DNR HV1 SRITIES SEKŲ STANDARTINIAI MOLEKULINĖS ĮVAIROVĖS INDEKSAI LIETUVIŲ POPULIACIJOJE Etnolingvistinė grupė Imties dydis (n) Haplotipų skaičius Genų įvairovė ±SD Vidutinis porinių skirtumų skaičius ±SD Nukleotidų įvairovė ±SD Tajima D reikšmė Nelygumo (r) indeksas Aukštaičiai Rytų aukštaičiai 30 23 0,982±0,013 3,79±1,96 0,011±0,006 -2,035 0,030 Pietų aukštaičiai 0,949±0,033 4,12±2,11 0,012±0,007 -2,000 0,016 Vakarų aukštaičiai 24 0,984±0,013 4,98±2,49 0,014±0,008 -1,766 0,011 Aukštaičiai iš viso 90 56 0,972±0,010 4,29±2,14 -2,072 0,010 Žemaičiai Šiaurės žemaičiai 0,979±0,016 4,85±2,43 -1,647 0,012 Pietų žemaičiai 22 0,947±0,033 3,61±1,89 0,010±0,006 -2,289 Vakarų žemaičiai 4,77±2,40 0,013±0,008 -1,621 Žemaičiai iš viso 58 0,970±0,011 4,51±2,24 0,013±0,007 -2,056 0,009 Lietuviai iš viso 180 95 0,971±0,008 4,41±2,19 -2,051 Atlikus išsamią lietuvių mtDNR haplogrupių analizę paaiškėjo, kad iš 95 skirtingų haplotipų, 56 haplotipai teko aukštaičių grupei ir beveik tiek pat – 58 haplotipai – žemaičių grupei. Genetinės įvairovės lygis rodo, kad tiriamosios grupės viena nuo kitos iš esmės nesiskiria Net 32.2% mtDNA (HVI) sekų yra unikalios Lietuvos populiacijoje. Tajima D reikšmės rodo, kad gamtinės atrankos poveikis HV1 sekų įvairovei yra nereikšmingas 51
mtDNR HAPLOGRUPIŲ SANTYKINIAI DAŽNIAI, % (SEKŲ SKAIČIUS) Haplogrupė, subhaplogrupė Haplogrupių santykiniai dažniai, % (sekų skaičius) Rytų aukštaičiai (N=30) Pietų aukštaičiai (N=30) Vakarų aukštaičiai (N=30) Šiaurės žemaičiai (N=30) Pietų žemaičiai (N=30) Vakarų žemaičiai (N=30) Iš viso aukštaičiai (N=90) Iš viso žemaičiai (N=90) Iš viso lietuviai (N=180) H 33,3 (10) 26,7 (8) 40,0 (12) 46,7 (14) 20,0 (6) 33,3 (30) 33,3 (60) H1 0 (0) 10,0 (3) 3,3 (3) 1,7 (3) H3 6,7 (2) 3,3 (1) 4,4 (4) 4,4 (8) H4 3,9 (7) H5 1,1 (1) 1,1 (2) H8 2,2 (2) V 13,3 (4) 5,6 (5) 5,0 (9) HV preV U 2,8 (5) K 2,2 (4) U3 U4 U5a1 U5b 3,3 (6) U5b1 U5 0,6 (1) J J1 J1b1 T 8,9 (8) 7,2 (13) T1 I W X Kitos
AKMENS AMŽIAUS ŽMONIŲ MITOCHONDRIJŲ DNR SEKŲ ĮVAIROVĖ B. Bramanti ir kt. 2009. Šalis Sritis, palaikai Datavimas(*) Datavimas calBC (*) Tyrimai mtDNR seka Haplogrupė Lietuva Spiginas 4 GIN-5571: 7470 ± 60 BP ca. 6350 calBC A, M3, C109, Q, Rf 356c U4 Donkalnis 1 Kultūrinis kontekstas Mesolithic A, D, M4, C79, N, Rf, SNP 192t 270t U5b2 Kretuonas 3 OxA-5926: 5580 ± 65 BP ca. 4450 calBC A, M4, C72, N,Rf, SNP Kretuonas 1 OxA-5935: 5350 ± 130 BP ca. 4200 calBC A, M5, C56, N,Rf, SNP Lenkija Dudka 2 14C-data ca. 3650 calBC A, M3, C80, N,Rf 189c 270t U5b1 Dudka 3 4000-3000 calBC A, M3, C127, Q, Rf 189c 265g 270t Drestwo 2 Ua-13085: 3805 ± 70 BP ca. 2250 calBC D, M4, C102, N,Rf 192t 256t 270t U5a Rusija Chekalino IVa 14C-data Chekalino IVb ca.7800 calBC A, D, M2, C83, Rf 192t 256t 270t 294t Lebyazhinka IV 14C-date shell and cultural context 8000-7000 calBC A, D, M2, C60, Rf 192t 241a/c 256t 270t 399g U5a1 Table 1. Stone Age individuals and their mtDNA results. Notes: A = DNA of the archaeologists available for comparison, D = diagenetical analysis, M = multiple extractions and number of these, C = clones of HVS-I and number of these, N = positive amplification of nuclear DNA; Rf = RFLP analysis; SNP = SNPs from the coding region of mtDNA obtained by means of multiplex amplification. The mtDNA was sequenced from np 15997 to np 16409. mtDNA positions are numbered according to the rCRS (22), minus 16,000. Fourteen individuals did not yield results (table S1), whereas for two individuals the mtDNA sequences were not determined (n.d.), thus not considered in the AMOVA analysis and simulations. (*) Radiocarbon dates with laboratory-numbers refer to direct dates of the skeleton and were calibrated with the program CalPal (23) on the basis of Intcal04. Corrections of reservoir effects were applied where identified 82% visų mtDNR tipų medžiotojų rankiotojų populiacijoje (Rytų ir Centrinėje Europoje) sudarė įvairūs U potipiai, kurie dabartiniais laikas yra ypač reti (2-5 %). 53
Staigus populiacijos augimas prasidėjo prieš 7000 – 1000 metų DEMOGRAFINIAI POPULIACIJŲ PARAMETRAI, APSKAIČIUOTI PAGAL Y CHROMOSOMOS MIKROSATELITINIŲ ŽYMENŲ ĮVAIROVĘ Populiacija, haplogrupė Mediana (95% intervalas) Mutavimo greitis pagal Kayser et. al. (2000) Mutavimo greitis pagal Zhivotovsky et. al. (2004) Populiacijos augimo greitis/kartai (x10-3) Populiacijos augimo pradžia, metai (x103) Apriorinės tikimybės (taikytos skaičiuojant) 6,9 (0,3-36,9) 4,9 (0,1-64,6) Aposteriorinės tikimybės: Lietuviai, HgN3 22,7 (0,8-79,2) 0,9 (0,2-3,3) 16,3 (4,8-43,4) 7,6 (2,9-24,4) Estai, HgN3 10,4 (0,3-54,0) 0,9 (0,1-4,0) 18,5 (4,7-53,3) 8,0 (2,8-27,1) Lietuviai ir estai HgN3 30,3 (1,4-86,2) 1,0 (0,3-3,1) 17,9 (5,0-49,2) 7,8 (3,1-25,1) Lietuviai, HgR1a 40,3 (5,2-93,0) 1,1 (0,5-2,6) 14,5 (4,1-41,1) 7,8 (2,9-24,1) Lietuviai, visos Y chromosomos 78,0 (42,8-130,4) 1,0 (0,7-1,7) 16,4 (5,8-39,6) 7,0 (3,0-18,3) Staigus populiacijos augimas prasidėjo prieš 7000 – 1000 metų
ŠIAURĖS EUROPOS POPULIACIJOS PAGRINDINIŲ KOMPONENČIŲ GRAFIKE 1,5 1,5 Lietuviai Latviai Latviai 1 Norvegai 1 Lietuviai ,5 ,5 Estai Švedai Estai Švedai Samai Samai –0,5 Pagal haplogrupių dažnį buvo atlikta populiacijų pagrindinių komponenčių analizė. Šiuo atveju nustatyti didžiausi skirtumai tarp rytų ir vakarų populiacijų, kurias skiria Baltijos jūra. Remiantis šia analize artimiausios populiacijos yra estai ir samai. Suomiai sudaro atskirą grupę. Lietuviai ir latviai taip pat sudaro atskirą grupę ir yra išsidėstę atskirai nuo kitų grupių. Pagal mikrosatelitų įvairovę buvo apskaičiuotos ΦST reikšmės, ir jų pagrindu nustatytos pagrindinių komponenčių reikšmės. Pagal pirmosios ir antrosios pagrindinės komponentės reikšmes visos populiacijos buvo išdėstytos dvimatėje erdvėje. Labiausiai nuo ištirtų populiacijų atsiskyrė lietuvių ir latvių grupė. –0,5 Gotlando Švedai Gotlando Švedai –1 Suomiai –1 Suomiai –1,5 –1,5 –2 – 3 –1 1 2 –2 –1,5 –1 –0,5 ,5 1 1,5 2 Pagal Y chromosomos haplogrupių dažnį Pagal ST įverčius 55
(Gotland s.) Švedai Samai Suomiai Estai Lietuviai Latviai 0,10 Y CHROMOSOMOS N3 HAPLOTIPAS ŠIAURĖS, RYTŲ IR PIETŲ BALTIJOS REGIONO POPULIACIJŲ FILOGENEZĖS MEDIS 56
N3 Y CHROMOSOMOS STR HAPLOTIPUS JUNGIANTIS TINKLAS Lietuviai Latviai Estai Šis paveikslas rodo, kad lietuvių N3 chromosomos yra kilusios iš nedidelio skaičiaus chromosomų. Taigi, praeityje buvo šių chromosomų staigus skaičiaus sumažėjimas (tikėtinas “butelio kaklelio” efektas).
GENETINIAI RYŠIAI TARP LIETUVOS IR KITŲ EUROPOS POPULIACIJŲ Filogenetinis medis buvo sudarytas naudojant Phylip programinę įrangą http://evolution.gs.washington.edu/phylip.html Neighbor Joining Metodu Medis pavaizduotas TreeView programine įranga http://taxonomy.zoology.gla.ac.uk/rod/treeview.html Lithuanians are in the middle of the circle because Lithuania is in the middle of Europe. 58
GENETINĖS ĮVAIROVĖS KITIMO EUROPOJE BARJERAI Vakarų Europoje galima pastebėti keletą neryškių barjerų, kurie skiria baskus nuo kaimyninių populiacijų, vakarinę Angliją nuo rytinės, olandus nuo belgų. Rytuose susidaro du svarbūs barjerai: 1) tarp Uralo kalbų šeimai priskiriamų marių ir Altajaus kalbų grupei priskiriamų čiuvašų; 2) tarp gruzinų ir osetinų, priklausančių skirtingoms kalbinėms grupėms, be to, atskirtų Kaukazo kalnais. Svarbūs ir barjerai, nustatyti Europos viduryje. Jie yra pasklidę nuo Italijos pietuose iki Baltijos jūros šiaurėje. Ypač ryškus genetinis barjeras yra Baltijos jūroje prie Gotlando salos ir tarp Suomijos bei Estijos. Atlikus analizę paaiškėjo, kad koreliacija tarp genetinių barjerų ir kalbinių skirtumų yra nedidelė. Kur kas svarbesnės lemiant genetinius barjerus gali būti gamtinės kliūtys. Genetinės įvairovės kitimo Europoje barjerai, nustatyti pagal Y chromosomos bialelinius žymenis (Rosser ir kt., 2000)
GENETINĖS ĮVAIROVĖS KITIMO EUROPOJE BARJERAI Genetinės įvairovės kitimo Europoje barjerai, nustatyti pagal Fst porų lyginimo matricą. 60
EUROPIEČIŲ GENETINĖ STRUKTŪRA: VAIZDAS IŠ ŠIAURĖS RYTŲ C2
VISO GENOMO INFORMATYVIAUSIOS GENETINĖS SRITYS MGC13125 115760668 11 rs543925 FSTL4 5q31.1 132587849 5 rs2303671 COL27A1 9q32 115980840 9 rs3827676 EIF2AK4 15q15.1 38112983 15 rs711906 C12orf28 12q15 68716731 12 rs789327 UBD 6p21.3 29632380 6 rs2745412 GPR158 10p12.1 25571977 10 rs1334059 SLC9A9 3q24 144959101 3 rs6788064 THEX1 8p23.1 8932162 8 rs10217044 144954522 rs9881418 NTS 12q21 84847387 rs7960313 SLITRK5 13q31.2 87977213 13 rs9521107 Neuroactive ligand-receptor interaction ZAP70 2q12 97742154 2 rs2305142 Natural killer cell mediated cytotoxicity; T cell receptor signaling pathway ZNF618 115806098 rs4979320 Regulation of actin cytoskeleton; MAPK signaling pathway FGFR3 4p16.3 1754823 4 rs6599400 Albinism, brown oculocutaneous;Albinism, ocular autosomal recessive; Albinism, oculocutaneous, type II OCA2 15q11.2-q12 26017833 rs7495174 87960360 rs1120556 115804104 rs4978561 Determines human skin pigmentation, ornithin uptake in retinal pigment epithelium SLC7A1 13q12-q14 29009933 rs1571786 FLJ90166 56465163 20 rs5007291 MYO1E 15q21-q22 57457699 rs4775159 NPAL2 8q22.2 99387257 rs4388427 SNP Info Gene Symbol Map Location Position Chr Rs# Statistiškai reikšmingi VNP pagal pagrindinių komponenčių rezultatus. Nustatyta 18-a genomo sričių, pagal kurias geriausia galima atskirti atskiras populiacijas. Trys VNP iš šių sričių (LCT komplekse) yra patys informatyviausi ir labiausiai polimorfiški.
APIBENDRINIMAS Statistiškai patikima koreliacija tarp genetinių (tiek pagal mtDNR, tiek pagal Y chromosomos, tiek pagal viso genomo skenavimo žymenis) ir geografinių atstumų Europoje rodo, kad geografiniai atstumai yra vienas svarbiausių genetinį Europos kraštovaizdį lėmusių veiksnių, t.y. žmogaus migracija populiacijų formavime buvo lemiantis veiksnys. Pirmoji pagrindinė komponentė brėžia genetinio panašumo gradientą iš pietryčių į šiaurės vakarus, tuo tarpu antroji pagrindinė komponentė atskiria Suomijos gyventojus nuo Baltų ir Centrinės Europos. Šiuolaikinių didelio pajėgumo viso genomo tyrimų rezultatai atitinka ir patvirtina ankstesnių Lietuvos populiacijos tyrimų rezultatus, t.y. lietuviai yra artimiausi latviams bei rytiniams slavams (rusams ir lenkams). 63
Žvelgiant iš genomo perspektyvos visi žmonės yra afrikiečiai, tik vieni gyvena Afrikoje, o kiti tremtyje už Afrikos ribų Svante Pääbo, Antropologas
AČIŪ UŽ DĖMESĮ!