Presentation is loading. Please wait.

Presentation is loading. Please wait.

Translatsiooni efektiivsuse sõltuvus geeni koodonkompositsioonist

Similar presentations


Presentation on theme: "Translatsiooni efektiivsuse sõltuvus geeni koodonkompositsioonist"— Presentation transcript:

1 Translatsiooni efektiivsuse sõltuvus geeni koodonkompositsioonist
Age Tats geenitehnoloogia III kursus

2 Bakteriaalne ribosoom 70S
30S väike subühik 23S rRNA, 5S rRNA, 31 valku 50S suur subühik 16S rRNA, 21 valku P-, A- ja E-sait

3 Translatsiooni mehhanism 1. Initsiatsioon
30S subühiku 16S rRNA 3’ otsa paardumine mRNA Shine-Dalgarno järjestusega 50S subühiku seondumine  70S ribosoom Initsiaator-tRNA P-saiti väikesel subühikul

4 http://old.jccc.net/.../proteinsynthesis/ translation/steps.html

5 Translatsiooni mehhanism 2. Elongatsioon
Startkoodonile järgneva koodoniga komplementaarset aminohapet kandev tRNA seondub A-saiti Metioniini ja teise aminohappe vahel moodustub peptidüülside Metioniin liigub üle A-saidis olevale tRNAle  peptiid on juba 2 aminohappe pikkune Translokatsioon – ribosoom liigub mRNA-l 3 aluse võrra

6 http://old.jccc.net/.../proteinsynthesis/ translation/steps.html

7 Translatsiooni mehhanism 3.Terminatsioon
Stoppkoodonid UAA, UAG, UGA Release faktorid RF1 ja RF2 RF1 tunneb ära UAA ja UAG ja RF2 tunneb ära UGA ja UAA.

8 http://old.jccc.net/.../proteinsynthesis/ translation/steps.html

9 N-terminuse signaalide bioloogiline roll
Ekspressioonitaseme määramine Terminatsioon – N-end rule Tähtsaimad rollid N-terminuse signaalidel on: … ja … Seotud tRNA hulgaga. Kasvu eksponentsiaalses faasis muutub teatud tRNAde hulk (vastab koodonitele, mida muidu kasutatakse) limiteerituks. Seetõttu võetakse kasutusele alternatiivsed sünonüümsed koodonid ja sellest tulenevalt ka suur codon bias kõrgelt ekspresseeritud valkudes niing erinev koodonkasutus N-terminuses.  ekspressioonitaseme kontrollija. Mitmetes organismides kasutatakse sünonüümseid koodoneid mittejuhuslikult ning selline koodonite bias korreleerub isoaktsepteeriva tRNA hulgaga. Eelistatud koodon optimiseerib translatsiooni ning kõrgelt ekspresseeruvatel geenidel on tavaliselt ekstreemne sünonüümsete koodonite bias. Aminohappejääk N-terminuses määrab valgu eluea.

10 Koodoneelistus Karlin et al 1998 ‘Codon usages in different gene classes of the Escherichia coli genome’, Molecular Microbiology 29, Geenid jagatuna amino-, keskmiseks ja karboksüülosaks Ekspressioonitase Geeniklassid jagades genoomi 100kb, 200kb või suuremateks kontiikideks (replikatsioon) Geenid jaotatud funktsiooni ja/või rakulise lokalisatsiooni alusel (14 kategooriat, alamklassid) Geeni suurus Klastrid koodonkasutuse, aminohapete kasutuse sarnasuse järgi Geenid kodeeritud leading vs lagging ahelalt ‘Alien’ geenid Geenide koodoneelistus on jagatav mitmete viiside järgi: Pikemad kui 100 koodonit. Nendest tehtud kollektsioonid ja analüüsitud kui kolme “geenide” gruppi Kõrgelt ekspresseeritud geenidel esineb tugev eelistus kindlale koodonite alamhulgale, samas kui madalalt ekspresseerunud geenidel on koodonkasutuse muster rohkem ühtlustunud. On näidatud tugev korrelatsioon sünonüümsete koodonite kasutuse nihke ja valgu hulga vahel. Eelistuse põhjuseks võib olla selektsioon translatsiooni efektiivsusele, nagu on näidatud optimaalsete koodonite ja tRNAde hulga vahelise positiivse korrelatsiooniga. 3. Prokarüootides arvatakse asukohaga seotud eelistus mõjutavat replikatsiooni ajastamist. 4. Translatsiooni kategooria sisaldab järgmisi alamklasse: aa-tRNA süntetaasid (20 geeni); degradatsioonivalgud (proteinaasid); modifikatsioonivalkude geenid (sh elongatsioonifaktorid, DNA protsessingu chain A, ribosome-releasing factor, initsiatsioonifaktor 3, adenülüültransferaas, peptiidiahela vabastamise faktor3 ja translatsioonifaktor); ribosomaalsed valgud (50-70 geeni). 5. 8. Hiljem ilmunud, osa patogeensuse saarelt? Või mingil muul viisil ebaharilikud.

11 Ekspressioonitase Ekspressioonitaseme ennustamiseks:
CAI (codon adaptation index) Sharp ja Li 1987 CU (codon usage) Karlin et al 1998 Lineaarne mudel (lineaarsel regressioonil põhinev) Jansen et al 2003 Kõik annavad suhteliselt sarnase ja küllaltki kõrge korrelatsiooni ( ) tegeliku ekspressioonitasemega. Ekspressioonitaseme ennustamiseks on mitmeid mudeleid. Tuntuimad: Lineaarse mudeli eelis on see, et tema poolt ennustatud ekspressioonitaseme dimensioon on sama mis tegeliku ekspressiooni logaritmil ja seega saab neid otse võrrelda. Vähem arvutusi, matemaatiliselt lihtne. CAi täpsust analüüsiti pärmi ekspressiooniandmete peal.

12 CAI mudel Relative adaptiveness of a codon (w) -
koodoni sageduse suhe kõige enam kasutatavasse sünonüümsesse koodonisse. 0 ≤ w ≥ 1 CAI (codon adaptation index) on kvantitatiivne meetod geeni ekspressioonitaseme ennustamiseks tema koodonjärjestuse baasil (12). CAI omistab igale 61 koodonile (v.a stoppkoodonid) parameetri, milleks on relatiivne adaptiivsus (w, relative adaptivness). Koodoni relatiivne adaptiivsus on defineeritud kui tema sageduse suhe kõige rohkem kasutatavasse sünonüümsesse koodonisse. Parameetri arvutamise aluseks on kõrgelt ekspresseerunud geenide hulk ( 24 geeni ), kuhu kuuluvad ribosoomivalke (ca pooled), välismembraani valke, elongatsioonifaktoreid, heat shock valke ja RNA polümeraasi subühiku valke kodeerivad geenid. Relatiivne adaptiivsus väljendub järgnevalt: valem, kus faa,i on koodoni i (mis kodeerib aminohapet aa) sagedus ja faa,max on kõige rohkem kõrgelt ekspresseerunud geenides G aminohappe aa kodeerimiseks kasutatava koodoni sagedus. Relatiivne adaptiivsus varieerub 0-st 1-ni. Vastavalt 0, kui koodonit ei kasutata rühmas G üldse, ja 1, kui koodon esineb antud aminohappe puhul rühmas G kõige rohkem.

13 CAI mudel Geeni g CAI on kõigi geenijärjestuses olevate koodonite relatiivsete adaptiivsuste geomeetriline keskmine: kus wk tähistab geneetilise koodi 61 koodonist k-nda koodoni relatiivset adaptiivsust. Xk,g on koodoni k fraktsioon geenis g olevate koodonite koguarvus: kus Ck,g on koodoni k esinemise arv geenis g. Nagu relatiivne adaptiivsuski, varieerub CAI 0-st 1-ni. Kõrgemad CAI väärtused näitavad, et vastavad geenid on tõenäoliselt kõrgelt ekspresseeruvad 0 ≤ CAI ≥ 1

14 Näide: w proliini koodonile CCU
Kõrgelt ekspresseerunud geenide abil saame koodoni CCU relatiivse adaptiivsuse. See on kõrgelt ekspresseerunud geenides esineva koodoni CCU sagedus jagatuna nendes geenides kõige sagedamini esineva proliini kodeeriva koodoni sagedusega. Antud juhul on meil selleks koodon CCG, mida kasutatakse proliini kodeerimisel E.coli geenides kõige rohkem. Teine parameeter, mida vajame, on koodoni CCU osakaal kõigist koodonitest antud geenis.

15 Translatsiooni efektiivsust mõjutavad signaalid
Shine-Dalgarno järjestus Startkoodonist -1 asuv nukleotiid U, fMet-tRNA 37.positsioonis olev A konserveerunud Startkoodon AUG (GUG, UUG) Startkoodonist downstream asuvad koodonid Minoorsed koodonid (AGA, AGG, CUA, UCA, AGU, ACA, GGA, CCC, AUA). Eelistatud rohkem initsiatsioonisaidis kui teistes geeni osades. Eelistus on suurem kõrgelt ekspresseerunud geenide puhul. 1. 9 bakterist 6-l on leitud selge korrelatsioon CAI väärtuste ja SD järjestuse konserveerumise vahel, sh E.colil. (Uuriti vabaenergia väärtuseid. Aluseks SD kõige sagedamini esinevad 7-meersed motiivid. (E.colil TCAGGAG.) Joondati need kõigi geenide 5’UTR’idega. Gappe ja mismatche ei lubatud. Madal vabaenergia väärtus näitab SD järjestuse kõrget konserveerumist. 200 kõrget CAId, 200 keskmist CAId ja 200 madalat CAId.Kõrge CAIga geenidel oli vabaenergia langus suurem kui teistel, mis lubab oletada, et kõrge CAIga geenide SD on rohkem konserveerunud kui madala CAIga geenidel.) Kuna CAI on seotud geeniekspressiooni tasemega, võib järeldada, et SD järjestuse konserveerumise ulatus on seotud translatsiooni efektiivsusega. Sagedamini ekspresseeruvate geenide jaoks on vaja, et ribosoom tunneks SD efektiivsemalt ära. Punktmutatsioon SD-s viib transalatsiooniefektiivsuse langusele. 2. Joonis järgmisel slaidil 3. On analüüsitud ka startkoodoni kasutuse ja CAI vahelist korrelatsiooni. Geenid kõrgema CAIga kasutavad AUGd sagedamini. AUG koodon interakteerub tugevamalt initsiaator tRNAga kui teised startkoodonid ja seetõttu on eelistatud efektiivseks translatsiooniks. 4. Startkoodoni läheduses asuvate koodonite kõigis kolmes positsioonis on tuvastatud adeniini kõrge esindatus ja guaniini madal esindatus. Erinevate koodonite kasutusel peale AUG startkoodonit on võimalik saavutada kordne geeniekspressiooni efekt. Spetsiifilisemalt, +2 positsioonis olevates koodonites, mis geeniekspressiooni taset tõstavad, on eelistatud adeniin. Koodonid, mis olid teiste aluste rikkad, eriti G- ja C-rikkad, seostusid madala geeniekspressiooniga. Võimalik, et A-rikkad (ja ka U-rikkad) koodonid soodustavad piirkonna mittestruktureeritust, hõlbustades sellega translatsiooni initsiatsiooni, kuna on näidatud, et ca 40% rRNA sekundaarstruktuuris esinevatest mittepaardunud nukleotiididest on A-d. 5. Paljudel bakteritel on startkoodoni läheduses eelistatud minoorsed koodonid. Nende koodonite hulgas on mõned, millel on tugev eelistus initsiatsioonisaidis kõrge CAIga geenide puhul. Minoorseid koodoneid, nagu AGA, AGG, CUA, UCA, AGU, ACA, GGA, CCC ja AUA kasutatakse E.coli geenides esimese 25 koodoni hulgas eelistatult (6). Raku kasvu jõudmisel statsionaarsesse faasi muutub minoorsete koodonite tRNA-de kontsentratsioon äärmiselt limiteerituks, mistõttu ribosoom jääb minoorsete koodonite kohal seisma, inhibeerides ribosoomi sissekäiku initsiatsioonisaidis. Seetõttu väheneb translatsiooni tase. Kui vahemaa startkoodoni ja minoorse koodoni vahel on suurem kui koodonit, ei blokeeri ribosoomide järjekord minoorsel koodonil translatsioonil ribosoomi sissekäiku. Seega mängivad minoorsed koodonid, mis asuvad vastavast piirist seespool, geeniekspressiooni reguleerimisel olulist rolli (7). Minoorsete koodonite esinemine initsiatsioonisaidis, isegi ühe AGG koodoni puhul, vähendab initsiatsioonisait geeniekspressiooni. Teiseks sõltub see efekt raku kasvufaasist ja on ületatav tRNAde üleproduktsiooniga. Minoorsete koodonite eelistatus initsiatsioonisaidi läheduses on tugevam kõrgemalt ekspresseeruvatel geenidel võrreldes madalamalt ekspresseeruvate geenidega. E.coli puhul on sellisteks koodoniteks AGA ja AGG. Need koodonid on kõrgelt ekspresseerunud geenides initsiatsioonisaidis üleesindatud juhul, kui vastavate tRNAde hulk on limiteeritud, osaledes seejuures ilmselt geeniekspressiooni vähendamises (11). Kuigi kõrge CAIga geenide koodonkasutus peaks olema optimiseeritud, minoorsete koodonite esinemine näitab vastupidist. Lahendus: minoorsed koodonid on kõrgelt ekspresseerunud geenides initsiatsioonisaidis eelistatud vaid juhul, kui vastavad tRNAd on limiteeritud, vähendades sellega ilmselt ekspressioonitaset. Kokkuvõttes mõjutavad SD, startkoodon ja DR kõik koos geeniekspressiooni taset, kuid võivad seda teha ka eraldi.

16 Startkoodonist -1 asuv nukleotiid U, fMet-tRNA 37
Startkoodonist -1 asuv nukleotiid U, fMet-tRNA 37.positsioonis olev A konserveerunud

17 Translatsiooni efektiivsust mõjutavad signaalid
Nukleotiidide sagedus Koodonite sagedus Aminohappeline koostis Aminohapete muster Aminohapete hüdrofoobsus Koodonkasutuse mõju translatsiooni efektiivsusele on ilmne. Kas mõju on nukleotiidide sagedusel või vastupidi, kas hakkab olulist rolli mängima ka aminohappeline koostis, muster ja kui, siis mille alusel? Hydrofoobsus võiks olla üks hüpotees.

18 Eesmärk Milline N-terminus on eelistatud?
Millist N-terminust püütakse kindlasti vältida? Leida mingi töötav grupeerimismeetod, millega saaks leida uusi N-terminaalseid regulatoorseid peptiide (Taneli soov).

19 Nukleotiidide, koodonite ja aminohapete sageduste võrdlus
A (ja U) nukleotiidide rohkus esimese 30 nukleotiidi seas A-d (ja U-d) sisaldavad koodonid N-terminuses eelistatud hüdrofiilsed aminohapped (Lys, Asn, Gln, Ser) Alaesindatud hüdrofoobsed (Ala, Gly, Leu, Val) Dipeptiidide sagedus Nukleotiidide eelistus A ja U suunas ühesugune nii kõigil geenidel kui kõrgelt ekspresseerunud geenidel. Vastavalt G ja C vähemeelistatus. See nähtub ka koodonkasutuses: On leitud, et E.coli valkude N-terminaalses otsas (positsioonides 2-10) esinevate aminohapete puhul on üleesindatud hüdrofiilsed aminohapped (Lys, Asn, Gln, Ser) ja alaesindatud hüdrofoobsed aminohapped (Ala, Gly, Leu, Val), sarnaselt Bacillus subtilis’ele. Hüdrofiilsete järjestuste üleesindatuse põhjuseks võib taas olla A-rikaste koodonite esindatus, sest koodonid A nukleotiidiga koodoni teises positsioonis kodeerivad just hüdrofiilseid järjestusi. Samas hüdrofiilsed aminohapped Ser ja Arg ei oma koodonite teises positsioonis A nukleotiidi ja ei ole A-rikkad, kuid on sellegipoolest üleesindatud. Uurisime ka dipeptiidide sagedust. Midagi huvitavat ei leidnud

20 Kõrgelt ekspresseerunud geenid
Kõrgelt ekspresseerunud geenid. Wobble hypotees - Translatsioonil on vajalik täpne paardumine mRNA koodoni ja tRNA antikoodoni esimeses kahes positsioonis. Antikoodoni 5’ aluse ja koodoni 3’ aluse vahel võib esineda ka ebastandartset paardumist.

21 Et parem võrrelda, on siin toodud nukleotiidide sagedus E
Et parem võrrelda, on siin toodud nukleotiidide sagedus E.coli kõigi geenide esimeses 15 positsioonis. Positsioon tähistab siin koodoni positsiooni geenis, mitte nukleotiidi positsiooni koodonis, st ma ei ole eraldi arvestanud seda, kas nukleotiid asub koodoni 1., 2. või 3. positsioonis, vaid lugenud nukleotiidid lihtsalt koodnis kokku.

22 Kõrgelt ekspresseerunud geenide graafikul me põhimõttelist erinevust ei näe. Graafik kõigub kyll rohkem, kuid see tuleneb ilmselt valimi väiksusest. Geeni alguses on aga ikkagi eelistatud A ja U nukleotiidid. Sealjuures A enim nagu ka kõigi geenide puhul oli näha.

23 3 AAG CUG AGA GGC ACA CCG AAA GCG AUA GUG 2 AAA CUG AGU GGC ACA GUG
AAU GCC UCU GGU 4 UUA GCG AUA GGU ACA CUG AAA GGC AGA GUG 5 AUA GGC AGA GCG ACA GGU UUA CUG ACU CCG 6 AGA GGC AUU GCG UUA GUG AUA CCG ACA GGU 7 AUA GCG UUA GUG AGA GGC AGG CUG CUU GGG 8 UUA GCG AGA GGC ACA CCG AUA CAG CUU GAA 9 ACA GUG AGA GCG AUA UAC CUA GAG CUU GGC 10 AGG CCG AUA GAA UUA GAG CUU GCG ACA GUG Eelistatud on rohelised, alaesindatud punased. 5 rida, sest need kõige märkimisväärsema erinevusega eeldatavast esinemissagedusest. (Rida jätkub tegelikult sama loogikaga, et eelistatumad on A ja U rikkad ja välditakse G-d ja C-d sisaldavaid koodoneid). Alates 9. ja 10. positsioonist hakkavad sisse ilmuma ka juba A ja U ülekaaluga koodonid. Nt 9.positsioonis UAC välditutes ja 10.positsioonis GAA välditutes. Samas ka AGG 10.positsioonis eelistatuim.

24 3 Lys Gly Thr Ala Asn Val Gln Leu Ile Pro 2 Lys Gly Ser Val Asn Leu
Tyr Asp 4 Lys Ala Ile Gly Ser Asp Asn Glu Phe Val 5 Ile Gly Thr Ala Lys Glu Phe Asp Asn 6 Ile Gly Lys Ala Thr Asp Leu Val Phe Glu 7 Ile Gly Leu Glu Lys Asp Ser Met Thr Ala positsioonis väga suure ylekaaluga esimene lüsiin. Esineb ka teisi hydrofiilseid aminohappeid nagu Ser, Asn, Thr. Alates 5.positsioonist aga tõuseb esikohale isoleutsiin, mis on yks hydrofoobsemaid aminohappeid.??? Koodonite eelistuses on samuti 5.positsioonis eelistatuim koodon AUA isoleutsiini koodon. Nii et see võib olla tingitud hoopis nukleotiididest, eelistatakse A ja U rikkaid nukleotiide. Samas Lys pysib ka pidevalt esimese kolme seas. Ser ja Thr samuti. Ylekaalus paisatb olevat siiski hydrofiilsete aminohapete eelistus ja mitte-eelistatute esimese 5 seas on rohkem hydrofoobseid aminohappeid. 8 Leu Gly Ile Ala Arg Glu Lys TER Cys Met 9 Leu Glu Ile Tyr Ser TER Gly 10 Leu Glu Ser TER Asp

25 HMM kõrgelt ekspresseerunud valkudest
Eraldi 25-st, 40-st ja 60-st kõrgelt ekspresseerunud valgust esimesed 12 aminohapet Otsingul nii kõrgelt ekspresseerunute eneste kui ka kogu genoomi vastu bioloogiliselt olulist tulemust ükski variant ei andnud (E väärtus liiga suur) Järelikult kindlalt konserveerunud mustrit pole. Uurimaks, kas esineb mingi konserveerunud aminohapete muster valgu alguses pyydsime teha HMM mudeli.

26 Hüdrofoobsusprofiilid
Kyte-Doolittle skaala. Mida hüdrofoobsem, seda negatiivsem väärtus Esimesed 15 aminohapet N-terminusest Võrdlus teiste bakteritega Hydrofoobsusega ikka edasi.

27 Kyte Doolittle Hydrophilicities
A -1,8 D 3,5 C -2,5 E F -2,8 G 0,4 I -4,5 H 3,2 L -3,8 K 3,9 M -1,9 N V -4,2 P 1,6 Q R 4,5 S 0,8 T 0,7 W 0,9 Y 1,3 Kyte Doolittle Hydrophilicities

28 Tekivad piigid. Negatiivsem on hüdrofoobsem. Kahene aken, ühese sammuga. (Kõik järgnevad graafikud samuti.)

29 Võrdlusena juhuslikult võetud sama arv valke. Sarnast joont ei teki.

30 Võrrelduna lisaks veel 60 kõrge CAI-ga valguga.

31 Võrdlus teiste bakteritega
Kas eksisteerib laiemalt levinud mudel kõrgelt ekspresseerunud geenide N- terminuses? B. subtilis R. prowazekii M. tuberculosis H. influenzae H.pylori T.pallidum Koodonkasutus Aminohappekasutus Hüdrofoobsusprofiilid

32 Võrdlusena teiste bakteritega. Nendest on võetud E. coli 40 ortoloogid
Võrdlusena teiste bakteritega. Nendest on võetud E.coli 40 ortoloogid. Esimene osa graafikust kõigil sarnane, hiljem enam mitte nii väga.

33 Kavas proovida: Hydrophobic profile clustering
Pattern discovery without alignment TEIRESIAS

34 Hydrophobic profile clustering

35 Hydrophobic profile clustering

36 Väga kiire ja suudab töötada ka suurte andmehulkadega
Väga kiire ja suudab töötada ka suurte andmehulkadega. Seetõttu on ka kasutatav mitmete bioloogiliste probleemide puhul, nagu näiteks seesama pattern discovery, dna tandeemsete korduste avastamine, geenide avastamine jne. lisaks ka mitte-bioloogilised probleemid. Input formaadiks on tavaline FASTA formaat. Outputis annab leitud mustrid ja järjestused, kust need leiti. Samuti võimaldab otsida SwissProt/trembl’ist teisi samasugust mustrit sisaldavaid järjestusi.

37 Kokkuvõte N-terminuses AT nukleotiidide rohkus
Kõrge CAI-ga valkudel spetsiifiline hüdrofoobsusprofiil valgu esimestes positsioonides Esineb ka teistes bakterites

38 Viited Varshavsky, 1996 The N-end rule: Functions, mysteries, uses, Biochemistry, 93, Sakai et al, 2000 Correlation Between Shine-Dalgarno Sequence Conservation and Codon Usage of Bacterial Genes, J. Mol. Evol., 52, Stenström et al, 2000 Codon bias at the 3’-side of the initiation codon is correlated with translation initiation efficiency in Escherichia coli, Gene, 263, Ohno et al, 2001 Preferential usage of some minor codons in bacteria, Gene, 276, Karlin et al 1998 Codon usages in different gene classes of the Escherichia coli genome, Mol. Microbiol., 29, Jansen et al 2003 Revisiting the codon adaptation index from a whole-genome perspective: analyzing the relationship between gene expression and codon occurrence in yeast using a variety of models, Nucl. Acid Res., 31,


Download ppt "Translatsiooni efektiivsuse sõltuvus geeni koodonkompositsioonist"

Similar presentations


Ads by Google