Translatsiooni efektiivsuse sõltuvus geeni koodonkompositsioonist

Slides:



Advertisements
Similar presentations
Traducción. Molécula de aminoácido Sitio de fijación del aminoácido Adaptador (RNAt) RNAm Triplete nucleotídico que codifica un aminoácido + -O 2 C—C—NH.
Advertisements

Translation By Josh Morris.
Mutations. DNA mRNA Transcription Introduction of Molecular Biology Cell Polypeptide (protein) Translation Ribosome.
Chapter 9 Proteins and Their Synthesis
Transcription & Translation Worksheet
Transcription and Translation
FEATURES OF GENETIC CODE AND NON SENSE CODONS
Chapter 17: From Gene to Protein.
How Proteins are Produced
Sec 5.1 / 5.2. One Gene – One Polypeptide Hypothesis early 20 th century – Archibald Garrod physician that noticed that some metabolic errors were found.
PowerPoint ® Lecture Slides prepared by Janice Meeking, Mount Royal College C H A P T E R Copyright © 2010 Pearson Education, Inc. 3 Cells: The Living.
Gene Expression: From Gene to Protein
Figure 14.1 Figure 14.1 How does a single faulty gene result in the dramatic appearance of an albino deer? 1.
7. Protein Synthesis and the Genetic Code a). Overview of translation i). Requirements for protein synthesis ii). messenger RNA iii). Ribosomes and polysomes.
Cell Division and Gene Expression
Transcription & Translation
Chapter 14 Genetic Code and Transcription. You Must Know The differences between replication (from chapter 13), transcription and translation and the.
©1998 Timothy G. Standish From DNA To RNA To Protein Timothy G. Standish, Ph. D.
Parts is parts…. AMINO ACID building block of proteins contain an amino or NH 2 group and a carboxyl (acid) or COOH group PEPTIDE BOND covalent bond link.
Today 14.2 & 14.4 Transcription and Translation /student_view0/chapter3/animation__p rotein_synthesis__quiz_3_.html.
Example 1 DNA Triplet mRNA Codon tRNA anticodon A U A T A U G C G
Chapter 17 Membrane Structure and Function From Gene to Proteins.
Figure 17.4 DNA molecule Gene 1 Gene 2 Gene 3 DNA strand (template) TRANSCRIPTION mRNA Protein TRANSLATION Amino acid ACC AAACCGAG T UGG U UU G GC UC.
Arginine, who are you? Why so important?. Release 2015_01 of 07-Jan-15 of UniProtKB/Swiss-Prot contains sequence entries, comprising
How Genes Work: From DNA to RNA to Protein Chapter 17.
Gene Translation:RNA -> Protein How does a particular sequence of nucleotides specify a particular sequence of amino acids?nucleotidesamino acids The answer:
Ms. Hatch, What are we doing today?
Ms. Hatch, What are we doing today?
F. PROTEIN SYNTHESIS [or translating the message]
DNA.
Nucleic Acids: DNA and RNA
Translation PROTEIN SYNTHESIS.
Whole process Step by step- from chromosomes to proteins.
Please turn in your homework
The blueprint of life; from DNA to Protein
Where is Cytochrome C? What is the role? Where does it come from?
Overview: The Flow of Genetic Information
Mutations.
Warm-Up 3/12/13 After transcription, an mRNA molecule with the sequence A U A C G C A G U was created. What was the sequence of the original DNA strand?
Transcription and Translation
What is Transcription and who is involved?
From Gene to Phenotype- part 2
Chemistry 121 Winter 17 Introduction to Organic Chemistry and Biochemistry Instructor Dr. Upali Siriwardane (Ph.D. Ohio State)
Ch. 17 From Gene to Protein Thought Questions
Gene Expression: From Gene to Protein
Gene Expression: From Gene to Protein
Gene Expression: From Gene to Protein
From Gene to Protein The information content of DNA is in the form of specific sequences of nucleotides The DNA inherited by an organism leads to specific.
Overview: The Flow of Genetic Information
Protein Synthesis Translation.
Overview: The Flow of Genetic Information
Koostas: Kristel Mäekask
PROTEIN SYNTHESIS RELAY
Chapter 17 From Gene to Protein.
Gene Expression: From Gene to Protein
Chapter 17 From Gene to Protein.
Protein Synthesis The information of DNA is in the form of specific sequences of nucleotides along the DNA strands The DNA inherited by an organism leads.
SC-100 Class 25 Molecular Genetics
NOTE SHEET 13 – Protein Synthesis
Warm Up 3 2/5 Can DNA leave the nucleus?
Protein Structure Timothy G. Standish, Ph. D..
Today’s notes from the student table Something to write with
Overview: The Flow of Genetic Information
Central Dogma and the Genetic Code
Bellringer Please answer on your bellringer sheet:
DNA, RNA, Amino Acids, Proteins, and Genes!.
Chapter 17: From Gene to Protein
DNA to proteins.
Mutations Timothy G. Standish, Ph. D..
Chapter 17: From Gene to Protein
Presentation transcript:

Translatsiooni efektiivsuse sõltuvus geeni koodonkompositsioonist Age Tats geenitehnoloogia III kursus

Bakteriaalne ribosoom 70S 30S väike subühik 23S rRNA, 5S rRNA, 31 valku 50S suur subühik 16S rRNA, 21 valku P-, A- ja E-sait

Translatsiooni mehhanism 1. Initsiatsioon 30S subühiku 16S rRNA 3’ otsa paardumine mRNA Shine-Dalgarno järjestusega 50S subühiku seondumine  70S ribosoom Initsiaator-tRNA P-saiti väikesel subühikul

http://old.jccc.net/.../proteinsynthesis/ translation/steps.html

Translatsiooni mehhanism 2. Elongatsioon Startkoodonile järgneva koodoniga komplementaarset aminohapet kandev tRNA seondub A-saiti Metioniini ja teise aminohappe vahel moodustub peptidüülside Metioniin liigub üle A-saidis olevale tRNAle  peptiid on juba 2 aminohappe pikkune Translokatsioon – ribosoom liigub mRNA-l 3 aluse võrra

http://old.jccc.net/.../proteinsynthesis/ translation/steps.html

Translatsiooni mehhanism 3.Terminatsioon Stoppkoodonid UAA, UAG, UGA Release faktorid RF1 ja RF2 RF1 tunneb ära UAA ja UAG ja RF2 tunneb ära UGA ja UAA.

http://old.jccc.net/.../proteinsynthesis/ translation/steps.html

N-terminuse signaalide bioloogiline roll Ekspressioonitaseme määramine Terminatsioon – N-end rule Tähtsaimad rollid N-terminuse signaalidel on: … ja … Seotud tRNA hulgaga. Kasvu eksponentsiaalses faasis muutub teatud tRNAde hulk (vastab koodonitele, mida muidu kasutatakse) limiteerituks. Seetõttu võetakse kasutusele alternatiivsed sünonüümsed koodonid ja sellest tulenevalt ka suur codon bias kõrgelt ekspresseeritud valkudes niing erinev koodonkasutus N-terminuses.  ekspressioonitaseme kontrollija. Mitmetes organismides kasutatakse sünonüümseid koodoneid mittejuhuslikult ning selline koodonite bias korreleerub isoaktsepteeriva tRNA hulgaga. Eelistatud koodon optimiseerib translatsiooni ning kõrgelt ekspresseeruvatel geenidel on tavaliselt ekstreemne sünonüümsete koodonite bias. Aminohappejääk N-terminuses määrab valgu eluea.

Koodoneelistus Karlin et al 1998 ‘Codon usages in different gene classes of the Escherichia coli genome’, Molecular Microbiology 29, 1341-1355 Geenid jagatuna amino-, keskmiseks ja karboksüülosaks Ekspressioonitase Geeniklassid jagades genoomi 100kb, 200kb või suuremateks kontiikideks (replikatsioon) Geenid jaotatud funktsiooni ja/või rakulise lokalisatsiooni alusel (14 kategooriat, alamklassid) Geeni suurus Klastrid koodonkasutuse, aminohapete kasutuse sarnasuse järgi Geenid kodeeritud leading vs lagging ahelalt ‘Alien’ geenid Geenide koodoneelistus on jagatav mitmete viiside järgi: Pikemad kui 100 koodonit. Nendest tehtud kollektsioonid ja analüüsitud kui kolme “geenide” gruppi Kõrgelt ekspresseeritud geenidel esineb tugev eelistus kindlale koodonite alamhulgale, samas kui madalalt ekspresseerunud geenidel on koodonkasutuse muster rohkem ühtlustunud. On näidatud tugev korrelatsioon sünonüümsete koodonite kasutuse nihke ja valgu hulga vahel. Eelistuse põhjuseks võib olla selektsioon translatsiooni efektiivsusele, nagu on näidatud optimaalsete koodonite ja tRNAde hulga vahelise positiivse korrelatsiooniga. 3. Prokarüootides arvatakse asukohaga seotud eelistus mõjutavat replikatsiooni ajastamist. 4. Translatsiooni kategooria sisaldab järgmisi alamklasse: aa-tRNA süntetaasid (20 geeni); degradatsioonivalgud (proteinaasid); modifikatsioonivalkude geenid (sh elongatsioonifaktorid, DNA protsessingu chain A, ribosome-releasing factor, initsiatsioonifaktor 3, adenülüültransferaas, peptiidiahela vabastamise faktor3 ja translatsioonifaktor); ribosomaalsed valgud (50-70 geeni). 5. 8. Hiljem ilmunud, osa patogeensuse saarelt? Või mingil muul viisil ebaharilikud.

Ekspressioonitase Ekspressioonitaseme ennustamiseks: CAI (codon adaptation index) Sharp ja Li 1987 CU (codon usage) Karlin et al 1998 Lineaarne mudel (lineaarsel regressioonil põhinev) Jansen et al 2003 Kõik annavad suhteliselt sarnase ja küllaltki kõrge korrelatsiooni (0.69-0.72) tegeliku ekspressioonitasemega. Ekspressioonitaseme ennustamiseks on mitmeid mudeleid. Tuntuimad: Lineaarse mudeli eelis on see, et tema poolt ennustatud ekspressioonitaseme dimensioon on sama mis tegeliku ekspressiooni logaritmil ja seega saab neid otse võrrelda. Vähem arvutusi, matemaatiliselt lihtne. CAi täpsust analüüsiti pärmi ekspressiooniandmete peal.

CAI mudel Relative adaptiveness of a codon (w) - koodoni sageduse suhe kõige enam kasutatavasse sünonüümsesse koodonisse. 0 ≤ w ≥ 1 CAI (codon adaptation index) on kvantitatiivne meetod geeni ekspressioonitaseme ennustamiseks tema koodonjärjestuse baasil (12). CAI omistab igale 61 koodonile (v.a stoppkoodonid) parameetri, milleks on relatiivne adaptiivsus (w, relative adaptivness). Koodoni relatiivne adaptiivsus on defineeritud kui tema sageduse suhe kõige rohkem kasutatavasse sünonüümsesse koodonisse. Parameetri arvutamise aluseks on kõrgelt ekspresseerunud geenide hulk ( 24 geeni ), kuhu kuuluvad ribosoomivalke (ca pooled), välismembraani valke, elongatsioonifaktoreid, heat shock valke ja RNA polümeraasi subühiku valke kodeerivad geenid. Relatiivne adaptiivsus väljendub järgnevalt: valem, kus faa,i on koodoni i (mis kodeerib aminohapet aa) sagedus ja faa,max on kõige rohkem kõrgelt ekspresseerunud geenides G aminohappe aa kodeerimiseks kasutatava koodoni sagedus. Relatiivne adaptiivsus varieerub 0-st 1-ni. Vastavalt 0, kui koodonit ei kasutata rühmas G üldse, ja 1, kui koodon esineb antud aminohappe puhul rühmas G kõige rohkem.

CAI mudel Geeni g CAI on kõigi geenijärjestuses olevate koodonite relatiivsete adaptiivsuste geomeetriline keskmine: kus wk tähistab geneetilise koodi 61 koodonist k-nda koodoni relatiivset adaptiivsust. Xk,g on koodoni k fraktsioon geenis g olevate koodonite koguarvus: kus Ck,g on koodoni k esinemise arv geenis g. Nagu relatiivne adaptiivsuski, varieerub CAI 0-st 1-ni. Kõrgemad CAI väärtused näitavad, et vastavad geenid on tõenäoliselt kõrgelt ekspresseeruvad 0 ≤ CAI ≥ 1

Näide: w proliini koodonile CCU Kõrgelt ekspresseerunud geenide abil saame koodoni CCU relatiivse adaptiivsuse. See on kõrgelt ekspresseerunud geenides esineva koodoni CCU sagedus jagatuna nendes geenides kõige sagedamini esineva proliini kodeeriva koodoni sagedusega. Antud juhul on meil selleks koodon CCG, mida kasutatakse proliini kodeerimisel E.coli geenides kõige rohkem. Teine parameeter, mida vajame, on koodoni CCU osakaal kõigist koodonitest antud geenis.

Translatsiooni efektiivsust mõjutavad signaalid Shine-Dalgarno järjestus Startkoodonist -1 asuv nukleotiid U, fMet-tRNA 37.positsioonis olev A konserveerunud Startkoodon AUG (GUG, UUG) Startkoodonist downstream asuvad koodonid Minoorsed koodonid (AGA, AGG, CUA, UCA, AGU, ACA, GGA, CCC, AUA). Eelistatud rohkem initsiatsioonisaidis kui teistes geeni osades. Eelistus on suurem kõrgelt ekspresseerunud geenide puhul. 1. 9 bakterist 6-l on leitud selge korrelatsioon CAI väärtuste ja SD järjestuse konserveerumise vahel, sh E.colil. (Uuriti vabaenergia väärtuseid. Aluseks SD kõige sagedamini esinevad 7-meersed motiivid. (E.colil TCAGGAG.) Joondati need kõigi geenide 5’UTR’idega. Gappe ja mismatche ei lubatud. Madal vabaenergia väärtus näitab SD järjestuse kõrget konserveerumist. 200 kõrget CAId, 200 keskmist CAId ja 200 madalat CAId.Kõrge CAIga geenidel oli vabaenergia langus suurem kui teistel, mis lubab oletada, et kõrge CAIga geenide SD on rohkem konserveerunud kui madala CAIga geenidel.) Kuna CAI on seotud geeniekspressiooni tasemega, võib järeldada, et SD järjestuse konserveerumise ulatus on seotud translatsiooni efektiivsusega. Sagedamini ekspresseeruvate geenide jaoks on vaja, et ribosoom tunneks SD efektiivsemalt ära. Punktmutatsioon SD-s viib transalatsiooniefektiivsuse langusele. 2. Joonis järgmisel slaidil 3. On analüüsitud ka startkoodoni kasutuse ja CAI vahelist korrelatsiooni. Geenid kõrgema CAIga kasutavad AUGd sagedamini. AUG koodon interakteerub tugevamalt initsiaator tRNAga kui teised startkoodonid ja seetõttu on eelistatud efektiivseks translatsiooniks. 4. Startkoodoni läheduses asuvate koodonite kõigis kolmes positsioonis on tuvastatud adeniini kõrge esindatus ja guaniini madal esindatus. Erinevate koodonite kasutusel peale AUG startkoodonit on võimalik saavutada 15-20-kordne geeniekspressiooni efekt. Spetsiifilisemalt, +2 positsioonis olevates koodonites, mis geeniekspressiooni taset tõstavad, on eelistatud adeniin. Koodonid, mis olid teiste aluste rikkad, eriti G- ja C-rikkad, seostusid madala geeniekspressiooniga. Võimalik, et A-rikkad (ja ka U-rikkad) koodonid soodustavad piirkonna mittestruktureeritust, hõlbustades sellega translatsiooni initsiatsiooni, kuna on näidatud, et ca 40% rRNA sekundaarstruktuuris esinevatest mittepaardunud nukleotiididest on A-d. 5. Paljudel bakteritel on startkoodoni läheduses eelistatud minoorsed koodonid. Nende koodonite hulgas on mõned, millel on tugev eelistus initsiatsioonisaidis kõrge CAIga geenide puhul. Minoorseid koodoneid, nagu AGA, AGG, CUA, UCA, AGU, ACA, GGA, CCC ja AUA kasutatakse E.coli geenides esimese 25 koodoni hulgas eelistatult (6). Raku kasvu jõudmisel statsionaarsesse faasi muutub minoorsete koodonite tRNA-de kontsentratsioon äärmiselt limiteerituks, mistõttu ribosoom jääb minoorsete koodonite kohal seisma, inhibeerides ribosoomi sissekäiku initsiatsioonisaidis. Seetõttu väheneb translatsiooni tase. Kui vahemaa startkoodoni ja minoorse koodoni vahel on suurem kui 50-60 koodonit, ei blokeeri ribosoomide järjekord minoorsel koodonil translatsioonil ribosoomi sissekäiku. Seega mängivad minoorsed koodonid, mis asuvad vastavast piirist seespool, geeniekspressiooni reguleerimisel olulist rolli (7). Minoorsete koodonite esinemine initsiatsioonisaidis, isegi ühe AGG koodoni puhul, vähendab initsiatsioonisait geeniekspressiooni. Teiseks sõltub see efekt raku kasvufaasist ja on ületatav tRNAde üleproduktsiooniga. Minoorsete koodonite eelistatus initsiatsioonisaidi läheduses on tugevam kõrgemalt ekspresseeruvatel geenidel võrreldes madalamalt ekspresseeruvate geenidega. E.coli puhul on sellisteks koodoniteks AGA ja AGG. Need koodonid on kõrgelt ekspresseerunud geenides initsiatsioonisaidis üleesindatud juhul, kui vastavate tRNAde hulk on limiteeritud, osaledes seejuures ilmselt geeniekspressiooni vähendamises (11). Kuigi kõrge CAIga geenide koodonkasutus peaks olema optimiseeritud, minoorsete koodonite esinemine näitab vastupidist. Lahendus: minoorsed koodonid on kõrgelt ekspresseerunud geenides initsiatsioonisaidis eelistatud vaid juhul, kui vastavad tRNAd on limiteeritud, vähendades sellega ilmselt ekspressioonitaset. Kokkuvõttes mõjutavad SD, startkoodon ja DR kõik koos geeniekspressiooni taset, kuid võivad seda teha ka eraldi.

Startkoodonist -1 asuv nukleotiid U, fMet-tRNA 37 Startkoodonist -1 asuv nukleotiid U, fMet-tRNA 37.positsioonis olev A konserveerunud

Translatsiooni efektiivsust mõjutavad signaalid Nukleotiidide sagedus Koodonite sagedus Aminohappeline koostis Aminohapete muster Aminohapete hüdrofoobsus Koodonkasutuse mõju translatsiooni efektiivsusele on ilmne. Kas mõju on nukleotiidide sagedusel või vastupidi, kas hakkab olulist rolli mängima ka aminohappeline koostis, muster ja kui, siis mille alusel? Hydrofoobsus võiks olla üks hüpotees.

Eesmärk Milline N-terminus on eelistatud? Millist N-terminust püütakse kindlasti vältida? Leida mingi töötav grupeerimismeetod, millega saaks leida uusi N-terminaalseid regulatoorseid peptiide (Taneli soov).

Nukleotiidide, koodonite ja aminohapete sageduste võrdlus A (ja U) nukleotiidide rohkus esimese 30 nukleotiidi seas A-d (ja U-d) sisaldavad koodonid N-terminuses eelistatud hüdrofiilsed aminohapped (Lys, Asn, Gln, Ser) Alaesindatud hüdrofoobsed (Ala, Gly, Leu, Val) Dipeptiidide sagedus Nukleotiidide eelistus A ja U suunas ühesugune nii kõigil geenidel kui kõrgelt ekspresseerunud geenidel. Vastavalt G ja C vähemeelistatus. See nähtub ka koodonkasutuses: On leitud, et E.coli valkude N-terminaalses otsas (positsioonides 2-10) esinevate aminohapete puhul on üleesindatud hüdrofiilsed aminohapped (Lys, Asn, Gln, Ser) ja alaesindatud hüdrofoobsed aminohapped (Ala, Gly, Leu, Val), sarnaselt Bacillus subtilis’ele. Hüdrofiilsete järjestuste üleesindatuse põhjuseks võib taas olla A-rikaste koodonite esindatus, sest koodonid A nukleotiidiga koodoni teises positsioonis kodeerivad just hüdrofiilseid järjestusi. Samas hüdrofiilsed aminohapped Ser ja Arg ei oma koodonite teises positsioonis A nukleotiidi ja ei ole A-rikkad, kuid on sellegipoolest üleesindatud. Uurisime ka dipeptiidide sagedust. Midagi huvitavat ei leidnud

Kõrgelt ekspresseerunud geenid Kõrgelt ekspresseerunud geenid. Wobble hypotees - Translatsioonil on vajalik täpne paardumine mRNA koodoni ja tRNA antikoodoni esimeses kahes positsioonis. Antikoodoni 5’ aluse ja koodoni 3’ aluse vahel võib esineda ka ebastandartset paardumist.

Et parem võrrelda, on siin toodud nukleotiidide sagedus E Et parem võrrelda, on siin toodud nukleotiidide sagedus E.coli kõigi geenide esimeses 15 positsioonis. Positsioon tähistab siin koodoni positsiooni geenis, mitte nukleotiidi positsiooni koodonis, st ma ei ole eraldi arvestanud seda, kas nukleotiid asub koodoni 1., 2. või 3. positsioonis, vaid lugenud nukleotiidid lihtsalt koodnis kokku.

Kõrgelt ekspresseerunud geenide graafikul me põhimõttelist erinevust ei näe. Graafik kõigub kyll rohkem, kuid see tuleneb ilmselt valimi väiksusest. Geeni alguses on aga ikkagi eelistatud A ja U nukleotiidid. Sealjuures A enim nagu ka kõigi geenide puhul oli näha.

3 AAG CUG AGA GGC ACA CCG AAA GCG AUA GUG 2 AAA CUG AGU GGC ACA GUG AAU GCC UCU GGU 4 UUA GCG AUA GGU ACA CUG AAA GGC AGA GUG 5 AUA GGC AGA GCG ACA GGU UUA CUG ACU CCG 6 AGA GGC AUU GCG UUA GUG AUA CCG ACA GGU 7 AUA GCG UUA GUG AGA GGC AGG CUG CUU GGG 8 UUA GCG AGA GGC ACA CCG AUA CAG CUU GAA 9 ACA GUG AGA GCG AUA UAC CUA GAG CUU GGC 10 AGG CCG AUA GAA UUA GAG CUU GCG ACA GUG Eelistatud on rohelised, alaesindatud punased. 5 rida, sest need kõige märkimisväärsema erinevusega eeldatavast esinemissagedusest. (Rida jätkub tegelikult sama loogikaga, et eelistatumad on A ja U rikkad ja välditakse G-d ja C-d sisaldavaid koodoneid). Alates 9. ja 10. positsioonist hakkavad sisse ilmuma ka juba A ja U ülekaaluga koodonid. Nt 9.positsioonis UAC välditutes ja 10.positsioonis GAA välditutes. Samas ka AGG 10.positsioonis eelistatuim.

3 Lys Gly Thr Ala Asn Val Gln Leu Ile Pro 2 Lys Gly Ser Val Asn Leu Tyr Asp 4 Lys Ala Ile Gly Ser Asp Asn Glu Phe Val 5 Ile Gly Thr Ala Lys Glu Phe Asp Asn 6 Ile Gly Lys Ala Thr Asp Leu Val Phe Glu 7 Ile Gly Leu Glu Lys Asp Ser Met Thr Ala 2. - 4. positsioonis väga suure ylekaaluga esimene lüsiin. Esineb ka teisi hydrofiilseid aminohappeid nagu Ser, Asn, Thr. Alates 5.positsioonist aga tõuseb esikohale isoleutsiin, mis on yks hydrofoobsemaid aminohappeid.??? Koodonite eelistuses on samuti 5.positsioonis eelistatuim koodon AUA isoleutsiini koodon. Nii et see võib olla tingitud hoopis nukleotiididest, eelistatakse A ja U rikkaid nukleotiide. Samas Lys pysib ka pidevalt esimese kolme seas. Ser ja Thr samuti. Ylekaalus paisatb olevat siiski hydrofiilsete aminohapete eelistus ja mitte-eelistatute esimese 5 seas on rohkem hydrofoobseid aminohappeid. 8 Leu Gly Ile Ala Arg Glu Lys TER Cys Met 9 Leu Glu Ile Tyr Ser TER Gly 10 Leu Glu Ser TER Asp

HMM kõrgelt ekspresseerunud valkudest Eraldi 25-st, 40-st ja 60-st kõrgelt ekspresseerunud valgust esimesed 12 aminohapet Otsingul nii kõrgelt ekspresseerunute eneste kui ka kogu genoomi vastu bioloogiliselt olulist tulemust ükski variant ei andnud (E väärtus liiga suur) Järelikult kindlalt konserveerunud mustrit pole. Uurimaks, kas esineb mingi konserveerunud aminohapete muster valgu alguses pyydsime teha HMM mudeli.

Hüdrofoobsusprofiilid Kyte-Doolittle skaala. Mida hüdrofoobsem, seda negatiivsem väärtus Esimesed 15 aminohapet N-terminusest Võrdlus teiste bakteritega Hydrofoobsusega ikka edasi.

Kyte Doolittle Hydrophilicities A -1,8 D 3,5 C -2,5 E F -2,8 G 0,4 I -4,5 H 3,2 L -3,8 K 3,9 M -1,9 N V -4,2 P 1,6 Q R 4,5 S 0,8 T 0,7 W 0,9 Y 1,3 Kyte Doolittle Hydrophilicities

Tekivad piigid. Negatiivsem on hüdrofoobsem. Kahene aken, ühese sammuga. (Kõik järgnevad graafikud samuti.)

Võrdlusena juhuslikult võetud sama arv valke. Sarnast joont ei teki.

Võrrelduna lisaks veel 60 kõrge CAI-ga valguga.

Võrdlus teiste bakteritega Kas eksisteerib laiemalt levinud mudel kõrgelt ekspresseerunud geenide N- terminuses? B. subtilis R. prowazekii M. tuberculosis H. influenzae H.pylori T.pallidum Koodonkasutus Aminohappekasutus Hüdrofoobsusprofiilid

Võrdlusena teiste bakteritega. Nendest on võetud E. coli 40 ortoloogid Võrdlusena teiste bakteritega. Nendest on võetud E.coli 40 ortoloogid. Esimene osa graafikust kõigil sarnane, hiljem enam mitte nii väga.

Kavas proovida: Hydrophobic profile clustering Pattern discovery without alignment TEIRESIAS

Hydrophobic profile clustering

Hydrophobic profile clustering

Väga kiire ja suudab töötada ka suurte andmehulkadega Väga kiire ja suudab töötada ka suurte andmehulkadega. Seetõttu on ka kasutatav mitmete bioloogiliste probleemide puhul, nagu näiteks seesama pattern discovery, dna tandeemsete korduste avastamine, geenide avastamine jne. lisaks ka mitte-bioloogilised probleemid. Input formaadiks on tavaline FASTA formaat. Outputis annab leitud mustrid ja järjestused, kust need leiti. Samuti võimaldab otsida SwissProt/trembl’ist teisi samasugust mustrit sisaldavaid järjestusi.

Kokkuvõte N-terminuses AT nukleotiidide rohkus Kõrge CAI-ga valkudel spetsiifiline hüdrofoobsusprofiil valgu esimestes positsioonides Esineb ka teistes bakterites

Viited Varshavsky, 1996 The N-end rule: Functions, mysteries, uses, Biochemistry, 93, 12142-12149 Sakai et al, 2000 Correlation Between Shine-Dalgarno Sequence Conservation and Codon Usage of Bacterial Genes, J. Mol. Evol., 52, 164-170 Stenström et al, 2000 Codon bias at the 3’-side of the initiation codon is correlated with translation initiation efficiency in Escherichia coli, Gene, 263, 273-284 Ohno et al, 2001 Preferential usage of some minor codons in bacteria, Gene, 276, 107-115 Karlin et al 1998 Codon usages in different gene classes of the Escherichia coli genome, Mol. Microbiol., 29, 1341-1355 Jansen et al 2003 Revisiting the codon adaptation index from a whole-genome perspective: analyzing the relationship between gene expression and codon occurrence in yeast using a variety of models, Nucl. Acid Res., 31, 2242-2251