Allineamenti Multipli Problema Durante l’evoluzione i residui importanti per il mantenimento della struttura e della funzione sono conservati. Come riconoscere.

Slides:



Advertisements
Similar presentations
Una didattica inclusiva Alunni stranieri ad alto potenziale cognitivo (GATE, febbraio 2015)
Advertisements

PROVINCIA DI FIRENZE Servizio di preselezione on line all’interno dei Servizi per l’Impiego della Provincia di Firenze.
Lo scenario Cresce l’occupazione femminile, non cambia lo svantaggio delle donne: nelle opportunità, nella retribuzione, nella carriera… Continua la resistenza.
La Genetica La scienza dell’ereditarietà. La Genetica In che modo il patrimonio genetico è trasmesso alle nuove cellule che devono sostituire quelle che.
Ontologie.. 1. cose del mondo esterno 2. rappresentazioni 3. pensieri G. Frege, Der Gedanke. Eine logische Untersuchung, 1918 “i pensieri non sono né.
MEMBRANA PLASMATICA - MEMBRANE DEGLI ORGANELLI COMPOSIZIONE: bistrato fosfolipidico contenente enzimi, recettori, antigeni; proteine integrali ed estrinseche.
Cloud informatica V anno. Sistemi informativi e basi di dati.
Manifestazione LOGO Concorso per la produzione di loghi per le Pari Opportunità e Forum dei Giovani. ISTITUTO COMPRENSIVO STATALE MORO-PASCOLI CASAGIOVE.
Corso di Laurea in Informatica Architettura degli elaboratori a.a Programmazione Assembly: procedure (2) Convenzioni di uso dei registri Utilizzo.
1 Attività materiali IAS 16, 23 e 40 1 Prof. Fabrizio Di Lazzaro Ordinario di Economia Aziendale Università “Luiss Guido Carli” LUISS Guido Carli AA 2012/2013.
Torino, 24 maggio 2006 L’Arte dell’Innovazione Tecnologica Moreno Tartaglini Manager of Printing Systems Division – Italia Guarene, 24 maggio 2006.
Advanced Encryption Standard & Steganografia Docente: Prof. Mastronardi Giuseppe Sicurezza dei Sistemi Informatici.
È un organo di senso con 2 funzioni: - percepire i suoni; - raccogliere informazioni riguardo ai movimenti per farci mantenere l’equilibrio. È diviso.
Copyright © 2013 Pearson Italia Microeconomia Pindyck/Rubinfeld, ottava edizione 1 di 40.
Convegno “Linee guida progettuali e Strumenti normativi per le politiche di conciliazione vita lavoro Lecce, 22 marzo 2006.
Gli insiemi N e Z I numeri naturali sono quelli che formano l’elenco illimitato e a tutti noto I numeri naturali ….. L’insieme N si può.
CORSO MEDICINA LA SAPIENZA agosto 2014 CHIMICA AMMISSIONE PROF. MARIA VITTORIA BARBARULO © 2014 Prof. Maria Vittoria Barbarulo Liceo Classico Montale.
LE CASETTE DA GIARDINO DI CASETTE ITALIA CASETTE DA GIARDINO IN PVC - PLASTICA Casette Italia, Casette Italia, da 10 anni sul mercato italiano, propone.
4. Codifica binaria dell’informazione Informatica - CDL in Ingegneria Industriale- A.A Ing. Simona Colucci.
© 2016 Giorgio Porcu - Aggiornamennto 19/04/2016 I STITUTO T ECNICO SECONDO BIENNIO T ECNOLOGIE E P ROGETTAZIONE Il Sistema Operativo Concetti di Base.
Giuseppe Pelagatti 8 giugno 2011 Il modello GeoUML e gli strumenti Catalogue e Validator nell’Interscambio tra DBTL e DBTR.
IL PARLAMENTO.  Il Parlamento della Repubblica Italiana è l'organo costituzionale che, all'interno del sistema politico italiano, è titolare della funzione.
SAMUEL BECKETT – PETER HANDKE Relazione tra il Teatro dell’Assurdo e il teatro di Handke CANDIDA MASTROPAOLO.
Le leggi dell’ereditarietà. Geni e alleli Le particelle responsabili dei caratteri ereditari sono come gli anelli di una catena e si trovano sui cromosomi.
Lezione n° 4 - Problemi di Programmazione Matematica - Problemi Lineari e Problemi Lineari Interi - Forma Canonica. Forma Standard Prof. Cerulli – Dott.
Elementi di logica matematica. Prof. Ugo Morra Programma Operativo Nazionale Scuola “Competenze per lo sviluppo” Fondo sociale europeo 2009/2010 Liceo.
TESI ALL ESTERO. Le borse di studio per tesi di laurea all’estero sono benefici economici che Sapienza mette a disposizione degli studenti iscritti ai.
2 | La dialettica dai filosofi greci a Hegel I termini dialogo e dialettica sono connessi tra loro e derivano dalla combinazione di due parole greche.
In molti sistemi laser si riesce ad ottenere una amplificazione nel mezzo attivo di solo qualche % per metro. Per evitare l’uso di un mezzo attivo di molti.
31/05/2016III Modulo di Fisica Applicata - Carlo Altucci - a.a Lezione 4: l’OSCILLOSCOPIO.
STATI DI AGGREGAZIONE DELLA MATERIA. Gli aspetti macroscopico, microscopico e particellare della materia La materia è tutto ciò che possiede una massa.
DISCIPLINE INFERMIERISTICHE 2 MED/45 Scienze Infermieristiche generali, cliniche e pediatriche  Obiettivi generali L’insegnamento ha lo scopo di fornire.
Laboratorio biologia Marcello Sala IL CORALLO DELLA VITA.
Un uomo chiede il divorzio dalla moglie accusandola d’infedeltà. Il primo e il secondo figlio sono di gruppo O e AB rispettivamente. Il terzo figlio,
MODULI FORMATIVI 2015 questionario di soddisfazione studenti.
Cinetica chimica E’ la disciplina che studia la velocità e il meccanismo delle reazioni chimiche Dalle caratteristiche termodinamiche dei reagenti e dei.
Visita alla fattoria Attività integrativa al progetto di Educazione Alimentare Scuola Primaria di Ossimo Superiore, Classi I, II, III, IV, V.
STORIA (classe 4^ B Fontanarossa) CIVILTA’: significato del concetto attraverso l’ acrostico della parola Con Intelligenza Viveva Imparando L’ uomo Tanti.
Tu, chi dici che io sia? Dalla risposta dipendono: l'orientamento della vita, le scelte di ogni giorno, la pace del cuore, il nostro destino eterno.
1 Le semplificazioni amministrative Alessandro Natalini.
MAESTRA….MA QUESTA LIM E’ LA LIMOUSINE DELLE LAVAGNE!!! Thomas, 7 anni, classe 2B.
Testo di Loreta Gregorutti Disegni by Edo A cura di
1 Corso di Pianificazione e Controllo Gestionale Livelli e obiettivi di pianificazione e controllo Livelli e obiettivi di pianificazione e controllo Lezione.
1 Studente: Lafronza Luciano Tutor aziendale: Lumini Rossella RICERCA E SINTESI SENTENZE.
Nuove tendenze nella psicologia odierna A cura di Eleonora Bilotta.
Concetti di base Modulo B.2. Dati B.2.1 Qualsiasi applicazione informatica gestisce ed elabora dati Dati interni (risultato di una elaborazione) I/O da.
S ERVIZIO F ORMAZIONE, A LTA F ORMAZIONE E F INANZIAMENTI E STERNI D. Ferrucci e G. Leoni ISTRUZIONI PER L’USO COME INSERIRE PROPOSTE di CORSI NEL DATABASE.
 Il termine Trojan è da attribuirsi al cavallo di troia, che nasconde il suo vero fine ovvero quello di indurre l’utente a eseguire il programma. In.
Management e Certificazione della Qualità Prof. Alessandro Ruggieri.
I BAMBINI DISABILI E L’ASSISTENZA DOMICILIARE. Carta per i diritti dell’infanzia e dell’adolescenza Art.6 Tutti dovrebbero riconoscere che hai IL DIRITTO.
Meccanismo d’azione MITOSI - MEIOSI. I protagonisti I protagonisti DNA cromosoma centrioli Fuso mitotico Cromosomi in fase di spiralizzazione cromatina.
21-1 Schema della lezione 1) Condurre una Conjoint Analysis i.Formulare il problema ii.Costruire gli stimoli iii.Decidere la forma dei dati di input iv.Selezionare.
Incontro con i pendolari e le associazioni dei consumatori Prato 15 giugno Nuovo contratto di servizio Regione Toscana - Trenitalia Incontro con.
ITS Luca Pacioli Progetto “1x1” Un computer per ogni studente Progetto “Eppur si muove” Didattica Laboratoriale Nuvola su Google Apps - ITS Luca Pacioli.
Presentazione dati “Questionario mobilità Bologna" 02/02/201 6.
+ Gestire la persistenza Nicolò Sordoni. + Meccanismi di persistenza dei dati In Windows Phone, come negli altri ambienti, abbiamo tre soluzioni principali.
Controllo di batterie in economia #Wire15 Workshop Impresa, Ricerca, Economia Dr Francesco Frau
Identità ed equazioni DEFINIZIONE. Si dice identità un’uguaglianza di due espressioni (di cui almeno una letterale) che è verificata da qualunque valore.
Paolo Pistarà Principi di Chimica Moderna © Istituto Italiano Edizioni Atlas 2012 Copertina 1.
Laboratorio 2 A cura di … (Lombardia Informatica) Mercoledì 1 giugno 2011Milano, Direzione/Ruolo Area Sistemi Terrioriali/Project Leader Servizi locali.
WORLD FAMILY of RADIO MARIA MARIATHON MONDIALE Found Raising Department World Family of Radio Maria World Family of Radio Maria - Via Mazzini n
CLUB ALPINO ITALIANO OTTO TAM EMILIA ROMAGNA - Bosco Chiesanuova(VR) : 4-5 ottobre 2014 Agricoltura & Montagna - Realizzazione Ricerca e Documentario Voci.
Norma e normalità nei Disability Studies
LA POLITICA DELLA CONCORRENZA. Che cos’è? La politica della concorrenza rappresenta la politica comunitaria volta a realizzare nel mercato comune una.
In un’economia di mercato:
Corso di Radioastronomia AA. 2010/2011 (Andrea Tarchi; Tel ) MASER I MASER Microwave Amplification by.
MITOCONDRI E CLOROPLASTI HANNO PIU’ MEMBRANE
29/06/2016 Servizi Postali01/03/ Focus Raccomandata1 Presentazione alle OOSS Milano 22 / 03 / 2011.
1 IL RIVENDITORE DEL FUTURO O PEN S OURCE M ANAGEMENT.
Un uomo aveva quattro figli. Egli desiderava che i suoi figli imparassero a non giudicare le cose in fretta, per questo, invitò ognuno di loro a fare.
Presentation transcript:

Allineamenti Multipli Problema Durante l’evoluzione i residui importanti per il mantenimento della struttura e della funzione sono conservati. Come riconoscere questi residui? In un allineamento di due proteine simili la maggior parte dei residui è rimasta invariata e quindi non è possibile distinguere i residui funzionali da quelli conservati per ragioni casuali. Proteine molto lontane dal punto di vista evolutivo sono difficili da allineare e quindi è elevato il rischio di non allineare residui conservati.

Allineamenti Multipli Soluzione Allineare non solo due sequenze omologhe ma quante più sequenze possibili in modo da creare un allineamento multiplo. Le colonne contenenti residui conservati in tutte o in molte delle proteine dell’allineamento indicheranno i residui strutturalmente e/o funzionalmente importanti. Un allineamento multiplo rappresenta anche un buon metodo per ottimizzare un allineamento a coppia fra due sequenze molto distanti. Infatti le sequenze intermedie faranno da guida nell’allineamento delle sequenze più distanti. Sequenze A e B = 25% id  allineamento difficile Sequenze A e C = 50% id  allineamento semplice Sequenze B e C = 50% id  allineamento semplice Soluzione: allineare A + C e B + C, quindi usare C come guida

SBL-C QNWATFQQKHIINTPIINCNTIMDNNIYIVGGQCKRVNTFIISSATTVKAICTGV-INMN 59 RC208 QNWATFQQKHITNTSSINCNTIMDNNIYIVGGQCKGVNTFIISSATTVKAICTGV-INMN 59 RC218 QNWATFQEQHITNTSSINCSNIMNNSLYIVGGQCKKVNTFIASSATTVKGICSGV-TDKK 59 RC212 QNWATFQQKHITNTSSINCSNIMNNSLYIVGGQCKKVNTFIASSATTVKGICSGV-TDKK 59 SBL-J QNWAKFQEKHIPNTSNINCNTIMDKSIYIVGGQCKERNTFIISSATTVKAICSGASTNRN 60 RC-RNASEL1 QNWAKFKEKHITSTSSIDCNTIMDKAIYIVGGKCKERNTFIISSEDNVKAICSGVSPDRK 60 ONC QDWLTFQKKHITNTRDVDCDNIMSTNLF----HCKDKNTFIYSRPEPVKAICKGIIASKN 56 ONC-LR1 QDWLTFQKKHLTNTRDVDCNNIMSTNLF----HCKDKNTFIYSRPEPVKAICKGIIASKN 56 RC-RNASE6 QDWDTFQKKHLTDTKKVKCDVEMKKALF----DCKKTNTFIFARPPRVQALCKNIKDNTN 56 RC-RNASE3 QDWETFQKKHLTDTKKVKCDVEMAKALF----DCKKTNTFIYALPGRVKALCKNIRDNTD 56 RC-RNASE2 QNWETFQKKHLTDTRDVKCDAEMKKALF----DCKQKNTFIYARPGRVQALCKNIIVSKN 56 RC-RNASE4 QDWATFKKKHLTDTWDVDCDNLMPTSLF----DCKDKNTFIYSLPGPVKALCRGVIFSAD 56 * *.*:::*:.* :.*. *. ::.** **** *:.:*... SBL-C VLSTTRFQLNTCTRTSITPRPCPYSSRTETNYICVKCENQYPVHFAGIGRCP 111 RC208 VLSTTRFQLNTCTRTSITPRPCPYSSRTENNYICVKCENQYPVHFAGIGRCP 111 RC218 VLSSTKFQLDICTRIFITPRPCPYSSRTETNYICVKCENQYPVHFAGIGQCP 111 RC212 VLSSTKFQLDICTRIFITPRPCPYSSRTETNYICVKCENQYPVHFAGIGQCP 111 SBL-J VLSTTRFQLNTCIRSATAPRPCPYNSRTETNVICVKCENRLPVHFAGIGRC- 111 RC-RNASEL1 ELSTTSFKLNTCIRDSITPRPCPYHPSPDNNKICVKCEKQLPVHFVGIGKC- 111 ONC VLTTSEFYLSDCNVT---SRPCKYKLKKSTNKFCVTCENQAPVHFVGVGSC- 104 ONC-LR1 VLTTSEFYLSDCNVT---SRPCKYKLKKSTNTFCVTCENQAPVHFVGVGHC- 104 RC-RNASE6 VLSRDVFYLPQCNRK---KLPCHYRLDGSTNTICLTCMKELPIHFAGVGKCP 105 RC-RNASE3 VLSRDAFLLPQCDRI---KLPCHYKLSSSTNTICITCVNQLPIHFAGVGSCP 105 RC-RNASE2 VLSTDEFYLSDCNRI---KLPCHYKLKKSSNTICITCENKLPVHFVAVEECP 105 RC-RNASE4 VLSNSEFYLAECNVKP--RKPCKYKLKKSSNRICIRCEHELPVHFAGVGICP 106 *: * * ** *..* :*: * :. *:**..: *

Esistono numerosi programmi per la visualizzazione e anche la modifica manuale degli allineamenti multipli (ottimizzazione manuale). Due molto usati sono: GeneDoc SeaView ftp://biom3.univ-lyon1.fr/pub/mol_phylogeny/seaview

Creazione di Allineamenti Multipli Gli algoritmi esatti per la creazione di allineamenti a coppie potrebbero in teoria essere usati anche per la creazione di allineamenti multipli tuttavia i tempi di calcolo sarebbero enormi: Se L è la lunghezza delle sequenze e N il numero di sequenze da allineare l’ordine delle operazioni è O (L N ) Il numero di operazioni cresce ESPONENZIALMENTE con il numero delle sequenze!

Creazione di Allineamenti Multipli Pertanto gli allineamenti multipli vengono creati attraverso una strategia semplificata che consiste nell’allineare prima coppie di sequenze molto simili e poi “fissare” questi allineamenti e allinearli tra loro. La prima operazione è generare tutti i possibili allineamenti a coppie per trovare le sequenze più simili tra loro. Se N è il numero di sequenze il numero di allineamenti a coppie da calcolare è [N*(N-1)]/2

Creazione di Allineamenti Multipli Le percentuali di differenze di ciascuna coppia di sequenze vengono utilizzate per creare una matrice di differenze fra le sequenze. La matrice viene utilizzata per creare un albero guida i cui rami hanno lunghezza proporzionale alle differenze fra le sequenze matrice di differenze albero guida

Sulla base dell’albero guida verranno prima allineate le sequenze 1-2 e le sequenze 3-4. Quindi il “cluster” 1-2 verrà allineato al “cluster” 3-4. Infine il “cluster” verrà allineato alla sequenza 5.

“cluster” 1-2 “cluster” 3-4

“cluster”

Aggiungere una sequenza ad un allineamento multiplo L’aggiunta di una sequenza ad un allineamento multiplo o l’allineamento fra due cluster di allineamento si effettua in maniera simile ad un semplice allineamento a coppie creando una matrice bidimensionale che però stavolta riporterà in orizzontale le posizioni dell’allineamento multiplo e in verticale la sequenza da aggiungere o il secondo allineamento. Ad esempio allineamo la sequenza AGRSGS all’allineamento ASDKL VSERF

AVAV SSSS DEDE KRKR LFLF A 0.5*(2+0) G R S G S Score = [Score(A,A) + Score(A,V)] 2 Lo score assegnato a ciascuna casella è la media degli score per tutti i possibili accoppiamenti!

AVAV SSSS DEDE KRKR LFLF A 0.5*(2+0)0.5*(1+1)0.5*(0+0)0.5*(-1-2)0.5*(-2-4) G 0.5*(1-1)0.5*(1+1)0.5*(1+0)0.5*(-2-3)0.5*(-4-5) R S G S Score = [Score(A,A) + Score(A,V)] 2 Lo score assegnato a ciascuna casella è la media degli score per tutti i possibili accoppiamenti!

AVAV SSSS DEDE KRKR LFLF A I ( ) 4 G R K S G A S T Score = [Score(A,A) + Score(A,V) + Score(I,A) + Score(I,V) ] 4 Lo score assegnato a ciascuna casella è la media degli score per tutti i possibili accoppiamenti!

Esistono vari programmi per la costruzione degli allineamenti multipli. Due molto usati sono: ClustalW (aggiunge anche nuove sequenze ad allineamenti preesistenti) MSA (multiple sequence alignment)

Da un allineamento multiplo si possono ricavare “sequenze consensus” e “profili”: *** la sequenza consensus di un allineamento multiplo riporta per ciascuna posizione l’amminoacido che ricorre più frequentemente di una certa frequenza soglia (ad esempio 60%). Se nessun amminoacido è presente in una percentuale superiore alla soglia viene aggiunto il carattere “X” o un vuoto. (a volte si usa il carattere maiuscolo se un aa è presente oltre una percentuale m% e il carattere minuscolo se l’aa è presente oltre una percentuale n% minore di m%) *** Un profilo al contrario è un “modello probabilistico” che per ogni posizione riporta la probabilità che sia presente ognuno dei 20 amminoacidi o anche un gap.

I profili più usati sono generati tramite i cosiddetti “Hidden Markov Models” (HMM) che sono funzioni probabilistiche che non solo consentono di associare una probabilità ad ogni singola posizione ma consentono di dare valori differenti di probabilità ad una posizione a seconda dei residui (o nucleotidi) presenti nelle altre posizioni dell’allineamento. Ad esempio un HMM può specificare che in posizione 124 dell’allineamento è più comune Arg se nelle posizioni 122 e 123 ci sono Gly, Ala o Ser mentre l’amminoacido più probabile in 124 è Trp se in posizioni 122 e 123 ci sono Val, Leu, Ile, Met. Gli HMM non solo consentono di creare profili da allineamenti multipli ricchi di informazioni su come cambiano i residui dell’allineamento ma consentono anche di cercare proteine in una banca dati che rispondono ai requisiti di un particolare HMM e quindi potrebbero far parte di un’unica famiglia di proteine omologhe (un meccanismo simile è utilizzato da PSI-Blast)

I “Sequence Logo” sono una rappresentazione grafica di un allineamento multiplo di proteine o nucleotidi. In un “logo” i residui o le basi presenti in ciascuna posizione dell’allineamento sono riportati con caratteri di altezza proporzionale alla loro frequenza nell’allineamento. Le posizioni più conservate sono globalmente più “alte” di quelle meno conservate.

Sequenza consensus del “ribosomal binding site” (RBS) di E. coli Start Codon

Tutti i “logo” mostrati sono stati creati con il programma WebLogo accessibile al sito: