Download presentation
Presentation is loading. Please wait.
1
3. Сравнение пространственных структур белков
2
Выравнивание последовательностей гомеодоменов Пример 1: гомеодомены
3
Совмещение полипептидных цепей гомеодоменов
4
Какая программа выравнивания не выдала бы такой результат! В структурном выравнивании три остатка сдвинуты к левому краю разрыва
5
Выравнивание мотивов A, B, C РНК- зависимых РНК-полимераз вирусов Мотив A Консервативные остатки: 2 из 39 (5%!) Пример 2: РНК-зависимые РНК-полимеразы вирусов
6
Мотив B Функционально консервативные остатки: 4 из 37 (10%)
7
Мотив С Консервативные остатки: 3 из 22 (14%)
8
Совмещение в пространстве мотивов A, B, C из полимераз 9 разных вирусов Мотив A Мотив C Мотив B Здесь расположен активный центр полимеразы
9
Геометрическое ядро этого семейства полимераз состоит из 58 C атомов в каждой из 9-и структур Критерий сходства – расстояния между любыми соответственными C отличаются не более чем на 2 ангстрема
10
Геометрическое ядро семейства структур (Gerstein, 1995; I.Gelfand&Kister, 1998) Совокупность участков полипептидной цепи родственных белков (или комплексов макромолекул), с высокой точностью одинаково расположенных во всех представителях семейства структур Англ.: geometrical core, structure core
11
Сходство всех этих полимераз продолжается на большую часть глобулы, хотя и без совпадения остовов цепей в пространстве Fingers Palm Thumb Template RNA Product RNA NTP “Дополнительные” фрагменты цепи некоторых полимераз не показаны
12
Метод сравнения формы белков, структуры которых удалось совместить RASMOL: Select *B and not within(5.0, *A) Save selected file_B # Select *A and not within(5.0, *B) Save selected file_A Потом (1) Найти какие остатки цепи A (соотв. B) “дополнительные” (2) Охарактеризовать объемы дополнительных частей (например, в числе атомов)
13
В родстве со всем, что есть, уверясь И знаясь с будущим в быту, Нельзя не впасть к концу, как в ересь, В неслыханную простоту. Но мы пощажены не будем, Когда ее не утаим. Она всего нужнее людям, Но сложное понятней им. Б. Пастернак
14
Фрагмент выравнивания (по Xu et al., 2003) Функционально консервативные остатки: 13 из 150 (8%)
15
Продолжение Функционально консервативные остатки: 5 из 140 (4%)
16
Выводы Консервативные по последовательности участки полипептидной цепи сохраняют взаимное расположение в структурах белков Даже слабая, но правильная, консервативность свидетельствует в пользу сходства структур
17
Пространственная структура остова полипептидной цепи консервативнее последовательности! Почему в эволюции с точностью в 1-2 ангстрема поддерживается пространственное расположение остова полипептидной цепи при том, что аминокислотные остатки в тех же самых участках заменяются???
18
Токарный станок – это фермент, катализирующий реакцию превращения заготовки в деталь, имеющую цилиндрическую, коническую или любую форму тела вращения 3 м 3 см
19
Станина остается неизменной!
20
Рост числа расшифрованных структур белков (PDB)
21
Сравнение 3D структур необходимо для - моделирования, - предсказания функции, - изучения эволюции белков Главный ( и почти единственный широко распространенный ) метод сравнения структур – выравнивание полипептидных цепей в пространстве
22
Постановки задачи пространственного выравнивания Алгоритмы
23
Пространственное выравнивание структур белков по C α атомам: белки рассматриваются как “твердое тело”
24
1. Парное выравнивание: Даны две структуры. Найти их наилучшее пространственной выравнивание 2. Поиск в БД: Дана структура. В банке данных (например, PDB) найти все похожие. 3. Множественное выравнивание: Даны n структур родственных (или не очень) белков (доменов). Найти наилучшее пространственное выравнивание всех вместе
25
В задачах пространственного выравнивания есть варианты постановки A.При заданном (частичном!) выравнивании последовательностей. B.Без заданного выравнивания последовательностей
26
Задача 1A (парное выравнивание) Дано: –n точек в пространстве A 1, …, A n - центры C атомов из выровненных остатков 1-й структуры –n точек в пространстве B 1, …, B n - центры C атомов из выровненных остатков 2-й структуры A1A1 A2A2 A3A3 A4A4 A5A5 B1B1 B3B3 B1B1 B4B4 B5B5 B2B2 Структура A Структура B
27
Найти: Наилучшее относительно некоторого параметра (A,B) совмещение Минимальное значение min (A,B) A1A1 A2A2 A3A3 A4A4 A5A5 B1B1 B3B3 B4B4 B5B5 B2B2
28
Параметр сходства (A,B) Среднее квадратичное расстояние: – Обе структуры помещены в одно пространство (можно воображать, что в один PDB файл) – (A,B)=sqrt(Σ i расст.(A i,B i ) 2 ) Английская аббревиатура: rmsd – root mean square deviation –Чем меньше (A,B), тем лучше структуры совмещены в пространстве
29
Другие меры сходства Максимальное расстояние: –Обе структуры поме щены в одно пространство ∞ (A,B)=max(расст.(A i,B i ))
30
Пара точек Расстоян ие между ними A 1,B 1 100 A 2,B 2 100 A 3,B 3 100 A 4,B 4 100 A 5,B 5 100 A 6,B 6 100 A 7,B 7 110 A 8,B 8 110 A 9,B 9 110 A 10,B 10 1110 10.63.2 ∞∞ 1110 Сравнение двух мер сходства
31
Выравнивание без совмещения: сравнение матриц расстояний между C α атомами Матрица расстояний между C α атомами в структуре A A 1234567 10346743 23023543 34202643 46320333 57563034 64443302 73333420 Полипептидная цепь
32
Если две матрицы расстояний совпадают, то соответствующие им конфигурации атомов могут быть совмещены движением пространства ( сохраняющим или не сохраняющим ориентацию) Если элементы двух матриц различаются не на много, то конфигурации хорошо совмещаются в пространстве
33
Задача 1A для rmsd эффективно решается итеративными процедурами (функция “Fit by selection” в SwissPDBviewer'е) Sippl&Stegbuchner, 1991: (1) Переместить “центры тяжести” и A, и B в начало координат (2) Подобрать поворот B вокруг оси X, минимизирующий (A,B) (угол вращения φ n вычисляется - выводится формула) (3) -- '' -- '' -- '' -- '' -- '' -- '' -- '' -- '' -- '' -- Y -- '' -- ψ n (4) -- '' -- '' -- '' -- '' -- '' -- '' -- '' -- '' -- '' -- Z -- '' -- ω n (5) Если φ n, ψ n, ω n < заданного порога δ, то остановка; иначе повторить (2) – (4)
34
1B. Пространственное выравнивание 2х структур без заданного выравнивания последовательностей Для данного порога d найти подмножество A={A 1, …, A n } C α атомов первой структуры и подмножество B={B 1, …, B n } C α атомов такие, что (A,B)< d ( какая-либо из мер сходства) (2) A 1, …, A n соблюдают порядок вдоль полипептидной цепи, возможно, с разрывами любой длины (3) B 1, …, B n соблюдают порядок вдоль полипептидной цепи, возможно, с разрывами любой длины (4) число n выбранных атомов максимально возможное
35
Не существует эффективных алгоритмов, гарантирующих точное решение задачи. Задача вычислительно сложная! Все предложенные эффективные алгоритмы основаны на эвристиках. В “простых” случаях дают правильный ответ, в более сложных – могут ошибаться.
36
Несколько работоспособных сервисов DALI server (алгоритм DALI, Holm, Sander, 1993) http://www.ebi.ac.uk/dali/index.html http://www.ebi.ac.uk/dali/index.html MultiProt –( алгоритм MUSTA, Leibowits, Nussinov, Wolfson, 2001) http://bioinfo3d.cs.tau.ac.il/ http://bioinfo3d.cs.tau.ac.il/ VAST (NCBI) MSD http://www.ebi.ac.uk/msd-srv/ssm http://www.ebi.ac.uk/msd-srv/ssm CE (Shindyanov&Bourne, 1998) http://cl.sdsc.edu/ce.html. http://cl.sdsc.edu/ce.html SARF (Spatial ARangement of backbone Fragments, Alexandrov, 1996) http://123d.ncifcrf.gov/ http://123d.ncifcrf.gov/
37
Алгоритм DALI (L.Holm&C.Sander) 1.Мера сходства двух сопоставленных наборов атомов A=(A 1, …, A n ) и B=(B 1, …, B n ): 1)Обозначения: d A i,j - расстояние между атомами A i и A j из структуры A d B i,j - расстояние между атомами B i и B j из структуры B
38
2)Модуль разности | d A i,j - d B i,j | определяет вес сходства для данной пары пар атомов: i,j = F(| d A i,j - d B i,j |) где F(x) – функция, определенная ниже 3)Чего хотим от i,j : 1.Чем больше i,j, тем более похожи структуры (по аналогии с весом – score – выравнивания последовательностей) 2.Разность расстояний измеряется в процентах, а не в абсолютных величинах 3.Значимость различий быстро убывает с расстоянием
39
(i,j) = | d A ij – d B ij | E d * ij w(d * ij ) E - 4) Реализация – elastic similarity score: E =0.2 ( по умолчанию) w(r) = exp(-r 2 / 2 ) где d * ij = среднее арифметическое d A ij и d B ij
40
2.Алгоритм. Шаг 1 – отбор сходных пар гексапептидов – начальных данных для пространственного выравнивания Пара гексапептидов (A’,A’’) в структуре A и сходная пара гексапептидов (B’,B’’) в структуре B B’’ A’’ i’ i+1 i+2 i+3i+4 i+5 j j+2 j+1 j’+5 j+4 j+3 i i’+1 i’+4 i’+5 j’ j’+2 j’+1 j+5 j+4 j’+3 i’+2 i’+3 A’ B’ Структура AСтруктура B
41
.123456...1 1212 1313 1414 1515 1616....0 10+++++XXXXXX 20++++XXXXXX 30+++XXXXXX 40++XXXXXX 50+XXXXXX 60XXXXXX.0.0.0 110+++++ 120++++ 130+++ 140++ 150+ 160.0.0.0 Матрица для пары гексапептидов извлекается из полной матрицы расстояний
42
1)Перебор гексапептидов в каждой структуре: 1.Пары гексапептидов, принадлежащих одной и той же паре элементов вторичной структуры, объединяются. Из них выбирается одна пара – та, для которой среднее расстояние между гексапептидами минимально. 2.Пары со средним расстоянием между гексапептидами более 25 ангстрем не рассматриваются 3.Пары упорядочиваются по среднему расстоянию между гексапептидами
43
2)Отбор пар сходных пар гексапептидов При сравнении пар гексапептидов из разных структур используются методы быстрой фильтрации непохожих пар: – по различию средних расстояний между гексапептидами; – по различию сумм матричных элементов по строкам (столбцам )
44
3) Завершение списка пар сходных пар 1.Порядок рассмотрения пар гексапептидов – по среднему расстоянию между ними, от пар с меньшим расстоянием к парам с большим. 2.Список сходных пар гексапептидов закрывается если либо (1) среднее расстояние между парами гексапептидов превышает 25 ангстрем либо (2) список достигает 80 000 пар сходных гексапептидов Не более 40 000 пар пар с лучшим весом S отправляются на следующий шаг – построение выравнивания
45
3.Отбор зародышей выравнивания – троек гексапептидов 1)Если –(A’, A’’) сходна с (B’,B’’) –(A’’, A’’’) сходна с (B’’,B’’’) –(A’’’, A’) сходна с (B’’’,B’) и гексапептиды A’, A’’, A’’’ (соотв., B’, B’’, B’’’) не пересекаются, то вычисляется сходство S наборов (A’,A’’, A’’’) с (B’, B’’, B’’’) 2)При достаточном сходстве эти наборы считаются зародышем пространственного выравнивания 3)Список зародышей ограничен числом 100
46
4.Каждый зародыш дает начало траектории наращивания выравнивания (A i, B i ), i=1,2,… 1)Обозначим зародыш (A’, A’’, A’’’; B’, B’’, B’’’) через (A 0, B 0 ) 2)(A i+1, B i+1 ) строится из (A i, B i ) добавлением одной из пар гексапептидов (ПГ), пересекающейся с (A i+1, B i+1 ) –ПГ выбирается случайно, с вероятностью p, зависящей от того, насколько сходство S’ нового выравнивания больше сходства S выравнивания (A i, B i ). Есть ненулевая вероятность выбрать худшее сходство! 3)На 1м и каждом 5м шагу происходит ревизия выравнивания (A i, B i ) – удаляются тетрапептиды, дающие отрицательный вклад в сходство 4)Траектория останавливается после того, как сходство перестает растит за 20 последних шагов
47
5.Фильтр траекторий Все траектории продолжаются параллельно. Траектория отбрасывается, если Сходство выравнивания существенно отстает от сходства для лидирующей траектории Выравнивание пересекается более, чем на 80% с выравниванием с лучшим сходство на другой траектории
48
6.Оптимизация лучшей траектории после завершения всех траекторий 1)10 раз удаляются из выравнивания случайно выбранные 30% тетрапептидов 2)Получившиеся 10 выравниваний наращиваются по тому же алгоритму 3)Выравнивание с лучшим сходством оставляется
49
7.Результат 1)Лучшее структурное выравнивание, число структурно сопоставленных остатков, Z-score 2)Альтернативные структурные выравнивания Для каждого выравнивания можно -совместить полипептидные цепи при данном выравнивании -визуально убедиться в его правильности - рассчитать rmsd по сопоставленным C
Similar presentations
© 2025 SlidePlayer.com. Inc.
All rights reserved.