Домены Определения Методы разделения структуры на домены Классификации.

Slides:



Advertisements
Similar presentations
C A T H C A T H lass rchitecture opology or Fold Group
Advertisements

Филогенетические деревья Что это такое Общий план действий Программы, которые строят деревья The time will come, I believe, though I shall not live to.
Компьютерный анализ белковой последовательности Анализируют только аминокислотную последовательность белка, пренебрегают взаимодействием между боковыми.
Деревья (trees) «…великое Дерево Жизни заполняет земную кору своими мертвыми и сломанными ветвями и покрывает поверхность вечно ветвящимися и прекрасными.
Сравнительный анализ пространственных структур белков 3. Поверхность белка: визуализация, вычисление площади, сравнение участков поверхности.
Схема распределения грантов городам-участникам программы Тасис (TCAS) Экологические гранты для муниципалитетов.
Расторгуев А.C., 545 группа Научный руководитель: Пименов А.А. Рецензент: ст. преп. Смирнова Е.А.
Системы отбора. Условные обозначения (1) (2) (3) (4) (5) (6) (7) Математическое моделирование процессов отбора2.
Елена Станиславовна Петрова Учитель-логопед высшей категории ГДОУ детский сад №47 комбинированного вида Фрунзенского района г. Санкт-Петербурга 2011 год.
Грековой Марии. Играет важную роль в формулировке современных теорий. Некоторые симметрии в современной физике считаются точными, другие — лишь приближёнными.
Веремьёва Е. И.. Радиобиология — это самостоятельная комплексная, фундаментальная наука, состоящая из многих научных направлений, изучающая действие ионизирующих.
R1R2R3R4R5R6R7R1R2R3R4R5R6R7. Аксиома R 1. В пространстве существуют плоскости. В каждой плоскости пространства выполняются все аксиомы планиметрии.
Можно выделить два подхода, на основе которых производится выбор посредника: 1.Аналитический, предполагающий осуществление выбора с использованием формул,
Некомпенсаторное агрегирование и рейтингование студентов Авторы: Гончаров Алексей Александрович, Чистяков Вячеслав Васильевич. НФ ГУ ВШЭ 2010 год.
Всевоволод Головизнин, MVC – паттерн проектирование, в котором бизнес - логика, управляющая логика и интерфейс разделены на три отдельных компонента.
Стресс и здоровье Презентация Нефёдовой Евгении Николаевны, классного руководителя 9 «Б» класса МОУ СОШ № 30 города Энгельса Саратовской области 2010 год.
Определение необходимого уровня запасов на складе.
АВДАШЕВА СВЕТЛАНА КАФЕДРА ЭКОНОМИЧЕСКОГО АНАЛИЗА ОРГАНИЗАЦИЙ И РЫНКОВ 2011/2012 УЧЕБНЫЙ ГОД Теория отраслевых рынков (по выбору для 3 курса факультета.
Учитель математики Кулакова Т.М. МОУ ООШ №15 г.о Новокуйбышевск Самарской области Сентябрь 2011г.
Что за хулиган толкает пассажиров автобуса то вперед, то назад? Этот хулиган, вернее, хулиганка -
Функции II. Классификация. Зачем? А.Б.Рахманинова (6 марта 2006 г.)
Частное равновесие на конкурентном рынке Частное равновесие: последствия государственного регулирования конкурентного рынка Распределение налогового бремени.
ООП Классы – 2. Ссылки Ссылка – еще одно имя объекта. Используйте ссылки вместо указателя. Это более безопасно. Complex c(10,10); Complex c2& = c; c2+=10;
Блок 3. Семейства белков I. Множественное выравнивание Первый курс, весна 2008, А.Б.Рахманинова.
Анализ аминокислотной последовательности: паттерны, домены, семейства … или что, где и как искать?
Генетика пола, сцепленное с полом наследование.. Мужские и женские особи отличаются наличием половых хромосом. У человека: Женский пол – гомогаметен,
1 Генерация контекстных ограничений для баз данных Выполнил: Жолудев В. Научный руководитель: Терехов А.Н. Рецензент: Иванов А.Н.
Гидрофобный эффект (наивное объяснение) Межмолекулярный уровень Неполярные молекулы в полярном растворителе (воде) стремятся агрегировать так, чтобы минимизировать.
L/O/G/O Психология решения задач и проблем: классика и современность Спиридонов В.Ф. (РГГУ-ГУВШЭ)
BLAST Что такое выравнивание Выравнивание 2х последовательностей
Protein structure (Part 2 of 2).
Основы цифровой обработки речевых сигналов. Общая схема процесса речеобразования x[n] – дискретные отсчеты сигнала возбуждения y[n] – дискретные отсчеты.
Growing Neural Gas Method Нейросетевой метод построения неструктурированных адаптивных сеток.
Сравнение различных методов хранения XML в реляционных базах данных и в разных системах. Нгуен Тхань Хуен- 545 группа Руководитель : Б.А. Новиков Рецензент:
Структура белка Как предсказать вторичную структуру белка? Как найти и анализировать пространственную структуру, если она известна? Что можно делать, если.
1 Ребенок в Сети. Ребенок играет?
Determinants of bank interest margins in Russia: Does bank ownership matter? Zuzana Fungáčová and Tigran Poghosyan Горбачев Е., Мальцева Е., 317 группа.
ЛЭТИ'20061 Семантическая классификация JPEG изображений Результаты экспериментального исследования.
"The European Molecular Biology Open Software Suite"
Формантный синтезатор речи. Часть 1. Полюсы и нули – иное понимание Полюс – это пара чисел (B, F), B – ширина форманты, F – частота форманты Нуль – это.
Мобильные ретроэлементы в геноме эукариот.. Ревертаза. РНК-зависимая ДНК- полимераза (ревертаза) способна катализировать синтез ДНК-копии (кДНК) на РНК-матрице.
Множественные выравнивания как метод исследования Материалы к занятиям IV блока курса биоинформатики, 2006 А.Б.Рахманинова.
Деревья и их представление в STL Презентацию подготовила Чиркова Ольга, 2 подгруппа, группа 271ПИ.
3. Сравнение пространственных структур белков. Выравнивание последовательностей гомеодоменов Пример 1: гомеодомены.
Ряды и произведения sum(expr, n=a..b), где expr – выражение, зависящее от индекса суммирования, a..b – пределы индекса суммирования, Если требуется вычислить.
Кураева Екатерина Анатольевна, заместитель директора по УВР, учитель математики сш № 29.
Сравнительный анализ пространственных структур белков 1. Оценка качества пространственной структуры (по G.Kleywegt, 2000)
Маршрут, цепь, цикл Маршрутом называют последовательность вершин и ребер, в которой любые два соседних элемента инцидентны (т.е. соединены). Например:
Методы анализа данных. Статистическая проверка гипотез.
Деревья (trees) «…великое Дерево Жизни заполняет земную кору своими мертвыми и сломанными ветвями и покрывает поверхность вечно ветвящимися и прекрасными.
Protein structure Classification Ole Lund, Associate professor, CBS, DTU.
Учитель биологии ГОУ ЦО №1470 Селезнёва И.Г.. « Рост, размножение, подвижность, возбудимость, способность реагировать на изменения внешней среды – все.
Как найти последовательность, кодирующую Ваш белок? Как найти последовательность ДНК, кодирующую Ваш белок: – Ссылки из белковых баз данных – Прямой поиск.
Cравнение биологических последовательностей А.Б.Рахманинова, 2008.
ВВЕДЕНИЕ В ВЫЧИСЛИТЕЛЬНУЮ МАТЕМАТИКУ Лекция 5 6 октября 2009 ВЫЧИСЛИТЕЛЬНАЯ ЛИНЕЙНАЯ АЛГЕБРА.
Анализ аминокислотной последовательности: паттерны, домены, семейства … или что, где и как искать?
Множественное выравнивание С.А.Спирин, весна
Microsoft TechDayshttp:// Александр Шаповал Эксперт по стратегическим технологиям
Вторичные структуры 2012 Часть 2 Анализ трехмерных структур 1.
HOW THE HIGHEST SCIENTIFIC ACHIEVEMENTS DEPEND ON HIRSCH INDEXES OF THEIR AUTHORS N.L.Istomina, A.M.Romanov, and M.Yu.Romanovsky Physical Branch of Russian.
КРУПНЕЙШАЯ ТЕХНИЧЕСКАЯ КОНФЕРЕНЦИЯ MICROSOFT В УКРАИНЕ Metro приложения: работа с данными Краковецкий Александр, MVP/RD/PhD. DevRain Solutions.
Алгебра логики это раздел математики, изучающий высказывания, рассматриваемые со стороны их логических значений (истинности или ложности) и логических.
Применение графического метода для решения различных математических задач Учитель гимназии №3 Шахова Т. А.
Jokes Jokes Jokes Teacher: Where's your text book? Student: At home. Teacher: What's it doing there? Student: Having a.
Gtcactaaatactttaaccaatataggcatagcgcacagacagataaaaattacagagtacacaacatccatgaaacgcattagcaccaccattaccaccaccatcaccattacca gcttttcattctgactgcaacgggcaatatgtctctgtgtggattaaaaaaagagtgtctgatagcagcttctgaactggttacctgccgtgagtaaattaaaattttattgactta.
Chapter 14 Protein Structure Classification
Решение типовых расчетных задач по формулам. Определение массовой доли элементов Массовая доля элемента ω(Э) % - это отношение массы данного элемента.
* Любой табак кроме WTO Депозит берется в течение 20 мин, как подошли все гости* В депозит входят все позиции в меню* Депозит не возвращается*
10 интересных фактов о Японии и Японцах. В состав Японии входит островов. При этом четыре наиболее крупных из них - Кюсю, Хонсю, Хоккайдо и Сикоку,
Presentation transcript:

Домены Определения Методы разделения структуры на домены Классификации

Что такое “домен”? Три определения: По функции По структуре По последовательности

Функциональный домен (биохимия/биоинженерия) Минимальная часть полипептидной цепи, которая (i)достаточна в эксперименте для сохранения одной из активностей целого белка (ii)может автономно свернуться в правильную, нативную структуру

Derbyshire et al., PNAS, 94, (1997)“Genetic definition of a protein-splicing domain: Functional mini-inteins support structure predictions and a model for intein evolution” Рекомбиназа A из Mycobacterium tuberculosis (790 а.о.) содержит интеин (440 а.о.) – мобильный элемент, обладающий способностью автономно вырезаться из полипептидной цепи (явление белкового сплайсинга) Интеин обладает также эндонуклеазной активностью

По сходству последовательностей с другими более изученными интеинами, в т.ч. интеином с расшифрованной РСА структурой (1VDE), была высказана гипотеза о том, что за две разные активности отвечают разные домены. При этом за белковый сплайсинг отвечает домен, который составлен из N-концевого и C-концевого участков полипептидной цепи

Для проверки гипотезы авторы создали 21 конструкт генов интеина, в которых удалены разные внутренние участки полипептидной цепи. Конструкты были встроены в ген другого белка (тимидилатсинтазы, TS) и экспрессировались в E.coli Активность проверялась по наличию нативного белка TS (без вставки интеина)

Результат: белковый сплайсинг сохранялся в тех случаях, когда удаленный участок не затрагивал первые 96 и последние 35 а.о. Вывод авторов: функциональный домен автономного белкового сплайсинга состоит из остатков 1-96 и (всего 131 из полных 440)

Структура гомологичного белка PI-SceI – хоминг эндонуклеазы из дрожжей (PDB код 1VDE) Интеин 1-181, Эндонуклеаза

Площадь контакта доменов не такая уж и маленькая. Белок димеризуется

Последовательность интеина консервативна. Об этом свидетельствуют доменные архитектуры трех белков из разных грибов, описанные в PFam Доменная структура белка PI-SceI Доменная структура полноразмерного белка TFP1 (аннотирован по сходству) Доменная структура полноразмерного белка VMA1

Эволюционный домен (биоинформатика: последовательности) Длинный непрерывный участок полипептидной цепи, который (i)эволюционирует существенно медленнее других участков (ii)замечен в перемешивании доменов (domain shuffling)

Белки, содержащие два эволюционных домена: гомеодомен и OAR домен (N-концевые участки не показаны)

Гомеодомены активно перемешивались в эволюции. Об этом можно судить по 65(!) различным доменным архитектурам гомеобелков, представленным в банке Pfam Гомеодомен Парный домен и гомеодомен Lim домены и гомеодомен Гомеодомен, продолженный Лейциновой молнией POU домен и гомеодомен Два гомеодомена PBX-домен и гомеодомен

OAR- домен, обнаруженныйтолько в некоторых гомеодоменных транскрипционных факторах Консервативность наблюдается В перемешивании доменов пока не замечен Образует структурный домен? - нет аргументов за; против – слишком короткий Функция не установлена

Пример консервативности, которую трудно характеризовать как домен: гексапептид антеннапедиа

Структурный домен (биоинформатика: 3D структуры) Обособленная в пространстве часть белка, его структурная единица, имеющая (i)сравнительно мало контактов с другими частями белка (ii) собственное гидрофобное ядро

Двудоменный транскрипционный фактор – репрессор из бактериофага P22 (PDB код 1QAR): два оче-видных домена связаны гибким линкером ДНК-связывающий домен Пептидаза, а за одно и димеризационный домен

P22 репрессор димеризуется ….

… и связывается с ДНК Сайт связывания – палиндром. Весь комплекс обладает (неполной) симметрией 2го порядка ATTTAAGACTTCTTAATT

Домен белка XXX (жизнь) Часть белка, названная доменом Субъективизм Образность Традиция

В полимеразах обычно определяют три домена: fingers, palm, thumb Fingers Palm Thumb Template RNA Product RNA NTP

Разные определения часто дают похожие результаты! Но не всегда…

Парный домен из транскрипционного фактора PAX5 человека (PDB 1K78) 19-81A 82-90A A Эволюционный домен (PAX в Pfam) включает оба структурных домена (126 а.о.)

Полипептидные цепи обоих структурных доменов имеют общую топологию (- одинаковое число спиралей, - одинаковы межспиральные взаимодействия, - одинаковый порядок следования спиралей вдоль цепи; * минорные элементы вторичной структуры не в счет!)

N-концевой структурный домен парного домена хорошо совмещается с C-концевым Синий – N-концевой Зеленый – C-концевой Совмещение – по двум спиралям, всего по14 C  атомам Rmsd = 0.5 Å

Структурные домены парного домена одинаково расположены на ДНК

Достоверного сходства последователь ностей не наблюдается Карта локального сходства последовательностей двух структурных доменов эволюционного домена PAX/Prd из белка PAX5 человека

При этом последовательности PAX/prd доменов консервативны по всех длине

Структурные домены Методы детектирования

На чем основаны методы Домен имеет собственное гидрофобное ядро (пример: алгоритм DETECTIVE Swindells, 1995) Домен – это часть белка, внутри которой много контактов аминокислотных остатков, а между доменами – мало контактов (пример: алгоритм DOMAK, Siddiqui&Barton, 1995)

Siddiqui&Barton, 1995: DOMAK Предпосылки: домен состоит из одного или двух непрерывных участков полипептидной цепи Число контактов остатков внутри домена больше чем число междоменных контактов Сверху – вниз, от целого – к части!

Формализация Два остатка контактируют если расстояние между ними меньше 5Å Если белок разбит на две части, A и B, то определяется индекс разделенности: SplitValue=(int A /ext AB )*(int B /ext AB ) int A – число пар контактирующих остатков из A; int B – число пар контактирующих остатков из B; ext AB – число пар контактирующих остатков, один из A, а другой – из B

Пример. Структура 1CD4. Часть A: N-конец полипептидной цепи до остатка i; часть B – от (i+1) до C-конца График зависимости индекса разделенности от номера граничного остатка

Деление по остатку 97 (пик на графике)

В алгоритме DOMAK проверяются следующие разделения на части A и B

Алгоритм К полной цепи применяются методы 1 и 2. Выбирается разделение с лучшим индексом К полученным двум доменам применяется та же процедура. В случае, когда домен состоит из двух сегментов, применяется также метод 3. Алгоритм останавливается в зависимости от пороговых значений: –MDS – минимальный размер домена (в числе остатков) –MSS - минимальный размер сегмента Отдельная процедура предусмотрена для сегментов, длина которых между MDS и MSS Найденные домены проверяются на “компактность”; некомпактные – сливаются в один

Swindells, 1995 DETECTIVE Снизу – вверх, наращивание частей! Предпосылки: каждый домен имеет свое гидрофобное ядро.

(1) Построение кластеров гидрофобно взаимодействующих неэкспонированных остатков Отбираются остатки, которые –Слабо экспонированы (<7%) –Принадлежат спиралям или тяжам –Более 75% контактов их атомов с другими атомами классифицируются как гидрофобные Контактом считается сближение “тяжелых” атомов на сумму vdW радиусов + 1 ангстрем Гидрофобным контактом считается контакт углеродов

Два остатка из отобранных считаются взаимодействующими гидрофобно если число гидрофобных межатомных контактов превосходит число негидрофобных межатомных контактов

Строится граф: Вершина – отобранный остаток Ребро соединяет вершины, если соответствующие остатки гидрофобно взаимодействуют Связные компоненты графа, содержащие 5 или более остатков, называются гидрофобными ядрами

Граф гидрофобных контактов (пример)

Гидрофобные ядра – еще не домены! Для получения доменов применяется многоходовая процедура чистки-слияния

Алгоритм демонстрируется на примере (см. рис.) (1)найдено 3 кластера – 1й, 2й и 3й (2)остатки, окруженные “чужими” вычищаются (3)кластеры меньше чем из 5и остатков вычищаются (4)заливка некластеризованных остатков (5)оставшиеся некластеризованные остатки присоединяются по контактам к кластерами предыдущего шага (6)- (8) опять прочистка, заливка и присоединение хвостов

Структурная классификация доменов SCOP (Murzin, Benner, Hubbard, Chotia, 1995) CATH (Orengo et al., 1993, 1997) FSSP (Holm&Sander, 1993) другие

Structural Classification of Proteins, SCOP Экспертное выделение доменов Экспертная классификация

Класс Укладка (fold) – сходная топология Суперсемейство – структурная гомология (?) Семейство – сходство последовательностей и/или хорошее пространственной выравнивание цепей Белок – б.м. ортологичные белковые домены Вид – конкретный белок Уровни классификации в SCOP

Альфа-спиральные домены (202 фолда) Бета-структурные домены (141) Альфа/бета структурные домены (a/b) (130) (бета-альфа-бета структурные единицы) Альфа+бета домены (a+b) (260) (разделенные альфа спиральные и бета-структурные области) Классы Основные

Спирализованные спирали (6) Низкое разрешение (22) Пептиды, фрагменты (111) Искусственные белки (41) Формально собранные классы Многодоменные белки (40) (сложные домены) Мембранные (42) (кроме белков иммунной системы) Маленькие(72) Специфические

Разница между a/b и a+b 1TPH Triosephosphate isomerase from Chicken (Gallus gallus) 1TPH a/b: - Спирали и тяжи вместе образуют глобулу -Часто спираль соединяет два тяжа как показано на рис. ниже

Разница между a+b и a/b 2ACT. ACTINIDIN (SULFHYDRYL PROTEINASE) a+b: - Спирали и тяжи более или менее разобщены - Часто спирали образуют свое маленькое ядро - Мотивы  -  -  как на предыдущем слайде встречаются редко

Каталаза (C-концевой домен) Флаводоксин Общая укладка (фолд). Хорошее совмещение полипептидных цепей невозможно, но что-то общее в расположении элементов вторичной структуры прослеживается… Говорят: “общая топология”

Общая топология у двух доменов характеризуется Хорошим выравниванием элементов вторичной структуры при котором сопоставленные элементы вторичной структуры одинаково контактируют в пространстве между собой что-то еще нужно сказать про одинаковое взаимное расположение элементов вторичной структуры; но не известно (боюсь, что не только мне) адекватных проверяемых формулировок …

Сравнение топологий каталазы (1CF9, C- концевой домен) и флаводоксина (1AG9)

Вторичная структура C-концевого домена Каталазы 1CFG Вторичная структура флаводоксина 1AG9

S 4 H 2 S 5 - S 1 S 2 S 3 H 2 S 2 H 1 S 1 - H 1 – | | | | | | | | | S 4 H 2 S 5 h S 3 H 2 S 2 H 1 S 1 S 1’ H 1 h 1

SCOP 1.67 release: PDB Entries (15 May 2004) Domains. Class Number of folds Number of superfamilies Number of families All alpha proteins All beta proteins Alpha and beta proteins (a/b) Alpha and beta proteins (a+b) Multi-domain proteins40 55 Membrane and cell surface proteins Small proteins Total

Class Architecture Topology Homologous superfamily, CATH Белок делится на домены автоматически при согласованных результатах трех алгоритмов: – DETECTIVE (Swindells, 1995), – PUU (Holm & Sander, 1994) – DOMAK (Siddiqui and Barton, 1995). При несовпадении результатов алгоритмов – решение о доменах за экспертом

Первичная классификация автоматическая (алгоритм SSAP, Taylor & Orengo 1989). При отказах программы решение принимает эксперт

CATH: уровни классификации Класс: основные all-alpha, all-beta, alha-beta Архитектура: сходное пространственное расположение элементов вторичной структуры без учета их последовательности Топология (укладка): сходное взаимное расположение вдоль цепи и в пространстве элементов вторичной структуры Суперсемейство: предположительно или несомненно гомологичные домены Семейство: сходные последовательности (>35% identity и выровненные участки покрывают >60% длины)

В каждой структурной классификации – свои “причуды ” CATH: два (?!!!) “домена” (?!!!) (красный и зеленый) в структуре токсина перфринголизин О из патогенной бакетрии Clostridium Perfringens (PDB код 1PFO) Вот что может автоматика ?! (В базе SCOP это один домен)

Человеческий фактор (?) В последнем релизе разделен на два домена SCOP: этот полипептид был классифицирован как один структурный домен класса all alpha (???) (белок - транскрипционный фактор из Listeria monocytogenes, регулирующий основные гены вирулентности)

DALI, Distance matrix ALIgnment

Структурные мотивы

Вторичная и супервторичная структура домена