Блок 3. Семейства белков I. Множественное выравнивание Первый курс, весна 2008, А.Б.Рахманинова
Построить выравнивание? Первый курс, весна 2008, А.Б.Рахманинова Написать последовательности друг под другом, вставляя гэпы, так, чтобы последовательности имели одинаковую длину, а вес выравнивания был максимально возможным. P1 DFRLLA P2 EY-LLA 1. P1 DFRLLA P2 EYL-LA 2. P1 DFRLLA P2 E-YLLA 3. P1 DFRLLA P2 EYLL-A 4....??
Множественное выравнивание, весна 2008 Что мы можем узнать нового? Множественное выравнивание: Попарное выравнивание:
Множественное выравнивание, весна 2008 Для чего строят множественные выравнивания? Это модель позволяет оценить эволюционные отношения Построение множественных выравниваний — необходимый этап решения многих задач молекулярной биологии поиск активного центра позволяет найти общее мотивы, паттерны, профили предсказание 3D-структуры реконструкция эволюции
Множественное выравнивание, весна 2008 Попарное и множественное выравнивание 1.Любое множественное выравнивание порождает набор попарных не обязательно оптимальных выравниваний 2. Не любой набор попарных выравниваний можно просто "сложить" во множественное выравнивание. Пример: P1 ALGTEEI-C P2 ALGT--IAC + P1 AL-GTEEI-C P1 AL-GTEEI-C P2 AL-GT--IAC P3 ALVGTE-IAC + P2 AL-GT-IAC P3 ALVGTEIAC
Множественное выравнивание, весна 2008 Змей-Горыныч биоинформатики Биологическая задача поставить друг под другом гомологичные позиции Математическая задача найти способ количественного сравнения качества выравниваний. Программирование создание эффективного алгоритма и его реализация
Множественное выравнивание, весна 2008 Можно ли построить единственное оптимальное множественное выравнивание? Можно найти самое лучшее выравнивание за время t seq1: MA-RR seq2: CADRQ при условии,что вес совпадения: 2 вес замены: -1 штраф за делецию: -2 Построение парного выравнивания по алгоритму Нидельмана-Вунша (пример из упр. студента ФББ) Да, можно, но за t =L N !!! Программа MSA строит оптимальное выравнивание в соответствии c матрицами замен.
Руководящее дерево Очевидные недостатки : результат зависит от порядка выравниваний; «один раз гэп – всегда гэп» Алгоритм ClustalW – пример эвристического прогрессивного алгоритма
Множественное выравнивание, весна 2008 Muscle или как исправить ClustalW
Множественное выравнивание, весна 2008 Наиболее известные программы множественного выравнивания: 1.MSA => оптимальное выравнивание, если дождаться результата 2. ClustalW (реализации ClustalX, emma из EMBOSS) до сих пор самый популярный алгоритм, в сложных случаях может ошибиться. 3. Muscle итеративный прогрессивный алгоритм, точнее и быстрее ClustalW 4. Т-COFFEE – немного точнее, но существенно медленнее 5. HMMER – часто ошибается, но хорошо строит профили
Множественное выравнивание, весна 2008 Как сравнивают разные программы множественного выравнивания? Эталонные выравнивания: BALIBASE (3D!): BLOCKS: Pfam: SMART: