Деревья (trees) «…великое Дерево Жизни заполняет земную кору своими мертвыми и сломанными ветвями и покрывает поверхность вечно ветвящимися и прекрасными.

Slides:



Advertisements
Similar presentations
Английский язык. Настоящее совершенное длительное время.
Advertisements

Филогенетические деревья Что это такое Общий план действий Программы, которые строят деревья The time will come, I believe, though I shall not live to.
Деревья (trees) «…великое Дерево Жизни заполняет земную кору своими мертвыми и сломанными ветвями и покрывает поверхность вечно ветвящимися и прекрасными.
Астрометрические каталоги К.В.Куимов, ГАИШ МГУ. Определение астрометрического каталога Астрометрический каталог – понятие неопределённое. Например, это.
Схема распределения грантов городам-участникам программы Тасис (TCAS) Экологические гранты для муниципалитетов.
IV семестр «Функция и эволюция» БЛОК 1 «Эволюция» – 4 занятия Молекулярная филогенетика. Задачи и подходы. Лекция- семинар, (АБР) Реконструкция.
Генетические алгоритмы Егоров Кирилл, гр Чураков Михаил, гр
« Использование двоичной системы счисления при составлении генеалогического дерева». Автор: Вербицкий Евгений Ученик МОУ «Лицей» 7 г класса.
Системы с наследованием. Если систему можно представить в виде : Где - непрерывные функции, то такая система называется системой с наследованием. Математическое.
Системы отбора. Условные обозначения (1) (2) (3) (4) (5) (6) (7) Математическое моделирование процессов отбора2.
Алгоритм приближённого join’а на потоках данных Выполнил : Юра Землянский, 445 группа Научный руководитель : Б.А. Новиков СПб, 2011 Санкт-Петербургский.
ЛОМОНОСОВ И МАТЕМАТИКА. Большое значение Ломоносов придавал математике, рекомендуя широко применять математические методы в других науках. Математику,
R1R2R3R4R5R6R7R1R2R3R4R5R6R7. Аксиома R 1. В пространстве существуют плоскости. В каждой плоскости пространства выполняются все аксиомы планиметрии.
Тел. (495) Москва, а/я 212 Рабочая группа по реформе МВД Москва, 2010 Новикова Асмик, Фонд «Общественный вердикт»
Некомпенсаторное агрегирование и рейтингование студентов Авторы: Гончаров Алексей Александрович, Чистяков Вячеслав Васильевич. НФ ГУ ВШЭ 2010 год.
Неотрицательное решение задачи Коши. Нередко постановка задачи требует чтобы фазовые переменные принимали лишь неотрицательные значения. Так, в физических.
Подготовил: Евгений Дзень
Bank ownership and lending behavior Alejandro Micco, Ugo Panizza Politicians and banks: Political influences on government-owned banks in emerging markets.
Определение необходимого уровня запасов на складе.
АВДАШЕВА СВЕТЛАНА КАФЕДРА ЭКОНОМИЧЕСКОГО АНАЛИЗА ОРГАНИЗАЦИЙ И РЫНКОВ 2011/2012 УЧЕБНЫЙ ГОД Теория отраслевых рынков (по выбору для 3 курса факультета.
Учитель математики Кулакова Т.М. МОУ ООШ №15 г.о Новокуйбышевск Самарской области Сентябрь 2011г.
Что называют химической реакцией? ? Перечислите условия протекания химических реакций. ?
Сохранение суммы фазовых координат. Важный частный случай представляют системы, в которых в течение всего процесса сохраняется постоянной сумма значений.
Что за хулиган толкает пассажиров автобуса то вперед, то назад? Этот хулиган, вернее, хулиганка -
Обзор последних достижений биометрических методов аутентификации РусКрипто 2005.
ООП Классы – 2. Ссылки Ссылка – еще одно имя объекта. Используйте ссылки вместо указателя. Это более безопасно. Complex c(10,10); Complex c2& = c; c2+=10;
Блок 3. Семейства белков I. Множественное выравнивание Первый курс, весна 2008, А.Б.Рахманинова.
Анализ аминокислотной последовательности: паттерны, домены, семейства … или что, где и как искать?
To the Solution of a Bilinear Optimal Control Problem with State Constrains by the Doubled-Variations Method E.A. Rovenskaya Lomonosov Moscow State University,
Решение задач на движение
1 Генерация контекстных ограничений для баз данных Выполнил: Жолудев В. Научный руководитель: Терехов А.Н. Рецензент: Иванов А.Н.
Номинация «Лучшее предложение по развитию массового спорта» «Строительство Роллердрома в городе Челябинск» Предложение подготовлено: Бобковой Екатериной.
МЕХАНИКА Кинематика……………………………………….. Основы динамики……………………………… Взаимодействие тел……………………………
Основы цифровой обработки речевых сигналов. Общая схема процесса речеобразования x[n] – дискретные отсчеты сигнала возбуждения y[n] – дискретные отсчеты.
ГРАФЫ ИХ ПРЕДСТАВЛЕНИЕ В STL u Отделение программной инженерии группа 271 ПИ Антонова Н. А.
Growing Neural Gas Method Нейросетевой метод построения неструктурированных адаптивных сеток.
Сравнение различных методов хранения XML в реляционных базах данных и в разных системах. Нгуен Тхань Хуен- 545 группа Руководитель : Б.А. Новиков Рецензент:
Деревья курс «Алгоритмы и структуры данных» Отделение Программной инженерии.
"The European Molecular Biology Open Software Suite"
Лобанов Алексей Иванович Основы вычислительной математики Лекция 1 8 сентября 2009 года.
Множественные выравнивания Зачем все это нужно? Глобальные множественные выравнивания – основы алгоритма, программы Где искать на Web? Можно ли редактировать.
Statistics and how to interpret them CIJ/OSI Investigative Journalism – Public Finance School April 2011 ЦЖР / ИОО Журналистские расследования - Общественная.
Деревья и их представление в STL Презентацию подготовила Чиркова Ольга, 2 подгруппа, группа 271ПИ.
3. Сравнение пространственных структур белков. Выравнивание последовательностей гомеодоменов Пример 1: гомеодомены.
Алгоритмы биоинформатики ФББ 2004 г., осенний семестр, 3-й курс. Миронов Андрей Александрович.
Тема: Сравнительный анализ сложности факторизации алгоритмов целых чисел Выполнила: Дубовицкая Н.В., гр 957 Научный руководитель: Ишмухаметов Ш.Т.
Кураева Екатерина Анатольевна, заместитель директора по УВР, учитель математики сш № 29.
Реализация XPath над S-выражениями 2007 Миленин Евгений, гр. 544 Кафедра Системного Программирования Математико-Механический ф-т, СПбГУ Научный руководитель:
Методы определения параметров вращения Земли
Topology Control. Coverage. Localization. Time Synchronization. Садков Александр Аспирант РФ Сайт курса:
Маршрут, цепь, цикл Маршрутом называют последовательность вершин и ребер, в которой любые два соседних элемента инцидентны (т.е. соединены). Например:
Методы анализа данных. Статистическая проверка гипотез.
ТЕОРИЯ И ПРАКТИКА МНОГОПОТОЧНОГО ПРОГРАММИРОВАНИЯ Тема 5 Некоторые понятия, используемые при разработке параллельных программ Д. ф.- м. н., профессор А.
Деревья (trees) «…великое Дерево Жизни заполняет земную кору своими мертвыми и сломанными ветвями и покрывает поверхность вечно ветвящимися и прекрасными.
Формализованы ли цели? Устраивает ли вас команда? Каковы этапы процесса? Изменение ИТ структуры? Нужны подрядчики? 1.
ВВЕДЕНИЕ В ВЫЧИСЛИТЕЛЬНУЮ МАТЕМАТИКУ Лекция 5 6 октября 2009 ВЫЧИСЛИТЕЛЬНАЯ ЛИНЕЙНАЯ АЛГЕБРА.
Хобби-мастерская рисунки на асфальте Подготовили: Коваленко Денис и Кульбарисова Саша.
Множественное выравнивание С.А.Спирин, весна
Классификация, кластеризация и поиск изображений на основе низкоуровневых характеристик Наталья Васильева Руководитель: Новиков Б. А.
XML Схемы XML документов. XML Schema созданая Microsoft позволяет избавиться от DTD блоков. Основа – использование пространств имен и очень точная типизация.
Обработка исключений в C# Единая техника обнаружения ошибок времени выполнения и передачи информации о них.
«Отгадай символы Рождества»
Восстановление филогений. наименьшее расстояние (distance-based methods), кластеризация быстро хорошо, если сходство ~ родство (молек. часы) наибольшая.
Алгебра логики это раздел математики, изучающий высказывания, рассматриваемые со стороны их логических значений (истинности или ложности) и логических.
Рассмотрим более подробно работу управляющей компоненты. В ЭС используются нетрадиционные методы управления. Это вызвано неформализованностью решаемых.
СУММА УГЛОВ ТРЕУГОЛЬНИКА Токарева В.Н.,учитель математики МБОУ «СОШ №20 с УИОП»
Применение графического метода для решения различных математических задач Учитель гимназии №3 Шахова Т. А.
‘For and Against’ Essays Useful tips. Plan Introduction - Paragraph 1 (state topic – summary of the topic without giving your opinion) Main Body – Paragraph.
Jokes Jokes Jokes Teacher: Where's your text book? Student: At home. Teacher: What's it doing there? Student: Having a.
* Любой табак кроме WTO Депозит берется в течение 20 мин, как подошли все гости* В депозит входят все позиции в меню* Депозит не возвращается*
Presentation transcript:

Деревья (trees) «…великое Дерево Жизни заполняет земную кору своими мертвыми и сломанными ветвями и покрывает поверхность вечно ветвящимися и прекрасными побегами» Ч. Дарвин

Задача построения филогенетического дерева The time will come, I believe, though I shall not live to see it, when we shall have fairly true genealogical trees of each great kingdom of Nature. Charles Darwin  Математическая задача – задача кластеризации, использование теории графов и комбинаторной оптимизации для того, чтобы на основе «грязных» биологических данных получить разумное с точки зрения эксперта-биолога дерево.  Биологические задачи – сравнение 3-х и более объектов (кто на кого более похож.... ) реконструкция эволюции ( кто от кого, как и когда произошел…)

Реальные события : Данные: Построенное дерево эволюция в природе или в например, древовидный граф, лаборатории, а.к. последо- вычисленный на основе компьютерная симуляция вательности или данных, может количество отражать или не усиков отражать реальные события >Seq4 GCGCTGFKI..... >Seq1 ASGCTAFKL... >Seq3 GCGCTLFKI ACGCTAFKI GCGCTAFKI ACGCTAFKL A -> G I -> L

Будни биоинформатика – деревья, деревья…

Рутинная процедура Составление выборки последовательностей Множественное выравнивание Построение дерева фрагмент записи в виде правильной скобочной структуры: Визуализация и редактура дерева (((((con101: ,(f53969: ,((f67220: , max4: ): ,con92: ): ): ): ,

Основные термины

Какие бывают построенные деревья? Бинарное разрешенное (в один момент времени может произойти одно событие ) Бинарное неразрешенное (может ли в один момент времени произойти два события? ) Время

Какие бывают построенные деревья? Укорененное ориентированное дерево отражает направление эволюции Неукорененное (бескорневое) неориентированное дерево показывает только связи между узлами Время Если число листьев равно n, существует (2n-3)!! разных бинарных укоренных деревьев. (2n-3)!! – это нечто вроде факториала, но учитываются только четные числа. Существует (2n-5)!! разных бескорневых деревьев с n вершинами

A B C A B C A B C A B C A B C D A B CD A B C D A B C D A B C D A B C D A B C D … 15 rooted trees of 4 OTUs 3 OTUs 4 OTUs UNROOTED ROOTED

Искусственный способ укоренения деревьев Бескорневое дерево можно «укоренить», если ввести внешнюю группу OTU (outgroup). Внешния группа должна быть "старше", т.е. заведомо отделиться раньше, чем произошла дивергенция остальных OTU. OG

Какие бывают построенные деревья ? Расстояние по дереву не то же самое, что эволюционное расстояние между данными Ультраметрические деревья Корневое дерево, в котором для любых листьев i и j расстояние D(i,j) – метка наименьшего общего предка i и j. В таком дереве все листья находятся на одинаковом от корня, что соответствует одинаковой скорости эволюции всех ветвей Аддитивные деревья Д ерево, в котором для любых вершин i и j расстояние D(i,j) – это эволюционный путь от i к j. При этом расстояния от i и от j до их наименьшего общего предка могут сильно различаться. Другие … аддитивные ультраметрические Вообще говоря, строгое решение задачи построения аддитивного дерева невозможно (следует из свойства задачи)

Филограмма: Длина ребер пропорциональна эволюционному расстоянию между узлами. Кладограмма: представлена только топология, длина ребер игнорируется. Arabidopsis Caenorhabditis Drosophila Anopheles Tenebrio Trout Mus 0.1 substitutions per site Arabidopsis Caenorhabditis Drosophila Anopheles Tenebrio Trout Mus Как можно нарисовать построенное дерево?

Основные алгоритмы построения филогенетических деревьев Методы, основанные на оценке расстояний (матричные методы): Вычисляются эволюционные расстояния между всеми вершинами (OTUs) и строится дерево, в котором расстояния между вершинами наилучшим образом соответствуют матрице попарных расстояний. UPGMA (Unweighted Pair Group with Arithmetic Mean) Ближайших соседей (Neighbor-joining, NJ) Символьно-ориентированные методы:  Наибольшего правдоподобия, Maximum likelihood, ML Используется модель эволюции и строится дерево, которое наиболее правдоподобно при данной модели  Максимальной экономии (бережливости), maximum parsimony, MP Выбирается дерево с минимальным количеством мутаций, необходимых для объяснения данных

Методы, основанные на оценке расстояний Дано: М – матрица n x n, где Mij>=0, Mij – эволюционное расстояние между листьями (OTU). Задача: Построить реберно взвешенное (an edge-weighted) дерево, где каждая вершина (лист) соответствует объекту из M, а расстояние, измеренное по дереву между вершинами (листьями) i and j соответствует Mij.

UPGMA (алгоритм последовательной кластеризации) Выбираем 2 наиболее похожие вершины a, c. Строим новый узел k такой, что D(a,k)=D(b,k)=D(a,c)/2. Пересчитываем матрицу попарных расстояний : D(b, a or c) = [ D(b,a) + D(b,c) ] /2 = (8+9)/2=8.5 D(d, a or c) = [ D(d,a) + D(d,c) ] /2=(12+11)/2=11.5 Повторяем процедуру…. В конце концов получаем единственное ультраметрическое укорененное дерево =11.5

Не пользуйтесь UPGMA! Алгоритм строит ультраметрическое дерево, а это означает, что скорость эволюции одинакова для всех ветвей дерева. Использовать этот алгоритм имеет смысл только в случае ультраметрических данных (объектов эволюционирующих с одинаковой скоростью). реальное c точки зрения UPGMA эксперта дерево

Метод ближайших соседей (Neighbor-joining, NJ) 1. Рисуем «звездное» дерево и будем "отщипывать" от него по паре вершин, рассмотрим все возможные пары вершины. пусть - «среднее» расстояние до других вершин. 2. Выберем 2 вершины i и j с минимальным значением Mij – ui –uj т.е. выбираем 2 узла, которые близки друг к другу, но далеки ото всех остальных.

Метод ближайших соседей (Neighbor-joining, NJ) 3. Кластер (i, j) – новый узел дерева Расстояние от i или от j до узла (i,j): di, (i,j) = 0.5(Mij + ui-uj) dj, (i,j) = 0.5(Mij + uj-ui) т.е. длина ветви зависит от среднего расстояния до других вершин. 4. Вычисляем расстояние от нового кластера до всех других M(ij)k = Mik+Mjk – Mij 2 5. В матрице М убираем i и j и добавляем (i, j). Повторяем, пока не останутся 2 узла......

Метод ближайших соседей (Neighbor-joining, NJ) Строит бескорневое аддитивное дерево Может работать с большим количеством данных Достаточно быстрый алгоритм Хорошо зарекомендовал себя на практике: если есть недвусмысленное с точки зрения эксперта дерево, то оно будет построено. Используется при множественном выравнивании с помощью программы ClustalW Могут появиться ветви с длиной <0

Достоверность топологии. Bootstraps. Создадим псевдоданные: N множественных выравниваний той же длины, что и исходное, каждое из псевдовыравниваний - случайный набор столбцов из исходного. Построим N деревьев: на каждом внутреннем узле отметим долю случаев из N, в которых появлялся этот узел. Обычно верят в топологию, если метки узлов на бутстрепном дереве больше 70-80%. Если меньше 30%, то не верим. В иных случаях – думаем… Есть множественное выравнивание и построенное по нему дерево. Верим ли мы в топологию дерева?

Human Chimp Gorilla Orangutan Gibbon Traditional Human Chimp Gorilla Orangutan Gibbon Molecular

Trees plagiarized by Chuck Staben, 1998 Sergeant Joyce Kilmer, 1914