Что можно делать с одиночной последовательностью ДНК? Как исключить векторные фланки? Рестрикционная карта Вашей последовательности Дизайн праймеров Анализ.

Slides:



Advertisements
Similar presentations
Review of Sharing of the eight core indicators Joint Task Force on Environmental Indicators Eighth session Eighth session Geneva, 14–15 May 2014 Robin.
Advertisements

ЗАРЯДКА НА АНГЛИЙСКОМ ЯЗЫКЕ.  Зарядка на уроке английского языка может стать самым любимым и веселым занятием для детей, при том, что она проходит исключительно.
Филогенетические деревья Что это такое Общий план действий Программы, которые строят деревья The time will come, I believe, though I shall not live to.
Компьютерный анализ белковой последовательности Анализируют только аминокислотную последовательность белка, пренебрегают взаимодействием между боковыми.
Linguistic tools Лекция 5. ПОИСКОВЫЕ СИСТЕМЫ: предыстория Библейские индексы и конкордансы 1247 – Hugo de St. Caro – было задействовано 500 монахов для.
Схема распределения грантов городам-участникам программы Тасис (TCAS) Экологические гранты для муниципалитетов.
Расторгуев А.C., 545 группа Научный руководитель: Пименов А.А. Рецензент: ст. преп. Смирнова Е.А.
Системы отбора. Условные обозначения (1) (2) (3) (4) (5) (6) (7) Математическое моделирование процессов отбора2.
Использование пальцев рук в качестве вспомогательного инструмента при умножении чисел от 1 до 100.
Елена Станиславовна Петрова Учитель-логопед высшей категории ГДОУ детский сад №47 комбинированного вида Фрунзенского района г. Санкт-Петербурга 2011 год.
R1R2R3R4R5R6R7R1R2R3R4R5R6R7. Аксиома R 1. В пространстве существуют плоскости. В каждой плоскости пространства выполняются все аксиомы планиметрии.
Тел. (495) Москва, а/я 212 Рабочая группа по реформе МВД Москва, 2010 Новикова Асмик, Фонд «Общественный вердикт»
Социальный инжиниринг и социальные сети Актуальные угрозы для пользователей социальных сетей.
Некомпенсаторное агрегирование и рейтингование студентов Авторы: Гончаров Алексей Александрович, Чистяков Вячеслав Васильевич. НФ ГУ ВШЭ 2010 год.
Определение необходимого уровня запасов на складе.
АВДАШЕВА СВЕТЛАНА КАФЕДРА ЭКОНОМИЧЕСКОГО АНАЛИЗА ОРГАНИЗАЦИЙ И РЫНКОВ 2011/2012 УЧЕБНЫЙ ГОД Теория отраслевых рынков (по выбору для 3 курса факультета.
Учитель математики Кулакова Т.М. МОУ ООШ №15 г.о Новокуйбышевск Самарской области Сентябрь 2011г.
Функции II. Классификация. Зачем? А.Б.Рахманинова (6 марта 2006 г.)
Российский государственный педагогический университет им. А.И. Герцена ИНСТИТУТ ДОВУЗОВСКОЙ ПОДГОТОВКИ Дистанционное обучение «Русский язык. Подготовка.
Создание сервиса синхронизации разнородных баз данных Допущена к защите зав. кафедрой: д.ф.м.н., профессор Терехов А.Н. Научный руководитель: доцент Графеева.
ООП Классы – 2. Ссылки Ссылка – еще одно имя объекта. Используйте ссылки вместо указателя. Это более безопасно. Complex c(10,10); Complex c2& = c; c2+=10;
Функции IV. Биоинформатические ресурсы для работы с мембранными белками А.Б.Рахманинова (3 и 4 апреля 2007г.)
Блок 3. Семейства белков I. Множественное выравнивание Первый курс, весна 2008, А.Б.Рахманинова.
Контекстно- поведенческие технологии Михаил Козлов, директор по продуктам «Бегуна»
Решение задач на движение
Ответы на вопросы 7 июля « Подготовка паспортов безопасности» тел: (495) Экологический Синтезирующий.
1 Генерация контекстных ограничений для баз данных Выполнил: Жолудев В. Научный руководитель: Терехов А.Н. Рецензент: Иванов А.Н.
Freelance: правила игры. КИРИЛЛ РЕЗНИЧЕНКО + СПЕЦИАЛИСТ В ОБЛАСТИ 3D ГРАФИКИ + КООРДИНАТОР ОБРАЗОВАТЕЛЬНОГО ЦЕНТРА КОМПАНИИ AUTODESK ПРИ ВГУ.
BLAST Что такое выравнивание Выравнивание 2х последовательностей
Михаил Налётов Активные продажи на сайте. Может ли ваш сайт работать еще эффективнее?
Основы цифровой обработки речевых сигналов. Общая схема процесса речеобразования x[n] – дискретные отсчеты сигнала возбуждения y[n] – дискретные отсчеты.
Ген-ориентированные базы данных и геномные браузеры Что такое ген-ориентированные базы данных? Самые простые примеры таких БД Примеры геном-ориентированных.
Сравнение различных методов хранения XML в реляционных базах данных и в разных системах. Нгуен Тхань Хуен- 545 группа Руководитель : Б.А. Новиков Рецензент:
Структура белка Как предсказать вторичную структуру белка? Как найти и анализировать пространственную структуру, если она известна? Что можно делать, если.
1 Ребенок в Сети. Ребенок играет?
А.Б. Рахманинова (13 апреля 2010 г.) Факультет Биоинженерии и Биоинформатики, 2 курс, весенний семестр Функции Мембранные белки. Транспортные белки.
Снегурочка «Здравствуйте, ребята! Пишет вам Снегурочка. Мне бы хотелось рассказать, как вы можете стать волшебни- ками. Это совсем нетрудно, просто нужно.
"The European Molecular Biology Open Software Suite"
Мобильные ретроэлементы в геноме эукариот.. Ревертаза. РНК-зависимая ДНК- полимераза (ревертаза) способна катализировать синтез ДНК-копии (кДНК) на РНК-матрице.
Множественные выравнивания Зачем все это нужно? Глобальные множественные выравнивания – основы алгоритма, программы Где искать на Web? Можно ли редактировать.
Д.А. Равчеев (14 апреля 2009 г.) Факультет Биоинженерии и Биоинформатики, 2 курс, весенний семестр Функции Трансмембранные белки.
Сервисы – специально для научных исследований:  Удаленный доступ и простой поиск, обеспечивающий быстрый доступ к нужной книге  Рефераты на каждую книгу.
Нахождение ориджинов в последовательности нуклеотидов Выполнил: Ромашкин Амир, 445 гр. Руководитель: Профессор АФТУ, Порозов Юрий.
Кураева Екатерина Анатольевна, заместитель директора по УВР, учитель математики сш № 29.
Swiss-Prot – одна из первых баз данных белковых последовательностей, “gold standard” белковой аннотации. Аннотация выполнена вручную группой профессиональных.
Маршрут, цепь, цикл Маршрутом называют последовательность вершин и ребер, в которой любые два соседних элемента инцидентны (т.е. соединены). Например:
Методы анализа данных. Статистическая проверка гипотез.
BioUML интегрированная расширяемая среда для моделирования биологических систем Biosoft.Ru Лабоработория Биоинформатики КТИ ВТ СО РАН
Как найти последовательность, кодирующую Ваш белок? Как найти последовательность ДНК, кодирующую Ваш белок: – Ссылки из белковых баз данных – Прямой поиск.
Учитель Антонова О.Я. Учитель Антонова О.Я. Зерноградская поликлиника.
Обработка исключений в C# Единая техника обнаружения ошибок времени выполнения и передачи информации о них.
«Отгадай символы Рождества»
©2010 Check Point Software Technologies Ltd. | [Unrestricted] For everyone Новый VPN клиент – Discovery Антон Разумов Консультант.
© Crown copyright 2011, Department for Education These materials have been designed to be reproduced for internal circulation, research and teaching or.
Writing Friendly Letters A Write On Activity. Friendly letters have five parts: 1. The Heading 2. The Salutation (greeting) 3. The Body (some paragraphs)
Анализ данных эксперимента ATLAS с использованием GANGA Tutorial.
Gtcactaaatactttaaccaatataggcatagcgcacagacagataaaaattacagagtacacaacatccatgaaacgcattagcaccaccattaccaccaccatcaccattacca gcttttcattctgactgcaacgggcaatatgtctctgtgtggattaaaaaaagagtgtctgatagcagcttctgaactggttacctgccgtgagtaaattaaaattttattgactta.
FAMILIES AND FRIENDS: ARE WE HAPPY TOGETHER?. HOLIDAYS ARE A TIME FOR ADVENTURES AND DISCOVERIES.
Захватывающее предложение по организации игры «Мафия» для event-агентств наши клиенты: тел.: сайт: (495)
Захватывающее предложение по организации игры «Мафия» для event-агентств наши клиенты: тел.: сайт: (495)
Т.В. Биренбаум Н.А. Качанова Подходы к формированию электронной библиотеки университета в условиях минимальных финансовых, материальных и трудовых ресурсов.
‘For and Against’ Essays Useful tips. Plan Introduction - Paragraph 1 (state topic – summary of the topic without giving your opinion) Main Body – Paragraph.
Jokes Jokes Jokes Teacher: Where's your text book? Student: At home. Teacher: What's it doing there? Student: Having a.
Gtcactaaatactttaaccaatataggcatagcgcacagacagataaaaattacagagtacacaacatccatgaaacgcattagcaccaccattaccaccaccatcaccattacca gcttttcattctgactgcaacgggcaatatgtctctgtgtggattaaaaaaagagtgtctgatagcagcttctgaactggttacctgccgtgagtaaattaaaattttattgactta.
АВТОМОБИЛИ. Первый паровой автомобиль создал в 1769 году французский инженер Кюньо. Машина двигалась вперед со скоростью 8 километров в час.
Сортировка, поиск и фильтрация данных в базе данных и выборках
* Любой табак кроме WTO Депозит берется в течение 20 мин, как подошли все гости* В депозит входят все позиции в меню* Депозит не возвращается*
10 интересных фактов о Японии и Японцах. В состав Японии входит островов. При этом четыре наиболее крупных из них - Кюсю, Хонсю, Хоккайдо и Сикоку,
ПРИНЯТИЕ БРОНИ.
ПРИНЯТИЕ БРОНЕЙ. ОСНОВНЫЕ ФРАЗЫ ПРИ ПРИНЯТИИ БРОНИ ПО ТЕЛЕФОНУ 1. Leto Lounge, (Петровка, Дубровка, Фрунзенская)/ Проект 6/2, имя, приветствие. 2. Уточнение.
Presentation transcript:

Что можно делать с одиночной последовательностью ДНК? Как исключить векторные фланки? Рестрикционная карта Вашей последовательности Дизайн праймеров Анализ ДНК-состава Повторы в ДНК Как искать гены? (прокариоты, эукариоты) Тривиальные случаи применения сборки фрагментов

Как выявить векторные сегменты в Вашей последовательности? Просто сравнить с исходным вектором? VecScreen: “VecScreen is a system for quickly identifying segments of a nucleic acid sequence that may be of vector origin. NCBI developed VecScreen to minimize the incidence and impact of vector contamination in public sequence databases. GenBank Annotation Staff use VecScreen to verify that sequences submitted for inclusion in the database are free from contaminating vector sequence. Any sequence can be screened for vector contamination using the VecScreen Web site”contaminationVecScreen Web site

Как это выглядит?

VecScreen - output “Non-significant similarity found” – ok! В нашем случае:

Как интерпретировать результаты VecScreen? Если сегменты гомологии с векторов по краям – просто удалить их Если в нескольких местах по всей длине – проще всего… все это выбросить (!) Не надо выбрасывать, если: Вектор не ваш – он может быть просто родственным (100% сходство!) Ваш ген мог быть основой для вектора Но: если Вы видите неожиданную гомологию к E.coli или дрожжам – задумайтесь!

Почему надо бояться загрязнения ДНК чужеродными сегментами? Быть уверенным в том, что Вы анализируете (и не тратить время зря) Ошибки распространяются по базам данных с экспоненциальной скоростью: неверная информация, проблемы сборки и т.п. В Swiss-Prot даже были специальные записи (P39188 – P39195: Alu-derived белки) Будьте внимательны при работах с базами данных! (неожиданно высокая гомология к бактериям в эукариотах и т.п.)

Карта рестрикционных фрагментов Еще одна возможность проверить сиквенс на идентичность с тем, что Вы ожидаете (годится, также, для длинных геномных кусков вплоть до бактериальных геномов) Все сайты рестрикции лежат в базе данных REBASE ( Как предсказать список рестрикционных фрагментов?

REBASE

RestrictionMapper

Output

Дизайн праймеров для PCR

Primer3 Output – простой текстовый формат, предлагает четыре варианта пар праймеров, первый из которых размечен на последовательности

Что можно варьировать? Искать только левый или правый праймер, или пробу для гибридизации Предлагать свой собственный левый или правый праймер Выбрать последовательность, которую Вы хотите включить или наоборот исключить из амплифицированного фрагмента Выбрать диапазон длины фрагмента Выбрать диапазон размера олигонуклеотидов, GC-состав, точку плавления …

Анализ ДНК-состава G+C – состав Статистика ди- и три- нуклеотидов (не путайте статистику тринуклеотидов и codon usage) Частота более длинных слов

Зачем анализировать статистику ДНК? GC-состав: (динамика плавления) Ди- и тринуклеотиды - уникальная геномная подпись: –Идентификация загрязнения вектором –Свидетельство параллельного переноса –Островки патогенности –Классификация метагеномных контигов Выявление origin репликации Более длинные слова – регуляторные сигналы

Как это делать? Это самые элементарные программы – обычно установлены на компьютере EMBOSS (European Molecular Biology Open Software Suite) – бесплатный пакет (~ 100 модулей, только под Unix) Web: Осмысленно смотреть “скользящим окном”

Какие программы выбрать?

Как искать повторы в ДНК? Внутренние повторы – сегменты, встречающиеся чаще, чем ожидается Могут быть несовершенными – отличаться одной или несколькими буквами Что лучше – 5 точных букв, 9 из 10 или 111 из 145? Разные score. Какой выбрать порог? => Много программ и несопоставимые результаты. Нельзя верить отрицательным результатам

Dot-Plot approach molkit/

Как оценить сколько одинаковых слов много, а сколько нет Статистическая модель – следует вероятность слова Самый простой расчет: CTGA - 10 раз в последовательности длины Оценим вероятность: в каждой позиции - ¼*¼*¼*¼ = 1/256. Всего должно быть – 5000*1/256 ~ 20 раз Если от ожидания отличается меньше, чем в 2 раза – все нормально. То есть от 10 до 40 раз - ок

Геном-специфические повторы: RepeatMasker

Поиск (белок-кодирующих) генов Прокариоты – просто поиск длинных открытых рамок считывания (ORF) (> 100 aa) ORFing – например, ORF finder на сайте NCBI gorf/gorf.html

Output Открытые рамки сортированы по длине Графическое представление – ссылка на белковую последовательность, соответствующую ORF Можно сразу запустить бласт этой последовательности по разным подмножествам GenBank Если надо найти CDS в эукариотической мРНК – абсолютно аналогично

Более точное предсказание – GeneMark (HMM) GeneMark/ Использует Hidden Markov Models Более короткие рамки Выбор из нескольких перекрывающихся рамок Более точное предсказание старта

Heuristic Model input window Если Вы знаете геном, то лучше выбрать не Heuristic Model и указать организм

Output Графический формат – посмотреть дома!

Предсказание внутренних экзонов (позвоночные) Принцип: –ищут те участки, которые статистически похожи на белок-кодирующие сегменты (codon usage, статистика ДНК) –Выбирают только те из них, которые фланкированы подходящими последовательностями (splicing sites) То есть (!), ищут только внутренние, белок- кодирующие экзоны

MZEF

MZEF - output Результат работы программы на сегменте генома человека ~2 Kbp, включающем 2 полных экзона и экзон на границе сегмента Типичный выход – ~1/2

Поиск генов: GenomeScan На основе HMM (учитывает статистику ДНК) и динамического программирования Разные объекты предсказывают разные модули Использует белковую гомология genomescan.html

GenomeScan - output

Сборка геномных фрагментов в контиги: EGassembler Чистит последовательности Маскирует повторы Маскирует векторные сегменты Маскирует сегменты геномов органелл Собирает контиги

EGassembler - output

Поиски регуляторных сигналов Пока поиск слишком несовершенен Самые лучшие программы не доступны on-line Результаты программ должен курировать специалист Почти все подходы используют Positional Weight Matrix (PWM)

Positional weight matrix (PWM) I =  j  b f(b,j)[log f(b,j) / p(b)] Information content