Ген-ориентированные базы данных и геномные браузеры Что такое ген-ориентированные базы данных? Самые простые примеры таких БД Примеры геном-ориентированных.

Slides:



Advertisements
Similar presentations
Submitting a Genome to RAST. Uploading Your Job 1.Login to your RAST account. You will need to register if this is your first time using SEED technologies.
Advertisements

© Wiley Publishing All Rights Reserved. Using Nucleotide Sequence Databases.
Databases (“knowledge bases”) used in genome analysis
Beyond PubMed and BLAST: Exploring NCBI tools and databases Kate Bronstad David Flynn Alumni Medical Library.
Genome databases and webtools for genome analysis Become familiar with microbial genome databases Use some of the tools useful for analyzing genome Visit.
NCBI web resources I: databases and Entrez Yanbin Yin Fall 2014 Most materials are downloaded from ftp://ftp.ncbi.nih.gov/pub/education/ 1.
Integrating dbSNP with P. falciparum genome resources.
Genomic Innovations- Orthology Paralogy. Genomic innovation.
Basic Genomic Characteristic  AIM: to collect as much general information as possible about your gene: Nucleotide sequence Databases ○ NCBI GenBank ○
Peter Tsai, Bioinformatics Institute.  University of California, Santa Cruz (UCSC)  A rapid and reliable display of any requested portion of genomes.
Visualization of genomic data Genome browsers. UCSC browser Ensembl browser Others ? Survey.
Tutorial 7 Genome browser. Free, open source, on-line broswer for genomes Contains ~100 genomes, from nematodes to human. Many tools that can be used.
Genome Browsers Carsten O. Daub Omics Science Center RIKEN, Japan May 2008.
Biological databases.
Sequence Analysis MUPGRET June workshops. Today What can you do with the sequence? What can you do with the ESTs? The case of SNP and Indel.
Copyright OpenHelix. No use or reproduction without express written consent1 Organization of genomic data… Genome backbone: base position number sequence.
Visualization of genomic data Genome browsers. How many have used a genome browser ? UCSC browser ? Ensembl browser ? Others ? survey.
UCSC Archaeal genome browser Advanced browsing September 19, 2006 David Bernick, Aaron Cozen and Todd Lowe September 19, 2006 David Bernick, Aaron Cozen.
UCSC Genome Browser Tutorial
Genome Browsers Ensembl (EBI, UK) and UCSC (Santa Cruz, California)
Genomic Database - Ensembl Ka-Lok Ng Department of Bioinformatics Asia University.
Swiss-Prot – одна из первых баз данных белковых последовательностей, “gold standard” белковой аннотации. Аннотация выполнена вручную группой профессиональных.
Genome Browsing with the UCSC Genome Browser
UCSC Archaeal genome browser September 19, 2006 David Bernick, Aaron Cozen and Todd Lowe September 19, 2006 David Bernick, Aaron Cozen and Todd Lowe.
Как найти последовательность, кодирующую Ваш белок? Как найти последовательность ДНК, кодирующую Ваш белок: – Ссылки из белковых баз данных – Прямой поиск.
Visualization of genomic data Genome browsers. UCSC browser Ensembl browser Others ? Survey.
Doug Brutlag 2011 Genome Databases Doug Brutlag Professor Emeritus of Biochemistry & Medicine Stanford University School of Medicine Genomics, Bioinformatics.
Doug Brutlag Professor Emeritus Biochemistry & Medicine (by courtesy) Genome Databases Computational Molecular Biology Biochem 218 – BioMedical Informatics.
Doug Brutlag 2011 Next Generation Sequencing and Human Genome Databases Doug Brutlag Professor Emeritus of Biochemistry & Medicine Stanford University.
The Genome Genome Browser Training Materials developed by: Warren C. Lathe, Ph.D. and Mary Mangan, Ph.D. Part 1.
Spring 2006, v7 Copyright OpenHelix. No use or reproduction without express written consent 1 The UCSC Genome Browser Search, retrieve and display the.
Genome Annotation and Databases Genomic DNA sequence Genomic annotation BIO520 BioinformaticsJim Lund Reading Ch 9, Ch10.
1 The Genome Browser allows you to –Browse the Rice-Japonica, Maize and Arabidopsis genomes. –View the location of a particular feature on the rice genome.
NCBI’s Bioinformatics Resources Michele R. Tennant, Ph.D., M.L.I.S. Health Science Center Libraries U.F. Genetics Institute January 2015.
NCBI FieldGuide NCBI Molecular Biology Resources January 2008 Using Entrez.
GENOME-CENTRIC DATABASES Daniel Svozil. NCBI Gene Search for DUT gene in human.
Doug Raiford Lesson 3.  More and more sequence data is being generated every day  Useless if not made available to other researchers.
Copyright OpenHelix. No use or reproduction without express written consent 2 Overview of Genome Browsers Materials prepared by Warren C. Lathe, Ph.D.
UCSC Genome Browser 1. The Progress 2 Database and Tool Explosion : 230 databases and tools 1996 : first annual compilation of databases and tools.
Genomics and Personalized Care in Health Systems Lecture 5 Genome Browser Leming Zhou, PhD School of Health and Rehabilitation Sciences Department of Health.
Genome databases and webtools for genome analysis Become familiar with microbial genome databases Use some of the tools useful for analyzing genome Visit.
DAY 1c: Accessing Completed Genomes 1. UCSC Genome Bioinformatics 2. Ensembl 3. NCBI Genomic Biology.
Browsing the Genome Using Genome Browsers to Visualize and Mine Data.
Professional Development Course 1 – Molecular Medicine Genome Biology June 12, 2012 Ansuman Chattopadhyay, PhD Head, Molecular Biology Information Services.
NCBI FieldGuide NCBI Molecular Biology Resources March 2007 Using Entrez.
Biological databases Exercises. Discovery of distinct sequence databases using ensembl.
Copyright OpenHelix. No use or reproduction without express written consent1.
Copyright OpenHelix. No use or reproduction without express written consent1.
Cool BaRC Web Tools Prat Thiru. BaRC Web Tools We have.
Copyright OpenHelix. No use or reproduction without express written consent1.
What do we already know ? The rice disease resistance gene Pi-ta Genetically mapped to chromosome 12 Rybka et al. (1997). It has also been sequenced Bryan.
Tools in Bioinformatics Genome Browsers. Retrieving genomic information Previous lesson(s): annotation-based perspective of search/data Today: genomic-based.
Copyright OpenHelix. No use or reproduction without express written consent1.
Genomes at NCBI. Database and Tool Explosion : 230 databases and tools 1996 : first annual compilation of databases and tools lists 57 databases.
Welcome to the combined BLAST and Genome Browser Tutorial.
NCBI: something old, something new. What is NCBI? Create automated systems for knowledge about molecular biology, biochemistry, and genetics. Perform.
Visualization of genomic data Genome browsers. How many have used a genome browser ? UCSC browser ? Ensembl browser ? Others ? survey.
GeneConnect Use Cases and Design August 3, GeneConnect Database IDs are linked by Direct Annotation, Inferred Annotation, or Sequence Alignment.
Introduction to Bioinformatics
GEP Annotation Workflow
Access to Sequence Data and Related Information
Visualization of genomic data
gene-CENTRIC database
INFORMATION FLOW AARTHI & NEHA.
Ensembl Genome Repository.
Next Generation Sequencing and Human Genome Databases
Biological Databases BI420 – Introduction to Bioinformatics
with the Ensembl Genome Browser
Gene Safari (Biological Databases)
Problems from last section
Presentation transcript:

Ген-ориентированные базы данных и геномные браузеры Что такое ген-ориентированные базы данных? Самые простые примеры таких БД Примеры геном-ориентированных баз данных и геномные браузеры Human Genome Browser

Что такое ген-ориентированные базы данных? Единица исследования – ген (а не экспериментальная последовательность) Призваны снабжать информацией по конкретному гену, а не “последовательностям, относящимся ко данному конкретному гену” – интегрируют все такие части в единое целое за Вас

Первый пример – Gene Entrez (бывший LocusLink) в NCBI Единица – генетический локус – конкретное место на хромосоме, кодирующее данный белок и/или соответствующее данному гену

DUT ген человека

Продолжение записи: Bibliography –Related Articles in PubMed –GeneRIFs: Gene References Into Function Interactions General gene information –Markers –Genotypes –Pathways –Homology GeneOntology General protein information (Names, ECs, ACs) NCBI Reference Sequences (RefSeq) –mRNAs and proteins –Reference assembly + Alternate assembly: Genomic Related Sequences (links between ACs of different types) Additional Links (OMIM, PharmGKB, HRDP, UniGene)

MapViewer

Геномные базы данных Объект – полный геном Возможность одновременно изучать все гены одного генома Сравнение друг с другом целых геномов – сравнительная геномика (comparative genomics) Интеграция всей доступной информации о данном геноме Основная информация о генах, но в геномном контексте Геномные браузеры – графическое представление всей интегрированной информации NCBI -> Genomic Biology (

Вирусные геномы Под таблицей – поиск (точное название генома или любого другого уровня таксономии)

HIV2 геном

Sequence Viewer

“Protein coding genes” link

gMap (comparative genomics) Zoom in, zoom- out Выбрать подмножество геномов Или кластер (!) Графическая схема в каждом окне своя!

Бактериальные геномы на сайте NCBI Tools legend: T - TaxMap; P - ProtTable; C - COG Table; D - 3-D neighbors; L - BLAST; S - CDD search; G - GenePlot; X - TaxPlot; M - gMap; F - FTP; R - Publications

COG Table

COG Table – регион (Overview)

TaxMap Каждая точка – ген Положение – слева направо, сверх вниз Цвет соответствует таксону лучшего BLAST-хита Только выше выставленного порога Распределение всех бласт хитов – нижняя диаграмма Click на точку – список бласт хитов к сегменту

Genomes in progress

TIGR Comprehensive Microbial Resources Стратегия – от инструмента, а не от генома scripts/CMR/CmrHomePage.cgi

Все геномы на TIGR

Эукариоты NCBI – Map Viewer, FTP для полной последовательности, таксономические группы, ссылки на специализированные базы данных MapViewer – подобно LocusLink

Human Два основных браузера: Ensembl ( – EBI & Sanger Institute, использует свои IDs, 35 эукариотических видов Human Genome Browser ( – UCSC, USAhttp://genome.ucsc.edu/ использует GenBank IDs, 41 эукариотический вид

Ensembl Ensembl Tutorials and Worked Examples:

Human Genome Browser RefSeq ID Chr Band Gene name Coords

DUT gene (dUTPAse)

Анализ RefSeq трека

Provided tracks (types)

Custom Track Возможность визуализировать свою собственную аннотацию: места локализации каких-либо своих свойств Upload – в BED, GFF, GTF, WIG или PSL формате: Напр., chr name11+ chr name21+ chr name31-

Как это выглядит?

BLAT BLAT = BLAST с параметрами, оптимизированны ми на поиск локализации последовательно- стей в родном геноме

Table Browser