Presentation is loading. Please wait.

Presentation is loading. Please wait.

Introduction to Bioinformatics - Tutorial no. 1 NCBI Entrez Genome Browser.

Similar presentations


Presentation on theme: "Introduction to Bioinformatics - Tutorial no. 1 NCBI Entrez Genome Browser."— Presentation transcript:

1 Introduction to Bioinformatics - Tutorial no. 1 NCBI Entrez Genome Browser

2 NCBI Entrez

3 Entrez http://www.ncbi.nlm.nih.gov/Entrez/

4 Entrez – cont ’ d לכל אחד מהמאגרים ב-Entrez יש דף כניסה המאפשר להתחיל את החיפוש ממנו. מצד שני, כל המאגרים מחוברים זה לזה (החיבורים כבר נעשו בזמן אחסון המידע, ולכן שליפתם מאוד מהירה). יכולת זו היא נקודת החוזק העיקרית של Entrez – היא מאפשרת לחוקר "לגלוש" בקלות (בקליק) בין רשומות הקשורות ביניהן אך נמצאות במאגרים שונים (למשל בין גן לחלבון, בין מחלה לגן, וכו...).

5 מאגרים ב -Entrez OMIM: Online Mendelian Inheritance in Man  http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=OMIM http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=OMIM  “ is a catalog of human genes and genetic disorders “  זהו קטלוג ערוך (באוניברסיטת Johns Hopkins)  מכיל רשומות על מחלות ורשומות על גנים שמשתתפים בהם.  החיפוש מוצא את שני סוגי הרשומות. (לכן יכולות להיות כפילויות).

6 שדות ברשומת מחלה:  DESCRIPTION  CLINICAL FEATURES  INHERITANCE  MAPPING  CLINICAL MANAGEMENT  EVOLUTION  ANIMAL MODEL  ועוד ועוד... (צד שמאל של המסך)  שדה MOLECULAR GENETICS מכיל קישור לרשומת גן. OMIM – cont ’ d

7 שדות ברשומת גן של מחלה:  DESCRIPTION  CLONING – היסטוריית השיבוט של הגן  GENE FUNCTION  MAPPING  ALLELIC VARIANTS  GENOTYPE/PHENOTYPE CORRELATIONS  ועוד... OMIM – cont ’ d

8 החיפוש מתבצע בברירת מחדל בכל השדות  לכן, חיפוש CF יחזיר גם מחלות שיש להם קשר עקיף. אפשר להגביל את החיפוש לשדה מסוים.  רשימת השדות ב-OMIM נמצאת ב: http://www.ncbi.nlm.nih.gov/entrez/Omim/omimhelp.html#SearchFields  קל להגיע אליה דרך ה-help בדף הראשי של OMIM.  כדי להגביל את החיפוש נכתוב את שם השדה מיד לאחר המילה המבוקשת בתוך סוגריים מרובעים.  למשל: CF [TI] כדי לחפש רק בכותרת.  ניתן לבצע חיפושים מורכבים יותר (המערבים כמה שדות) – פרטים בהמשך.

9 Entrez – cont ’ d כל "נקודות הכניסה" ל-Entrez דומות בממשקן ויכולות החיפוש שלהן. בדומה, הממשק שמציג את הרשומות זהה (במידת הניתן- הרי מדובר בסוגי אינפורמציה שונים)

10

11 Entrez: Nucleotide The Entrez Nucleotides database is a collection of sequences from several sources, including GenBank, RefSeq, and PDB זהו אינו "עותק דיגיטלי של הגנום" אלא רשימת רצפים שהוגשו (submitted) למאגר, ויכולים להיות למשל:  רצפי DNA גנומים (כוללים אינטרונים, פרומוטרים וכו')  רצפי mRNA  רצפים ש"נחשבים" כגנים (putative)  רצפים גנומים ש"רוצפו" (sequenced) אך תפקודם לא ידוע לכן יש המון:  חזרות  חפיפות  גרסאות שונות

12 גם כאן, כל רשומה היא מעין 'תיקיה'- שמכילה, בנוסף לרצף ה- DNA/RNA גם שדות כמו:  AUTHORS – מי הגיש את הרצף  REFERENCESמאמרים הקשורים לרצף –  ORGANISM  FEATURES:  מידע על חלקים של הרצף  למשל שבנוקלאוטידים 79...56 יש אקסון.  או שבנוקלאוטיד 103 יש SNP- כלומר לפעמים יש A במקום G.  או שבנוקלאוטידים 5985... 7814 יש CDS. אם נרצה לקבל רק את הרצף, נבחר ב-'display' להציג את הרשומה בפורמט FASTA. אם נרצה לראות את הסידור של features על הרצף, נוכל להשתמש בתצוגת Graphics. Entrez: Nucleotide

13 Entrez: PubMed “includes over 14 million citations for biomedical articles back to the 1950's” רשימת השדות- http://www.ncbi.nlm.nih.gov/entrez/query/static/help/pmhelp.html#Se archFieldDescriptionsandTags לדוגמא: Title [ti] Author [au] Affiliation [ad] Journal title [ta] Journal issue [ip] Publication date [dp] Language [la] MESH term [mh]

14 חיפושים מורכבים ניתן לחבר קריטריונים שונים לחיפוש ספציפי יותר:  ע"י שימוש ב-Boolean operators: AND OR NOT OR = ו/ או AND קודם ל-OR (כמו שכפל קודם לחיבור)  אפשר לעקוף זאת ע"י עטיפת חלקים מהביטוי בסוגריים.

15 לדוגמא CF AND Jones[au] OR Smith[au] (CF AND Jones[au]) OR Smith[au] לעומת זאת, כשכותבים: CF AND (Jones[au] OR Smith[au]) נקבל את התוצאה הרצויה

16 ממשק Entrez – יכולות נוספות Limits: מסך המאפשר להריץ בקלות חיפושים מסוגים שכיחים- לפי סוג המידע  למשל- במסך ה-limits של PubMed נוכל לבחור publication date ואילו ב-OMIM נוכל לבחור כרומוזום אליו ממופית המחלה. History: מאפשר לנו לראות את החיפושים האחרונים שביצענו ולחבר ביניהם (#2 AND #6).

17 MESH Terms "אוצר מילים" ברפואה / מדעי החיים במכיל יותר מ- 19,000 מילים. המילים מסודרות בהיררכיה. כל מאמר שמוכנס ל-PubMed מתואר ע"י אוסף המונחים הספציפי ביותר במאגר. המשתמש יכול לחפש לפי מונחים ספציפיים אלו או לפי המונחים הכלליים יותר. בחירת מונחים מתוך MESH לחיפוש- ע"י מסך Preview/Index.

18 IDs and Accessions לכל רשומה ב-Entrez יש "מזהה יחודי" שנקרא ID או לפעמים Accession. במידה וידוע המזהה ניתן לחפש לפיו בשורת החיפוש ולהגיע ישר לרשומה.

19 UCSC Browser

20 UCSC Genome Browser (1) OrganismAssembly dateDisplay size http://genome.ucsc.edu/

21 UCSC Genome Browser (2) Move left/rightZoom in/outCurrent range Position Track title Track description

22 UCSC Genome Browser Tracks

23 Other Resources Human Genome at Department of Energy  http://www.ornl.gov/hgmis/ Ensembl genome browser  http://www.ensembl.org/ NCBI human genome resources  http://www.ncbi.nlm.nih.gov/genome/guide/ Nature genome gateway  http://www.nature.com/genomics/human/


Download ppt "Introduction to Bioinformatics - Tutorial no. 1 NCBI Entrez Genome Browser."

Similar presentations


Ads by Google