Video Crawler מגישים: ארז וויטיץ רון הראל מנחה: מקסים גורביץ'

Slides:



Advertisements
Similar presentations
תוכנה 1 סמסטר א ' תשע " ב תרגול מס ' 7 * מנשקים, דיאגרמות וביטים * לא בהכרח בסדר הזה.
Advertisements

מבוא למדעי המחשב לתעשייה וניהול
תוכנת EndNote – תוכנה חיונית לחוקר ולמרצה מאת: ד"ר דפנה רבן ביה"ס לניהול והמרכז לחקר חברת המידע, אוניברסיטת חיפה
מערכות הפעלה ( אביב 2009) חגית עטיה © 1 מערכות קבצים מבוזרות  מבוא  מבנה כללי  דוגמה : Network file system  דוגמה : Google file system.
מערכות הפעלה ( אביב 2008) חגית עטיה © 1 מערכות קבצים מבוזרות  מבוא : שקיפות ושמירת מצב.  דוגמה : Network File System.
פרויקט ויקיספר מתמטיקה משולבת : עריכת ויקיספר על ידי קבוצת מורים בסביבה מותאמת רוחמה אבן, שי אולשר, גילה אוזרוסו - חגג המחלקה להוראת המדעים, מכון ויצמן.
היכרות עם אקסל 1. 2 נושאי המפגש היכרות עם אקסל – אלכסוני הקסם שימושים בהוראה: מחשבון סודי ופעילות לחנוכה שימושים נוספים: ממוצע.
רקורסיות נושאי השיעור פתרון משוואות רקורסיביות שיטת ההצבה
רשימה מקושרת Linked Lists. דוגמא STRING איך עושים Dim x as String בלי לדעת מראש את הגודל !
1 מבוא למדעי המחשב משתנים. 2  סוגי משתנים בשפת C  ההבדלים בין סוגי המשתנים השונים.
RSS. על מה נדבר מה זה RSS ולמה צריך את זה היסטוריה ותקנים איך כותבים איך קוראים.
RSS אוקטובר RSS – Really Simple Syndication תקן שמשמש להפצת תכנים ברשת – חדשות והודעות למעקב אחר עדכונים חדשים מוזן ב- XML - Extensible Markup Language.
שאלות חזרה לבחינה. שאלה דיסקים אופטיים מסוג WORM (write-once-read-many) משמשים חברות לצורך איחסון כמויות גדולות של מידע באופן קבוע ומבלי שניתן לשנותו.
Power Consumption Awareness by using a Pedometer המעבדה לרשתות מחשבים המעבדה לרשתות מחשבים סמסטר אביב תשס " ח סמסטר אביב תשס " ח מנחים: איתי דברן – המעבדה.
Bar Ilan Library System מערך הספריות והמידע של אוניברסיטת בר אילן הספרייה המרכזית ע”ש וורצוויילר. מדור ההדרכה חיפוש מתקדם.
עבודה סמינריונית Prelude to Ukkonen algorithm ON-LINE CONSTRUCTION OF SUFFIX TREES מגישים : עיד מוחמד טיבי פיראס.
המעבדה לבקרה ורובוטיקה 1 חקירה אמפירית של ניתוב תחרותי ברשתות תקשורת מגישים : דרור עמר & איתי ג ' ורג ' י מנחה : ישי מנשה סמסטר : חורף תשס "
פרויקט מחקרי בנושא יחס הזהב ואסתטיקה של מנשקים ARD מנחה : פרופ ' נעם טרקטינסקי מנחה אקדמי : פרופ ' יובל אלוביץ ' מגישים : אפרת דוד ארסני קרופניק.
Map-Reduce Input: a collection of scientific articles on different topics, each marked with a field of science –Mathematics, Computer Science, Biology,
מחקר בנושא: דיאגנוסטיקה של כלי עיבוד לטיפול בשיניים
RSS מדור הדרכה ויעץ ינואר RSS – Really Simple Syndication משמש להפצת תכנים ברשת – חדשות והודעות משמש למעקב אחר עדכונים חדשים העדכון מגיע לכתובת.
צוות : גרייף אלה כורך אילנה רשקובסקי לובה אוניברסיטת בו גוריון בנגב מחלקה להנדסה תוכנית להנדסת תוכנה Application Requirements Presentation.
Formal Specifications for Complex Systems (236368) Tutorial #6 appendix Statecharts vs. Raphsody 7 (theory vs. practice)
צורות נורמליות הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 10.
דוד שוורץ, עידן זק, נטע צור וחיה כהן. הפונקציונאליות:  המשתמש בוחר קובץ שעליו הוא רוצה לבצע את האנליזה, ולוחץ עליו עם כפתור ימני בעכבר.  נפתח תפריט.
הרחבות המודל הבסיסי של היצע העבודה ד"ר אנליה שלוסר.
מערכות הפעלה ( אביב 2009) חגית עטיה ©1 מערכת קבצים log-structured  ה log הוא העותק היחיד של הנתונים  כאשר משנים בלוק (data, header) פשוט כותבים את הבלוק.
הודעות ריענון מהיר חומרה והגדרות ערוצים המשך... תרגולים בדגימת ערוצים. Counters.
מגישים עמיחי פוקס לליב גפן מנחה ארי טוטפלד מערכת GPS קולית.
רישום חומרי למידה והסטנדרט הישראלי: ISRACORE יהודית בר אילן, אוניברסיטת בר-אילן אלי שמואלי, מיט"ל.
תיוג באינטרנט: הכוח עובר למשתמש ד"ר ג'ני ברונשטיין כנס Multi ידע בפברואר 2008.
מבני בקרה לולאות. שאלה #1 שאלה ב' – תכתוב תוכנה הכותבת את תפריט הבאה Type 1 to find the area of a circle Type 2 to find the circumference of a circle.
פרויקט באבטחה מגישים : מרינה יצינה שי פרץ
Galileo Navigation System Software Systems lab Software Systems lab סמסטר חורף תשס " ט סמסטר חורף תשס " ט מנחה: ולדימיר זדורנוב משה חיות מבצעים: גליה סימנובסקי.
1 Data Structures, CS, TAU, Perfect Hashing בעיה: נתונה קבוצה S של n מפתחות מתחום U השוואה ל- Hash : * טבלה קבועה (Hash רגיל - דינאמי) * רוצים זמן קבוע.
פרויקט מחקרי בנושא יחס הזהב ואסתטיקה של מנשקים ADD מנחה : פרופ ' נעם טרקטינסקי מנחה אקדמי : פרופ ' יובל אלוביץ ' מגישים : אפרת דוד ארסני קרופניק.
Global Motion Estimation קורס : מבוא לעיבוד מקבילי מרצה: דר' גיא תל צור מגישים: גלעד נרקיס אייר רום אייר רום קבוצה: pp3.
1 מבוא למדעי המחשב סיבוכיות. 2 סיבוכיות - מוטיבציה סידרת פיבונאצ'י: long fibonacci (int n) { if (n == 1 || n == 2) return 1; else return (fibonacci(n-1)
הטכניון - מכון טכנולוגי לישראל TECHNION - ISRAEL INSTITUTE OF TECHNOLOGY הפקולטה להנדסת חשמל המעבדה לבקרה ורובוטיקה תכנות רובוט מסוג AIBO בעזרת תכנת Webots.
Safari On-line books. מה זה ספארי ספארי זו ספריה וירטואלית בנושא מחשבים היא כוללת יותר מ כותרים כל הספרים הם בטקסט מלא ניתן לחפש ספר בנושא מסוים.
Points on a perimeter (Convex Hull) קורס – מבוא לעבוד מקבילי מבצעים – אריאל פנדלר יאיר ברעם.
Text to speech In Mobile Phones איתי לוי. הקדמה שימוש בהודעות טקסט על המכשירים הסלולארים היא דרך תקשורת מאוד פופולארית בימינו אשר משתמשים בה למטרות רבות,
מערכות הפעלה ( אביב 2008) חגית עטיה © 1 מערכת הקבצים  מבוא : מטרות מערכת קבצים  מנשק המשתמש : פעולות על קבצים, ארגון קבצים, הגנה  תכונות של דיסקים.
1 ׃1998 Morgan Kaufmann Publishers פקודת ה- jump 4 bits 26 bits 2 bits 00 : כתובת קפיצה במילים : כתובת קפיצה בבתים … …
CCN CCN Central Control Network Part A presentation Winter & Spring 2002/03 Student : Kormas Tal Guide : Gerber Alex.
איחזור מידע אלגוריתמי חיפוש PageRank ד " ר אבי רוזנפלד.
Advanced Topics in Search Theory 3: Concurrent Search.
Engineering Science Short term Long term Tactical Strategic Vertical Horizontal Product Teams Microsoft Research Labs bridge the gap.
אתרי מתמטיקה באינטרנט לפניכם מספר אתרים מעניינים ללימוד מתמטיקה תוך כדי משחק ותרגול. אנו מניחים שמצגת זו מביאה מספר קטן מן האתרים הקיימים ברשת. אין ספק.
פיתוח מערכות מידע Class diagrams Aggregation, Composition and Generalization.
Copyright © 2003 Fair Isaac Corporation and Ness AT Corp. All rights reserved. מנוע חוקים עסקיים Blaze Advisor מציג: גיל ששון, מנהל המוצר
Wallwisher Writing in the Present Progressive. Task 1 Enter our site. Click on Wallwisher. Click on “Describing Pictures”. – Post one sticky note for.
Yaron Doweck Yael Einziger Supervisor: Mike Sumszyk 1.
Contents Building Web Services כתב אקת'ם חאג' יחיא BuildingWeb Services Building Web Services
Operating Systems Practical Session 10 File Systems 1.
File Systems Motivation SQL (Structured Query Language) MapReduce 1 תרגול 1.
שיאון שחוריMilOSS-il מוטיבציה  python זה קל ו C זה מהיר. למה לא לשלב?  יש כבר קוד קיים ב C. אנחנו רוצים להשתמש בו, ולבסס מעליו קוד חדש ב python.
1 חלק XQuery :IV XML Query. 2 ביבליוגרפיה - DTD 3 ביבליוגרפיה – books.xml TCP/IP Illustrated Stevens W. Addison-Wesley Advanced Programming in.
מבוא למדעי המחשב לתעשייה וניהול הרצאה 6. מפעל השעווה – לולאות  עד עכשיו  טיפלנו בייצור נרות מסוג אחד, במחיר אחיד  למדנו להתמודד עם טיפול במקרים שונים.
דוח אמצע סמסטר אביב תשס"ב 2002 שם הפרויקט :סביבת בדיקה ל PCIX PCIX environment מנחה : איתי אדר מגישים : שמיל ניסימוב גוילי יואב הטכניון.
אביב תשס " ה JCT תיכון תוכנה ד " ר ר ' גלנט / י ' לויאןכל הזכויות שמורות 1 פרק 5 תרשימי מצבים Statecharts למחלקות תגובתיות Reactive Classes הקדמה ודוגמא.
אחסן, סנכרן ושתף את הקבצים שלך
עדכון נתונים אישיים באתר המומחים
עבודה עם נתונים באמצעות ADO.NET
מבוא ל Maven אליהו חלסצ'י תכנות מתקדם תרגול מספר 3
מנועי חיפוש.
למה.
תהליכים-דייאט: חוטים מוטיבציה חוטי משתמש וחוטי מערכת
Shell Scripts בסביבת UNIX
מבוא למערכות מידע פרק 1.
Presentation transcript:

Video Crawler מגישים: ארז וויטיץ רון הראל מנחה: מקסים גורביץ'

מטרות הפרויקט  סיוע בבניית מאגר סרטוני וידאו לצרכי מחקר ראיה ממוחשבת  תמיכה בהורדה פשוטה ומהירה של כמויות גדולות של סרטוני וידאו ומידע רלוונטי לגביהם

אתגרים מרכזיים  יש לעקוב אחרי המידע הרב שמורידה התוכנה ולנהל אותו בצורה מסודרת (על מנת למנוע הורדות כפולות, הורדות חלקיות ועוד...)  כמות המידע הגדולה איתה עובדים והדרישות מהתוכנה דורשות עבודה מקבילית עם מספר גדול של רכיבים  אתרי שיתוף שונים מאכסנים את הלינקים לסרטונים בצורות שונות

אתגרים מרכזיים (המשך)  אתרי שיתוף שונים מאכסנים את המידע הרלוונטי לגבי הסרטונים בצורות שונות  אתרי שיתוף הסרטונים לא תומכים בהורדה ישירה של הסרטונים  הכמות הגדולה של המידע המורד ע"י התוכנה דורש אכסון מסודר וידידותי שלו במאגר המשתמש

הפתרון- High Level  ה- Video Crawler (VC)ינהל את המידע איתו הוא עובד באמצעות Data Base  ה- VC יתמוך במציאת לינקים לסרטונים באתרים השונים בהתאם לצורת אכסונם באותם האתרים

הפתרון- High Level (המשך)  הורדת הסרטונים מאתרי השיתוף הנתמכים ע"י ה- VC באמצעות שימוש בכלי עזר חיצוני להורדות סרטונים הנקרא My Downloader  הורדת המידע הרלוונטי באתרים השונים תאופשר בהתאם לצורת אכסון המידע באתרים השונים  מאגר המידע במחשב המשתמש יאוכסן על פי היררכיית קבצים ידידותית

דוגמא: צורת אכסון של לינק בדף תוצאות חיפוש ב- YouTube

היררכיית הקבצים במחשב המשתמש

תיאור ה- Design: Class diagram

Videos searching- sequence diagram

Videos downloading- sequence diagram

Data Base  תפקידו להבטיח סנכרון בין פעולות הרכיבים השונים על הסרטונים עליהם עובדים  מאפשר מעקב אחרי סטאטוסי הטיפול בסרטונים  מאפשר גיבוי של המידע על מנת להצילו במקרה של קריסת התוכנה

Data Base  כל כניסה ב- DB מכילה ארבעה שדות: ID- מזהה את הסרטון באופן ייחודי Status- מלמד על סטאטוס הטיפול בסרטון URL- כתובת ההורדה של הסרטון Source site- מציין את האתר ממנו מורד הסרטון  כל רכיב הניגש ל- DB לצורך הוספת כניסה/בקשת כניסה/ שינוי סטאטוס של כניסה יעבור דרך Mutex  בכל פרק זמן מוגדר מראש יגבה ה- DB את המידע ע"י שמירתו לקובץ XML במחשב המשתמש

דוגמא למבנה ה- Data Base ה- ID של הסרטון ה- URL של הסרטוןהסרטון מורד מהאתר MetaCafe סטאטוס- הורדות הסרטון וה- Meta Data הסתיימו סטאטוס- הסרטון בשלבי הורדה סטאטוס- הסרטון ממתין הורדה הסרטון מורד מהאתר YouTube הסרטון מורד מהאתר MetaCafe

Downloader  אחראי על הורדת הסרטונים מאתרי השיתוף  משתמש בכלי חיצוני לצורך ההורדה  מבקש מה- DB קליפים להורדה וימשיך לעבוד כל עוד יש כאלה  מספר תהליכים מוגדר מראש של Downloader יורידו סרטונים במקביל

Site Handler  אחראי על הורדת ה- Meta Data הרלוונטי על הסרטונים מאתרי השיתוף  לכל אתר שיתוף תהיה מחלקת Site Handlerהמטפלת בו:

Site Handler  כל Site Handler משתמש במחלקה מסוג Meta Data המתאימה לאתר עובד ה Handler  השדות של Meta Data מתארים את המידע הרלוונטי בעמוד ה- Meta Data  את ה- Meta Data מוצאים באמצעות חיפוש XPATH  ה- Meta Data של הסרטון ישמר בקובץ XML ייחודי לאותו סרטון

דוגמא למציאת Meta Data ב- YouTube ה- XPATH:

פיתוחים עתידיים  תמיכה בהורדת High Quality מ- YouTube  תמיכה בקידוד לפורמטים נוספים מלבד MPG  הוספת תמיכה בהורדה מאתרים נוספים

דמו