מנועי חיפוש.

Slides:



Advertisements
Similar presentations
©Silberschatz, Korth and Sudarshan4.1Database System Concepts סכימה לדוגמא.
Advertisements

לומדה לשימוש ב Google Scholar en&tab=ws.
הדרכה בשימוש בקטלוג הספרייה מפגש מס ' 2 תשס " ח. מטרת ההדרכה  איתור חומר מתוך הסילבוס  איתור חומר בנושא מבוקש.
A smart phone application for sales agents בס"ד.  סוכני מכירות מגיעים ללקוח ומבצעים הזמנות ע " פ דרישות הלקוח  סוכן המכירות נעזר בקטלוג מוצרים, טלפון.
היכרות עם אקסל 1. 2 נושאי המפגש היכרות עם אקסל – אלכסוני הקסם שימושים בהוראה: מחשבון סודי ופעילות לחנוכה שימושים נוספים: ממוצע.
לא רק תחת הפנס: דרכים חדשניות לחיפוש ואחזור מידע איכותי Taly Sharon and Ariel Frank INFO April 2008.
Bar Ilan Library System מערך הספריות והמידע של אוניברסיטת בר אילן הספרייה המרכזית ע”ש וורצוויילר. מדור ההדרכה איתור עבודות.
If You Build It Will they come? Heidi Sugarman Ph.D.
תמחיר תהליך. מערכת תמחיר תהליך מערכת זו נועדה לספק מידע, כמו מערכת תמחיר הזמנה, על עלות המוצרים שיוצרו בתקופה ועל עלות המוצרים שבתהליך הייצור בסוף התקופה.
רקורסיות נושאי השיעור פתרון משוואות רקורסיביות שיטת ההצבה
חורף - תשס " ג DBMS, Design1 שימור תלויות אינטואיציה : כל תלות פונקציונלית שהתקיימה בסכמה המקורית מתקיימת גם בסכמה המפורקת. מטרה : כאשר מעדכנים.
מה החומר למבחן ? כל החומר שנלמד בהרצאות ובתרגולים. לגבי backtracking: לא תידרשו לממש אלגוריתם, אך כן להבין או להשלים מימוש נתון. אחת משאלות המבחן מבוססת.
Bar Ilan Library System מערך הספריות והמידע של אוניברסיטת בר אילן הספרייה המרכזית ע”ש וורצוויילר. מדור ההדרכה חיפוש מתקדם.
ספר סקיצות ספר סקיצות קלאסי עם יכולות ממוחשבות. ספר סקיצות רגיל  יתרונות : נוח לנשיאה, מהיר ונוח לעבודה, עמיד.  חסרונות : הכול ידני, קשה לקבל דיוקים.
משאבים אלקטרוניים לפסיכיאטריה ולמדעי ההתנהגות הרצאה לחברי החוג לפסיכיאטריה מרים גרינברג דצמבר 2007.
חורף - תשס " ג DBMS, צורות נורמליות 1 צורה נורמלית שלישית - 3NF הגדרה : תהי R סכמה רלציונית ותהי F קבוצת תלויות פונקציונליות מעל R. R היא ב -3NF.
A. Frank-T.Sharon 1 Internet Resources Discovery (IRD) Introduction to Search Engines Thanks to Chen Lin, Yossi Yitshaki and Ofer Kaatabi.
ממשק המשתמש שימושיות או בעצם תכליפאניות?. ISO9241 Web usability is the extent to which a web site enables users, in a given context of use, to achieve.
א " ב, מילים, ושפות הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 1.
א " ב, מילים, ושפות הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 1.
Bar Ilan Library System מערך הספריות והמידע של אוניברסיטת בר אילן הספרייה המרכזית ע”ש וורצוויילר. מדור ההדרכה רמב " י.
Formal Specifications for Complex Systems (236368) Tutorial #6 appendix Statecharts vs. Raphsody 7 (theory vs. practice)
תורת הקבוצות חלק ב'. קבוצה בת מניה הגדרה: קבוצה אינסופית X היא ניתנת למניה אם יש התאמה חד-חד ערכית בין X לבין .
תכנות תרגול 6 שבוע : תרגיל שורש של מספר מחושב לפי הסדרה הבאה : root 0 = 1 root n = root n-1 + a / root n-1 2 כאשר האיבר ה n של הסדרה הוא קירוב.
שילוב SQL & Keywords ממילות-חיפוש לטפסי-חיפוש מוטי פורת.
כמה עובדות... בשנת 1993 היו ברשת 130 אתרים בלבד כיום יש יותר מ-4 מיליארד דפים בכל יום מתווספים כ 7.3 מיליון דפים לרשת (Cyveillance August 2001) מנועי.
Questions are the Answer Penick&all H ISTORY R ELATIOINSHIPS A PPLICATION S PECULATION E XPLANATION.
א " ב, מילים, ושפות הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 1.
A. Frank - T. Sharon 1 Internet Resources Discovery (IRD) Web Search Options Thanks to Chen Lin and Yossi Yitshaki.
ערכים עצמיים בשיטות נומריות. משוואה אופינית X מציין וקטור עצמי מציינת ערך עצמי תואם לוקטור.
רישום חומרי למידה והסטנדרט הישראלי: ISRACORE יהודית בר אילן, אוניברסיטת בר-אילן אלי שמואלי, מיט"ל.
תיוג באינטרנט: הכוח עובר למשתמש ד"ר ג'ני ברונשטיין כנס Multi ידע בפברואר 2008.
מבני בקרה לולאות. שאלה #1 שאלה ב' – תכתוב תוכנה הכותבת את תפריט הבאה Type 1 to find the area of a circle Type 2 to find the circumference of a circle.
טיב פני שטח (טפ"ש) טיב פני שטח- רמת החלקות של המשטח.
מערכים עד היום כדי לייצג 20 סטודנטים נאלצנו להגדיר עד היום כדי לייצג 20 סטודנטים נאלצנו להגדיר int grade1, grade2, …, grade20; int grade1, grade2, …, grade20;
עקרון ההכלה וההדחה.
מבוא למדעי המחשב, סמסטר א ', תשע " א תרגול מס ' 1 נושאים  הכרת הקורס  פסאודו - קוד / אלגוריתם 1.
שימושי אינטרנט לרוקחים הקורס ליישומי מחשב ברוקחות.
מתמטיקה בדידה תרגול 2.
1 מבוא למדעי המחשב סיבוכיות. 2 סיבוכיות - מוטיבציה סידרת פיבונאצ'י: long fibonacci (int n) { if (n == 1 || n == 2) return 1; else return (fibonacci(n-1)
A. Frank-T.Sharon 1 Internet Resources Discovery (IRD) Search Engines Types Thanks to Chen Lin, Yossi Yitshaki and Ofer Kaatabi.
חיפוש כתבי עת בקטלוג האוניברסיטה. חיפוש בסיסי לכתב עת אלקטרוני בקטלוג המאוחד לכתבי עת אלקטרוניים של האוניברסיטה, ניתן לבצע חיפוש עבור כתבי עת אלקטרוניים.
חשוב לדעת! על מנת להשתמש במשאבי הספריה, עליך לעדכן פרטים אישיים בדלפק בתחילת הסמסטר הראשון ללימודים. מתוקף היותך סטודנט בטכניון, הינך זכאי לקבל שירות בכל.
Safari On-line books. מה זה ספארי ספארי זו ספריה וירטואלית בנושא מחשבים היא כוללת יותר מ כותרים כל הספרים הם בטקסט מלא ניתן לחפש ספר בנושא מסוים.
Text to speech In Mobile Phones איתי לוי. הקדמה שימוש בהודעות טקסט על המכשירים הסלולארים היא דרך תקשורת מאוד פופולארית בימינו אשר משתמשים בה למטרות רבות,
מידע באינטרנט: סיווג, איתור והערכה ניתן למצוא באינטרנט מידע מהסוגים הבאים : מידע כללי: מילונים ואנציקלופדיות כתובות דואר אלקטרוני וכתובות דואר רגילות מספרי.
WEB OF SCIENCE. WEB OF SCIENCE  Science Citation Index ExpandedTM  Social Sciences Citation Index®  Art & Humanities Citation Index®
איחזור מידע אלגוריתמי חיפוש PageRank ד " ר אבי רוזנפלד.
אתרי מתמטיקה באינטרנט לפניכם מספר אתרים מעניינים ללימוד מתמטיקה תוך כדי משחק ותרגול. אנו מניחים שמצגת זו מביאה מספר קטן מן האתרים הקיימים ברשת. אין ספק.
פיתוח מערכות מידע Class diagrams Aggregation, Composition and Generalization.
הם מאגרי מידע מקבוצת המאגרים של "רפואה מבוססת ראיות", Evidence Based Medicine – EBM מגיעה למסקנות על יעילות טיפולים על סמך ניסויים קליניים מבוקרים. Cochrane.
1 טכנולוגיות אינטרנט מתפתחות: הווב הסמנטי ויישומיו אייל סלע מנהל פרויקטים, איגוד האינטרנט הישראלי ומשרד ה -W3C הישראלי 18/5/2011.
Combo Box שלושה סוגים של Combo Box: Style 0 (default) - drop-down combo box המשתמש יכול להוסיף אפשרויות לרשימה או ללחוץ על החץ לבחירה מרשימת האפשרויות.
קשר לוגי : סיבה ותוצאה. במשפט – דוגמות קלות בגלל הגשם החלטנו לא לנסוע לטיול לחיפה. הרצון שלי להצליח הניע אותי להשקיע בלימודים. ציפורים נודדות בין יבשות.
פס על כל העיר נורית זרחי.
מספרים אקראיים ניתן לייצר מספרים אקראיים ע"י הפונקציה int rand(void);
ריקי דרורי דירקטורית שיווק איזורית, גוגל אירופה ומזה"ת
פרוקטוז, C6H12O6 , חד-סוכר מיוחד
MICROMEDEX January 2008 Vol. 135.
הנעה חשמלית.
הויגנס נגד פרמה וחוק סנל- סיבתיות מול אופטימיזציה בטבע - האם יש מקום בתוכנית הלימודים בפיזיקה? חזי יצחק תיכון לחינוך סביבתי, המחלקה.
בחירת חומר גלם כתב: עמרי שרון.
Present Simple הווה פשוט
למה.
תזכורת על מה דיברנו שיעור שעבר? בנינו אתר אינטרנט עם כותרות
Shell Scripts בסביבת UNIX
Compendex שימוש במאגר הביבליוגרפי
איתור נתונים מתקדם, בעזרת vlookup וחברים
מן הספרות ערכה והביאה לדפוס: ד"ר אדווה מרגליות
עקרונות החיפוש במאגרי מידע: הדרכה לפרוסמינר בפקולטה לחקלאות – רחובות
Presentation transcript:

מנועי חיפוש

זכרו: אף אחד לא יודע מה הגודל האמיתי של האינטרנט לא קיים כלי אחד שמכסה את כל האינטרנט. גודל הווב שאפשר בקלות להגיע אליו היום נאמד בכ 2.5 מיליארד מסמכים ומידי יום מתווספים מיליוני מסמכים. כל האינטרנט הינו פי 500 בגודלו!

מהם מנועי חיפוש? מנועי חיפוש הם מאגרי מידע ענקיים של קבצי דפי ווב אשר נאספו באופן אוטומטי (לעומת אינדקסים ידניים בהם נאסף המידע באמצעים אנושיים). ישנם מספר סוגים של מנועי חיפוש: מנועי חיפוש כלליים, אשר יצרו מאגרי מידע עצמאיים מנועי חיפוש על (או: מנועי חיפוש מרובים) (metasearchers). מנועים אלו מבצעים חיפוש במקביל במאגרי מידע שנוצרים ע"י מנועים כלליים. מנועי חיפוש ספציפיים, בניגוד למנועי חיפוש כלליים, שנועדו לאיתור מידע בכל סוג, המנוע הספציפי מתמחה במידע בתחום מסוים: ספרים, עסקים וכדומה.

כיצד עובדים המנועים? מנועי החיפוש יוצרים את מאגרי המידע ע"י שימוש ב'עכבישים' ו'רובוטים' (spiders or robots) "הזוחלים" במרחב הרשת מקישור לקישור, מזהים אתרים ורושמים את האתרים שאליהם הגיעו. כשעכביש מגיע לאתר, הוא סורק את הטקסט וממפתח את כל המילים בדף הווב ומוסיף אותם למפתח של מאגר המידע. אין חובה לחכות לעכביש שיגיע לאתר שלך: ניתן לרשום את האתר למנוע החיפוש, רישום הכרוך לעיתים בתשלום. בעת החיפוש, המנוע סורק את מפתח האתרים שלו, ומחפש התאמות למילות החיפוש שביקשתם, בתוך טקסטים של מסמכים במאגר של המנוע. חשוב לזכור - חיפוש במנוע אינו מהווה חיפוש בכל הרשת, אלא חיפוש של האתרים הרשומים במנוע בלבד. ככל שהרשת גדלה כך יעילות מנועי החיפוש קטנה. מתי רשם העכביש את האתרים? קשה לקבוע. העכבישים חוזרים מדי פעם למצוא שינויים באתרים שכבר מפתחו. כשנמצאים שינויים, מאגר המידע מתעדכן במילות המפתח החדשות. אך התהליך יכול לקחת זמן מה. (אם אתם מחפשים מידע על חדשות שמתרחשות – לכו ישירות לאתרי חדשות!)

מהם היתרונות והחסרונות של מנועי חיפוש? מנועי חיפוש מאפשרים גישה מהירה למיליוני דפים ברשת (אך לא לכל הרשת – מנוע כזה עוד לא נברא!). היתרון הוא ששיטת המפתוח מאפשרת איתור מידע לא שכיח. אך יש למנועי החיפוש חסרונות. מיליוני מילות המפתח בקטלוג מעלים את "הרעש" בחיפוש על ידי הצגת תוצאות לא רלוונטיות או לא מתאימות להקשר החיפוש. יש לזכור כי מנוע החיפוש יציג כתוצאה גם דף שבו מילת המפתח מוזכרת פעם אחת בלבד בהקשר או משמעות שונים לחלוטין ממה שהתכוונתם אליו בחיפוש.

האם כל מנועי החיפוש דומים? למרות שחלק מתכונותיהם דומות, מנועי החיפוש משתמשים בתוכנות שונות לביצוע העבודה. השונות יכולה להתבטא ב: נפח – גודל המפתח מהירות החיפוש חוקי החיפוש והתכנים – שימוש באופרטורים, קיבוץ התשובותclustering) - כאשר המנוע מציג רק את הדף העליון של האתר), שימוש באותיות גדולות/קטנות על מנת להבחין בין מילים לשמות עצם פרטיים (לדוגמא, Turkey – turkey ע"מ להבחין בין שם הארץ לשם העוף) מנועים שונים משתמשים בשיטות שונות לדרוג תוצאות החיפוש מנועים שונים מציעים אפשרויות חיפוש שונות. כתוצאה מכך, תוצאות החיפוש יהיו שונות בכל מנוע עבור מילות מפתח זהות. ההערכה היא שהחפיפה בין מנועי החיפוש עומדת על כ-60% מה שמשאיר כ-40% תוכן (תוצאות חיפוש) בלעדי לכל מנוע.

כיצד מדרגים מנועי החיפוש את התוצאות? הכללים לדרוג תוצאות החיפוש שונים ממנוע למנוע. מטרת הדירוג היא להציג את התוצאות הרלוונטיות של החיפוש בתחילת הרשימה. הדירוג מבוצע או על ידי מיקום מילת המפתח במסמך - ההנחה היא שאם המילה מופיעה בכותרת או בתחילת הדף היא כנראה מעידה על תוכנו או על פי תדירות הופעת המילה בדף. חלק מהמנועים מבצעים חיפוש בשורות הקוד הנקראות META tags. ישנם המנסים להערים על מנגנוני החיפוש ע"י הצפה של שורות אלו בעשרות מילות מפתח על מנת להתקדם בדירוג. אך מנועי החיפוש "מענישים" את המנסים להערים עליהם בדירוג נמוך במיוחד ואף סילוק מהמאגר. חלק מהמנועים מבצעים הערכת פופולאריות של דפים לפי כמות ההפניות לדף באתרים אחרים או על פי כמה מבקרים היו באתר. בהנחה שככל שהדף יותר פופולארי, אזי הוא מרכזי בתחום התוכן שלו. יש מנועים המציעים למחפש להגדיר מראש את שיטת הדירוג ולתת משקל שונה לכל ביטוי בחיפוש. חשוב להדגיש, כי הדירוג הוא גם תוצאה של שיקולים כלכלים. יתכן ותוצאה שממוקמת גבוהה ברשימה אינה דווקא הרלוונטית ביותר, אלא שמנוע החיפוש קבל אתנן עבור מיקומו זה. לכן חשוב לדפדף בתוצאות הרשימה ולא להסתפק בתוצאות הראשונות.

קריטריונים לבחינת יעילות העבודה של מנועי חיפוש: http://www.lib.berkeley.edu/TeachingLib/Guides/Internet/SrchEngCriteria.pdf

http://www. lib. berkeley http://www.lib.berkeley.edu/TeachingLib/Guides/Internet/SearchEngines.html

מנוע חיפוש מרובה / מנועי על "Meta-Search" Engines מנוע חיפוש מרובה מחפש את מילת החיפוש במנוע שלו ובמנועי חיפוש נוספים. קיימות שתי דרכים בהם עובד מנוע מרובה: א. המנוע מציג רשימה של מנועי חיפוש שאפשר לבחור מתוכם מנוע אחד או יותר לחיפוש. ב. המנוע מפעיל אוטומטית מספר מנועי חיפוש ומנפה את התוצאות הכפולות

מנועי על ישראליים www.a. co.il www.zooloo.co.il www.start.co.il

מנועי על זרים www.mamma.com www.ixquick.com www.vivisimo.com www.dogpile.com

מידע נוסף על מנועי-על: http://www.lib.berkeley.edu/TeachingLib/Guides/Internet/MetaSearch.html

מנועים ספציפיים מנועי חיפוש ספציפיים, בניגוד למנועי חיפוש כלליים, שנועדו לאיתור מידע בכל סוג, מתמחים במידע בתחום מסוים: ספרים, עסקים וכדומה. יתרונם של מנועים אלו הוא הנושא הספציפי שהם מתמחים בו המאפשר להגיע באמצעותם לפירוט רב בנושא המבוקש. כאשר ידועים לכם אתרים המכילים מנועי חיפוש ספציפיים טובים כדאי לחפש בהם תחילה.

דוגמאות למנועי חיפוש ספציפיים בנושאים שונים ספרים www.dbook.co.il www.mitos.co.il www.steimatzky.co.il www.amazon.com www.bn.com אנשים www.144.bezek.com www.whitepages.com

דוגמאות למנועי חיפוש ספציפיים בנושאים שונים יהדות www.shamash.org www.maven.co.il מסעדות www.rest.co.il עסקים www.yp.co.il wwww.yp.com