ניתוח של אלגוריתמים להתאמת תבניות אינווריאנטית לסיבוב ולקנה מידה סמסטר חורף תשס " ח ערן דהן מנחה : מר אריה נחמני
מבוא האפשרויות של מציאת אובייקט נתון בתוך תמונה קבועה או משתנה שימוש בתעשיות ביטחוניות כגון מצלמות אבטחה החיסכון האדיר במשאבים ובכוח אדם מהירות
הבעיות להם ניתנו פתרון בעיית החיפוש: בהינתן אובייקט ותמונה נרצה לקבוע האם האובייקט נמצא בתמונה בעיית הארה בעלת סטטיסטיקה קבועה: כאשר יש הארה שונה של האובייקט בתמונה נרצה חיפוש חכם יותר המאפשר אינוורינטיות להארה שונה בעיית הסיבוב: בהינתן שתי תמונות אחת מסובבת לעומת השנייה בזווית סיבוב כלשהי נרצה לקבוע האם שתי התמונות זהות
המשך בעיית ההגדלה: בהינתן שתי תמונות אחת מוגדלת יחסית לשנייה בפקטור הגדלה מסוים נרצה לקבוע האם יש התאמה בין התמונות בעיית ההסתרה: בהינתן תמונה בה האובייקט מוסתר נרצה לממש חיפוש חכם יותר שיוכל לתת לנו אינדיקציה האם האובייקט נמצא בתמונה
בעיית החיפוש SSD נרצה למצוא את האובייקט: בתוך התמונה: מה שבעצם נעשה הוא: ניקח את האובייקט ונעבור איתו בתוך התמונה תוך כדיי שאנחנו משווים בין האובייקט לאותו חלק בתמונה. המקסימום מתקבל בפיקסל המקסימום מתקבל בפיקסל 117X47כמצופה
בעיית השינוי הארה SVOD sum variance of differences בסטטיסטיקה קבועה מה שנעשה כדיי להתגבר על השינוי הארה הוא להשתמש באותו חיפוש כמו שהשתמשנו קודם אך כעת אנחנו קודם נמצע – נעשה ממוצע על האזור שבו אנחנו מחפשים בתמונה כדיי להוריד ערך קבוע – הארה קבועה נבנה את המטריצה: ונחפש למטריצה הזו מקסימום
בעיה חשובה יש בעיה מובנית בשיטה הזו מכיוון שאנחנו ממצעים על הערכים של התמונה נראה דוגמא: במידה ואנחנו מחפשים אובייקט לבן לגמרי על תמונה שחורה לגמרי הממוצע המתקבל הוא והערך של הסימגה זאת אומרת שמקבלים ש:
נחשוב שיש התאמה מושלמת למרות שיש אי התאמה מושלמת מה שעשיתי כדיי להתגבר על הבעיה הזו: בעיה!!! SSD מטריצה המעידה על "בערך המיקום" SVOD האם האובייקט בכלל יכול להיות במיקום זה לפי מטריצת ה SSD כן לאהכנס 0 למטריצת ה SVOD הכנס ערך למטריצת ה SVOD
דוגמא לבעיה החשובה לקחנו תמונה של קיבוע לבן וריבוע אפור והרצנו חיפוש כדיי למצוא את הריבוע הלבן זו תמונת המוצא שהתקבלה. כאשר נקודה לבנה מראה על ההתאמה לעומת זאת כאשר העברנו את התמונה לאחר התיקון התקבל פיק בדיוק כנדרש 51X51
דוגמא לבעיית ההארה בסטטיסטיקה קבועה לקחנו את אותה תמונה כמו בדוגמא הקודמת אך הפעם שינינו לה את ההארה רנדומאלית בכל התמונה(בערך +-50): ושוב חיפשנו את האובייקט: ועדיין התקבל לנו פיק כמצופה בפיקסל 117X47
מגבלות בפתרון בעיית החיפוש והאהרה השתדלנו לעבוד ברמה ל פיקסלים בודדים הרמה הנמוכה ביותר שנוסתה היא 30 פיקסלים יש לזכור שאם ישנם שני אובייקטים הדומים בתמונה יש לדאוג ששינוי ההארה לא יגרום לאחד לקבל ציום גבוה יותר מהשני
בעיית הסיבוב נתונות לנו שתי תמונות אחת מסובבת יחסית למרכזה בזווית מסוימת ונרצה למצוא את זווית הסיבוב כדיי להסביר את פתרון בעיית הסיבוב נסביר על המרה לקוארדינטות log-polar מכיוון שסיבוב בזווית מסוימת מתורגם להזזת התמרת פורייה בקוארדינטות פולריות
התמרת log – polar בהנתן לנו תמונה בקוארדינטות x,y נרצה להעביר אותה לקוארדינטות לשם כך נשתמש בהמרה המוכרת : אך במקום להמיר נקודה מסוימת בתמונה המקורית לערכי הרדיוס והזוית נעבוד הפוך ונבנה לנו מטריצה בגודל שהמשתמש יבחר המטריצה תייצג ערכי רדיוס וזווית בדומה למטריצה המייצגת ערכי x,y. אנו עובדים בצורה הפוכה כזו כדיי שהמטריצה של הרדיוס והזווית תיהיה מטריצה רציפה.
ובמילים אחרות אנו עוברים מהרדיוס הכי מינימלי שהוא 0 לרדיוס הכי מקסימלי שהוא המרחק ממרכז התמונה לקצה של התמונה ומזווית 0 לזווית 360 בקפיצות שתלויות בגדול המטריצה (נבחר ע"י המשתמש) ומבצעים את המיפוי וכך בעצם מממפים כל רדיוס וזווית לערך x,y ואז הולכים לתמונה בערך x,y המתאים וממפים אותו לערך הרדיוס והזווית שנבחרו
לדוגמא נקח את התמונה של לנה בקוארדינטות רגילות x,y זו התמונה של לנה אחרי שהעברנו אותה לקוארינטות של רדיוס וזווית כדיי להסביר את העיגולים השחורים בסוף התמונה נסתכל על התמונה הבאה: הרדיוס נמדד מאמצע התמונה, רדיוס אפס לרדיוס המקסימלי לקצוות התמונה. אך כאשר נעבור עם הרדיוס המקסימלי על זווית שונות נצא מגבולות התמונה ושם לא יהיה ערך במטריצת התמונה לכן יוכנס ערך אפס למטריצת הרדיוס זווית ערך אפס זהו צבע שחור.
כמו שהסברנו העברנו את התמרת הפורייה של שתי התמונות כדיי למדוד הזזה של אחת כלפי השנייה אך מה שיצא לנו זה שההזזה לא מתאימה לערך הסיבוב לכן עברנו ומדדנו עבור כל זווית את ההזזה הנמדדת בין שתי ההתמרות והוצאנו את הגרפים: הגרף המתאים לזווית של מעלות הגרף המתאים לזווית של 0-90 מעלות זאת אומרת שהצלחנו למצוא התאמה בין זווית הסיבוב לההזזה הנמדדת. ההזזות אינוורינטיות לסיבוב של 180 מעלות
בעיית ההגדלה כעת נתונות לנו שתי תמונות אחת מוגדלת כלפי מרכזה בפקטור מסוים ובדומה לסיבוב בזוית, ההגדלה מתרגמת להזזה בציר של הרדיוס של ההתמרות בדומה לבעיית הסיבוב גם כאן ההזזה לא היתה כמצופה אך הצלחנו לבנות גרף לינארי עבור ערכים מסוימים של הגדלה
סכמה לבלוק הסיבוב\הגדלה FFT LOG- POLAR Shift measure Discover the angle by putting the measured shift in the right table
דוגמא נוספת לסיבוב לקחנו את התמונה:ואת התמונה המסובבת: מדדנו את ההיסט בין התמונות וגילינו כי ההיסט הוא 20.5 לפי הטבלה היסט זה מתאים לערך של סיבוב של 30 מעלות בדיוק כמו שסיבבנו את התמונה
דוגמא נוספת להגדלה לקחנו את התמונה הבאה:והקטנו אותה פי 0.9 (ניתן לראות זאת לפי הצירים) מדדנו את ההיסט בציר הרדיוס וקבלנו ערך של -1.5 המתאים לפי הטבלה בדיוק להגדלה של 0.9
מגבלות בפתרון בעיית הסיבוב וההגדלה בבעיית הסיבוב יש זווית מסוימות שעבורם לא התקבל ערך נכון: 130, 150. בבעיית ההגדלה רק ערכים מסוימים הצליחו להימדד : בקפיצות של 0.1 חוץ מהערכים במקומם נמדד כמו כן נזכור שהמשתמש קובע את הדיוק של התמרת log – polar במידה והוא יבחר דיוק שונה יהיו טבלאות שונות וגרפים שונים.
בעיית ההסתרה לעיתים האובייקט מוסתר בתמונה, בסעיף זה יש למשתמש אפשרות לבחור את הדיוק. האלגוריתם הוא: נחלק את האובייקט ל n חלקים שווים ונעביר כל חלק בחיפוש של ה VOD כאשר כל חלק יקבל ציון לפי מידת ההתאמה שלו לתמונה המשתמש יגדיר לנו כמה חלקים הוא רוצה לקחת k, ואנחנו ניצור אובייקט חדש לפי ה k חלקים שקיבלו את הציון הכי גבוה
דוגמא לבעיית ההסתרה לדוגמא יש לנו את האובייקט הזה: בתמונה האובייקט מוסתר: נחלק את האובייקט ל 9 חלקים ונעביר חלק חלק: נבחר את ה 7 חלקים שקיבלו את הציון הכי טוב את האובייקט החדש שיצרנו נעביר שוב בחיפוש VOD לקבלת ההשערה הכי טובה להיכן שהאובייקט המוסתר נמצא בתמונה
דוגמא לבעיית ההסתרה לקחנו את התמונה כאשר האובייקט מוסתר: ניסינו לחפש את האובייקט: ואכן התקבל לנו פיק כנדרש בפיקסל 117X47
דוגמא להסתרה בעייתית רצינו לחפש את הריבוע הלבן הנמצא בפיקסלים 51X51 אך ריבוע זה היה מוסתר בחציו על ידי ריבוע שחור אך הפעם התקבל לנו פיק ב 101X101 ז"א שלא הצלחנו לזהות את הריבוע הנכון, לא היה מספיק מידע.
מגבלות בפתרון בעיית ההסתרה בבדיקת ההסתרה אנחנו מחלקים את האובייקט ל n חלקים שווים, אנחנו לא נוכל לקחת אובייקטים ממש קטנים כי אז שנחלק אותם ל n חלקים יכול להיות שהחלקים שנקבל יהיו כל כך קטנים שיכילו רק מספר פיקסלים בודד. כאשר אנחנו מריצים את החיפוש עם פיקסל בודד הוא יקבל ציון גבוה תמיד כי תמיד יש פיקסל שדומה לו כך גם עם מספר פיקסלים בודד כמו כן הגבלנו את העבודה שלנו לאובייקטים המתחלקים ב n למספר חלקים שווה
סיכום בפרויקט זה עסקנו בכמה בעיות מהותיות בחיפוש של אובייקט בתוך תמונה בעיית החיפוש בעיית ההארה בעיית הסיבוב בעיית ההגדלה בעיית ההסתרה לכל הבעיות האלו הצלחנו לממש בשפת matlab פתרונות יעילים.
דוגמא נוספת נרצה למצוא את האובייקט בתוך התמונה: כמו שעשינו קודם נעביר בפילטר שבנינו ואכן מתקבל פיק כמצופה בפיקסל 91X91
דוגמא נוספת לבעיית ההסתרה ניתן לראות את ההסתרה בכובעה של לנה חיפשנו את החלק של הכובע (ללא ההסתרה): ואכן קבלנו פיק במטריצה בפיקסל 91X121