Livnat zahav & Nir golan Line segmentation for degraded handwritten historical documents Itay Bar-Yosef, Nate Hagbi, Klara Kedem.

Slides:



Advertisements
Similar presentations
כריית מידע -- Clustering
Advertisements

ממיבחניםC שאלות ++.
מבוא למדעי המחשב לתעשייה וניהול
©Silberschatz, Korth and Sudarshan4.1Database System Concepts סכימה לדוגמא.
עיבוד תמונות ואותות בעזרת מחשב
מטרות בבניית התנורמטרות בבניית התנור שהתנור יהיה כמה שיותר קרוב לעיגול, אך שיהיה נוח לבנות אותו. לא נאבד את החום בפינות התנור לא לאבד חום בדפנות התנור.
איתור ומעקב אחר הכדור בסרט וידאו של משחק כדורגל מדריך: גיא גלבוע מגישים: יגאל חלמיש גלבוע רוט.
איפיון השיזור הקוונטי של מצבים טהורים הרצאה למבחן מאסטר ישי שמעוני.
רקורסיות נושאי השיעור פתרון משוואות רקורסיביות שיטת ההצבה
Inverse kinematics (Craig ch.4) ב"ה. Pieper’s solution נתבונן ברובוט עם 6 מפרקי סיבוב כאשר שלושת הצירים של המפרקים האחרונים נחתכים. נקודת החיתוך נתונה.
חורף - תשס " ג DBMS, Design1 שימור תלויות אינטואיציה : כל תלות פונקציונלית שהתקיימה בסכמה המקורית מתקיימת גם בסכמה המפורקת. מטרה : כאשר מעדכנים.
מריוס הרשקוביץ. תוכן רקע רקע שיטות ואלגוריתמים שיטות ואלגוריתמים תוצאות תוצאות.
שאלות חזרה לבחינה. שאלה דיסקים אופטיים מסוג WORM (write-once-read-many) משמשים חברות לצורך איחסון כמויות גדולות של מידע באופן קבוע ומבלי שניתן לשנותו.
Power Consumption Awareness by using a Pedometer המעבדה לרשתות מחשבים המעבדה לרשתות מחשבים סמסטר אביב תשס " ח סמסטר אביב תשס " ח מנחים: איתי דברן – המעבדה.
מה החומר למבחן ? כל החומר שנלמד בהרצאות ובתרגולים. לגבי backtracking: לא תידרשו לממש אלגוריתם, אך כן להבין או להשלים מימוש נתון. אחת משאלות המבחן מבוססת.
רקורסיות נושאי השיעור מהן רקורסיות פתרון רקורסיות : שיטת ההצבה שיטת איטרציות שיטת המסטר 14 יוני יוני יוני 1514 יוני יוני יוני 1514.
עבודה סמינריונית Prelude to Ukkonen algorithm ON-LINE CONSTRUCTION OF SUFFIX TREES מגישים : עיד מוחמד טיבי פיראס.
Edge Detection Using MPI אמיר ושקובר אלכס הוניג. כללי  מציאת גבולות בתוך תמונה ע " י שימוש באלגוריתם למציאת שינוי גוון חדים בתמונות שהומרו לגווני אפור.
אינטרפולציה רועי יצחק.
ספר סקיצות ספר סקיצות קלאסי עם יכולות ממוחשבות. ספר סקיצות רגיל  יתרונות : נוח לנשיאה, מהיר ונוח לעבודה, עמיד.  חסרונות : הכול ידני, קשה לקבל דיוקים.
חורף - תשס " ג DBMS, צורות נורמליות 1 צורה נורמלית שלישית - 3NF הגדרה : תהי R סכמה רלציונית ותהי F קבוצת תלויות פונקציונליות מעל R. R היא ב -3NF.
A. Frank File Organization Indexed-Sequential File Introduction Thanks to Tamar Barnes.
שיחזור תמונה בעזרת סופררזולוציה.. 1. הקדמה. נתון אובייקט בעולם האמיתי. מטרה היא לקבל תמונה של האובייקט הנתון בגודל מסויים (L x L). לרשותינו נמצאית מצלמה.
מסדי נתונים תשס " ג 1 תכנון סכמות – אלגוריתם פירוק לתבניות בצורת BCNF מסדי נתונים.
עיבוד תמונות ואותות במחשב אלכסנדר ברנגולץ דואר אלקטרוני : שיטות קידוד שיטות קידוד אורך מלת קוד ואנטרופיה אורך מלת קוד ואנטרופיה קידוד.
א " ב, מילים, ושפות הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 1.
א " ב, מילים, ושפות הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 1.
משטר סטטי שערים לוגיים Wired Drives – © Dima Elenbogen 2009, Moshe Malka :29.
Formal Specifications for Complex Systems (236368) Tutorial #6 appendix Statecharts vs. Raphsody 7 (theory vs. practice)
מגישים: אנדרי זמנסקי יבגני שיפמן מנחה: ד"ר גבי דוידוב עקיבה אחרי ארבע מטרות תוך כדי מיון אוטומטי בשיטת קורלציה ו - JPDAF.
תורת הקבוצות חלק ב'. קבוצה בת מניה הגדרה: קבוצה אינסופית X היא ניתנת למניה אם יש התאמה חד-חד ערכית בין X לבין .
תכנות תרגול 6 שבוע : תרגיל שורש של מספר מחושב לפי הסדרה הבאה : root 0 = 1 root n = root n-1 + a / root n-1 2 כאשר האיבר ה n של הסדרה הוא קירוב.
1 חישוב ואופטימיזציה של שאילתות חלק 2 Query Evaluation and Optimization Part 2.
עיבוד אותות ותמונות במחשב
הרחבות המודל הבסיסי של היצע העבודה ד"ר אנליה שלוסר.
א " ב, מילים, ושפות הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 1.
Motion planning via potential fields תומר באום Based on ch. 4 in “Principles of robot motion” By Choset et al. ב"הב"ה.
ערכים עצמיים בשיטות נומריות. משוואה אופינית X מציין וקטור עצמי מציינת ערך עצמי תואם לוקטור.
The Cyclic Multi-peg Tower of Hanoi מעגלי חד-כווני סבוכיות הפתרון בגרסאות עם יותר מ-3 עמודים.
טיב פני שטח (טפ"ש) טיב פני שטח- רמת החלקות של המשטח.
אלכסנדר ברנגולץ דואר אלקטרוני: אלכסנדר ברנגולץ דואר אלקטרוני: פעולות מורפולוגיות.
עקרון ההכלה וההדחה.
Markov Decision Processes (MDP) תומר באום Based on ch. 14 in “Probabilistic Robotics” By Thrun et al. ב"הב"ה.
מתמטיקה בדידה תרגול 2.
1 מבוא למדעי המחשב סיבוכיות. 2 סיבוכיות - מוטיבציה סידרת פיבונאצ'י: long fibonacci (int n) { if (n == 1 || n == 2) return 1; else return (fibonacci(n-1)
ניתוח בחינת הבגרות במכניקה ומעבר..... מכניקה – שאלה 3.
Points on a perimeter (Convex Hull) קורס – מבוא לעבוד מקבילי מבצעים – אריאל פנדלר יאיר ברעם.
1 מבוא למדעי המחשב backtracking. 2 מוטיבציה בעיית n המלכות: נתון: לוח שחמט בגודל. המטרה: לסדר על הלוח n מלכות כך שאף אחת לא תאיים על השנייה. דוגמא: עבור.
Text to speech In Mobile Phones איתי לוי. הקדמה שימוש בהודעות טקסט על המכשירים הסלולארים היא דרך תקשורת מאוד פופולארית בימינו אשר משתמשים בה למטרות רבות,
11 Introduction to Programming in C - Fall 2010 – Erez Sharvit, Amir Menczel 1 Introduction to Programming in C תרגול
Interpolation Functions in Matlab By Dmitriy Katsif.
פיתוח מערכות מידע Class diagrams Aggregation, Composition and Generalization.
1 חלק XQuery :IV XML Query. 2 ביבליוגרפיה - DTD 3 ביבליוגרפיה – books.xml TCP/IP Illustrated Stevens W. Addison-Wesley Advanced Programming in.
1 Formal Specifications for Complex Systems (236368) Tutorial #1 Course site:
קשר לוגי : סיבה ותוצאה. במשפט – דוגמות קלות בגלל הגשם החלטנו לא לנסוע לטיול לחיפה. הרצון שלי להצליח הניע אותי להשקיע בלימודים. ציפורים נודדות בין יבשות.
פס על כל העיר נורית זרחי.
מצגת סוף סמסטר מנחה: ד"ר גבי נקבלי מגיש: ויקטור מרגוליס
מספרים אקראיים ניתן לייצר מספרים אקראיים ע"י הפונקציה int rand(void);
Tirgul 12 Trees 1.
Formal Specifications for Complex Systems (236368) Tutorial #1
SQL בסיסי – הגדרה אינדוקטיבית
חיפוש לוקלי Local Search.
פרוקטוז, C6H12O6 , חד-סוכר מיוחד
משימת חקר מכוון ללמידה משמעותית
Marina Kogan Sadetsky –
בחירת חומר גלם כתב: עמרי שרון.
קצוות תמונה Edge Detection
תזכורת על מה דיברנו שיעור שעבר? בנינו אתר אינטרנט עם כותרות
סמינר בנושאים מתקדמים בעיבוד תמונה
NG Interpolation: Divided Differences
Presentation transcript:

Livnat zahav & Nir golan Line segmentation for degraded handwritten historical documents Itay Bar-Yosef, Nate Hagbi, Klara Kedem

הקדמההקדמה מסמכים היסטוריים מציבים הרבה אתגרים בפנינו כאשר אנו באים לנתח אותם כמסמך גרפי. חלק גדול מהמסמכים סובלים מבלאי קשה, אם מדובר בדפים קרועים, מחיקה של חלק מהכתוב או כתמי דיו.

הקדמההקדמה נדון תחילה בשני אלגוריתמים אשר מטפלים בבעיה של הפרדת שורות במסמכים היסטוריים. וניגע בחסרונות של כל אחד מהאלגוריתמים הללו. לאחר מכן נדון באלגוריתם שבו עוסק המאמר. בשונה מרוב האלגוריתמים, וגם מאלו שנציג, האלגוריתם שנדון בו יעבוד על המסמך ישירות ולא על העיבוד הבינארי שלו ( 0 ללבן ו-1 לשחור או להפך). כלומר ינתח את המסמך בגווני אפור (תחום בין (,זאת בעזרת שיטה הנקראת LPP-Local projection profile analysis.

LPP-Local Projection Profile לפני שנעסוק בהבנת האלגוריתמים יש צורך בהבנת שיטת ה- LPP, או בעברית פרופיל הטלה מקומי. ע"י מעבר על הציר האופקי של תמונת המסמך נסכום את ערכי הפיקסלים ונבנה פרופיל הטלה. הפרופיל הוא מעין גרף אשר מייצג את כמות וערכי הפיקסלים בציר האופקי בהטלה לציר האנכי. נקודות השיא בגרף מייצגות שורות טקסט ואילו נקודות המינימום הקרויות "עמקים" מייצגות את הרווח בין השורות.

LPPיתרונות וחסרונות של שיטת ה- LPPיתרונות וחסרונות של שיטת ה- יש כמה יתרונות בשיטת פרופיל ההטלה: 1. אין צורך להפוך את התמונה לבינארית. מה שהופך את השיטה למאוד מתאימה לעבודה ישירה על התמונה בגווני אפור. 2.השיטה עמידה בפני רעשים והפרעות.

LPPיתרונות וחסרונות של שיטת ה- LPPיתרונות וחסרונות של שיטת ה- החיסרון המרכזי של השימוש בהטלה הוא הרגישות הגבוהה לנטיית השורות במסמך. אפילו זווית מזערית יכולה להפוך את ההטלה ללא יעילה. סיבוב המסמך כך שהשורות תהיינה ישרות יכולה להוות פתרון טוב אך זו לא תמיד קיימת וזאת כיוון שלרוב לכל אחת מן השורות במסמך יש זווית שונה.

אלגוריתמים קיימים לפתרון בעיית השורות הנטויות בעיית השורות הנטויות אלגוריתמים קיימים לפתרון בעיית השורות הנטויות בעיית השורות הנטויות חלק מהאלגוריתמים פותרים את בעיית הנטייה של השורות ע"י חלוקת המסמך לרצועות אנכיות לא חופפות וביצוע LPP על כל אחת מן הרצועות בנפרד. בכל רצועה "העמקים" שמתקבלים הם אפשרות לרווח בין שורות הטקסט. "עמקים" של שתי רצועות רצופות מחוברים ביחד בהתאם לחוקים מוגדרים. ניתן לראות כי ההפרדה המתקבלת היא בצורת "מדרגות" זאת מכיוון ש"העמקים" לא מחוברים ישירות, כלומר אין חפיפה בין הרצועות שנלקחו.

אלגוריתמים קיימים לפתרון בעיית השורות הנטויות בעיית השורות הנטויות אלגוריתמים קיימים לפתרון בעיית השורות הנטויות בעיית השורות הנטויות אלגוריתם נוסף יוצר תמונה מטושטשת (blurred) שנקראת ALCM-Adaptive Local Connectivity Map (תמונה 1.d). ALCM היא תמונה בגווני אפור אשר בה כל ערך של פיקסל מחושב בהתאם לערכי הפיקסלים השכנים לו בתמונה המקורית. ממירים את תוצאת ה-ALCM לתמונה בינארית ע"י ביצוע thresholding. בעקבות פעולה זו מתגלות תבניות ברורות של שורות טקסט שמהן ניתן להפיק את ההפרדה בין השורות. (תמונה 1.c).

אלגוריתמים קיימים לפתרון בעיית השורות הנטויות בעיית השורות הנטויות אלגוריתמים קיימים לפתרון בעיית השורות הנטויות בעיית השורות הנטויות ישנן שתי מגבלות לשיטה זו, הראשונה היא שניתן לתמוך רק בזווית מסוימת של שורות הטקסט. והשנייה היא שהתמונה המטושטשת שמתקבלת (תמונת ה- ALCM) תלויה באופן ישיר בבלאי שממנו סובל המסמך שאותו מעבדים. כתוצאה מכך הפיכת המסמך לתמונה בינארית קשה לא פחות מהפיכת המסמך המקורי לתמונה בינארית. 1.d1.c 1.a

האלגוריתם בו עוסק המאמר האלגוריתם פותר את הבעיות שבהם נתקלו האלגוריתמים הקודמים שהצגנו. נחלק את האלגוריתם לשני שלבים: 1. חישוב LPP 2. מציאת מינימום (מציאת עמקים)

שלב ראשון של האלגוריתם חישוב LPP לרצועה הכי שמאלית של המסמך. (מדובר בכתב לטיני. אם היה מדובר בעברית או ערבית היינו מבצעים את הפעולה על הרצועה הימנית ביותר במסמך). במהלך ביצוע האלגוריתם נעדכן את ה-LPP ע"י הוספת עמודה נוספת לימין הרצועה המוזזת והורדת העמודה השמאלית ביותר ברצועה, תוך כדי ביצוע ה-LPP לכל פיקסל.

שלב שני של האלגוריתם למצוא מינימום מקומי (מציאת "העמקים") לכל פרופיל הטלה. בשלב הקודם ביצענו חישוב LPP, וכעת בהינתן פרופיל ההטלה נבצע החלקה בעזרת נגזרת גאוס. נתבונן בפונקציה המוחלקת שהתקבלה ונמצא נקודות בהן הנגזרת של הפונקציה מתאפסות על מנת למצוא את נקודות המינימום. התוצאה של הפעולה הנ"ל היא רצף של קווי גבול מופרדים, שכל אחד מתאים לרווח בין שתי שורות טקסט שכנות.

בכל תמונה ישנו רעש אשר מתווסף לתמונה, במקרה שלנו הרעש בא לידי ביטוי ככתמי דיו ובלאי של המסמך. הרעש הנ"ל מתווסף לחישוב פרופיל ההטלה, דבר היכול לגרום לנקודות שיא שאינן היו מופיעות אם המסמך היה ללא רעש. באותו אופן גם לגבי נקודות המינימום בפרופיל ההטלה. בעזרת נגזרת ראשונה של גאוס ניתן לבצע החלקה של פונקציה. את ההחלקה מבצעים על מנת לקבל מינימום גלובלי ולא מינימום מקומי. כאשר המינימום הגלובלי מתאר מינימום "אמיתי" של הפונקציה ללא רעש. נגזרת ראשונה של גאוס

פונקציה עם רעש נגזרת ראשונה של גאוס הפונקציה המוחלקת

סקירה מעמיקה של האלגוריתם באלגוריתמים שבהם דנו קודם רוחב הרצועה נקבע באופן יוריסטי (כלל אצבע המבוסס על הגיון פשוט או אינטואיציה, המציע דרך קלה ומהירה לקבל החלטות) ע"י ממוצע האורך של המילה. בחינה מדוקדקת מגלה שישנם כמה פרמטרים חשובים שמשפיעים על רוחב הרצועה אשר משפיעים מאוד על הביצועים של גישת ה-LPP.

סקירה מעמיקה של האלגוריתם נסמן ב- את זווית הנטייה, ∆L את המרווח האנכי בין שתי שורות הטקסט ו-∆H את הקו המאונך ל-∆L.

סקירה מעמיקה של האלגוריתם תוצאה טובה של רוחב הרצועה המקומית תתקבל ע"י גילוי נכון של "העמק" בין שתי השורות. כפי שמתואר בתמונה בשקופית הקודמת. בחירת ∆H כרוחב הרצועה יפיק ערך מינימום יחיד של פרופיל ההטלה. בחירת רצועה קטנה מ-∆H : עדין יופקו ערכי מינימום בטווח הנכון, אבל ערכים אלו יהיו מועדים לשגיאות של מינימום מקומי הנובעות לדוגמא מרווח בין מילים. בחירת רצועה רחבה מ-∆H : לא תספק מיקום נכון של נקודת המינימום של פרופיל ההטלה.

סקירה מעמיקה של האלגוריתם המשוואה מסבירה את התלות של רוחב הרצועה בזווית הנטייה המקומית והרווח בין שורות הטקסט. כאשר זווית הנטייה גדלה, הרוחב של הרצועה אמור להיות קטן יותר. למרות שהשיטות שמופיעות באלגוריתמים בהם דנו משמשות לעבודה על מסמכים בעלי נטיות טקסט קלות, ההשפעה של מרווחי השורות עדין משמעותית. המשמעות היא ששיטת ה- LPP מועדת לשגיאות כאשר מדובר בנטיות גדולות של התמונה או שורות טקסט עם מרווחים קטנים.

סקירה מעמיקה של האלגוריתם עניין חשוב נוסף היא ההשפעה של הפעלת שיטות LPP ישירות על תמונה בלויה בגווני אפור. 1.כתמי דיו, חלקים דהויים ומעבר של הכתב בין צידי הדף, כולם מסבכים את הניתוח של נקודת המינימום של פרופיל ההטלה. במקרה זה ההשלכה הנגזרת מרצועות צרות מדי או רחבות מדי היא יותר גדולה. 2. יש חשיבות גדולה לשימוש ברצועות רחבות כאשר מדובר במסמכים בלויים זאת מכיוון שמרווחים בין שורות יכולים להתפספס וכשיש הופעות של כתמי דיו וחלקים דהויים הדבר יכול להוביל לשגיאה בחישוב המינימום של פרופיל ההטלה.

התמודדות של האלגוריתם עם רוחב הרצועה על מנת להתגבר על בעיית רוחב הרצועה והמגבלה של ה-LPP בנושא זה, ועל מנת לאפשר רצועות רחבות יותר, האלגוריתם מממש את שיטת ה-LPP בצורה אינקרמנטלית (מצטברת) בהתאם לכיוון של שורות הטקסט, במקום לבצע הטלה אופקית ישירה על התמונה. זאת מאחר וברוב המסמכים כיוון שורות הטקסט משתנה באופן תדיר, הרעיון הוא לממש את שיטת ה- LPP בצורה מצטברת, כלומר רצועה אחר רצועה. במהלך תהליך האלגוריתם אנחנו מחשבים את הכיוון של שורות הטקסט ברצועה הנוכחית, וממשיכים באלגוריתם האינקרמנטלי בכיוון החדש שהתקבל כתוצאה מהרצועה הנוכחית. נחלק את תהליך זה לשני שלבים: 1.אומדן נטייה מקומית. 2. פרופיל הטיה מכוון.

אומדן נטייה מקומי 1.ביצוע האלגוריתם על הרצועה הנוכחית מתבטא בסט של קווי הפרדה, כל אחד מהם תואם לרווח בין שורות הטקסט. 2. הכיוון הממוצע של קווי ההפרדה מקורב באמצעות נקודות ההתחלה והסיום של הרצועה הנוכחית, אשר נושא את הקירוב לזווית המקומית של שורת הטקסט. 3. שורות טקסט סמוכות מקובצות יחדיו בהתאם לזוויות הנטייה המקומית שלהן. מאחר ושיטת ה-LPP יכולה להתמודד עם זוויות נטייה קטנות ( ), שורות טקסט אשר שונות האחת מהשנייה בעד מקובצות יחדיו. בכך אנחנו מתארים איך ליישם את שיטת ה-LPP על קבוצה מסוימת של שורות שלהן יש בקירוב את אותו הכיוון. התהליך מיושם באופן בלתי תלוי על כל אחת מהקבוצות הללו.

פרופיל הטיה מכוון לאחר שיש קבוצה בעלת כיוון נתון נתקדם בכיוון זה. הרעיון הבסיסי הוא לקבל את הנטייה הממוצעת של הרצועה הקודמת ואז להטיל את הרצועה החדשה לכיוון הנטייה הזו. בעמוד הבא ניתן לראות תמונה המכילה שלוש רצועות סמוכות, כל אחת מופרדת ע"י קו מקווקו, כאשר הרצועה השמאלית ביותר כבר חושבה.

פרופיל הטיה מכוון תחילה אנו מחשבים את נקודות הבקרה של קווי ההפרדה ברצועה הראשונה, נקודות הבקרה הן נקודות החיתוך של שורת ההפרדה העליונה והתחתונה עם הקווים האנכיים המגדירים את ההתחלה והסוף של הרצועה (התמונה בעמוד הקודם). נשים לב שבמטרה ליישם את אלגוריתם ההפרדה לרצועה הבאה יש צורך גם ברצועה העוקבת. לשם כך אנחנו מחשבים את נקודות הבקרה של התמונה המכילה את שתי הרצועות העוקבות. CP2 מחושב ע"י הרחבה של קו ההפרדה דרך הנקודות (T1,T2) עד שהוא מגיע לסוף הרצועה השלישית (T3). באופן דומה אנחנו מחשבים את B3 (התמונה בדף הבא)

פרופיל הטיה מכוון

בשלב הבא אנחנו מחשבים ומיישמים T spatial transformationאשר ממפה את CP2 לפינות של תמונה מלבנית בעלת מידות. כאשר T2 B2 T3 B3 T2T3 B3B2 M Spatial transformation T N

פרופיל הטיה מכוון מאחר והקו העובר דרך (T2,T3) הוא לא בהכרח מקביל לקו העובר דרך (B2,B3), משתמשים ב- projective transformation שהיא צורה מסוימת של spatial transformation. התוצאה של הטרנספורמציה הזו היא תמונה של מלבן מתוקן (בתמונה 4.c) שבו שורות הטקסט הן כמעט אופקיות. בשלב זה אנחנו יכולים ליישם את שיטת ה-LPP על הרצועה.

% Set up an input coordinate system so that the input image % fills the unit square with vertices (0 0),(1 0),(1 1),(0 1). I = imread('cameraman.tif'); udata = [0 1]; vdata = [0 1]; % Transform to a quadrilateral with vertices (-4 2),(-8 3), % (-3 -5),(6 3). tform = maketform('projective',[ 0 0; 1 0; 1 1; 0 1],... [-4 2; -8 -3; -3 -5; 6 3]); % Fill with gray and use bicubic interpolation. % Make the output size the same as the input size. [B,xdata,ydata] = imtransform(I, tform, 'bicubic',... 'udata', udata,... 'vdata', vdata,... 'size', size(I),... 'fill', 128); subplot(1,2,1), imshow(udata,vdata,I), axis on subplot(1,2,2), imshow(xdata,ydata,B), axis on Projective transformation

פרופיל הטיה מכוון 4.d4.c

פרופיל הטיה מכוון השלב האחרון הוא ליישם inverse transformation לתוצאה המתקבלת לשם קבלת התוצאה הסופית הנראית בתמונה 4.d בעמוד הקודם. ע"י התקדמות רצועה אחר רצועה ועדכון נקודות הבקרה המתאימות, אנחנו דואגים כי אלגוריתם ה-LPP תמיד מיושם על שורות טקסט אופקיות יחסית. ע"י כך אנחנו לא מוגבלים לאף זווית נטייה, ויכולים להשתמש ברצועות גדולות יותר. הרוחב של כל רצועה מוגדר בהתאם ליחס. מאחר ואלגוריתם ה-LPP יכול להתמודד ביעילות עם זוויות נטייה של הוגדרה המשוואה,כאשר מקורב מפרופיל ההטלה של הרצועה הראשונה.

1. התוצאה של הפעלת האלגוריתם היא הפרדת שורות ברורה, אשר מבטאת את הזווית של כל שורת טקסט בנפרד. זאת בשונה מהתוצאה שהתקבלה באלגוריתם שדנו בו קודם שבו התקבלה הפרדת שורות במראה של מדרגות. מראה המדרגות הוא הפרדה תקינה כאשר מדובר בטיפול במסמך בינארי, מכיוון שהגבולות מסמנים לאיזה רכיב שייכת כל שורת טקסט. אבל כאשר מדובר בתמונה בגווני אפור שלא עברה עיבוד בינארי יש צורך בניתוח מדויק של שורות הטקסט מפני שלא ניתן להפעיל תהליך שמשייך את השורות לרכיבים. (התהליך הזה פועל על מידע בינארי בלבד) יתרונות האלגוריתם

2. שיוך "העמקים" הנוצרים מפרופילי הטלה שכנים. כתוצאה מהרזולוציה של הפרופילים נגרם איחוד טבעי של שני "עמקים" שכנים. (תמונה 2.b). לעומת איחוד בין שני "עמקים" שכנים שנעשה ע"י חיבור של כל נקודת שיא לנקודת השיא של הרצועה השכנה לו. (תמונה 2.a) כפי שניתן לראות חוק זה של חיבור שתי נקודות השיא לא תמיד מפיק את התוצאה הרצויה. יתרונות האלגוריתם 2.a2.b

נערכו שני סטים של ניסויים על 30 מסמכים בלויים. כל אחד מהמסמכים הכיל שורות טקסט, ו- 50% מהמסמכים הכילו שורות טקסט נטויות בעלות זוויות שונות. תוצאות הניסוי של האלגוריתם

בניסוי הראשון האלגוריתם יושם על כל המסמכים. מאחר והניסויים בוצעו על תמונות בגווני אפור, ההערכה נעשתה בעזרת תצפית ויזואלית. בניסוי השני נוצר עוד סט ע"י סיבוב ידני של כל אחד מהמסמכים ב-8 זוויות שונות בתחום עם הפרש. המטרה של הניסוי השני הייתה לבדוק את החסינות של האלגוריתם לכמות גדולה של זוויות נטייה. התוצאות היו מבטיחות מאוד. בניסוי הראשון 98% משורות הטקסט הופרדו נכון. הסיבה העיקרית ל-2% טעות הייתה זיהוי שגוי של "העמקים" בפרופיל ההטלה המקומי. התוצאות של הניסוי השני היו כמעט זהות. בכל המסמכים שנבדקו האלגוריתם הסתגל נכון לזוויות הנטייה, חוץ ממספר שגיאות בתחילת המסמך. הסיבה לכך נעוצה בעובדה שהאלגוריתם מתוכנן להסתגל לזווית הנטייה במהלך עבודתו. כאשר הוא הסתגל לנטייה של המסמך הביצועים היו תואמים לביצועים על המסמכים בניסוי הראשון. תוצאות הניסוי של האלגוריתם

הצגנו גישה חדשנית להפרדה בין שורות טקסט המסתמכת על פרופיל הטלה מקומי. הצענו אלגוריתם מהיר LPP) שמתאים למסמכים ישנים בעלי עקמומיות ונטייה מתונה). החלק השני של הגישה שלנו והחידוש העיקרי בה הוא יישום אלגוריתם ה-LPP בצורה אינקרימנטלית, כך שהוא מסתגל לנטייה של המסמך במהלך עבודתו. השיטה המוצעת השיגה תוצאות מדויקות מאוד על סט של מסמכים בלויים בעלי זוויות נטייה שונות. מסקנות וסיכום:

סוף

חזרה לשקופית