(C) סיון טל גילוי מידע וזיהוי תבניות תרגול מס. 9 גילוי מידע וזיהוי תבניות תרגול מס. 9 דחיסת נתונים מהו קידוד תכונות של קידודים אי - שוויון קרפט.

Slides:



Advertisements
Similar presentations
Completeness and Expressiveness. תזכורת למערכת ההוכחה של לוגיקה מסדר ראשון : אקסיומות 1. ) ) (( 2. )) ) (( )) ( ) ((( 3. ))) F( F( ( 4. ) v) ( ) v ((
Advertisements

ממיבחניםC שאלות ++.
מבוא למדעי המחשב לתעשייה וניהול
טבלאות סמלים נכתב ע"י אלכס קוגן סמסטר חורף, תשס"ח.
Number Theory and Algebra Advisor …………… Dr. Shpilka Amir Presented by …… Cohen Gil..………
מתמטיקה בדידה תרגול 3.
רקורסיות נושאי השיעור פתרון משוואות רקורסיביות שיטת ההצבה
מסדי נתונים תשס " ג 1 תכנון סכמות (Design Theory) מסדי נתונים.
חורף - תשס " ג DBMS, Design1 שימור תלויות אינטואיציה : כל תלות פונקציונלית שהתקיימה בסכמה המקורית מתקיימת גם בסכמה המפורקת. מטרה : כאשר מעדכנים.
עבודה סמינריונית Prelude to Ukkonen algorithm ON-LINE CONSTRUCTION OF SUFFIX TREES מגישים : עיד מוחמד טיבי פיראס.
אוטומט מחסנית הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 11.
חורף - תשס " ג DBMS, צורות נורמליות 1 צורה נורמלית שלישית - 3NF הגדרה : תהי R סכמה רלציונית ותהי F קבוצת תלויות פונקציונליות מעל R. R היא ב -3NF.
1 Trees CLRS: chapter A hierarchical combinatorial structure הגדרה רקורסיבית: 1. צומת בודד. זהו גם שורש העץ. 2. אם n הוא צומת ו T 1 ….T K הינם עצים,
1 Data Structures, CS, TAU, Splay Tree Splay Tree  מימוש של עץ חיפוש בינארי  מטרה לדאוג ל- Amortized Time  פעולה בודדת יכולה לקחת O(N)  אבל כל רצף.
סמינר במדעי המחשב 3 עודד פרץ משפט הנורמליזציה החזקה.
(C) סיון טל גילוי מידע וזיהוי תבניות תרגול מס. 4 חזרה על בעיית השערוך, שיטות פרמטריות. שיטת MAP ( בייסיאנית ) לשערוך פרמטרים. שיטת הנראות המירבית. השיטה.
מסדי נתונים תשס " ג 1 תכנון סכמות – אלגוריתם פירוק לתבניות בצורת BCNF מסדי נתונים.
עיבוד תמונות ואותות במחשב אלכסנדר ברנגולץ דואר אלקטרוני : שיטות קידוד שיטות קידוד אורך מלת קוד ואנטרופיה אורך מלת קוד ואנטרופיה קידוד.
א " ב, מילים, ושפות הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 1.
Data Structures, CS, TAU, Splay Tree 1 Splay Tree - עץ חיפוש בינארי - מטרה לדאוג ל - Amortized Time - פעולה בודדת יכולה לקחת O(N) - אבל כל רצף M פעולות.
א " ב, מילים, ושפות הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 1.
משטר סטטי שערים לוגיים Wired Drives – © Dima Elenbogen 2009, Moshe Malka :29.
Formal Specifications for Complex Systems (236368) Tutorial #6 appendix Statecharts vs. Raphsody 7 (theory vs. practice)
תורת הקבוצות חלק ב'. קבוצה בת מניה הגדרה: קבוצה אינסופית X היא ניתנת למניה אם יש התאמה חד-חד ערכית בין X לבין .
תכנות תרגול 6 שבוע : תרגיל שורש של מספר מחושב לפי הסדרה הבאה : root 0 = 1 root n = root n-1 + a / root n-1 2 כאשר האיבר ה n של הסדרה הוא קירוב.
ערמות ; מבני נתונים 09 מבוסס על מצגות של ליאור שפירא, חיים קפלן, דני פלדמן וחברים.
תחשיב הפסוקים חלק ג'. צורות נורמליות א. DF – Disjunctive Form – סכום של מכפלות. דוגמא: (P  ~Q  R)  (R  P)  (R  ~Q  ~P) הגדרה: נוסחה השקולה לנוסחה.
Backpatching 1. תזכורת מתרגול קודם קוד ביניים - שפת הרביעיות שיטות לייצור קוד ביניים –שימוש בתכונת code –כתיבה ישירה ל-buffer של פקודות שיטות לתרגום מבני.
א " ב, מילים, ושפות הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 1.
ערכים עצמיים בשיטות נומריות. משוואה אופינית X מציין וקטור עצמי מציינת ערך עצמי תואם לוקטור.
הפקולטה למדעי המחשב אוטומטים ושפות פורמליות (236353)
Data Structures, CS, TAU, Perfect Hashing 1 Perfect Hashing בעיה : נתונה קבוצה S של n מפתחות מתחום U השוואה ל - Hash : * טבלה קבועה (Hash רגיל - דינאמי.
Remember Remember The 5 th of November. תרגול 2 קובץ סדרתי.
1 Data Structures, CS, TAU, Perfect Hashing בעיה: נתונה קבוצה S של n מפתחות מתחום U השוואה ל- Hash : * טבלה קבועה (Hash רגיל - דינאמי) * רוצים זמן קבוע.
משטר דינמי – © Dima Elenbogen :14. הגדרת cd ו -pd cd - הזמן שעובר בין הרגע שראשון אותות הכניסה יוצא מתחום לוגי עד אשר אות המוצא יוצא מתחום.
מודל הלמידה מדוגמאות Learning from Examples קלט: אוסף של דוגמאות פלט: קונסיסטנטי עם פונקציה f ב- C ז"א קונסיסטנטי עם S ז"א מודל הלמידה מדוגמאות Learning.
עקרון ההכלה וההדחה.
יחס סדר חלקי.
מבוא למדעי המחשב תרגול 3 שעת קבלה : יום שני 11:00-12:00 דוא " ל :
Last time on Clang משתנה: "פתק" המשמש את המחשב לשמירת מידע. לכל משתנה יש שם וטיפוס כללים לשמות משתנים –חייבים להכיל רק אותיות, מספרים ו '_' –חייבים להתחיל.
תחשיב היחסים (הפרדיקטים)
1 חישוב של אופרטורים רלציוניים Evaluation of Relational Operators.
מבוא למדעי המחשב, סמסטר א ', תשע " א תרגול מס ' 1 נושאים  הכרת הקורס  פסאודו - קוד / אלגוריתם 1.
מודל הלמידה מדוגמאות Learning from Examples קלט: אוסף של דוגמאות פלט: קונסיסטנטי עם פונקציה f ב- C ז"א קונסיסטנטי עם S ז"א.
מתמטיקה בדידה תרגול 2.
Lecture 13 Maximal Accurate Forests From Distance Matrix.
R. Bar-Yehuda © 1 Graph theory – תורת הגרפים 4. ORDERED TREES 4.1 UNIQUELY DECIPHERABLE CODES מבוסס על הספר : S. Even,
11 Introduction to Programming in C - Fall 2010 – Erez Sharvit, Amir Menczel 1 Introduction to Programming in C תרגול
1 גילוי מידע וזיהוי תבניות תרגול מס. 3 התפלגות נורמלית רב - מימדית Kullback-Leibler Divergence - משפט קמירות - נגזרת שנייה משפט Log sum inequality משפט.
פיתוח מערכות מידע Class diagrams Aggregation, Composition and Generalization.
מבוא למדעי המחשב לתעשייה וניהול הרצאה 7. סברוטינות subroutines.
שיאון שחוריMilOSS-il מוטיבציה  python זה קל ו C זה מהיר. למה לא לשלב?  יש כבר קוד קיים ב C. אנחנו רוצים להשתמש בו, ולבסס מעליו קוד חדש ב python.
Data Structures Hanoch Levi and Uri Zwick March 2011 Lecture 3 Dynamic Sets / Dictionaries Binary Search Trees.
1 Formal Specifications for Complex Systems (236368) Tutorial #1 Course site:
. Sequence Alignment Tutorial #3 © Ydo Wexler & Dan Geiger.
מספרים אקראיים ניתן לייצר מספרים אקראיים ע"י הפונקציה int rand(void);
Tirgul 12 Trees 1.
Formal Specifications for Complex Systems (236368) Tutorial #1
4 July 2007 נרמול מסד הנתונים.
SQL בסיסי – הגדרה אינדוקטיבית
פרוקטוז, C6H12O6 , חד-סוכר מיוחד
תיאוריית תכנון סכמות למסדי נתונים יחסיים חלק 4
Data Structures, CS, TAU, Splay Tree
Marina Kogan Sadetsky –
תרגול 11 NP complete.
תזכורת על מה דיברנו שיעור שעבר? בנינו אתר אינטרנט עם כותרות
תוכנה 1 תרגול 13 – סיכום.
Computer Programming תרגול 3 Summer 2016
Engineering Programming A
Computer Architecture and Assembly Language
Presentation transcript:

(C) סיון טל גילוי מידע וזיהוי תבניות תרגול מס. 9 גילוי מידע וזיהוי תבניות תרגול מס. 9 דחיסת נתונים מהו קידוד תכונות של קידודים אי - שוויון קרפט

2 דחיסת נתונים אנחנו עוסקים בדחיסת נתונים במובן הרחב של המושג. הבסיס לדחיסת נתונים -- קידוד יעיל של קלט. התרגול יעסוק בקידודים.

3 מהו קידוד קידוד הגדרה : קידוד של משתנה מקרי הוא מיפוי מ - ( תחום ערכי ) ל - - קבוצת המחרוזות הסופיות מעל א ” ב : נסמן -- מילת הקוד עבור -- האורך של דוגמה : הוא קידוד עבור עם א ” ב

4 תוחלת האורך הגדרה : תוחלת האורך של קידוד עבור מ ” מ עם פונקצית מסת הסתברות :

5 דוגמה : יהי מ ” מ עם ההתפלגות והקידוד הבאים : תוחלת אורך הקידוד שווה לאנטרופיה ! כמו - כן, כל רצף של ביטים ניתן לפענח באופן יחיד לרצף של ערכי לדוגמה :

6 דוגמה : נסתכל על המ ” מ והקידוד הבאים : במקרה זה תוחלת האורך גדולה מהאנטרופיה. גם כאן, כל קידוד ניתן לפענח באופן יחיד.

7 תכונות של קידודים לא - סינגולרי הגדרה : קוד לא - סינגולרי הוא קוד שבו כל ערך ממופה למילת קוד שונה, כלומר : קוד לא - סינגולרי מספיק כדי לקודד באופן חד - משמעי ערך בודד של. הבעיה היא שכדי לפענח רצף של מילות קוד, יש להפריד ביניהן ע ” י סימן כלשהו (delimiter). ( לדוגמה : 0,1,01,1,111,101,0) אבל זהו שימוש לא יעיל של הסימן המפריד. אפשר לדחוס טוב יותר ע ” י שימוש בקודים ש ” מפסקים את עצמם ” ואין צורך בהוספת סימנים מפרידים על - מנת לפענח רצף של מילות קוד.

8 תכונות של קידודים ( המשך ) הרחבה הגדרה : הרחבה (extension) של קידוד היא מיפוי ממחרוזות סופיות של למחרוזות סופיות של, מוגדרת ע ” י : כלומר הקידוד של שרשור הוא שרשור של הקידודים. לדוגמה : אם אז מכאן והלאה נשתמש בסימן גם עבור שרשורים ( ולא ).

9 תכונות של קידודים ( המשך ) בעל פענוח יחיד הגדרה : קוד הוא בעל פענוח יחיד (uniquely decodable) אם ההרחבה שלו היא לא - סינגולרית. במלים אחרות : לכל רצף של מילות קוד יש בדיוק אפשרות אחת לרצף של ערכי שייצרו אותו. תכונה זאת נראית כתנאי מספיק לדרוש מקידוד, על מנת שניתן יהיה לפענחו. אך למעשה אנו דורשים יותר מזה...

10 תכונות של קידודים ( המשך ) רגעי הגדרה : קידוד נקרא רגעי (instantaneous or prefix) אם אף מילת קוד אינה רישא של מילת קוד אחרת. כאשר יש לנו קוד רגעי, אנו יכולים לזהות מילת קוד ברגע שסיימנו לקרוא אותה. אנחנו יודעים שהסימן הבא שייך למילת הקוד הבאה. זהו קוד ש ” מפסק את עצמו ”.

11 תכונות של קידודים ( המשך ) לא כל קוד בעל פענוח יחיד הוא קוד רגעי. בקוד כזה ייתכן שנצטרך לקרוא רצף של מילות קוד לפני שנוכל לזהות בודאות את מילת הקוד הראשונה. דוגמה לקוד כזה : לקלט יש פענוח יחיד (322), אבל ניתן לדעת כי שתי הסיביות הראשונות הן מילת הקוד “11” רק לאחר קריאת כל הקלט. לקלט יש פענוח יחיד (422).

12 All codes Non-singular codes Uniquely decodable codes Instantaneous codes

13 אי - שוויון קרפט Kraft inequality אנו רוצים לבנות קודים רגעיים בעלי תוחלת אורך מינימלית. ברור שלא ניתן להקצות את מילות הקוד הקצרות ביותר לקבוצת ערכי מ ” מ ולהישאר עם התכונה שאף מילת קוד אינה רישא של אחרת. קבוצת אורכי מילות קוד שאפשרית עבור קוד רגעי מוגבלת ע ” י אי - השוויון הבא : אי - שוויון קרפט : לכל קידוד רגעי מעל א ” ב בגודל D, אורכי המלים בהכרח מקיימות : בהינתן קבוצת אורכים המקיימת את אי - השוויון הנ ” ל, קיים קידוד רגעי עם קבוצת אורכים זו.

14 דוגמה : האם ניתן לבנות קידוד רגעי בינרי שאורכי מילות - הקוד שלו הן 1,1,2 ? פתרון 1: ננסה לבנות קוד כזה : 2 מילות הקוד באורך 1 הן בהכרח 0 ו -1. כל מילת - קוד שנבחר באורך 2 תפר את דרישת הרישא. מכאן - שלא ניתן לבנות קוד כזה. פתרון 2: ולכן לפי אי - שוויון קרפט לא ניתן לבנות קוד כזה.

15 הוכחת אי - שוויון קרפט : נסתכל על עץ D- ארי מלא ( ראה שרטוט עבור D=2). הקשתות מסומנות מ -0 עד D-1 כל צומת בעץ מייצג מילת קוד אפשרית. לפי הגדרת קוד רגעי - מילת קוד אינה יכולה להיות על צומת שהוא צאצא של מילת קוד אחרת. יהי אורך מילת קוד הגדול ביותר בקידוד רגעי כלשהו. ברמה בעץ יש צמתים. לכל מילת קוד באורך יש צאצאים ברמה כל קבוצות הצאצאים הנ ” ל זרות ( מתכונות עץ ). סה ” כ צאצאים של מילות קוד ברמה :

16 הוכחת הכיוון השני : יהיו קבוצת אורכים המקיימת את אי - השוויון. נניח בה ” כ. ניתן לבנות קידוד רגעי עם האורכים הנ ” ל ע ” י מעבר על אותו עץ מלא : בגלל המחיקה - מובטח לנו כי תנאי הרישא מתקיים. נותר רק להראות כי הבניה בהכרח לא תיכשל. היא עלולה להיכשל רק אם עבור כלשהו, לא קיים צומת ברמה. נניח בשלילה כי זה קרה.

17 כל צומת שנבחר ברמה גרם למחיקת צמתים ברמה. בסה ” כ נמחקו ברמה. בסתירה לקיום אי - השוויון.