שיחזור פאזה באותות שמע שעברו שינוי

Slides:



Advertisements
Similar presentations
Completeness and Expressiveness. תזכורת למערכת ההוכחה של לוגיקה מסדר ראשון : אקסיומות 1. ) ) (( 2. )) ) (( )) ( ) ((( 3. ))) F( F( ( 4. ) v) ( ) v ((
Advertisements

מבוא למדעי המחשב לתעשייה וניהול
1 Formal Specifications for Complex Systems (236368) Tutorial #4 Refinement in Z: data refinement; operations refinement; their combinations.
עיבוד תמונות ואותות בעזרת מחשב
Presentation by Dudu Yanay and Elior Malul 1.  מה משותף לכל אלגוריתם המשתמש ב -Bucket Elimination: ◦ נתון מודל הסתברותי ורשת ביסיאנית מתאימה. ◦ נתונה.
רקורסיות נושאי השיעור פתרון משוואות רקורסיביות שיטת ההצבה
Inverse kinematics (Craig ch.4) ב"ה. Pieper’s solution נתבונן ברובוט עם 6 מפרקי סיבוב כאשר שלושת הצירים של המפרקים האחרונים נחתכים. נקודת החיתוך נתונה.
שאלות חזרה לבחינה. שאלה דיסקים אופטיים מסוג WORM (write-once-read-many) משמשים חברות לצורך איחסון כמויות גדולות של מידע באופן קבוע ומבלי שניתן לשנותו.
מטרות הפרויקט הבנת בעיית העקיבה לימוד בעיית העקיבה החד ממדית לימוד השימוש במסנן קלמן לפתרונה שימוש בלוגיקה עמומה לשיפור הפתרון לימוד בעיית העקיבה הדו.
1 שיפור עקיבה אחר מטרה בשיטת קורלציה ומרכז כובד בשילוב אלגוריתם IMM מגיש: שישלניקוב דניס מנחה: דר' גבי דוידוב הטכניון - מכון טכנולוגי לישראל TECHNION -
The Solar Wind And its consequences. dx dA משוואות בסיסיות בהידרו דינמיקה הכח הפועל כתוצאה מגרדיאנט בלחץ על אלמנט מסה - dm.
אוטומט מחסנית הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 11.
חורף - תשס " ג DBMS, צורות נורמליות 1 צורה נורמלית שלישית - 3NF הגדרה : תהי R סכמה רלציונית ותהי F קבוצת תלויות פונקציונליות מעל R. R היא ב -3NF.
שימושים בטורי פוריה לעיבוד אותות
1 Formal Specifications for Complex Systems (236368) Tutorial #5 Refinement in Z: data refinement; operations refinement; their combinations.
בהסתברות לפחות למצא בעיה במודל PAC עבור בהסתברות ε הפונקציה f טועה מודל ONLINE 1. אחרי כל טעות הפונקציה משתפרת 2. מספר הטעיות קטן.
שיחזור תמונה בעזרת סופררזולוציה.. 1. הקדמה. נתון אובייקט בעולם האמיתי. מטרה היא לקבל תמונה של האובייקט הנתון בגודל מסויים (L x L). לרשותינו נמצאית מצלמה.
סמינר במדעי המחשב 3 עודד פרץ משפט הנורמליזציה החזקה.
עיבוד תמונות ואותות במחשב אלכסנדר ברנגולץ דואר אלקטרוני : שיטות קידוד שיטות קידוד אורך מלת קוד ואנטרופיה אורך מלת קוד ואנטרופיה קידוד.
א " ב, מילים, ושפות הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 1.
א " ב, מילים, ושפות הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 1.
Formal Specifications for Complex Systems (236368) Tutorial #6 appendix Statecharts vs. Raphsody 7 (theory vs. practice)
תכנות תרגול 6 שבוע : תרגיל שורש של מספר מחושב לפי הסדרה הבאה : root 0 = 1 root n = root n-1 + a / root n-1 2 כאשר האיבר ה n של הסדרה הוא קירוב.
שימושים בטורי פוריה לעיבוד אותות
מערכות הפעלה ( אביב 2009) חגית עטיה ©1 מערכת קבצים log-structured  ה log הוא העותק היחיד של הנתונים  כאשר משנים בלוק (data, header) פשוט כותבים את הבלוק.
מודל ONLINE לומדמורה 1. כל ניתן לחישוב בזמן פולינומיאלי 2. אחרי מספר פולינומיאלי של טעיות ( ) הלומד לא טועה ז"א שווה ל- Littlestone 1988.
א " ב, מילים, ושפות הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 1.
ערכים עצמיים בשיטות נומריות. משוואה אופינית X מציין וקטור עצמי מציינת ערך עצמי תואם לוקטור.
שימושים בטורי פוריה לעיבוד אותות
שאלה 1 נתון כביש ישר עם תחנות דלק בנקודות , בנקודת המוצא נתונה מכונית עם תא דלק שמספיק ל-100 ק"מ. מחיר מילוי תא הדלק בתחנה.
Kalman Filter תומר באום Based on ch. 8 in “Principles of robot motion” By Choset et al. ב"הב"ה.
הפקולטה למדעי המחשב אוטומטים ושפות פורמליות (236353)
טיב פני שטח (טפ"ש) טיב פני שטח- רמת החלקות של המשטח.
Ray 7 דוגמא אלגוריתם 1.קבל דוגמאות 2. פלט f a עבור הדוגמה a המינימלית החיובית ?
Galileo Navigation System Software Systems lab Software Systems lab סמסטר חורף תשס " ט סמסטר חורף תשס " ט מנחה: ולדימיר זדורנוב משה חיות מבצעים: גליה סימנובסקי.
עיבוד תמונות ואותות במחשב תרגול 9: טורי פורייה 1/39 עיבוד תמונות ואותות בעזרת מחשב תרגול מס' 9: טורי פורייה.
Data Structures, CS, TAU, Perfect Hashing 1 Perfect Hashing בעיה : נתונה קבוצה S של n מפתחות מתחום U השוואה ל - Hash : * טבלה קבועה (Hash רגיל - דינאמי.
עיבוד תמונות ואותות בעזרת מחשב תרגול מס' 10: התמרת פורייה הבדידה
אלכסנדר ברנגולץ דואר אלקטרוני: אלכסנדר ברנגולץ דואר אלקטרוני: פעולות מורפולוגיות.
1 Data Structures, CS, TAU, Perfect Hashing בעיה: נתונה קבוצה S של n מפתחות מתחום U השוואה ל- Hash : * טבלה קבועה (Hash רגיל - דינאמי) * רוצים זמן קבוע.
משטר דינמי – © Dima Elenbogen :14. הגדרת cd ו -pd cd - הזמן שעובר בין הרגע שראשון אותות הכניסה יוצא מתחום לוגי עד אשר אות המוצא יוצא מתחום.
מרחב הפאזה פרקים בתנודות וגלים לא ליניאריים פרופ' לזר פרידלנד
מודל הלמידה מדוגמאות Learning from Examples קלט: אוסף של דוגמאות פלט: קונסיסטנטי עם פונקציה f ב- C ז"א קונסיסטנטי עם S ז"א מודל הלמידה מדוגמאות Learning.
עקרון ההכלה וההדחה.
יחס סדר חלקי.
מבוא למדעי המחשב, סמסטר א ', תשע " א תרגול מס ' 1 נושאים  הכרת הקורס  פסאודו - קוד / אלגוריתם 1.
Markov Decision Processes (MDP) תומר באום Based on ch. 14 in “Probabilistic Robotics” By Thrun et al. ב"הב"ה.
1 עקיבה אחר מטרה בשיטת קורלציה בשילוב אלגוריתם IMM מגישים: קיריצ'נקו אלכס שישלניקוב דניס מנחה: דר' גבי דוידוב הטכניון - מכון טכנולוגי לישראל TECHNION -
גיאולוגיה סטרוקטורלית מעגלי מוהר למעוות סופי (המשך...)
Safari On-line books. מה זה ספארי ספארי זו ספריה וירטואלית בנושא מחשבים היא כוללת יותר מ כותרים כל הספרים הם בטקסט מלא ניתן לחפש ספר בנושא מסוים.
Points on a perimeter (Convex Hull) קורס – מבוא לעבוד מקבילי מבצעים – אריאל פנדלר יאיר ברעם.
Text to speech In Mobile Phones איתי לוי. הקדמה שימוש בהודעות טקסט על המכשירים הסלולארים היא דרך תקשורת מאוד פופולארית בימינו אשר משתמשים בה למטרות רבות,
Interpolation Functions in Matlab By Dmitriy Katsif.
הבחנה בין קולות רחרוח וקולות הלחתה של כלבים 1 אופיר אזולאי גיל בלוך מנחה : ד " ר יזהר לבנר.
- אמיר רובינשטיין מיונים - Sorting משפט : חסם תחתון על מיון ( המבוסס על השוואות בלבד ) של n מפתחות הינו Ω(nlogn) במקרה הגרוע ובממוצע. ניתן לפעמים.
פיתוח מערכות מידע Class diagrams Aggregation, Composition and Generalization.
VNA + S PARAMETER. VNA Vectors and Scalars קיימים 2 סוגי N.A : ווקטורי : וקטור הכולל את גודל ופאזה של האות, ולו תחום דנמי רחב. סקלרי : סקלר הוא גודל.
. Sequence Alignment Tutorial #3 © Ydo Wexler & Dan Geiger.
פס על כל העיר נורית זרחי.
מספרים אקראיים ניתן לייצר מספרים אקראיים ע"י הפונקציה int rand(void);
Object Oriented Programming
Tirgul 12 Trees 1.
Object Oriented Programming
SQL בסיסי – הגדרה אינדוקטיבית
שימוש בשיטה א-פרמטרית להשוואת תוחלות של שתי אוכלוסיות.
השוואת נתונים למודל הסתברותי - כללית
פרוקטוז, C6H12O6 , חד-סוכר מיוחד
מסננים מסנן מעביר נמוכים LPF תומר ורונה.
תזכורת על מה דיברנו שיעור שעבר? בנינו אתר אינטרנט עם כותרות
סמינר בנושאים מתקדמים בעיבוד תמונה
Presentation transcript:

שיחזור פאזה באותות שמע שעברו שינוי מאת: עופר עידן גיל אוזילבסקי

רקע ומוטיבציה אותות שמע המיוצגים בתחום באמצעות התמרת פורייה בזמנים קצרים ( Short Time Fourier Transform, STFT ) מכילים מידע על עוצמה, תדר ופאזה של כל אחד מהמרכיבים הספקטרליים. כאשר האות עובר שינוים כגון שינוי בגובה או במשך, או במצבים של דחיסה חזקה של האות וכן ביישומים של הפרדת אותות וניקוי רעשים, מרכיבי הפאזה לא נשמרים ונדרש טיפול מיוחד על מנת לייצר אות חדש בעל פאזות נכונות. המטרה:  המטרה הינה יישום מספר שיטות לשחזור ואפיון פאזה באותות שמע שעברו שינויים.

למה צריכים פאזה ? לא ניתן לבצע שיחזור לאות אם לא ידועה לנו הפאזה לא לכל עוצמות ספקטרליות (ספקטוגרמה) קיים אות בזמן ממשי אמיתי, ולכן לפעמים נצטרך למצוא שיערוך שיהיה כמה שיותר קרוב לאות המקורי השיטה שנראה בהמשך מאפשרת שיחזור של הפאזה גם כאשר המידע היחיד שיש בידינו מתייחס לספקטוגרמה.

שימושים נוספים: ניתן להשתמש באלגוריתם זה על מנת לבצע ניתוחים שונים של קול: כיווץ ומתיחה של קול ללא פגיעה במידע הספקטרלי דחיסה הפרדת קולות מרעשי רקע ומדוברים מפריעים

הפרדת קולות מרעשי רקע ומדוברים מפריעים עפ"י מאמר של Malcom Slaney: הנחת היסוד מתבססת על כך שהמוח האנושי משתמש ב"רמזים" מתהליכים לא לינאריים בתהליך השמיעה לאיסוף קולות. אחד "מרמזים" אלו(במיוחד עבור דיבור) הינו המחזוריות בין התדרים ,דבר המיוצג ב-Correlogram . "רמזים" נוספים המתייחסים לאופן הדיבור אפשריים רק באמצעות עיבוד נוסף. באמצעות טכניקות שיתוארו בהמשך ניתן לזהות קול של דובר מסוים ולהפרידו מרעשי רקע.

למידת נושא וניתוח התמרת STFT Short Time Fourier Transform התמרת STFT פותחה ע"י דניס גאבור ב- 1946כנסיון להתגבר על בעיית חוסר האינפורמציה של מיקום בזמן בהתמרת פוריה רגילה. היא שילוב של זמן ותדר בהסתכלות על הסיגנל וטובה יותר מהתמרת פוריה רגילה עבור אותות לא סטציונאריים. עבור התמרה זו האות מנותח בחלקים באמצעות חלון המוזז על הסיגנל ,כאשר מתבצעת התמרת פוריה על כל חלון.

ההתמרה נותנת מידע על המיקום בזמן וספקטרום התדר ,אולם דיוק המידע מוגבל ונקבע באמצעות גודל החלון. חלון קטן מוביל לדיוק רב בזמן אולם גורר בעקבותיו רזולוציה נמוכה בתדר. רזולוצית התדר ניתנת לשיפור ע"י שימוש בחלון גדול ,אולם זה גורר דיוק נמוך בזמן ובעיתיות עבור אותות לא סטציונאריים.

Short Time Fourier Transform Magnitude   העוצמות הספקטרליות של הינן דרך נוספת להציג את האות בייצוג זמן-תדר. ייצוג זה הינו שימושי ביותר באפליקציות דיבור , כאשר מנתחים את הספקטוגרמה של האות המאופנן. האוזן האנושית מתנהגת בדומה לייצוג של ספקטוגרמה של דיבור ייצוג זה הוא אי שלילי בזמן ובתדר

שיערוך האות באמצעות מינימום שגיאה ריבועית Least Squares Signal Estimation From Modified STFTM בשיטה זו נשערך אות שה-STFTM שלו הכי קרוב במובן של מינימום שגיאה ריבועית. שהוא העוצמה של האות מתוך השיטה משערכת את שעבר שינוי האלגוריתם מפחית בצורה איטרטיבית את המרחק בין ה- STFTM של לבין ה-STFTM של :

עפ"י המאמר האלגוריתם מקבל : 1) עוצמות ספקטרליות של האות המעוות (בערכם המוחלט). 2) ניחוש ראשוני של האות המשוחזר – x(n).(ממנו נלקחת הפאזה הראשונית). את הניחוש הראשוני בחרנו בצורה רנדומלית עפ"י פילוג נורמלי (פונקציית randn של matlab). האלגוריתם פועל בצורה איטרטיבית : 1) בכל שלב הוא מחליף את העוצמות הספקטרליות של השחזור הקודם (כאשר בפעם הראשונה זה הניחוש שהתקבל) , בעוצמות הספקטרליות של האות המעוות. כלומר בעצם "מלביש" את העוצמות הספקטרליות על וקטור הפאזות. 2) שחזור האות עפ"י נוסחא מתמטית שהוכחה בדו"ח המכין. 3) כאשר בכל שלב האות ששוחזר נכנס בתור כניסה לאיטרציה הבאה של האלגוריתם: כלומר חזרה לשלב 1.

תרשים האלגוריתם:

בצורה זו אנו בעצם כל פעם מתקנים את האות ע"י החלפת הפאזה לפאזה מתוקנת שיותר קרובה לפאזה המקורית שלו , אולם בהתמרה ההפוכה אנו שוב מקבלים עיוותים כי בעצם ההחלפה לא שמרנו על אילוצי האות , ולכן כאשר אנו פועלים בצורה איטרטיבית אנו מתקרבים לאות המקורי. אלגוריתם זה מתכנס כל הזמן לקראת האות המקורי (הוכחה מתמטית לזה ניתנה בנספח של הדו"ח המכין) , ולכן לאחר מספר סופי של איטרציות נקבל אות משוחזר טוב.

באפליקציה הבאה נלקח אות שמע מעוות המיוצג בייצוג של ספקטוגרמה ומשוחזר בהתאם לאלגוריתם שתואר. מימוש matlab

מסקנות 1) בצורה ישירה במהלך האלגוריתם אנו מחשבים בכל שלב את הפאזה של האות. כלומר מאות מעוות מהתקבל בהתחלה שתואר ע"י העוצמות הספקטרליות שלו וללא מידע על הפאזה , בעצם בסוף האלגוריתם קיימת לנו פאזה חדשה משוחזרת שקרובה לפאזה המקורית. כלומר ניתן להשתמש באלגוריתם זה על מנת לשחזר פאזה עבור אות בעל פאזה לא ידועה. 2) ניתן לשפר את האלגוריתם ע"י ניחוש ראשוני יותר טוב מאשר רעש לבן. 3) המימוש הנ"ל הינו פיזיבילי ב- Real Time וכאשר ממומש במעבד מקבילי יהיה delay כגודל חלון האנליזה כתוצאה מהחישובים המתבצעים באלגוריתם (כאשר ניתן לאחר מספר מינימלי של איטרציות לקבל אות שמע באיכות טובה). 

4) מבחינה מעשית , ישנם מצבים רבים (לדוגמא כאשר האות עובר שינוים כגון שינוי בגובה או במשך, או במצבים של דחיסה חזקה של האות וכן ביישומים של הפרדת אותות וניקוי רעשים) בהם מרכיבי הפאזה לא נשמרים ונדרש טיפול מיוחד על מנת לייצר אות חדש בעל פאזות נכונות. שיטה זו מאפשרת שיחזור של הפאזה המתאים למצבים אלו גם כאשר אין לנו מידע נוסף על הפאזה.