Download presentation
Presentation is loading. Please wait.
1
שיחזור פאזה באותות שמע שעברו שינוי
מאת: עופר עידן גיל אוזילבסקי
2
רקע ומוטיבציה אותות שמע המיוצגים בתחום באמצעות התמרת פורייה בזמנים קצרים ( Short Time Fourier Transform, STFT ) מכילים מידע על עוצמה, תדר ופאזה של כל אחד מהמרכיבים הספקטרליים. כאשר האות עובר שינוים כגון שינוי בגובה או במשך, או במצבים של דחיסה חזקה של האות וכן ביישומים של הפרדת אותות וניקוי רעשים, מרכיבי הפאזה לא נשמרים ונדרש טיפול מיוחד על מנת לייצר אות חדש בעל פאזות נכונות. המטרה: המטרה הינה יישום מספר שיטות לשחזור ואפיון פאזה באותות שמע שעברו שינויים.
3
למה צריכים פאזה ? לא ניתן לבצע שיחזור לאות אם לא ידועה לנו הפאזה
לא לכל עוצמות ספקטרליות (ספקטוגרמה) קיים אות בזמן ממשי אמיתי, ולכן לפעמים נצטרך למצוא שיערוך שיהיה כמה שיותר קרוב לאות המקורי השיטה שנראה בהמשך מאפשרת שיחזור של הפאזה גם כאשר המידע היחיד שיש בידינו מתייחס לספקטוגרמה.
4
שימושים נוספים: ניתן להשתמש באלגוריתם זה על מנת לבצע ניתוחים שונים של קול: כיווץ ומתיחה של קול ללא פגיעה במידע הספקטרלי דחיסה הפרדת קולות מרעשי רקע ומדוברים מפריעים
5
הפרדת קולות מרעשי רקע ומדוברים מפריעים
עפ"י מאמר של Malcom Slaney: הנחת היסוד מתבססת על כך שהמוח האנושי משתמש ב"רמזים" מתהליכים לא לינאריים בתהליך השמיעה לאיסוף קולות. אחד "מרמזים" אלו(במיוחד עבור דיבור) הינו המחזוריות בין התדרים ,דבר המיוצג ב-Correlogram . "רמזים" נוספים המתייחסים לאופן הדיבור אפשריים רק באמצעות עיבוד נוסף. באמצעות טכניקות שיתוארו בהמשך ניתן לזהות קול של דובר מסוים ולהפרידו מרעשי רקע.
6
למידת נושא וניתוח התמרת STFT
Short Time Fourier Transform התמרת STFT פותחה ע"י דניס גאבור ב- 1946כנסיון להתגבר על בעיית חוסר האינפורמציה של מיקום בזמן בהתמרת פוריה רגילה. היא שילוב של זמן ותדר בהסתכלות על הסיגנל וטובה יותר מהתמרת פוריה רגילה עבור אותות לא סטציונאריים. עבור התמרה זו האות מנותח בחלקים באמצעות חלון המוזז על הסיגנל ,כאשר מתבצעת התמרת פוריה על כל חלון.
7
ההתמרה נותנת מידע על המיקום בזמן וספקטרום התדר ,אולם דיוק המידע מוגבל ונקבע באמצעות גודל החלון. חלון קטן מוביל לדיוק רב בזמן אולם גורר בעקבותיו רזולוציה נמוכה בתדר. רזולוצית התדר ניתנת לשיפור ע"י שימוש בחלון גדול ,אולם זה גורר דיוק נמוך בזמן ובעיתיות עבור אותות לא סטציונאריים.
8
Short Time Fourier Transform Magnitude העוצמות הספקטרליות של הינן דרך נוספת להציג את האות בייצוג זמן-תדר. ייצוג זה הינו שימושי ביותר באפליקציות דיבור , כאשר מנתחים את הספקטוגרמה של האות המאופנן. האוזן האנושית מתנהגת בדומה לייצוג של ספקטוגרמה של דיבור ייצוג זה הוא אי שלילי בזמן ובתדר
9
שיערוך האות באמצעות מינימום שגיאה ריבועית Least Squares Signal Estimation From Modified STFTM בשיטה זו נשערך אות שה-STFTM שלו הכי קרוב במובן של מינימום שגיאה ריבועית. שהוא העוצמה של האות מתוך השיטה משערכת את שעבר שינוי האלגוריתם מפחית בצורה איטרטיבית את המרחק בין ה- STFTM של לבין ה-STFTM של :
10
עפ"י המאמר האלגוריתם מקבל :
1) עוצמות ספקטרליות של האות המעוות (בערכם המוחלט). 2) ניחוש ראשוני של האות המשוחזר – x(n).(ממנו נלקחת הפאזה הראשונית). את הניחוש הראשוני בחרנו בצורה רנדומלית עפ"י פילוג נורמלי (פונקציית randn של matlab). האלגוריתם פועל בצורה איטרטיבית : 1) בכל שלב הוא מחליף את העוצמות הספקטרליות של השחזור הקודם (כאשר בפעם הראשונה זה הניחוש שהתקבל) , בעוצמות הספקטרליות של האות המעוות. כלומר בעצם "מלביש" את העוצמות הספקטרליות על וקטור הפאזות. 2) שחזור האות עפ"י נוסחא מתמטית שהוכחה בדו"ח המכין. 3) כאשר בכל שלב האות ששוחזר נכנס בתור כניסה לאיטרציה הבאה של האלגוריתם: כלומר חזרה לשלב 1.
11
תרשים האלגוריתם:
12
בצורה זו אנו בעצם כל פעם מתקנים את האות ע"י החלפת הפאזה לפאזה מתוקנת שיותר קרובה לפאזה המקורית שלו , אולם בהתמרה ההפוכה אנו שוב מקבלים עיוותים כי בעצם ההחלפה לא שמרנו על אילוצי האות , ולכן כאשר אנו פועלים בצורה איטרטיבית אנו מתקרבים לאות המקורי. אלגוריתם זה מתכנס כל הזמן לקראת האות המקורי (הוכחה מתמטית לזה ניתנה בנספח של הדו"ח המכין) , ולכן לאחר מספר סופי של איטרציות נקבל אות משוחזר טוב.
13
באפליקציה הבאה נלקח אות שמע מעוות המיוצג בייצוג של ספקטוגרמה ומשוחזר בהתאם לאלגוריתם שתואר.
מימוש matlab
14
מסקנות 1) בצורה ישירה במהלך האלגוריתם אנו מחשבים בכל שלב את הפאזה של האות. כלומר מאות מעוות מהתקבל בהתחלה שתואר ע"י העוצמות הספקטרליות שלו וללא מידע על הפאזה , בעצם בסוף האלגוריתם קיימת לנו פאזה חדשה משוחזרת שקרובה לפאזה המקורית. כלומר ניתן להשתמש באלגוריתם זה על מנת לשחזר פאזה עבור אות בעל פאזה לא ידועה. 2) ניתן לשפר את האלגוריתם ע"י ניחוש ראשוני יותר טוב מאשר רעש לבן. 3) המימוש הנ"ל הינו פיזיבילי ב- Real Time וכאשר ממומש במעבד מקבילי יהיה delay כגודל חלון האנליזה כתוצאה מהחישובים המתבצעים באלגוריתם (כאשר ניתן לאחר מספר מינימלי של איטרציות לקבל אות שמע באיכות טובה).
15
4) מבחינה מעשית , ישנם מצבים רבים (לדוגמא כאשר האות עובר שינוים כגון שינוי בגובה או במשך, או במצבים של דחיסה חזקה של האות וכן ביישומים של הפרדת אותות וניקוי רעשים) בהם מרכיבי הפאזה לא נשמרים ונדרש טיפול מיוחד על מנת לייצר אות חדש בעל פאזות נכונות. שיטה זו מאפשרת שיחזור של הפאזה המתאים למצבים אלו גם כאשר אין לנו מידע נוסף על הפאזה.
Similar presentations
© 2025 SlidePlayer.com. Inc.
All rights reserved.