Download presentation
Presentation is loading. Please wait.
1
دکتر سعید شیری قیداری & فصل 5 کتاب
Localization دکتر سعید شیری قیداری & فصل 5 کتاب Amirkabir University of Technology Computer Engineering & Information Technology Department
2
مقدمه قابلیتNavigation یکی از نیازمندیهای مهم روبات متحرک است.
برای موفقیت در این امر میبایست تمام چهار جزء اصلی آن نیز بخوبی انجام شوند: : Preceptionروبات میبایست تعبیر مناسبی از داده های سنسورها داشته باشد : localizationروبات میبایست موقعیت خودش را در محیط پیدا نماید : Cognition روبات میبایست در مورد نحوه رسیدن به هدف تصمیم گیری نماید. : Motion Controlروبات میبایست خروجی موتورهایش را برای حرکت در مسیر مطلوب کنترل نماید.
3
مشکل اصلی بر سر راه مکان یابی
مسئله مکان یابی بسی فراتر از مسئله پیدا کردن موقعیت یک روبات در محیط است . روبات ممکن است نیازمند دانستن فاصله نسبی اش تا اشیا و آدمی باشد. روبات ممکن است نیاز به داشتن نقشه ای از محیط باشد تا برای انجام کارهایش قادر به planning باشد. مسئله مکان یابی بشدت وابسته به استفاده از سنسورهای روبات است. اما به خاطر اینکه این سنسورها دارای عدم قطعیت هستند مسئله مکان یابی دقیق روبات به مسئله ای پیچیده تبدیل میشود.
4
مکان یابی
5
دو روش ممکن در روباتیک نقشه شکل زیر را در نظر بگیرید. روبات برای انجام Navigation نیاز دارد که از سنسورها برای جلوگیری از برخورد با اشیا استفاده نماید. همچنین روبات باید بتواند موتورهایش را کنترل نماید. آیا روبات برای رفتن از اتاقی به اتاق دیگر نیاز به مکان یابی دارد؟
6
مثال
7
استفاده از نقشه ممکن است مکان یابی برای جابجائی بین دو اتاق ضروری باشد. روبات باید بتواند موقعیت خود را در روی نقشه پیدا کند تا از رسیدن به هدف مطمئن گردد. همچنین روبات باید بتواند هدف را در روی نقشه مشخص نماید.
8
پرهیز از ایجاد نقشه مکتب Behaviour-based از طرف دیگر معتقد است که بعلت وجود نویز در سنسورها باید از ایجاد نقشه ژئومتریک پرهیز نمود. در این روش از ارائه موقعیت آشکار و همچنین طرح ریزی مسیر پرهیز میشود. در این روش اعتقاد بر این است که میتوان فرایندی برای انجام یک navigation مشخص انجام داد. برای مثال برای رفتن از اتاق A به اتاقB میتوان از یک رفتار برای دنبال کردن دیوار و از رفتار دیگری برای تشخیص اتاق مقصد که با فرش قرمز مفروش شده است استفاده نمود.
9
ساختار Behavior based navigation
10
ساختار Behavior based navigation
از مزایای این روش سادگی پیاده سازی برای یک مسئله با اهداف محدود است. از معایب آن این است که بسادگی برای سایر مسایل و یا محیط های بزرگترقابل تعمیم نیست. همچنین طراحی رفتارهائی مانند تعقیب یک دیوار بسادگی قابل پیاده سازی نبوده و به سخت افزار روبات بستگی خواهد داشت. در عمل ممکن است رفتارهای متعددی بطور همزمان فعال باشند که انتقال بین آنها به تنظیمات دقیقی نیاز دارد که وقتی رفتار جدیدی به سیستم اضافه میشود همه این تنظیمات به هم میخورد.
11
ساختار model-based navigation
در این روش روبات با استفاده از سنسورها اطلاعاتی در مورد محیط جمع میکند. سپس باوری در مورد موقعیت روبات در روی نقشه بوجود میآید. در این روش همکاری بین انسان و روبات ساده تر انجام میشود که نقشه این محیط را میسازد. این خطر وجود دارد که تصور روبات از محیط و واقعیت تفاوت زیادی داشته باشند. امید می رود که در آینده بتوان روباتهائی ساخت که قادر به تهیه نقشه و حرکت در محیط های مختلفی باشند.
12
ساختار model-based navigation
13
نمایش نقشه روبات باید نقشه ای برای نمایش و یا مدل کردن محیط ایجاد نماید. در اینصورت: نقشه باید چه جنبه هائی از محیط را شامل شود؟ وبالعکس نقشه در چه سطحی قادر به نمایش محیط است؟ همچنین روبات باید باوری نسبت به موقعیت خود در روی نقشه داشته باشد.) ممکن است روبات موقعیت خودش را با یک و یا چندین نقطه در روی نقشه مشخص نماید(
14
انواع مختلف نمایش موقعیت روبات در روی نقشه
a) Continuous map with single hypothesis b) Continuous map with multiple hypothesis c) Discretized map with probability distribution d) Discretized topological map with probability distribution
15
باور تک فرضیه ای مستقیم ترین روش نشان دادن موقعیت روبات در یک نقطه باور تک فرضیه ای است که در آن فقط یک موقعیت برای روبات متصور میشود. حسن این روش عدم وجود ابهام درموقعیت است که باعث میشود تا تصمیم گیری در مواردی نظیر طراحی مسیر بسادگی قابل انجام باشد. به همین ترتیب به روز کردن باور روبات به موقعیتش نیز میتواند بسادگی انجام پذیرد. اما وجود خطا در سنسورها این امر را با چالش زیادی روبرو میسازد.
16
باور تک فرضیه ای Single-hypothesis Belief – Continuous Line-Map
17
باور تک فرضیه ای Single-hypothesis Belief – Grid and Topological Map
18
باور چند فرضیه ای در این روش روبات بطور همزمان چندین رد از موقعیت را دنبال میکند. ممکن است نظم وترتیبی به موقعیت ها داده شود بنحویکه موقعیتی محتملتر از سایرین باشد. برای مثال ممکن است موقعیت روبات در صفحه دو بعدی بصورت یک توزیع احتمال گوسی با مقدار میانگین و واریانس نشان داده شود. در این روش روبات بطور مشخص عدم قطعیت در موقعیت خودش را نگهداری خواهد نمود. از معایب این روش مشکل بودن تصمیم گیری است. از جنبه محاسباتی تصمیم گیری ها پر هزینه هستند.
19
نمایش نقشه نحوه نمایش نقشه مرتبط با نحوه نمایش موقعیت روبات است.
محدودیت های نقشه: دقت نقشه باید با دقتی که روبات برای رسیدن به هدف لازم دارد منطبق باشد دقت نقشه و نوع ویژگی های آن باید با دقت سنسورها و ویژگی هائی که روبات قادر به استخراج آن است سازگار باشد. پیچیدگی های نقشه تاثیر مستقیمی بر پیچیدگی عملیات وابسته به آن نظیر mapping, localization , navigation دارد. انتخاب نحوه نمایش نقشه علاوه بر محدودیت های فوق به صورت مسئله نیز ارتباط خواهد داشت.
20
نحوه نمایش باور نسبت به موقعیت
پیوسته: گسسته: دقت آن توسط سنسور تعیین میشود دقت آن بستگی به نحوه گسسته سازی دارد معمولا چندین فرضیه ارائه میشود معمولا تک فرضیه ای است توان پردازشی بالائی نیاز دارد بسادگی قابل محاسبه است
21
نمایش محیط نمایش محیط مدل کردن محیط Continuos Metric x,y,q
Discrete Metric metric grid Discrete Topological topological grid مدل کردن محیط Raw sensor data, e.g. laser range data, grayscale images large volume of data, low distinctiveness on the level of individual values makes use of all acquired information Low level features, e.g. line other geometric features medium volume of data, average distinctiveness filters out the useful information, still ambiguities High level features, e.g. doors, a car, the Eiffel tower low volume of data, high distinctiveness filters out the useful information, few/no ambiguities, not enough information
22
نمایش پیوسته نقشه geometric map
در این روش ویژگی های محیط با مقادیر پیوسته بدقت نشان داده میشوند. معمولا از این روش فقط در نقشه های 2 بعدی که پیچیدگی محاسباتی کمتری دارند استفاده میشود. در این روش فرض میشود که هر شئی موجود در محیط در نقشه نیز وجود خواهد داشت. ممکن است برای سادگی کار فقط اشیائی را در نقشه ذکر کرد که روبات قادر به ادراک آنها از طریق سنسورهایش میباشد. در این نقشه ها فقط موقعیت فیزیکی اشیا ذکر میشود و سایر ویژگی ها نظیر رنگ، بافت وغیره حذف میشوند. همچنین برای سادگی همه اشیا با چند ضلعی های گوژ نمایش داده میشوند.
23
نمایش محیط با استفاده از خط
در روبات های خانگی که از لیزر استفاده میشود میتوان خطوط مربوط به محیط را از روی نقاط اندازه گیری شده استخراج نمود. در این حالت میتوان نقشه را با خطوطی با موقعیت و جهت دلخواه نشان داد. برای چنین نقشه ای میتوان موقعیت روبات را با هر یک از روشهای ذکر شده قبلی نشان داد.
24
نمایش محیط با استفاده از خط
Key advantage is potentially high accuracy
25
Cell decomposition روشی است برای ساده تر کردن نمایش محیط
در این روش محیط به نواحی تجزیه میشود که فضای آزاد ویا free space نامیده میشوند. میتوان بجای ذخیره کل محیط فقط گره های مربوط به نواحی آزاد را بصورت یک گراف ذخیره نمود. ایده اصلی این روش این است که موقعیت محلی روبات در هر ناحیه آزاد چندان مهم نیست. بلکه آنچه که اهمیت دارد توانائی روبات در در حرکت از یک ناحیه به ناحیه آزاد مجاورش است.
26
Cell decomposition ممکن است اندازه سلولهای بکار رفته ثابت و یا متغیر باشد.
27
Cell decomposition در عمل تجزیه دقیق محیط بسیار مشکل است زیرا جمع آوری اطلاعات آن کار سختی است. در نتیجه بجای یک نقشه پیوسته از نقشه دیجیتایز شده استفاده میشود.
28
Adaptive cell decomposition
29
Occupancy grid در این روش محیط توسط یک شبکه گسسته نمایش داده میشود که در آن هر سلول یا توسط یک مانع اشغال شده است و یا اینکه خالی بوده و فضای آزاد بحساب میاید. این روش بخصوص در مواقعی که روبات مجهز به سنسورهای فاصله نظیر سونار است استفاده میشود زیرا به روز کردن نقشه ساده تر است. در این روش هر سلول با یک شمارنده همراه است که مقدار آن در مواقعی که سنسور فاصله برای آن مقدار برمیگرداند افزایش می یابد و در مواقعی که اندازه گیری از آن رد میشود کاهش میابد. از معایب این روش نیاز به داشتن حافظه بزرگ است.
30
Topological map در این روش از اندازه گیری مقادیر هندسی محیط پرهیز میشود در عوض بر مشخصاتی از محیط که برای مکان یابی روبات مهم است تاکید میشود. در حالت کلی یک نقشه توپولوژیکال یک گراف است که گره ها و لینک های اتصال بین آنها را نشان میدهد. گره ها مکان های موجود در محیط و لینک ها مجاورت هر زوج از گره ها را نشان میدهد. وقتی که یک لینک دو نقطه را به هم متصل میکند به این معناست که روبات میتواند مستقیما از یک محل به محل دیگری برود .
31
Topological map برای اینکه روبات بتواند با استفاده از یک نقشه توپولوژیک جابجا شود باید: بتواند موقعیت خودش را برحسب گره ها ی نقشه پیدا نماید. درثانی روبات باید بتواند قادر به حرکت بین گره ها باشد. اندازه گره ها و ابعاد آن باید بهینه شوند تا با توانائی های سخت افزاری روبات هماهنگی داشته باشند. انگیزه اصلی در استفاده از نقشه های توپولوژیکی این است که محیط ممکن است ویژگی های غیرهندسی مهمی داشته باشد که روبات بتواند آنها را تشخیص دهد. ممکن است landmark هائی در محیط قرار داده شوند که روبات با تشخیص آنها بتواند محیط خودش را تشخیص دهد.
32
Topological map
33
Topological map
34
Topological map
35
مشکلات تهیه نقشه یک محیط واقعی
محیط واقعی یک محیط پویاست که در آن اشیا بسیاری در حال حرکت هستند. یکی از نقاط ضعف روشهای فوق قابلیت جدا کردن اشیا ثابت از اشیا متحرک است. استفاده از بینائی روبات میتواند برای تشخیص اشیا ثابت از متحرک مفید واقع شود. ساخت نقشه های توپو لوژیکی برای محیط های خارج از اتاق مشکل است. در عمل ناگزیر به sensor fusion هستیم.
36
مثالی از مکان یابی بر پایه احتمالات
فرض کنید که روبات میخواهد با استفاده از اندازه گیری S موانع را تشخیص دهد: What is p(obstacle|s)?
37
مثالی از مکان یابی بر پایه احتمالات
درعمل اندازه گیری p(obstacle|s) مشکل است. با توجه به اینکه مدلی برای سنسور در اختیار میباشد، اغلب ساده تر است که مقدار زیر محاسبه شود:p(s|obstacle) با اعمال قانون بیز خواهیم داشت:
38
نرمالیزه کردن
39
مثال عددی فرض کنید که روبات میخواهد با استفاده از اندازه گیری S موانع را تشخیص دهیم: What is p(obstacle|detection) if p(obstacle) = 0.1 p(detection|obstacle)=0.9 p(detection|no obstacle)=0.05
40
مکان یابی بر اساس نقشه احتمالاتی Probabilistic, Map-Based Localization
این روشها موقعیت روبات را با یک تابع احتمال نشان میدهند. دو تکنیک اساسی در این زمینه عبارتند از: روش مارکف: یک توزیع احتمال برای همه مکانهای ممکن برای روبات بدست میاورد روش کالمن فیلتر: یک توزیع گاوسی برای موقعیت روبات بدست آورده و بدنبال محلی که با آن تطبیق نماید میگردد.
41
سایر تکنیکهای احتمالاتی
Markov Localization: Uses robot position as the probability distribution, Bayes’ rule and convolution to update the belief. Markov Assumption: past and future data are independent if one knows the current state. KalmanFiltering Considers posing localization problem as a sensor fusion problem Assumption: Gaussian distribution function Particle Filtering Sample-based, nonparametric Filter Monte-Carlo method SLAM (simultaneous localization and mapping) Multi-robot localization
42
مکان یابی بر اساس نقشه احتمالاتی Probabilistic, Map-Based Localization
یک روبات متحرک را در محیطی شناحته شده در نظر بگیرید. این روبات از یک محل اولیه شروع به حرکت نموده و با استفاده از Odometery موقعیت خود را مشخص مینماید. روبات بعد از پیمودن مسافتی دچار عدم قطعیت در مورد موقعیت خود خواهد شد. روبات میتواند موقعیت خود را با انجام مشاهداتی از محیط )با استفاده از سنسورهائی غیر از ادومتری(به روز نماید. هر مشاهده منجر به یک تخمین از موقعیت روبات میشود که میتوان آنرا با موقعیت حاصل از Odometery ترکیب نموده و بهترین تخمین از محل واقعی روبات را بدست آورد.
43
تخصیص مقدار احتمال به موقعیت ربات
Uniform distribution وقتی که ربات هیچگونه اطلاعی از موقعیت خود ندارد Multimodal distribution وقتی که احتمال حضور ربات در چند موقعیت قوی تر باشد
44
تخصیص مقدار احتمال به موقعیت ربات
Dirac distribution وقتی که ربات با احتمال 100% از بودن در نقطه a اطمینان دارد. Gaussian distribution در برخی مواقع می توان باور ربات نسبت به یک موقعیت را با تابع احتمال گوسی تقریب زد.
45
مکان یابی بر اساس نقشه احتمالاتی Probabilistic, Map-Based Localization
عمل مکان یابی در دو مرحله انجام میشود: Action update مدلی برای نحوه عمل روبات فرض میشود که با استفاده ازقرائت انکدرها Ot و بر مبنای باور موجود نسبت به وضعیت قبلی یعنی St-1 باور جدیدی نسبت به وضعیت جدید روبات بدست میآید .S’t=Act(Ot , St-1 ) این مدل میتواند بسادگی از روی سینماتیک روبات بدست آید. Perception update مدلی از ادراک به ورودیهای سنسور it و باور به روز شده S’t اعمال میشود تا یک باور تصحیح شده از وضعیت فعلی روبات بدست آید. St=See(it , S’t)
46
مکان یابی بر اساس نقشه احتمالاتی Probabilistic, Map-Based Localization
درحالت کلی درمرحله به روز کردن actionعدم قطعیت باور روبات نسبت به موقعیت خود افزوده خواهد شد. اما درمرحله به روز کردن perception باعث تصحیح باور نسبت به وضعیت میگردد. در روش مارکف برای هر وضعیت ممکن روبات یک تابع احتمال جداگانه منظور و با انجام مشاهدات همه آنها به روز میشوند. در روش کالمن فقط از یک توزیع احتمال گوسی برای توصیف موقعیت روبات استفاده میشود که با یک مقدار میانگین و یک واریانس بیان میشود. در هر مرحله مقدار این دو متغیر به روزخواهند شد.
47
مراحل به روز رسانی باور ربت نسبت به موقعیت خود
Action update Perception update
48
مراحل Map-Based Localization
49
مقایسه روشهای مارکف وکالمن
Kalman filter localization tracks the robot and is inherently very precise and efficient. However, if the uncertainty of the robot becomes too large (e.g. collision with an object) the Kalman filter will fail and the position is definitively lost. Markov localization localization starting from any unknown position recovers from ambiguous situation. However, to update the probability of all positions within the whole state space at any time requires a discrete representation of the space (grid). The required memory and calculation power can thus become very important if a fine grid is used.
50
مکان یابی به روش مارکف در این روش باور روبات نسبت به موقعیت توسط تابع توزیع احتمال دلخواه نشان داده میشود. فضای موقعیت روبات با استفاده از یک grid و یا یک گراف توپولوژیک به تعدادی موقعیت محدود تجزیه میشود. ( صدها و گاها میلیونها ) در هر مرحله از بروز رسانی موقعیت تمامی نقاط فضای وضعیت به روز میشوند. اینکار با استفاده از ابزارهای تئوری احتمال انجام میشود.
51
مکان یابی به روش مارکف احتمال اولیه حضور روبات r در لحظه t در موقعیت اولیه l با P(A) و یا با P(rt=l) نشان داده میشود. این احتمال مستقل از هر دانشی است که وجود دارد. در عمل مایلیم احتمال مربوط به هرموقعیت روبات را بااستفاده ازداده های سنسورها محاسبه کنیم. برای اینکار از احتمال شرطی P(rt=l | it) استفاده میشود. فرمول بیز
52
مکان یابی به روش مارکف به روز کردن تابع See
p(l): belief state before perceptual update process p(i |l): probability to get measurement i when being at position l consult robots map, identify the probability of a certain sensor reading for each possible position in the map p(i): normalization factor so that sum over all l for L equals 1.
53
مکان یابی به روش مارکف به روز کردن تابع Act
برای محاسبه باورجدید روبات به بودن در یک وضعیت باید احتمال رسیدن به آن وضعیت از تمامی وضعیتهای ممکن بررسی و انتگرال گیری شود. بعبارت دیگر مجموع احتمال یک موقعیت l با استفاده از تمامی موقعیتهای l’ قبلی و مشاهده انکدر o ساخته میشود.
54
فرض اساسی روش مارکف روش مارکف بر پایه این فرض اساسی است که موقعیت فعلی روبات فقط به موقعیت قبلی و مقادیر حاصل ازاندازه گیری و یا ادراک بستگی دارد. در حالت کلی ممکن است این فرض صحیح نباشد مثلا مقدار قرائت سنسورها ممکن است تابعی ازtrajectory باشند و از اینرو نیازمند در نظر گرفتن تاریخچه های موقعیت های قبلی باشند. با این وجود فرض مارکف باعث میشود تا محاسبات مربوطه به سادگی انجام پذیرند.
55
مثالی از مکان یابی به روش مارکف با استفاده از یک نقشه توپولوژیکی
در یک نقشه توپولوژیکی محیط به نقاط مجزائی تجزیه شده است از اینرو بستر استفاده از روش مارکف ازقبل آماده است. در این مثال روباتی با نام درویش با استفاده از نقشه توپولوژیک دانشکده که در آن راهروها وکلاسها توسط نقاطی در روی نقشه مشخص شده اند و روبات با استفاده از سنسورها از محل مبدا به مقصد مورد نظر حرکت میکند. نقشه ممکن است اتصالات غلطی را نیز داشته باشد. این روبات توانست با استفاده از روش مارکف با موفقیت در مسابقات 1994انجمن هوش مصنوعی امریکا برنده شود.
56
مثال روبات فاقد انکدر بوده و با استفاده از رینگ اولترا سونیک عمل مکان یابی و ممانعت از برخورد با موانع را انجام میدهد. روبات با استفاده از سونار سعی در ادراک و تشخیص عبور از محل اتصال سالن ها می نمود.
57
نقشه توپولوژیک محیط شامل فضاهای مستطیلی و اشیا متداول در فضای کار است.
نقشه هندسی در یک نقشه توپولوژیکی مهمترین مسئله تصمیم گیری شامل تعیین گره ها و اتصال بین آنها میباشد. نقشه توپولوژیکی
58
مدل ادراک روبات با استفاده از سنسورهای سمت چپ و راست خود محل اتصال بین اتاقها و سالنها را تشخیص میدهد. در سیستم ادراکی فقط از زمان برای تشخیص وقایع استفاده میشود. برای مثال وقتی روبات برای مدت 1 ثانیه در فاصله 7 تا 17 سانتیمتری خود بطور پیوسته در دیوار سالن مانعی را تشخیص میدهد رویداد “ در بسته ” تشخیص داده میشود.
59
باور موقعیت برای نمایش باور موقعیت به هر گره توپولوژیکی n مقدار احتمال بودن در محدوده آن اختصاص داده می شود . P(rt=n) به روز کردن مقدار این باور وقتی انجام میشود که یک ویژگی سطح بالا نظیر راهرو و یا تقاطع استخراج میشود. معمولا این محاسبه بصورت تقریبی و بر اساس liklihood صورت میپذیرد. p(n | i)= p(i | n) p(n) p(n | i): new likelihood for being in position n p(n): current believe state p(i | n): probability of seeing i in n
60
استفاده از جدول p(i | n): probability of seeing i in n
سیستم استخراج ویژگی درویش قادر است تا فقط 4 نوع ویژگی را تشخیص دهد و از آنجائیکه هر گره دارای 5 حالت است لذا در مجموع میتوان با استفاده از یک جدول و یا certainty matrixتخمینی از مقدار احتمال p(i | n) را بیان نمود.
61
به روز رسانی action از آنجائیکه درویش فاقد انکدر است، و رویدادهای ادراکی بصورت غیرهمزمان رخ میدهند لذا عمل به روز رسانی مربوطه به قسمت action انجام نمیشود. با این وجود در عمل با هر رویداد ادارکی ترکیبی از به روز رسانی action و perception بطور همزمان انجام میشود. t-i is used instead of t-1 because the topological distance between n’ and n can vary depending on the specific topological map
62
برای محاسبه احتمال مشاهده رویداد i در موقعیت n در احتمال عدم مشاهده رویدادی در تمامی موقعیت های بین n و n’ ضرب میشود.
63
مثالی از محاسبه مقدار احتمال
64
مثالی از محاسبه مقدار احتمال
فرض کنید که روبات فقط دارای دو وضعیت با مقدار احتمال غیر صفر باشد: p(1-2) = 1.0 ; p(2-3) = 0.2 اگر روبات به یقین به سمت چپ در حال حرکت باشد از حالت 2-3 به حالت 3 و سپس به 3-4 و 4 خواهیم رسید. حال اگر روبات یک راهرو در سمت چپ خود و یک در باز در سمت راست خود مشاهده کرده باشد: احتمال بودن در 3و 3-4 حذف خواهند شد زیرا احتمال تشخیص یک در باز وقتی که دیواری وجود دارد صفرا ست. احتمال رسیدن به حالت 4 عبارت است P(4)=A*B*C =A حاصلضرب احتمال اولیه بودن در وضعیت 2-3 =Bاحتمال عدم مشاهده چیزی در وضعیت 3 و 3-4 =Cاحتمال مشاهده یک راهرو در سمت چپ و یک در در سمت راست در گره 4
65
مثالی از محاسبه مقدار احتمال
=A حاصلضرب احتمال اولیه بودن در وضعیت 2-3 =Bاحتمال عدم مشاهده چیزی در وضعیت 3 و 3-4 =Cاحتمال مشاهده یک راهرو در سمت چپ و یک درب در سمت راست در گره 4 بنا به مقادیر احتمال اولیه داریم: A=0.2 B وقتی رخ میدهد که روبات در حالت 3 درب بسته و یا باز را در سمت چپ تشخیص نداده و بدرستی در سمت راست چیزی نیافته باشد. برای سادگی احتمال عدم یافتن چیزی در 3-4 یک فرض شده است. B=[0.6*0.4+(1-0.6)*0.05]*.7 ( احتمال بسته بودن درب 0.6 فرض شده است) C وقتی رخ میدهد که روبات بدرستی راهرو را در سمت چپ تشخیص داده و به اشتباه به جای راهرو سمت راست یک درب تشخیص دهد .C=0.9*0.1 P(4)=0.003 توجه شود که مقادیر احتمال فوق likelihood هستند لذا مجموع آنها 1 نخواهد شد.
66
مثالی از محاسبه مقدار احتمال
به روش مشابهی میتوان نشان داد که اگر روبات از حالت 1-2 شروع نماید احتمال بودن در حالتهای 2-3و3و 3-4 صفر بوده و برای حالتهای 2 و 4 خواهیم داشت: p(4) =4.3*10-6وp(2) = 0.3 که برای حالت 4 این مقدار به مقدار قبلی اضافه خواهد شد. از اینرو باور وضعیت جدید روبات به {2,4}تغییر خواهد نمود که وضعیت 2 دارای احتمال بیشتری خواهد بود.
67
نحوه برنامه ریزی برای حرکت
برای اینکه روبات بتواند حرکت خود در محیط را برنامه ریزی نماید روبات باید بتواند یکی از موقعیت های موجود در نقشه را بعنوان موقعیت فعلی خود برگزیند. معمولا این انتخاب موقعیتی خواهد بود که دارای بیشترین احتمال است. درحالتی که فاصله بین وضعیت با بیشترین احتمال و وضعیت با احتمال بعدی خیلی کم باشد تصمیم گیری دشوار شده و روبات مجبور خواهد بود تا مدتی در محیط به حرکت خود ادامه دهد تا به قطعیت در مورد موقعیت برسد.
68
مثالی از مکان یابی به روش مارکف با استفاده از یک نقشه شبکه ای
روبات این مثال دارای 24 سونار و یک فاصله یاب لیزری است و از یک نقشه grid based استفاده میکند. نقشه متریک محیط بصورت یک شبکه 2 بعدی با اندازه سلول 4 تا 64 سانتیمترنشان داده میشود. باور موقعیت بصورت 3 بعدی و با یک آرایه 15 cm x 15 cm x 1°برای مختصات x,y,q نشان داده میشود.
69
به روز رسانی باور وضعیت به روزرسانی action
اگر در لحظه t انکدر اندازه گیری o را داشته باشد احتمال بودن در موقعیت l برابر است با: به روزرسانی perception احتمال بودن در موقعیت l با اندازه گیری فاصله i برابر است با:
70
محاسبه مقدار احتمال در این مثال نیز محاسبه p(i|l) کار سختی است بویژه اینکه تعداد حالات وضعیت بسیار زیاد است. لذا این مقدار مستقیما از روی مدل عملکرد سنسور و موقعیت روبات و نقشه متریک ساخته میشود. برای اینکار از فرضهای زیر استفاده میشود: برای اشیا تشخیص داده شده توسط سنسور فاصله خطای موقعیت را میتوان با تابع توزیع احتمالی که میانگین آن در موقعیت صحیح قرار دارد نشان داد. احتمال عدم اندازه گیری توسط سنسور فاصله صفر است برای مواقعی که اندازه گیری سنسور فاصله از حد میگذرد تابع توزیع احتمال به پیک خود خواهد رسید.
72
مشکلات روش مارکف در حالت کلی نشان دادن موقعیت ربات نیازمند یک ارایه 3 بعدی است که اندازه آن میتواند خیلی بزرگ شود. مثال) یک اتاق 30x30 m اگر با رزلوشن 0.1 m x 0.1 m x 1 deg نشان داده شود تعداد سلولهای نقشه برابر خواهد بود با: 300 x 300 x 360 = 32.4 عمل بروز رسانی در چنین نقشه ای به حافظه خیلی زیاد و همچنین توان پردازشی بالائی نیاز دارد.
73
جبران مشکلات روش مارکف کاهش اندازه نقشه. برای مثال از طریق استفاده از سلولهائی با سایز مختلف به روز رسانی باور موقعیت برای نقاط محدودی که احتمال بیشتری دارند. Particle Filter
74
مکان یابی با استفاده از فیلتر کالمن
یک روبات متحرک ممکن است از سنسورهای متعدی استفاده نماید که هرکدام نشانه هائی را در مورد مکان روبات در بر خواهند داشت. از اینرو با استفاده از sensor fusionممکن است بتوان تخمین بهتری از موقعیت روبات بدست آورد. فیلتر کالمن روش قدرتمندی است که امکان ترکیب داده های سنسورهای مختلف را فراهم میاورد. این روش نسبت به روش مارکف ساده تر است. اما منجر به یک الگوریتم برگشتی میگردد .
75
شمای کلی فیلتر کالمن System error source فیلتر کالمن یک مکانیزم ریاضی است که با استفاده ازاطلاعاتی در مورد سیستم و وسیله اندازه گیری تخمینی از حالت سیستم بدست میدهد. Control System System State (Unknown) Optimal estimate of system state Observed measurement Kalman Filter Measurement Device Measurement error source
76
مقدمه ای بر تئوری فیلتر کالمن
فیلتر کالمن امکان ترکیب چندین اندازه گیری را برای رسیدن به یک تخمین واحد از موقعیت سیستم فراهم میاورد. در ابتدا مسئله را برای حالت استاتیک که در آن روبات بین دو اندازه گیری ثابت مانده است بررسی و سپس نتایج به حالت دینامیک تعمیم داده خواهد شد. فرض های فیلتر کالمن سیستم خطی فرض میشود نویز سفید و گاوسی در نظر گرفته میشود
77
مقدمه ای بر تئوری فیلتر کالمن
فیلتر کالمن باور نسبت به موقعیت را بصورت یک توزیع گاوسی نشان میدهد A 1-d Gaussian distribution is given by: An n-d Gaussian distribution is given by:
78
تخمین استاتیک روباتی را در نظر بگیرید که دارای دو سنسور لیزر و سونار برای اندازه گیری فاصله است. لیزر اطلاعات دورتر و دقیق تری را بوجود میاورد اما در مواردی نظیر وجود شیشه قادر به اندازه گیری درست فاصله نیست. انتظار میرود که با ترکیب اطلاعات دو سنسور بتوان بهره اطلاعات را افزایش داد. اگر در لحظه k یک اندازه گیری با لیزر و در لحظه k+1 اندازه گیری دیگری با سونار انجام شده باشد با فرض اینکه سنسورها دارای نویز unimodal گوسی با میانگین صفر باشند میتوان با فیلتر کالمن اندازه گیری دو سنسور را ترکیب نمود.
79
تخمین استاتیک موقعیت روبات را میتوان از طریق هر یک از اندازه گیری ها بصورت جداگانه تخمین زد: q1 تخمین حاصل از سونار q2 تخمین حاصل از لیزر این اندازه گیری ها را میتوان با توزیع احتمال گوسی مدل نمود:
80
ترکیب داده ها با فرض ثابت بودن روبات در بین اندازه گیری ها میتوان اطلاعات را بصورت زیر باهم ترکیب نمود. Weighted least square که در آن wi وزن اندازه گیری i میباشد. برای پیدا کردن خطا میتوان مشتق Sرا برابر صفر در نظر گرفت:
81
ترکیب داده ها اگر مقدار وزن را بصورت زیر اختیار کنیم: خواهیم داشت
82
ترکیب داده ها از اینرو میتوان نوشت:
این رابطه به شکل فیلتر کالمن بصورت زیر نوشته میشود: که در آن واریانس تخمین جدید برابر است با
83
حالت دینامیک اگر روبات بین دو اندازه گیری در حال حرکت باشد میتوان حرکت آنرا با سرعت u و نویز w مدل نمود: اگر از لحظه k که در آن واریانس موقعیت روبات و واریانس نویز حرکت مشخص است، شروع نمائیم، برای لحظه k’ خواهیم داشت: از اینرو تخمین بهینه ای از موقعیت روبات قبل از اندازه گیری در لحظه t+1 خواهد بود
84
حالت دینامیک معادلات کالمن بصورت زیر خواهند بود:
85
کاربرد فیلتر کالمن در روباتیک
Encoder Position Prediction Observation Prediction Position estimate Estimation (Fusion) Matched predictions and Actual observation Prediction observations Map Matching Raw sensor data Or extracted features Actual Observation Perception
86
مثالی از کاربرد کالمن فیلتر
روبات از لیزر برای اندازه گیری فاصله استفاده میکند. محیط با نقشه ای شامل مجموعه ای از خطوط محدود نشان داده میشود. باور وضعیت روبات توسط یک توزیع گاوسی نشان داده میشود. فریم مختصات مورد استفاده برای سنسورها {S} با فریم روبات {R} یکسان است. بردار ها در فریم مرجع {W} نشان داده میشوند.
87
تخمین موقعیت روبات موقعیت روبات در لحظه k+1 با استفاده از موقعیت قبلی آن در لحظه k و مقدار حرکت آن در اثر اعمال کنترل u(t) بدست میاید. واریانس این تخمین از رابطه زیر بدست میاید. f: Odometry function
88
مدل خطا برای تخمین موقعیت با استفاده از اودومتری
موقعیت یک روبات بصورت زیر نشان داد ه میشود: برای یک روبات دیفرانسیلی اگر در فواصل منظم از x,y,q نمونه برداری شود خواهیم داشت: فاصله بین چرخها فاصله طی شده توسط چرخها
89
مدل خطا برای تخمین موقعیت با استفاده از اودومتری
فرمول فوق فقط میتواند یک تقریب کلی از موقعیت روبات بدست دهد زیرا خطاها در طول زمان با هم جمع خواهند شد. برای محاسبه ماتریس کواریانس خطا اگر فرض شود که این ماتریس در ابتدا معلوم است خواهیم داشت: فاصله طی شده توسط هر چرخ ثوابت خطا
90
مدل خطا برای تخمین موقعیت با استفاده از اودومتری
اگر مقدار p و مقدار حرکت چرخها کارولیشن نداشته و f را بتوان با یک بسط تیلور مرتبه اول تقریب زد قانون انتشار خطا بصورت زیر خواهد بود:
91
انتشار خطا برای حرکت در روی یک خط
92
Robot Position Prediction: Example
تخمین موقعیت روبات در لحظه k+1 با استفاده از تخمین قبلی و در نظر گرفتن داده های انکدر ها بدست میاید. برای روبات دیفرانسیلی داریم: که ماتریس کوواریانس آن از روابط زیر بدست میاید.
93
Robot Position Prediction: Example
در لحظه k موقعیت روبات با p(k)=[x(k) y(k) q(k)]T وبهترین تخمین موقعیت آن با p^(k|k) نشان داده میشود. ورودی کنترلی u(k) روبات را به موقعیت p(k+1)میبرد.
94
مشاهده در این مرحله در لحظه k+1 اندازه گیری z(k+1) انجام میشود.
این مشاهده میتواند بر اثر اعمال فرایند استخراج ویژگی بر داده های خام سنسورها باشد که یک خط و یا یک درب را مشخص کرده باشد. پارامترهای ویژگی استخراج شده معمولا در فریم مختصات محلی بیان میشود. برای تطبیق این ویژگی مشاهده شده باید آنرا از فریم مرجع به فریم سنسورها تبدیل نمود. The parameters of the targets are usually observed in the sensor frame }S}. Therefore the observations have to be transformed to the world f rame {W} or the measurement prediction have to be transformed to the sensor frame {S}. This transformation is specified in the function hi (seen later).
95
Raw Data of laser scanner
Observation: Example این روبات با استفاده از لیزردوار نقاطی را اندازه گیری کرده و از این داده ها خطوط موجود در محیط را استخراج میکند. Raw Data of laser scanner Extracted Lines
96
Observation: Example پارامترهای هر خط در مختصات قطبی با aj,rj مشخص میشوند. برای هر خط مقدار عدم قطعیت بدست آمده و ماتریس کوواریانس حاصله استخراج میشود.
97
تخمین اندازه گیری در این مرحله با استفاده از نقشه محیطM(K) و موقعیتی که برای روبات تخمین زده شده است p^(k+1|k) ، تخمینی از ویژگی های مورد انتظارzt,i محاسبه میشود. تابع hi برای تبدیل بین مختصات مرجع و سنسور)روبات ( بکار میرود.
98
Measurement Prediction: Example
با استفاده از نقشه محیط و موقعیتی که برای روبات تخمین زده شده است p^(k+1|k) ، تخمینی از ویژگی های مورد انتظارzt,i محاسبه میشود. معمولا خطوط موجود در نقشه در فریم مرجع بیان میشوند که باید به فریم روبات منتقل شوند.
99
Measurement Prediction: Example
بر طبق شکل قبل این تبدیل مختصات بصورت زیر خواهد بود: که ژاکوبین آن بصورت زیر خواهد بود:
100
Measurement Prediction: Example
تخمین اندازه گیری منجر به تخمین خطوطی خواهد شد که در فریم روبات بیان میشوند. این تخمین نادقیق خواهد بود زیرا تخمین موقعیت روبات نادقیق است.
101
تطبیق در این مرحله دارای دو دسته اطلاعات هستیم:
یکی ویژگی های مشاهده شده است و دیگری مجموعه ای از ویژگی های تخمین زده شده است. هر دو این داده ها در مختصات سنسور بیان شده اند. هدف از مرحله تطبیق این است که مشخص نمائیم اندازه گیری روبات به کدامیک از ویژگی های تخمین زده شده در روی نقشه مربوط است.
102
تطبیق در این مرحله ارتباط بین ویژگی های مشاهده شده zj(k+1)
و ویژگی هدف )که در نقشه ذخیره شده است(، zt پبدا میشود. برای اینکار فاصله بصورت زیر محاسبه میشود این فاصله inovation نامیده میشود. مقدار کوواریانس آن بصورت زیر خواهد بود ویژگی هائی معتبر خواهند بود که مقدار innovation برای آنها در رابطه زیر صدق ماید: نویز
103
Matching: Example
104
مرحله تخمین: اعمال فیلتر کالمن
در این مرحله بهترین تخمین برای موقعیت روبات با استفاده از تخمین موقعیت و همه مشاهدات در لحظه k+1 انجام میشود. Kalman filter gain: Update of robot’s position estimate: The associate variance
105
مرحله تخمین: اعمال فیلتر کالمن
برای حالت یک بعدی خواهیم داشت:
106
مسائل ناشی از اعمال مدل خطی
اغلب مسائل مورد علاقه از جمله روباتهای متحرک غیر خطی هستند در چنین مواردی باید سیستم غیر خطی را به نحوی بصورت خطی مدل کرد میتوان با استفاده از معادلات انتشار حالت مدلهای سنسورها را بصورت خطی درآورد با خطی کردن روابط خطای حالت افزایش خواهد یافت.
107
Nonlinear Dynamic Systems
در عمل بسیاری از سیستمها خطی نیستند اما ممکن است اختلاف زیادی با یک سیستم خطی هم نداشته باشند. این امر وقتی اتفاق می افتد که حالت سیستم و اندازه گیزی ها غیر خطی بوده اما برای مقادیر کوچک اختلاف در مقادیر بتوان آنرا خطی فرض کرد. در چنین شرایطی دیگر نمی توان از معادلات خطی توصیف کننده حالت استفاده نمود: بجای آن روابط غیرخطی فرض می شوند: که در آن f تابعی غیرخطی است که وضعیت قبلی سیستم را به حالت فعلی ربط می دهد. این روابط برای اندازه گیری ها هم اعمال می شود:
108
Perturbation Kalman Filter (PKF)
در این فیلتر برای تخمین وضعیت سیستم از روش خطی کردن مقادیر غیرخطی استفاده میشود. در این روش تابع در یک محدوده کوچک حول x خطی فرض میشود. بدین ترتیب خواص سیستم خطی در یک محدوده کوچک قابل اعمال می شود. در این روش تابع غیر خطی به دو جزء تقسیم میشود: یک بخش معلوم nominal component و یک بخش نامشخص component perturbation بخش nominal یک مسیر مرجع یا reference trajectory بحساب می آید که در آن متغیر تصادفی مقادیر مورد انتظار خود را دارد. بخش perturbation در واقع اختلاف بین مسیر واقعی و مسیر nominal است که در اثر نویز و خطا های اندازه گیری بوجود می آید.
109
Taylor Series برای خطی کردن تابعی که پیوسته بوده و بی نهایت بار قابل مشتق گیری باشد، می توان از بسط سری تیلور استفاده نمود. در این رابطه f(i) مشتق مرتبه i ام است. برای خطی کردن تابع، از جملات مرتبه بالاتر از یک سری تیلور صرفنظر میشود. لازمه اینکار این است که مقدار تغییرات نسبت به جملات مرتبه بالاتر کوچک باشد. 2 n
110
Nominal Trajectory Linearization
برای خطی کردن سیستم فرض میشود که بتوان حالت آنرا با دو جمله زیر نوشت: وضعیت xnom k-1 قسمتی از nominal trajectory سیستم است که برای محاسبه آن میتوان از رابطه برگشتی زیر استفاده نمود: مقدار اختلال در سیستم از رابطه زیر محاسبه میشود:
111
Nominal Trajectory Linearization
برای خطی کردن رابطه قبل تابع f را حول بسط میدهیم. با قرار دادن این تابع در جمله مربوط به مقدار اخلال خواهیمداشت: ماتریس A ماتریس ژاکوبین نامیده میشود.
112
Linearized Measurement Model
مدل اندازه گیری را نیز میتوان به روش مشابهی خطی نمود:
113
PKF Algorithm الگوریتم PKF برای تخمین موقعیت یک سیستم غیرخطی مقدار nominal وضعیت را با مقدار تخمین اختلال وضعیت ترکیب می کند: که مقادیر اختلال از رابطه زیر تقریب زده می شود.
114
PKF Algorithm در شروع الگوریتم، مقادیراختلال و عدم قطعیت با مقادیر اولیه آنها در t=0 مقدار دهی اولیه می شوند. در فاز پیش بینی، مقادیر اختلال و عدم قطعیت در هر مرحله از مقادیر آنها در مرحله قبلی بدست می آید: هر بار که یک اندازه گیری جدید Zk بدست می آید، مقدار آن از رابطه زیر در محاسبه مقدار اخلال دخالت داده میشود. Prediction Correction
115
PKF Algorithm Full State Estimate
با در دست داشتن اخلا وضعیت اولیه و ثاویه می توان تخمین وضعیت اولیه و ثانویه را با ترکیب مقادیر اخلال با مقادیر نرم محاسبه کرد.
116
ملاحظات عمل خطی کردن حول یک مسیر نامی وقتی خوب عمل میکند که مسیر واقعی و مسیر نامی نزدیک به هم باشند. این عمل وقتی استفاده میشود که مسیر از قبل معلوم باشد لذا میتوان ماتریس های ژاکوبین Ak , Hk را بصورت off line محاسبه نمود. به همین ترتیب مقادیر ضریب کالمن Kk و کوواریانس خطا P-k , P+k را نیز بصورت off line محاسبه نمود. با این وجود اگر مقادیر اخلال کوچک نباشد، مقدار خطای این روش خیلی زیاد خواهد شد.
117
Extended Kalman Filter
مشکل اصلی روش PKF این بود که این روش از یک مسیر نامی واحد در طول فرایند تخمین استفاده میکند و این مسیر حتی وقتی که مقدار تخمین زده اختلاف زیادی با آن دارد تغییر نمی کند. برای جلوگیری از افزایش خطا میتوان مسیری که اختلال حول آن خطی شده است را بصورت دینامیک در نظر گرفت. روش EKF از ایده فوق پیروی میکند.
118
Estimated Trajectory Linearization
بجای محاسبه بسط سری تیلور حول مسیر نامی که مستقل از اندازه گیری و تخمین حالت بود، میتوان آنرا حول مسیری که بر مبنای آخرین تخمین بروز رسانی می شود محاسبه نمود. اگر وضعیت سیستم باندازه کافی قابل مشاهده باشد، یعنی اندازه گیری ها با فرکانس بالائی انجام شده باشد، اختلاف بین مسیر واقعی و تخمین زده شده کوچک خواهد بود. در نتیجه بهتر است بجای مسیر نامی از مسیر تخمین زده شده استفاده نمود.
119
Nominal Trajectory Update
فرض کنید آخرین اندازه گیری انجام شده در لحظه K-1 یعنی Zk-1 را برای تخمین موقعیت استفاده کرده و تخمین موقعیت ثانویه را بدست آوریم: حال با استفاده از این موقعیت مقدار مسیر نامی را مجددا باشروع از حالت K-1 محاسبه میکنیم. که در آن بجای از برای موقعیت اولیه استفاده میکنیم. در نتیجه بهترین تخمین از در مرحله K-1 برابربا صفر خواهد بود زیرا آخرین تخمین بهترین تخمین نیز فرض شده است:
120
Prediction برای تخمین مقدار اخلال در لحظه k با استفاده از مقدار قبلی آن از ماتریس ژاکوبین استفاده میکنیم: توجه شود که این ماتریس در نقطه زیر محاسبه میشود: برای محاسبه مقدار تخمین اولیه موقعیت از رابطه زیر استفاده میشود: که بر خلاف حالت قبل وابسته به مقدار سیستم غیر خطی اولیه یعنی f است.
121
Correction مسیر نامی اندازه گیری وابسته به مسیر نامی وضعیت است. از آنجائیکه مسیر نامی وضعیت، اکنون به نحو دیگری محاسبه میشود، از این مقدار جدید برای محاسبه اندازه گیری استفاده میگردد و باقی عملیات مشابه قبل است: توجه شود که مقدار ماتریس ژاکوبین H و تابع اندازه گیری h در نقطه به روز رسانی میشوند که در روش جدید از روی تابع بدست می آید.
122
Correction با دنباله روی از روش قبلی بهترین مقدار برای تخمین ثانویه موقعیت از رابطه زیر بدست خواهد آمد: همانگونه که مشاهده میشود در این روش دیگر نیازی به محاسبه صریح مقدار نخواهد بود.
123
Algorithm EKF الگوریتم در سه مرحله انجام میشود: Initialization
Prediction در هر لحظه k مقدار تخمین موقعیت از روی مقدار قبلی بدست آمده و مقدار عدم قطعیت آن از رابطه زیر بدست می اید: Correction مقدار تخمین ثانویه موقعیت با استفاده از اندازه گیری به عمل آمده محاسبه میشود.
124
ملاحظات ماتریس های ژاکوبین Ak, Hk با آخرین مقدار تخمین موقعیت محاسبه میشوند و از آنجائیکه این مقدار از قبل معلوم نیست امکان محاسبه off line ماتریس ها وجود نخواهد داشت. EKF تخمین بهتری از موقعیت بدست میدهد زیرا انحراف از مسیر نرمال در آن کمتر است. مقدار ضریب کالمن و معادلات مربوط به محاسبه کوواریانس خطا بر مبنای تخمین موقعیت محاسبه میشوند. EKF در کاربردهای عملی زیادی در سیستمهای غیر خطی با موفقیت عمل کرده است
Similar presentations
© 2025 SlidePlayer.com. Inc.
All rights reserved.