Decision Tree.

Slides:



Advertisements
Similar presentations
Awe sim.
Advertisements

Version Space Search in Prolog سمینار درس : برنامه سازی منطق استاد : دکتر محمد ابراهیم شیری ارایه دهنده : رحمت ا... محمدی.
معاونت درمان امور مامایی اردیبهشت 90. برای ثبت اطلاعات در برنامه نرم افزاری نظام مراقبت مرگ پریناتال ابتدا لازم است برنامه نرم افزار info-path وپرنیان.
فاکتورهای مهم در ایجاد یک مقاله علمی
الگوریتم ژنتیکی. تعریف  الگوریتم ژنتیکی، رویه ای تکراری است که راه حل های انتخابیش را بصورت رشته ای از ژنها که کروموزوم نامیده می شوند، بازنمایی می کند.
Definition. قانون بیز P(b|a) = P(a|b)P(b)/P(a) P(b|a) = P(a|b)P(b)/P(a) این قانون برای استنتاج آماری استفاده می شود. این قانون برای استنتاج آماری استفاده.
© 2005 Prentice Hall Inc. All rights reserved. o r g a n i z a t i o n a l b e h a v i o r e l e v e n t h e d i t i o n.
معماری DSS.
© 2005 Prentice Hall Inc. All rights reserved. o r g a n i z a t i o n a l b e h a v i o r e l e v e n t h e d i t i o n.
Ali Karimpour Associate Professor Ferdowsi University of Mashhad ADVANCED CONTROL Reference: Chi-Tsong Chen, “Linear System Theory and Design”, 1999.
فصل دوم:Questions For Review. مقایسه Decision Making با Problem Solving  اصولا مساله وقتی پیش می آید که سیستم پاسخگو به اهدافش نباشد و به نتایج پیش گویی.
فایل پردازی در C File based Programming in C. انواع فایل متنی –سرعت بالا –حجم کمتر –امکان دسترسی تصادفی –حفظ امنیت داده ها دودویی (باینری) –امکان باز.
1 Network Address Translation (NAT). 2 Private Network شبکه خصوصی شبکه ای است که بطور مستقیم به اینترنت متصل نیست در یک شبکه خصوصی آدرس های IP به دلخواه.
روش تحقیق جلسه چهارم دانشگاه صنعتی اصفهان دانشکده کشاورزی
Database Laboratory: Session #4 Akram Shokri. DB-Lab 2 Lab Activity You must already created all tables You have to have inserted proper data in tables.
تکنیک های پیشرفته در برنامه سازی وب ) اسلايد هفتم ) جوانمرد Website: به نام خدا.
موضوع: دبير مربوطه: آموزشگاه : اجرا : عبارتهای جبری خانم مقصودی
مظفر بگ محمدی دانشگاه ایلام Generics. کدهای عمومی 2 یکی از اهداف OOP ایجاد قابلیت نوشتن برنامه های عمومی با قابلیت استفاده ی مجدد است. کدهای چندریخت تا.
ساختمان داده‌ها پیمایش گراف. مرور °مشکل: چگونه تمام نودهای گراف را مشاهده کنیم؟ °جستجوی اول عمق دنبال کردن مسیرهای بین راسها. °جستجوی اول سطح دیدن تمام.
Arrangements of Lines C omputational Geometry By Samaneh shafi naderi
پیاده سازی کنترلر PC/104. Contents PC/104 پیاده سازی کنترلر HILتست 1.
آشنايي با سيستم اعداد.
AHP فرایند تحلیل سلسله مراتبی. پیشگفتار یکی از کارآمد ترین تکنیک های تصمیم گیری فرایند تحلیل سلسله مراتبی ( Analytical Hierarchy process-AHP ) که اولین.
[c.
تمرین هفتم بسم الله الرحمن الرحیم درس یادگیری ماشین محمدعلی کیوان راد
هیدروگراف(Hydrograph) تهیه : دکتر محمد مهدی احمدی
استفاده از ماشین بردار پشتیبان (SVM) برای تشخیص گوینده
ویژگی های DHCP جلوگیری از Conflict سرعت بخشیدن به کارها مدیریت متمرکز
بررسي روش های تحلیل رفتارکاربران در شبکه
بنام خدا زبان برنامه نویسی C (21814( Lecture 12 Selected Topics
آشنایی مقدماتی با نرم افزار Endnote X4
ساختمان داده‌ها الگوریتمهای کوتاهترین مسیر
مدولاسیون چندحاملی OFDM
برنامه ریزی خطی پیشرفته (21715( Advanced Linear Programming Lecture 11
چگونه بفهمیم آیا ژورنالی ISI است؟ ایمپکت فاکتور دارد یا خیر؟
سیستم مدرسه کارنیک شرکت کارنیک سیستم
مدیریت مالی و اقتصاد مدیریت موضوع : نقطه سر به سر زمستان 93
فصل دوم جبر بول.
تکنیک دیماتل DEMATEL: decision making trial and evaluation laboratory.
شبکه های کامپیوتری 2 درس اول چند پخشی.
SSO Single Sign-on Systems
1.
آشنایی با پایگاه داده mysql
Tree Sort.
کوئیز از جلسه قبل) کارخانه ای در حال خرید قطعه‌ای برای یکی از ماشین‌آلات خود می باشد اگر نرخ بهره 10% برای محاسبات فرض شود، دو مدل از قطعه ماشین در دسترس.
مدارهای منطقی فصل سوم - خصوصیات توابع سويیچی
آشنایی مقدماتی با نرم افزار Endnote X4
داده ها -پیوسته Continuous
دینامیک سیستمهای قدرت مدرس: دکتر مهدی بانژاد
تهیه و تنظیم: فاطمه قاسمی دانشگاه صنعتی شریف – پاییز 86
فضای نمونه: مجموعه همه برآمدهای ممکن یک آزمایش را فضای نمونه گویند . واقعه (پیشامد) : هر زیر مجموعه از فضای نمونه را پیشامد گویند . پیشامدها با حروف بزرگ.
Bucket sort اكرم منوچهري زهرا منوچهري
آشنایی مقدماتی با نرم افزار Endnote X4
بسم الله الرحمن الرحیم هرس درخت تصمیم Dr.vahidipour Zahra bayat
آشنایی مقدماتی با نرم افزار Endnote
جستجوی منابع الکترونیک
IN THE NAME OF GOD MATH SABA KARBALAEI
سمینار SharePoint رانندگی در بزرگراه پرتال ها
فصل ششم مدارهای ترتیبی.
ابزارهای جستجوی پایان نامه
ساختمان داده‌ها درختان و درختان دودویی
توزیع میانگین نمونه سعید موسوی.
مراحل پیش رو : 1- الگوریتم عقبگرد برای مسئله کوله پشتی صفر و یک
نسبت جرم فرمولی ”جرم اتمی و فرمول تجربی
برنامه ریزی خطی پیشرفته (21715( Advanced Linear Programming Lecture 7
kbkjlj/m/lkiubljj'pl;
مباني كامپيوتر و برنامه سازي Basics of Computer and Programming
مباني كامپيوتر و برنامه سازي Basics of Computer and Programming
ساختمان داده ها گرافها.
سد خونی- مغزی. تکنولوژی نمایش فاژی و کاربرد آن  مقدمه و تاریخچه  نمایش فاژی در تولید آنتی بادی مونوکونال.
Presentation transcript:

Decision Tree

تعریف درختی با درجه دلخواه است که برای دسته بندی نمونه ها استفاده می شود. هر نود برگ، یک دسته بندی از نمونه ها یا تصمیم را ارائه می کند. هر نود غیربرگ، یک ویژگی تست یا در واقع یک انتخاب بین چندین آلترناتیو را ارائه می کند.

مثال درخت تصمیم گیری برای کمک به یک موسسه مالی در تصمیم برای اینکه به شخصی وام بدهد یا نه

مثالی برای ساخت درخت تصمیم گیری 7 نمونه داریم و 3 ویژگی و نمونه ها در دو کلاس دسته بندی می شوند. ویژگیها و ارزشهای آنها: size: small medium large colour: red blue green shape: brick wedge sphere pillar کلاسها: کلاس yes: medium blue brick small red sphere large green pillar large green sphere کلاس no: small red wedge large red wedge large red pillar

الگوریتم استنتاج درخت الگوریتم بر روی مجموعه نمونه های training ِ C عمل می کند. اگر تمام نمونه ها متعلق به یک کلاس باشند، نود مربوط به آن کلاس را ایجاد کرده و متوقف می شود. در غیر این صورت یک ویژگی را انتخاب کرده و نود تصمیم گیری مربوط به آن را ایجاد می کند. و مطابق با ارزشهای آن، نمونه های training ِ C را به چند بخش تقسیم می کند. و به همین ترتیب ادامه می دهد.

الگوریتم استنتاج درخت این الگوریتم با if های تو در تو قابل پیاده سازی است. if (shape == wedge) return no; if (shape == brick) return yes; if (shape == pillar) { if (colour == red) return no; if (colour == green) return yes; } if (shape == sphere) return yes;

خروجی الگوریتم

الگوریتم های ساخت Decision Tree الگوریتم ID3 الگوریتم C4.5 الگوریتم C5 الگوریتم Bagging الگوریتم Boostering

انتخاب ویژگیها در الگوریتم ID3 پیچیدگی درخت بستگی به ترتیب انتخاب ویژگیها دارد. ID3 از تئوری اطلاعات برای تعیین میزان اطلاع دهندگی ویژگی استفاده می کند. میزان محتوای اطلاعات پیغام، معکوس احتمال دریافت آن پیغام می باشد. information1(M) = 1/probability(M) تعداد بیتهای لازم برای انکود پیغام از رابطه زیر بدست می آید: Information(M) = -log2 (probability(M))

Entropy میانگین میزان اطلاعات در واحد بیت را برای ویژگیها بیان می کند. -ΣP log2P

الگوریتم ID3 ویژگیها را برای اضافه کردن در سطح بعدی درخت با استفاده از محاسبه entropy بررسی کنید. ویژگیی را انتخاب کنید که entropy را مینیمم کند.

مثال (استفاده از الگوریتم ID3) درخت تصمیم گیری اولیه شامل یک نود با تمام جوابها است. 4 خروجی مثبت و 3 خروجی منفی داریم. بنابراین احتمال جوابهای مثبت 7/4=0.57 و احتمال جوابهای منفی 7/3=0.43 است. Entropy: - (0.57 * log 0.57) - (0.43 * log 0.43) = 0.99 ویژگیهای مختلف را انتخاب کرده و entropy آنها را بدست می آوریم. سایز: سه ارزش بزرگ، متوسط و کوچک دارد. 4 نمونه با سایز بزرگ داریم که خروجی 2 تای آن مثبت و 2 تای دیگر منفی است. و entropy آن برابر است با: - (0.5 * log 0.5) - (0.5 * log 0.5) = 1 2 نمونه با سایز کوچک داریم که خروجی یکی مثبت و دیگری منفی است. و entropy آن برابر است با: 1 نمونه با سایز متوسط داریم که خروجی آن مثبت است. و entropy آن برابر است با صفر. میزان اطلاعات مورد انتظار برای شکستن بر روی سایز برابر است با: 1*4/7+1*2/7+0*1/7=0.86 رنگ: میزان اطلاعات مورد انتظار برای شکستن بر روی آن برابر است با: 0.48 شکل: میزان اطلاعات مورد انتظار برای شکستن بر روی آن برابر است با: 0.3 بنابراین شکل را انتخاب می کنیم. برای تمام زیر درختها نیز این عمل را تکرار می کنیم.

فهرست منابع Lucas Ballard, “Topics in Machine Learning: Decision Tree Learning”. 9/18/02