Presentation is loading. Please wait.

Presentation is loading. Please wait.

ارائه درس هوش مصنوعی پیشرفته

Similar presentations


Presentation on theme: "ارائه درس هوش مصنوعی پیشرفته"— Presentation transcript:

1 ارائه درس هوش مصنوعی پیشرفته
ارزیابی ریسک اعتبار مالی Financial credit risk assessment: a recent review ارائه درس هوش مصنوعی پیشرفته استاد درس: دکتر بیژنی دانشجو: علی بسمی سال تحصیلی: 96-97

2 چکیده ارزیابی ریسک اعتبار مالی (ا.ر.ا.م) یک موضوع تحقیقاتی و چاش برانگیز در حوزه حسابداری و مالی است حجم زیادی از مطالعات صورت گرفته در ابتدای قرن اخیر است دقت بررسی ا.ر.ا.م و جلوگیری از شکست های تجاری نقش مهمی در اقتصاد بازی می کند به همین دلیل در سال های اخیر الگوریتم ها و روش های زیادی ارائه شده است در این ارائه خلاصه از روش های آماری سنتی و روش های خلاقانه برای پیش بینی ناهنجاری های مالی بیان شده است

3 1: مقدمه بحران مالی به یک مشکل جدی در جهان تبدیل شده است به طوری که طبق بررسی سالانه Coface در پرتغال، 80% از شرکت های کوچک و متوسط دچار کمبود سود، سختی تامین مالی و میزان بدهی های بالا هستند در بخش های بعد موارد زیر بررسی می شود: بخش دوم: بررسی روش هایی که به طور گسترده ا.ر.ا.م مورد استفاده قرار می گیرند بخش سوم: سیستم های طبقه بندی چندگانه که تازگی ظهور کرده و پتانسیل قابل توجهی برای بهبود عملکرد مدل های پیش بینی دارند بخش چهارم: یادگیری حساس به هزینه و نامتعادل به عنوان یکی از موضوعات مهم در ا.ر.ا.م از جمله روش های یادگیری حساس به هزینه بخش پنجم: اهمیت کاهش ابعاد پایگاه داده های مالی و روش های یادگیری پیشرفته زیرفضا در ا.ر.ا.م بخش ششم: روش های اعتبارسنجی کارایی و تفسیر عمیق نتایج پیش بینی هاو بیان معیارهای عملکرد و تست های آماری مهم بخش هفتم: محدودیت مطالعاتی که تاکنون صورت گرفته و پیشنهاد جهت های تحقیقاتی آینده

4 بخش دوم: روش های ارزیابی ریسک اعتبار مالی
ریسک اعتبار مالی بیانگر خطر مربوط به تامین مالی است به عبارت دیگر، یک وام گیرنده نمی تواند بدهی خود را به وام دهندگان پرداخت کند ا.ر.ا.م در نظر دارد مشکل را این گونه حل کند: با استفاده از روش هایی شرکت ها را برچسب گذاری کند (اعتبار خوب یا بد) و احتمال این که شرکت دارای ریسک بالایی است را پیش بینی کند دو مشکل: 1)اعتبار یا امتیاز دادن 2)پیش بینی ورشکستگی روش : هر دو مشکل با روشی به صورت دسته بندی باینری برطرف می شود

5 مسیر و روش اجرایی ارزیابی ریسک اعتبار مالی
ابتدا داده های مورد بررسی از متغیرهای مالی شرکت وارد می شوند پیش پردازش (فیلتر کردن، پرکردن داده های از دست رفته، نرمال سازی و ... با استفاده از ابزارهای انتخاب ویژگی ابعاد پایگاه داده را کاهش می دهیم مانند PCA که تبدیلی خطی است و ISOMAP و LLE که تبدیل های غیر خطی اند از مدل های یادگیری برای بررسی الگوهای تبدیل شده استفاده می شود، در این قسمت داده های خاصی مانند اولویت هزینه کاربران، توزیع کلاس داده های مورد بررسی، نوع متغیر ها اضافه می شود به مدل یادگیری برای تقویت توضیح و فهم داده ها در نهایت نتایج پیش بینی ها از لحاظ معیارهای عملکرد در طبقه بندی های مختلف برای مقایسه ارزیابی می شوند

6 بخش دوم: روش های ارزیابی ریسک اعتبار مالی
مطالعات اخیر نشان دادند که روش های هوشمند می توانند به طور قابل توجهی دقت روش های آماری را افزایش دهند نمونه هایی از این تکنیک ها: شبکه های عصبی مصنوعی (ANNS) نظریه مجموعه های فازی (Fuzzy Set Theory) درخت های تصمیم گیری (Decision Trees) استدلال مبتنی بر مورد (Case-based Reasoning(CBR)) Support Vector Machines (SVM) برنامه نویسی ژنتیک GP یادگیری ترکیبی (Hybrid Learning)

7 برخی مطالعات اخیر در مورد ارزیابی ریسک اعتبار مالی

8 بخش دوم: روش های ارزیابی ریسک اعتبار مالی
2.1: مدل های آماری روش های آماری سنتی مانند: تجزیه و تحلیل خطی (LDA) و 2R و MDA و FA و... منطق این مدل ها: یافتن یک ترکیب خطی بهینه از داده های ورودی که قادر به مدل سازی، تحلیل و پیش بینی ریسک باشند 2.2: روش های شبه پارامتری روش های آماری قدیمی تر پارامتری مدل سازی می کنند روش های هوشمند از مدل های غیر پارامتری که از روی داده ها مدل را می سازند استفاده می کنند روش های نیمه پارامتری: پلی بین این دو هستند با توجه به انعطاف پذیری بیشتر این روش ها از آن ها در پیش بینی ورشکستگی استفاده می شود

9 بخش دوم: روش های ارزیابی ریسک اعتبار مالی
2.3) شبکه های عصبی مصنوعی خانواده ای از شبکه های عصبی مصنوعی را نشان می دهد مانند: Self-organizing map, back propagation, multi-layer perceptron, probabilistic neural network, … مزیت: . توانایی عالی در پردازش داده های غیرخطی برای یافتن الگوهای حقیقی از اطلاعات مالی پیچیده معایب: . نیازمند زمان آموزش (Training Time) . ممکن است شامل جواب بهین نباشند . بیش از حد وابسته به داده های آموزشی

10 بخش دوم: روش های ارزیابی ریسک اعتبار مالی
2.4) Support Vector Machines (SVM) SVM ها ورودی های غیر خطی را با استفاده از یک تابع هسته، به یک فضای High-dimensional تبدیل می کنند تا تا داده ها توسط مدل های خطی جداسازی شوند روند اصلی: جستجوی یک hyperplane بهینه که داده ها به دسته بندی بکند و margin یا حاشیه جدایی را حداکثر بکند مجبوبیت زیاد SVM ها در فضاهای high-dimensional با داده های با حجم نسبتا کم 2.5) Decision Trees روش کلاسیک طبقه بندی شامل گره برگ و تصمیم (هدف و تست روی صفت ها) ویژگی ها: . تفسیر آسان نتایج، برآورد غیرخطی، فرم غیرپارامتری نمونه های مناسب برای پیش بینی ورشکستگی: . CARD , C45

11 بخش دوم: روش های ارزیابی ریسک اعتبار مالی
2.6) استدلال مبتنی بر مورد (Case-based Reasoning(CBR)) روش: بر اساس اصل K-Nearest Neighbors (KNN) کار می کند KNN: ورودی مشابه باید خروجی مشابه داشته باشد CBR کلاسیک از چهار مرحله تشکیل شده است: 1. بیرون کشیدن KNN از Case-base با استفاده از similarity kernel function (Retrieval) 2. پیش بینی برای نمونه جدید بر اساس همسایگان (Reuse) 3. تایید پیش بینی نمونه جدید (Revise) 4. اضافه کردن نمونه جدید و پیش بینی آن به Case-base (Retain) CBR اجازه کم و زیاد کردن نمونه ها را می دهد عملکرد CBR به عنوان یک روش مناسب برای پیش بینی ورشکستگی تایید شده است CBR را می توان به مجموعه داده های کوچک اعمال کرد

12 بخش دوم: روش های ارزیابی ریسک اعتبار مالی
2.7) الگوهای یادگیری ترکیبی (Hybrid Learning Models) ادغام: ترکیب روش های اکتشافی مثل ژنتیک و شبیه سازی و آنیل و ... با مدل های یادگیری مد آبشاری (cascade mode): از طبقه بندها (classifier) به صورت متوالی استفاده می کند مد ترکیب (combination mode): از خوشه بند (clustering)به عنوان preprocessor استفاده می کند برای classification

13 بخش سوم: سیستم طبقه بندی چندگانه (MCS) (Multiple Classifier Systems)
چند طبقه بندی که به صورت جداگانه آموزش داده می شوند ترکیب می شوند و برای تصمیم گیری نهایی به صورت گروهی جمع می شوند اصل موفقیت MCS: داشتن بازده بالا در طبقه بندی های ابتدایی

14 بخش سوم: سیستم طبقه بندی چندگانه (MCS) (Multiple Classifier Systems)
ساخت سیستم های طبقه بندی چندگانه

15 بخش سوم: سیستم طبقه بندی چندگانه (MCS) (Multiple Classifier Systems)
سیستم های طبقه بندی چندگانه در ارزیابی ریسک اعتبار مالی بسیاری از محققان شواهدی بدست آورده اند که نشان می دهد استفاده از MCS ها برای ا.ر.ا.م نتیجه ای مطلوب تر از سیستم های طبقه بندی ساده ارائه می دهند در مقابل لیستی از طبقه بندی های چندگانه سیستم های هیبرید است که نشان دادند می توانند از نتایج نامساعد جلوگیری کنند و نتایج بهتری ارائه دهند - چند classifier را ترکیب کرده اند و یک MCS ساخته اند

16 بخش چهارم: ارزیابی ریسک اعتبار مالی حساس به هزینه و نامتعادل
بخش چهارم: ارزیابی ریسک اعتبار مالی حساس به هزینه و نامتعادل در دنیای واقعی مشکل پیش بینی شکست مالی معمولا با حساسیت هزینه و کلاس-نامتعادل مشخص می شود حساسیت هزینه نشان می دهد که طبقه اشتباه هزینه غیر یکنواخت است یا به عبارت دیگر هزینه طبقه بندی اشتباه یک شرکت با اعتبار خوب بیش از هزینه طبقه بندی خوب یک اعتبار بد است کلاس نامتعادل بیان می کند که توزیع کلاس ها در دنیای واقعی بسیار نامتقارن است راه مناسب برای ساخت الگوریتم حساس به هزینه که عمدتا نامتعادل هستند، آموزش داده ها با روش های resampling است

17 بخش چهارم: ارزیابی ریسک اعتبار مالی حساس به هزینه و نامتعادل
4.1) Cost Representation دسته های هزینه طبقه بندی اشتباه: هزینه زمان، هزینه ویژگی و هزینه تست و هزینه وابسته به نمونه خاص Cp>Cn Cp: هزینه طبقه بندی اشتباه یک نمونه خوب به عنوان یک نمونه بد (در حال ورشکستگی) Cn: هزینه طبقه بندی اشتباه یک نمونه بد به عنوان یک نمونه خوب

18 بخش چهارم: ارزیابی ریسک اعتبار مالی حساس به هزینه و نامتعادل
4.2) روش های یادگیری حساس به هزینه تلاش های زیادی برای ارائه الگوریتم طبقه بندی حساس به هزینه با قابلیت یادگیری شده است از جمله: Resampling ,instance-weighting ,instance-relabeling 4.3) طبقه بندی اطلاعات مالی نامتقارن الگوریتم های طبقه بندی استاندارد نتایج رضایت بخشی به دلیل این که می خواهند قوانین کلی برای کلاس خاص پیدا کنند، روی داده های نامتقارن ندارند . حوزه طبقه بندی داده های نامتعادل توجه ویژه ای به datamining دارد . در کل راه حل های طبقه بندی داده های نامتعادل در دو گروه تقسیم می شوند: 1- data-level methods algorithm methods 1: شامل تنوع دادن به نمونه ها (برای متعادل کردن توزیع کلاس) 2: با هدف قوی تر کردن قدرت یادگیری الگوریتم های موجود با استفاده از inductive bias

19 بخش پنجم: کاهش ابعاد و یادگیری زیرمجموعه
معمولا پایگاه داده های مالی تعداد قابل توجهی متغیر، بعضا تا 50 متغیر دارند 5.1) روش های خطی تکنیک های یادگیری زیرفضای خطی عبارتند از: تجزیه و تحلیل مولفه های اصلی (PCA)، تجزیه تک ارزش (SVD) و ... محدودیت: داده ها باید در زیرمجموعه خطی یا در نزدیکی آن قرار داشته باشند 5.2) روش های غیر خطی - برای داده های مالی که ساختارهای غیرخطی پیچیده دارند مناسبترند - خطای عمومی سازی طبقه بندی را کاهش می دهد . از روش های ISOMAP و Locally Linear Embedding برای کاهش ابعاد استفاده نمود.

20 بخش ششم: اعتبارسنجی کارایی ارزیابی ریسک اعتباری
6.1) اعتبارسنجی in-sample و out-sample برای ارزیابی عملکرد مدل های پیش بینی استفاده می شوند در اکثر مطالعات از in-sample استفاده می شود In-sample مدل را روی نمونه همان مسئله، آزمایش می کند Out-sample مدل را روی نمونه های مشابه آزمایش می کند که حساسیت کمتری دارد و قابل اعتمادتر است از in-sample برای بهینه سازی پارامترها استفاده می کنند از out-sample برای محاسبه بازده استفاده می شود برای پیش بینی ورشکستگی از out-sample استفاده می شود

21 بخش ششم: اعتبارسنجی کارایی ارزیابی ریسک اعتباری
6.2) معیارهای کارایی معمولا نتیجه ا.ر.ا.م باینری است.خوب یا بد، ورشکسته یا سالم نتیجه طبقه بندی می تواند به شکل یک ماتریس احتمالی نشان داده شود fn: خطای طبقه بندی شرکت های بد به عنوان شرکت خوب fp: خطای طبقه بندی شرکت های خوب به عنوان شرکت بد tp: پیش بینی درست نمونه های مثبت tn: پیش بینی درست نمونه های منفی

22 معیارهای عملکرد مدل پیش بینی ورشکستکی (دقت و نرخ مثبت واقعی و نرخ منفی واقعی و ...)

23 بخش ششم: اعتبارسنجی کارایی ارزیابی ریسک اعتباری
6.3) مقایسه و تفسیر کارایی طبقه بندی مورد کمتر مطالعه شده در حوزه ا.ر.ا.م، اعتبار سنجی بازده classifier هاست بیشتر مقایسه ها تاکنون از یک یا تعداد بسیار کمی معیار استفاده می کردند ولی تحقیقات نشان می دهد که استفاده از معیار بیش تر نتیجه را بسیار بهبود می دهد آزمون های آماری یک جزء مهم برای انداه گیری بازده اعتبارسنجی دسته بندی های چندگانه است آزمون آماری معولا در دو بخش پارامتری و غیر پارامتری صورت می گیرد از این آزمون برای نشان دادن برتری یک classifier بر دیگری استفاده می شود

24 بخش ششم: اعتبارسنجی کارایی ارزیابی ریسک اعتباری
در آزمون های پارامتریک داده های باید مستقل و نرمال باشند یکی از پرکاربردترین آزمون های پارامتری آزمون تی است نمونه هایی از آزمون های غیر پرامتری: . آزمون فریدمن . آزمون wilcoxon signed-rank test

25 نتیجه گیری و Future Remarks
در مطالعاتی که تاکنون صورت گرفته بیشتر از دسته بندی های باینری که توزیع خروجی باینری دارند استفاده شده است پیشنهاد می شود از دسته بندی هایی با توزیع خروجی گوسی استفاده شود بیشتر از نسبت های مالی برای ساخت مدل های پیش بینی استفاده می شود و اطلاعات اقتصاد کلان در نظر گرفته نمی شود در حالی اقتصاد کلان تاثیر بسیار زیادی بر عملکرد شرکت ها دارد بایستی تحقیقات بیشتری برای انتخاب معیارهای مناسب صورت گیرد به جای استفاده از مدل های استاتیک که روی صورت های مالی کار می کنند، از تکنیک های تشخیص الگو برای تشخیص و پیش بینی ورشکستگی براساس روند مالی شرکت ها استفاده کرد


Download ppt "ارائه درس هوش مصنوعی پیشرفته"

Similar presentations


Ads by Google