داده کاوی: مفاهيم، روشها، کاربردها

Slides:



Advertisements
Similar presentations
Stranded Costs مقدمه 1 - آشنايی با پديده های غيرخطی ( ياد آوری و تکميل ) 2 - مبانی رياضی ( مهم )
Advertisements

طراحي و ساخت سيستم‌هاي تجارت الکترونيک چارچوب و الگوي سازمان‌هاي تجاري.
1 آزمايشگاه سيستم های هوشمند ( Domain-specific Architecture.
Computer Programming برنامه سازی کامپيوتر1 مدل های رياضی مهندسی يعنی کاربرد علوم مختلف (رياضی، فيزيک) در حل مسائل کاربردی مدل های رياضی برای پيش بينی رفتار.
فاکتورهای مهم در ایجاد یک مقاله علمی
طراحي و ساخت سيستم ‌ هاي تجارت الکترونيک چارچوب و الگوي سازمان ‌ هاي تجاري.
برنامه‌ريزي استراتژيک پيشرفته مدل و فرآيند کلان برنامه‌ريزي راهبردي سيستم های تجارت الکترونيک.
طبقه بندی تعاریف سیستم های تصمیم یار
1 بسم الله الرحمن الرحیم. 2 پژوهش های آموزشی فرآیند – محور (POER) علی عمادزاده عضو هیئت علمی EDC
مهندسی نرم افزار مبتنی بر عامل
محدثه گل پرور, ملاحت ملکی استاد راهنما : مهندس برادران هاشمی.
ارائه روشي براي شناسايي کاراکترهاي دستنويس، برپايه شبکه LVQ.
Decision Tree.
بسم الحق برنامه ارزيابی خارجی کيفيت محسن نوربخش آزمايشگاه بيوشيمی بيمارستان قائم (عج) تيرماه 86.
© 2005 Prentice Hall Inc. All rights reserved. o r g a n i z a t i o n a l b e h a v i o r e l e v e n t h e d i t i o n.
تعاریف هوش تجاری مهدی گرکانی درس هوش تجاری
ارائه رويکردی جديد به مسئله طبقه بندی توزيع شده: عاملهای هوشمند
عامل و محيط. آزمایشگاه سیستمهای هوشمند 2 رئوس مطالب عاملها و محيطها مفهوم رفتار عقلانی محيطها ساختارهای مختلف برای عاملها.
برنامه‌ريزي استراتژيک مرحله تعيين اهداف راهبردي سازمان.
سيستمهاي اطلاعات مديريت ارائه كننده : محسن كاهاني.
مديريت پروژه‌هاي فناوري اطلاعات فرآيند مديريت پروژه-مرحله برنامه‌ريزي.
طراحي و ساخت سيستم‌هاي تجارت الکترونيک ساخت سيستم‌هاي تجارت الکترونيک ECSE.
نام و نام خانوادگي : فريد ملازم 1 آزمايشکاه سيستم هاي هوشمند ( موضوع ارائه Process and Deployment Design.
برنامه سازی کامپيوتری 1 نرم افزار در کامپيوتر. برنامه سازی کامپيوتری 2 نرم افزارها سخت افزار کامپيوتر بدون نرم افزار ان غير قابل استفاده است نرم افزار.
1 تدوين راهبرد برای يک برنامه جلب حمايت همه جانبه Mohsen Shams, MD. PhD Candidate in Health Education, School of Public Health, Tehran University of Medical.
شهرهاي اينترنتي و مراكز داده (Data Center) دكترمحسن كاهانيمحسن كاهاني دانشگاه فردوسي مشهد
مديريت پروژه‌هاي فناوري اطلاعات فرآيند مديريت پروژه-مرحله برنامه‌ريزي تخصيص منابع.
DSS in Actions. شرکت آتلانتیک الکتریک یک شرکت پیمانکاری سرویس دهی کامل الکتریکی برای کارهای صنعتی و تجاری است که در سال 1969 در چارلزتن تاسیس شد. یک شرکت.
اصول و مفاهيم جلب حمايت همه جانبه Mohsen Shams, MD. PhD Candidate in Health Education, School of Public Health, Tehran University of Medical Sciences.
مراحل مختلف اجرای يک برنامه
فایل پردازی در C File based Programming in C. انواع فایل متنی –سرعت بالا –حجم کمتر –امکان دسترسی تصادفی –حفظ امنیت داده ها دودویی (باینری) –امکان باز.
پیدا کردن شواهد علمی. منابع بررسي متون  كتاب ها  گزارش ها  مجله هاي علمي peer reviewed  ايندكس مديكوس  داده هاي الكترونيكي  بانك هاي الكترونيكي.
1 Network Address Translation (NAT). 2 Private Network شبکه خصوصی شبکه ای است که بطور مستقیم به اینترنت متصل نیست در یک شبکه خصوصی آدرس های IP به دلخواه.
پايگاههای داده ی توزيع شده احمد کيان راد فرزاد مهديخانی.
فارسی سازی يکپارچه در سيستم عاملهای OS/390 & Windows واحد 1 مهندسی سيستم Integrated Farsi support on OS/390 & Windows.
بررسي حافظه هاي ديناميکي و
معماری فناوری اطلاعات چیست؟
تهیه و تنظیم: فاطمه قاسمی دانشگاه صنعتی شریف – پاییز 86
بسم الله الرحمن الرحیم مدیرگروه HIT: خانم لیلا غلامحسینی
مطالعات تحليلي مشاهده اي
نظریه رفتار برنامه ريزي شده Theory of Planned Behavior
تمرین هفتم بسم الله الرحمن الرحیم درس یادگیری ماشین محمدعلی کیوان راد
دانشگاه صنعتي اميرکبير
دانلود جدیدترین مقالات برق الکترونیک و کامپیوتر
سید احمد طباطبائی علی مستوفی نژاد دیماه 88.
استانداردهای تصاویر دیجیتال پزشکی با فرمت دایکام DICOM در سیستم PACS
تکنیک دیماتل DEMATEL: decision making trial and evaluation laboratory.
داده کاوی: مفاهيم، روشها، کاربردها، آينده
SSO Single Sign-on Systems
تبدیل فوریه (Fourier Transform)
MADM Techniques(2) TOPSIS
زمینه فعالیت شرکت/ هسته:
Data Mining By : Alireza Abazari.
عنوان دانشجو: نام دانشجو رشته تحصیلی: رشته تحصیلی، گرایش
مقدمه اي بر داده کاوي و اکتشاف دانش
آشنایی با پایگاه ساینس دایرکت
ASP.NET فرناز شریعت.
1.
نظریه رفتار برنامه ريزي شده Theory of Planned Behavior
وبلاگ جامع مهندسی برق و الکترونیک
تدريس يار: ميثم نظرياني
به نام خدا اين فايل راهنما جهت آشنايی کاربران گرامی با پايگاه اطلاعاتی Sciencedirect و نحوه جستجوی اطلاعات در آن تهيه شده است لطفاً اسلايدهای بعد را مشاهده.
به نام خدا Koha برنامه.
سمینار SharePoint رانندگی در بزرگراه پرتال ها
ابزارهای جستجوی پایان نامه
کتابخانه دانشکده پرستاری و مامایی دانشگاه علوم پزشکی شهید بهشتی
فرآیند حل مسائل حمل و نقل فرآیند برنامه ریزی حمل و نقل
مقدمه ای بر مهندسی نرم افزار An Introduction to Software Engineering
AntNet :Routing in Communication Networks
عنوان پایان نامه : بهبود خوشه بندی داده های حجیم درالگوریتم PSON برای کاوش مجموعه اقلام تکراری استاد راهنما : دکتر تورج بنی رستم نگارش : اکبر خبازیان.
Presentation transcript:

داده کاوی: مفاهيم، روشها، کاربردها به نام خدا دانشگاه آزاد تهران شمال داده کاوی: مفاهيم، روشها، کاربردها

فهرست مطالب مقدمه کاربردهای داده‌کاوی تکنيکهای داده‌کاوی کاربردهای تجاری کاربردهای علمی کاربردهای امنيتی تکنيکهای داده‌کاوی دسته بندی قوانين تداعی خوشه بندی آينده داده‌کاوی: کاربردهای جديد، چالشها و دستاوردها تشخيص ناهمگونی داده‌کاوی توزيع شده داده کاوی و حريم خصوصی

داده کاوی و دلايل پيدايش آن توسعه تکنولوژيهای ذخيره و بازيابی اطلاعات افزايش اطلاعات تنوع زياد بانکهای اطلاعاتی فايلهای چندرسانه ای اطلاعات متنی و فاقد ساختار

پردازش اطلاعات: از فايلهای متنی تا داده کاوی پردازش اطلاعات: از فايلهای متنی تا داده کاوی سير کلی تکنولوژی پردازش اطلاعات را می توان به صورت زير خلاصه کرد: فايلها بانکهای اطلاعاتی خاص بانکهای اطلاعاتی رابطه ای بانکهای اطلاعاتی تحليلی داده کاوی

مراحل يک فرآيند داده کاوی هريک از مراحل، با مشکلات خاص خود مواجه است. پيرايش و تجميع اطلاعات، معمولا حجم عمده کار را به خود اختصاص می دهند. بازنمائی دانش، به خصوص در مورد داده کاوی، در موارد متعددی هيچ راه حل قابل قبولی ندارد. انتخاب اطلاعات هدف پيرايش اطلاعات تجميع اطلاعات استخراج دانش بازنمائی دانش استخراج شده تفسير نتايج

پايه های يک فرآيند داده کاوی 5 پايه اصلی مجموعه نمونه های آموزشی نوع دانش دانش پايه معيارهای ارزيابی نحوه ارائه

دانش پايه دانش فعلی کاربر در مورد نمونه های آموزشی غالبا به صورت سلسله مراتب مفهومی (Concept Hierarchy) به صورت ترتيب جزئی بين سطوح تجرد مطرح می شود مثال: کشور > استان > شهر > منطقه

خلاصه مطالب مقدمه عدم کفايت روشهای سنتی در بهره برداری از پتانسيل اطلاعات در دسترس. سير کلی روشهای پردازش اطلاعات، بر حسب نياز حوزه های متفاوت، از فايلهای ساده تا داده کاوی. تعريف داده کاوی به عنوان يک فرآيند نيمه خودکار برای استخراج دانش از انواع اطلاعات ذخيره شده. جايگاه داده کاوی در يادگيری ماشين و نياز به چارچوبهای تئوريک و فراگير. ابهام زدائی از تعريف موجود و جداکردن واقعيات از اهداف ايده آل و بلند مدت. مراحل اصلی يک فرآيند داده کاوی عبارتند از: انتخاب، پيرايش و تجميع اطلاعات، استخراج دانش، بازنمائی و تفسير دانش حاصل. پايه های اصلی يک فرآيند داده کاوی عبارتند از: اطلاعات ورودی، نوع دانش، دانش پايه، معيارهای ارزيابی دانش و روشهای بازنمائی آن.

کاربردهای داده کاوی کاربردهای تجاری کاربردهای علمی کاربردهای امنيتی

کاربردهای تجاری تقريبا در تمام سازمانها و انواع تجارتها، به دليل وجود اطلاعات، می توان داده کاوی را مورد استفاده قرار داد. پيش بينی مربوط به بازار بورس تحليل سبد خريد شناسائی طبقات و گروههای اصلی مشتريان تعيين ميزان تاثير عوامل مختلفی نظير تبليغات، تخفيف، ... بر ميزان و الگوهای فروش

کاربردهای علمی اطلاعات جمع آوری شده در حوزه های مختلف حجم بالا تنوع اطلاعات نويز شديد نياز مبرم به تکنيکهای داده کاوی

کاربردهای علمی … حوزه پزشکی: حوزه اطلاعات جغرافيائی و اقليمی

مثالی از کاربردهای داده کاوی: اطلاعات ژنتيک (1) مثالی از کاربردهای داده کاوی: اطلاعات ژنتيک (1) آرايه ای از نمونه های DNA انجام تعدادی آزمايش بر روی يک تراشه

مثالی از کاربردهای داده کاوی: اطلاعات ژنتيک (2) مثالی از کاربردهای داده کاوی: اطلاعات ژنتيک (2) معيار شباهت ژن ها: رفتار مشابه در آزمايش ها

کاربردهای علمی… حوزه کاربردی فضا و سفرهای فضائی حجم بسيار زيادی از اطلاعات نويز بسيار بالا ارزش بسيار زياد دانش قابل استخراج پردازش اطلاعات جمع آوری شده از فضا پردازش اطلاعات مربوط به سفينه های فضائی ارائه دانش مفيد برای اتخاذ تصميم نهائی جهت پرتاب يا عدم پرتاب يک سفينه به فضا

کاربردهای امنيتی سيستمهای تشخيص نفوذ مقابله با تروريسم روشهای سنتی، حجم اطلاعات بسيار عدم امکان بررسی تمام گزارشها نياز به شناسائی خودکار لزوم همکاری با متخصصان شبکه لزوم اجتناب از سيستمهای بسيار بدبين مقابله با تروريسم

کاربردهای داده کاوی: جمع بندی حوزه های اصلی شامل کاربردهای علمی، تجاری و امنيتی می باشد. در تمام حوزه ها با حجم بسيار زياد اطلاعات و خصايص متعدد مواجهيم. در تمام حوزه ها با انواع اطلاعات مفيد روبرو هستيم. کاهش شديد هزينه ها، افزايش درآمدها و نجات زندگی انسانها از دستاوردهای داده کاوی در هريک از حوزه های کاربردی آن است. کاربردهای تجاری: تشخيص صحت ادعای خسارت در بيمه، تشخيص سوء استفاده از کارتهای اعتباری، تحليل اطلاعات مشتريان يک سازمان،... کاربردهای علمی: حوزه های پزشکی، جغرافيائی و اقليمی، فضا و سفرهای فضائی کاربردهای امنيتی: مبارزه با تروريسم، مقابله با نفوذگران به شبکه های کامپيوتری

جمع بندی و نتيجه گيری داده کاوی عبارت است از فرآيند نيمه خودکار استخراج دانش از اطلاعات موجود. داده کاوی شامل مراحل انتخاب، پيرايش و تجميع اطلاعات، استخراج و بازنمائی و تفسير دانش می باشد. کاربردهای داده کاوی شامل حوزه های تجاری، امنيتی و علمی می باشد. تکنيکهای اصلی داده کاوی عبارتند از: دسته بندی، خوشه بندی و استخراج قوانين تداعی. مسائل جديد در داده کاوی عبارتند از: تشخيص ناهمگونی، داده کاوی توزيع شده و مسئله حفظ دانش محرمانه و حريم خصوصی. نياز مبرم به روشهای داده کاوی مقياس پذير نياز به توسعه داده کاوی بر روی انواع اطلاعات موجود نياز به توسعه داده کاوی به عنوان يک فرآيند استاندارد و توزيع شده

فهرست منابع J. Han, M. Kamber and Simon Fraser, Data Mining: Concepts and Techniques, Morgan Kaufman Publisher., 2001 H. Miller, and J. Han, Geographic Data Mining and Knowledge Discovery. Taylor and Francis, London, U.K., 2001. M. Steinbach, P. Tan, V. Kumar, S. Klooster, and C. Potter, Data mining for the discovery of ocean climate indices, Proceedings of th 5th Workshop on Scientific Data Mining (SDM 2002), (Arlington, VA, Apr. 13), Society of Industrial and Applied Mathematics, pp 7–16, 2002. S. J. Stolfo, W. Lee, P. K. Chan, W. Fan and E. Eskin, “Data Mining-based Intrusion Detectors: An Overview of the Columbia IDS Project”, SIGMOD Record, Vol. 30, No. 4, December 2001, pp 5-14, 2000. H. Kargupta, A. Joshi, K. Sivakumar and Y. Yesha, “Data Mining: Next Generation Challenges and Future Directions”, Prentice Hall of India, pp. 157-219, 2005. L. A.F. Park, K. Ramamohanarao, and M. Palaniswami, “Fourier Domain Scoring: A Novel Document Ranking Method”, IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING, VOL. 16, NO. 5, pp 529-539, MAY 2004 S. Schockaert, M. De Cock, C. Cornelis and E. E. Kerre “Efficient Clustering with Fuzzy Ants”, Applied Computational Intelligence, World Scientific, p. 195-200, 2004

فهرست منابع (ادامه) M. Halkidi, Y. Batistakis and M. Vazirgiannis, “On Clustering Validation Techniques”, Journal of Intelligent Systems, vol. 17:2/3, pp 107-145, 2001 S. Dˇzeroski and H. Blockeel, MultiRelational Data Mining 2004: Workshop Report, SIGKDD Explorations. Volume 6,Issue 2, pp. 140-141, 2004. C.A. Ratanamahatana and E. Keogh, Towards Parameter-Free Data Mining, KDD ’04, Seattle, Washington, USA, pp. 206-215, 2004 H. Mannila, “Theoretical Frameworks for Data Mining”, SIGKDD Explorations, January 2000. Volume 1, Issue 2 - page 30-32 R. Grossman, Data Mining Standards, Services, and Platforms 2004 (DMSSP 2004) Workshop Report,, SIGKDD Explorations. Volume 6,Issue 2 - Page 157-158, 2004. U.M. Fayyad, G.Piatetsky-Shapiro, R. Uthurusamy, Summary from the KDD-03 Panel -- Data Mining: The Next 10 Years, SIGKDD Explorations. Volume 5,Issue 2 – pp. 191-196, 2003.