1 Chương 7: Phát triển ứng dụng khai phá dữ liệu Khai phá dữ liệu (Data mining) Học kỳ 1 – 2009-2010 Khoa Khoa Học & Kỹ Thuật Máy Tính Trường Đại Học Bách.

Slides:



Advertisements
Similar presentations
GV: Nguyễn Thị Thúy Hiền PHÒNG GD&ĐT PHÚ VANG TRƯỜNG THCS PHÚ THƯỢNG.
Advertisements

Giáo viên thực hiện: Bùi Thị Hồng Diệu Trung Tâm GDTX Quảng Điền.
CHƯƠNG III: NGÂN HÀNG VÀ CÁC NGHIỆP VỤ NGÂN HÀNG.
Cài đặt Moodle Cài đặt Moodle trên môi trường Windows Cục CNTT-Bộ GD&ĐT.
By Nguyen Minh Quy - UTEHY
LOGO JOOMLA & PHP See How easy it is! Trung tâm đào tạo lập trình viên quốc tế Aprotrain -Aptech Làm web trong 10 phút Diễn giả : Đặng Tuấn Tú.
Kỹ năng Trích dẫn và Lập danh mục tài liệu tham khảo
Chào mừng quý thầy cô và các em TRƯỜNG THPT TRẦN VĂN KỶ TỔ LÝ – TIN - KTCN.
BÀI 3. ĐƯỜNG THẲNG VÀ MẶT PHẲNG SONG SONG SỞ GD&ĐT ĐIỆN BIÊN TRƯỜNG THCS-THPT TẢ SÌN THÀNG BÀI DỰ THI SOẠN GIẢNG E-LEARNING Chương II ĐƯỜNG THẲNG VÀ MẶT.
Rèn luyện nghiệp vụ sư phạm 3
Java I/O.
SO¹N GI¶NG GI¸O ¸N ĐIÖN Tö e-LEARNING
CƠ CHẾ QUẢN LÝ KINH TẾ TRƯỚC THỜI KÌ ĐỔI MỚI (1975 – 1986)
37 Lê Quốc Hưng, Quận 4, Tp. Hồ Chí Minh ​ (08) ĐỀ XUẤT POC CÁC GIẢI PHÁP GIÁM SÁT HẠ TẦNG TRÊN NỀN TẢNG CÔNG.
TỔNG QUAN VỀ NGÔN NGỮ LẬP TRÌNH C/C++
Thị trường mới ThS. Nguyễn Văn Thoan
Kính Chào Cô và Các b ạ n thân m ế n !!!!!. HÌNH THỨC CHÍNH THỂ CỦA NHÀ NƯỚC CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM VÀ MỘT SỐ NƯỚC TRÊN THẾ GIỚI. Thuyết trình.
Tổ PPGD VẬT LÝ. 1.CƠ SỞ LÝ LUẬN VÀ THỰC TIỄN CỦA DẠY HỌC THEO ĐỊNH HƯỚNG PHÁT TRIỂN NĂNG LỰC HỌC SINH 1.1. Khái niệm về năng lực * Năng lực là gì? Năng.
Chương 7: Phát triển ứng dụng khai phá dữ liệu
WEB SERVICES Nhóm trình bày: Nguyễn Văn Dũng . Nguyễn Quang Minh .
Đầu tiên chỉ là 1 giao thức đơn giản
Bảo mật - Mã hóa dữ liệu Nội dung trình bày :
CHƯƠNG 9 PHẦN MỀM POWERPOINT
BÀI 4 CÔNG NGHỆ THÔNG TIN VÀ CHUỖI CUNG ỨNG
PHÂN TÍCH THIẾT KẾ HƯỚNG ĐỐI TƯỢNG
Hướng dẫn viết đề cương nghiên cứu
LẬP TRÌNH HƯỚNG ĐỐI TƯỢNG C++
Để sử dụng SciVerse ScienceDirect hiệu quả …
Khai phá dữ liệu (Data mining)
Công nghệ phần mềm Các quy trình phần mềm.
Chương 8 KẾT NỐI VỚI SQL SERVER & ỨNG DỤNG TRÊN C#
NETNAM NETWORK MANAGEMENT
NHẬP MÔN VỀ KỸ THUẬT.
© 2007 Thomson South-Western
OBJECT-ORIENTED ANALYSIS AND DESIGN WITH UML 2.0
Hệ quản trị Cơ sở dữ liệu Giới thiệu
CÔNG NGHỆ THƯƠNG MẠI ĐIỆN TỬ
Chương 1: Khái quát về dự án đầu tư.
VNUNi® Sales & Inventory Control
Ra quyết định kinh doanh
TIẾP CẬN CÁC CHƯƠNG TRÌNH KHOA HỌC VÀ CÔNG NGHỆ HỖ TRỢ NGÀNH DƯỢC
HỆ CƠ SỞ DỮ LIỆU GV: ThS.Trịnh Thị Ngọc Linh
PLAN
Bài giảng môn Tin ứng dụng
Sự truyền ánh sáng trong tinh thể dị hướng
Môn: Lập trình Hướng đối tượng (Object Oriented Programming)
TÀI LIỆU GIẢNG DẠY IC3 GS4 SPARK
GIÁO TRÌNH ĐÀO TẠO TRƯỜNG ĐẠI HỌC SÀI GÒN
HỆ ĐIỀU HÀNH MẠNG.
DOANH NGHIỆP – SINH VIÊN VỀ VẤN ĐỀ THỰC TẬP
Công nghệ phần mềm Quản lý dự án.
CẤU TRÚC DỮ LIỆU VÀ GIẢI THUẬT
BÀI 29: LỌC DỮ LIỆU TỪ DANH SÁCH DỮ LIỆU
MÔ HÌNH NGHIÊN CỨU MARKETING
LEADERSHIP WORSHOP HUẤN LUYỆN LÃNH ĐẠO
Tổng quan về Hệ điều hành
Phương pháp Nghiên cứu khoa học (SCIENTIFIC RESEARCH METHODOLOGY)
Lớp DH05LN GIÁO VIÊN PHỤ TRÁCH ThS. NGUYỄN QUỐC BÌNH
GV: Lương Trần Hy Hiến – ĐH Sư phạm TpHCM
Please click through slides at your leisure
AUDIO DROPBOX - TUTORIALS
Thương mại điện tử Electronic Commerce (EC)
Module 2 – CSR & Corporate Strategy
Kể chuyện bằng kỹ thuật số (Digital Storytelling -DST)
Company LOGO CĂN BẢN VỀ MẠNG NGUYEN TAN THANH Xem lại bài học tại
Mục tiêu Chào mừng Cty Lê Bảo Minh 20 năm Qui chuẩn ISO 9001:2015 Nâng cao học tập KTV BIS Cuộc thi BIS Annual 2017.
DẠY HỌC DỰA TRÊN VẤN ĐỀ
Quản trị rủi ro Những vấn đề căn bản Nguyễn Hưng Quang 07/11/2015 NHẬT HOA IC&T.
TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG CƠ SỞ II TẠI TP. HỒ CHÍ MINH HỘI NGHỊ KHOA HỌC CƠ SỞ II “BÁO CÁO HOẠT ĐỘNG ĐI THỰC TẾ CỦA GIẢNG VIÊN CSII, NĂM HỌC ”
Nghiên cứuLập kế hoạch Thực thi giao tiếp Đánh giá.
Presentation transcript:

1 Chương 7: Phát triển ứng dụng khai phá dữ liệu Khai phá dữ liệu (Data mining) Học kỳ 1 – Khoa Khoa Học & Kỹ Thuật Máy Tính Trường Đại Học Bách Khoa Tp. Hồ Chí Minh

2 Nội dung  7.1. Tổng quan về vấn đề phát triển ứng dụng khai phá dữ liệu  7.2. Qui trình phát triển ứng dụng khai phá dữ liệu  7.3. Các chuẩn dành cho khai phá dữ liệu  7.4. Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu  7.5. Tóm tắt

3 Tài liệu tham khảo  [1] Jiawei Han, Micheline Kamber, “Data Mining: Concepts and Techniques”, Second Edition, Morgan Kaufmann Publishers,  [2] David Hand, Heikki Mannila, Padhraic Smyth, “Principles of Data Mining”, MIT Press,  [3] David L. Olson, Dursun Delen, “Advanced Data Mining Techniques”, Springer-Verlag,  [4] Graham J. Williams, Simeon J. Simoff, “Data Mining: Theory, Methodology, Techniques, and Applications”, Springer-Verlag,  [5] ZhaoHui Tang, Jamie MacLennan, “Data Mining with SQL Server 2005”, Wiley Publishing,  [6] Oracle, “Data Mining Concepts”, B ,  [7] Oracle, “Data Mining Application Developer’s Guide”, B , 2008.

Tổng quan về vấn đề phát triển ứng dụng khai phá dữ liệu  Vấn đề dữ liệu Lượng và chất lượng dữ liệu Kiểu dữ liệu  Vấn đề tri thức từ quá trình khai phá Biểu diễn và tích hợp vào ứng dụng  Vấn đề kỹ thuật khai phá Lựa chọn giải thuật khai phá  Vấn đề hiệu quả (effective) và hiệu suất (efficient)

Qui trình phát triển ứng dụng khai phá dữ liệu  Qui trình phát triển ứng dụng  Qui trình phát triển ứng dụng khai phá dữ liệu  T ương đồng và khác biệt

Các chuẩn dành cho khai phá dữ liệu  The Predictive Model Markup Language (PMML –  Standard application programming interfaces (APIs)  The Cross-Industry Standard Process for Data Mining (CRISP-DM – Nguồn: R. L. Grossman, M. F. Hornick, G. Meyer, Data Mining Standards Initiatives, Communications of the ACM 45 (8)

Các chuẩn dành cho khai phá dữ liệu  The Predictive Model Markup Language (PMML – Chuẩn dựa trên XML  Mô tả các mô hình thống kê và khai phá dữ liệu, các tác vụ làm sạch và biến đổi dữ liệu Các thành phần của PMML  Data dictionary  Mining schema  Transformation dictionary  Model statistics  Models

Các chuẩn dành cho khai phá dữ liệu

9

Các chuẩn dành cho khai phá dữ liệu

Các chuẩn dành cho khai phá dữ liệu  Standard application programming interfaces (APIs) SQL/MM Part 6: Data Mining The Java Specification Request-73 (JSR-73)  Jcp.org/jsr/detail/073.jsp Microsoft APIs  Microsoft.AnalysisServices.AdomdClient

Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu  Các công cụ mã nguồn mở (open-source tools)  Các công cụ thương mại

Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu  Các công cụ mã nguồn mở (open-source) R ( Tanagra (eric.univ-lyon2.fr/~ricco/tanagra/) Weka ( YALE (rapid-i.com) KNIME ( Orange ( … Nguồn: B. Zupan, J. Demsar, “Open-Source Tools for Data Mining”, Clinics in Laboratory Medicine 28(2008)

Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu

Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu

Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu

Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu

Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu

Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu

Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu  Các công cụ thương mại Hỗ trợ từ Intelligent Miner (IBM) Hỗ trợ từ Microsoft data mining tools (MS SQL Server 2000/2005/2008) Hỗ trợ từ Oracle Data Mining Hỗ trợ từ Enterprise Miner (SAS Institute) …

Tóm tắt  Xem xét sự tương đồng/khác biệt giữa qui trình phát triển ứng dụng truyền thống và ứng dụng khai phá dữ liệu  Sự cần thiết của các chuẩn (standards) dành cho khai phá dữ liệu  Sự quan tâm của các nhà sản xuất phần mềm đối với việc hỗ trợ phát triển ứng dụng khai phá dữ liệu

22 Hỏi & Đáp …