The university of Texas at Dallas

Slides:



Advertisements
Similar presentations
THIÊN ĐƯỜNG HOA TÌNH YÊU TẠI XỨ NHẬT
Advertisements

GV: Nguyễn Thị Thúy Hiền PHÒNG GD&ĐT PHÚ VANG TRƯỜNG THCS PHÚ THƯỢNG.
AI CŨNG PHẢI HỌC LÀM NGƯỜI
Giáo viên thực hiện: Bùi Thị Hồng Diệu Trung Tâm GDTX Quảng Điền.
CHƯƠNG III: NGÂN HÀNG VÀ CÁC NGHIỆP VỤ NGÂN HÀNG.
LOGO JOOMLA & PHP See How easy it is! Trung tâm đào tạo lập trình viên quốc tế Aprotrain -Aptech Làm web trong 10 phút Diễn giả : Đặng Tuấn Tú.
Cách trộn thư trong Office 2003 Ứng dụng để làm giấy khen, giấy mời.
Anh gặp nàng trong một bữa tiệc. Nàng vô cùng xinh xắn và dễ thương... Biết bao chàng trai vây quanh nàng trong khi anh chỉ là một gã bình thường chẳng.
BÀI 3. ĐƯỜNG THẲNG VÀ MẶT PHẲNG SONG SONG SỞ GD&ĐT ĐIỆN BIÊN TRƯỜNG THCS-THPT TẢ SÌN THÀNG BÀI DỰ THI SOẠN GIẢNG E-LEARNING Chương II ĐƯỜNG THẲNG VÀ MẶT.
Rèn luyện nghiệp vụ sư phạm 3
Trường THPT Long Châu Sa
Orientation Các vấn đề về IT.
BIỆN PHÁP TRÁNH THAI TỰ NHIÊN ĐỐI TƯỢNG: CĐ HỘ SINH THỜI GIAN: 4 TIẾT.
CHƯƠNG 5. CẤU TẠO ĐƯỜNG KIẾN TẠO. Nội dung chính KHÁI NIỆM CHUNG CÁC DẠNG CẤU TẠO ĐƯỜNG KIẾN TẠO CÁCH ĐO ĐẠC VÀ THU THẬP CÁC SỐ LIỆU CẤU TẠO ĐƯỜNG.
1 BÀI 6 BẤM CÁP VÀ CHIA SẺ DỮ LIỆU MẠNG. 2 Nội Dung  Bấm cáp xoắn đôi đúng chuẩn Phương pháp bấm cáp chuẩn A Phương pháp bấm cáp chuẩn B  Kết nối máy.
TỔNG QUAN VỀ NGÔN NGỮ LẬP TRÌNH C/C++
Thị trường mới ThS. Nguyễn Văn Thoan
Kính Chào Cô và Các b ạ n thân m ế n !!!!!. HÌNH THỨC CHÍNH THỂ CỦA NHÀ NƯỚC CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM VÀ MỘT SỐ NƯỚC TRÊN THẾ GIỚI. Thuyết trình.
Ngôn ngữ lập trình C/C++
SỬ DỤNG EXCEL ĐỂ TRÍCH KHẤU HAO TSCĐ
Hướng dẫn viết đề cương nghiên cứu
LẬP TRÌNH HƯỚNG ĐỐI TƯỢNG C++
LÝ THUYẾT HỌC THỐNG KÊ (statistical learning theory)
MÔ HÌNH HỒI QUY HAI BIẾN Thế nào là hồi quy? Thế nào là tuyến tính?
Hồi quy PLS Hervé Abdi Đại học Texas, Dallas
Công nghệ phần mềm Các quy trình phần mềm.
Vấn đề ngôn ngữ lập trình
© 2007 Thomson South-Western
Phân tích mô tả biến liên tục
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN KHOA VẬT LÝ
Hệ quản trị Cơ sở dữ liệu Giới thiệu
Dược Thảo Lợi Hại Ra Sao Kính thưa quí bạn, slide show nầy nói về những điều cần lưu ý khi tìm đọc các thông tin về các loại thuốc phụ trợ hoặc bổ sung,
Chương 1: Khái quát về dự án đầu tư.
Ra quyết định kinh doanh
SỞ GIÁO DỤC VÀ ĐÀO TẠO ĐIỆN BIÊN Trường THCS – THPT Tả Sìn Thàng
Policy Analysis Tools of the Trade NMDUC 2009.
Cấu hình đơn giản cho Router
Bài giảng môn Tin ứng dụng
Ring ? Bus ? ? Mesh ? Start ?. Ring ? Bus ? ? Mesh ? Start ?
Môn: Lập trình Hướng đối tượng (Object Oriented Programming)
Chương 6 Các chiến lược tiếp thị
KỸ THUẬT CHỤP CT ĐỘNG MẠCH CHI DƯỚI
TÀI LIỆU GIẢNG DẠY IC3 GS4 SPARK
Bài 8 (6 tiết): CÂY (TREE) A. CÂY VÀ CÂY NHỊ PHÂN (2 tiết)
HỆ ĐIỀU HÀNH MẠNG.
ỨNG DỤNG HIV INFO 3.0 QUẢN LÝ SỐ LIỆU NGƯỜI NHIỄM HIV/AIDS
GVHD: TS Lê Vũ Tuấn Hùng HV: Trịnh Thị Quỳnh Như
HỘI NGHỊ KHOA HỌC GÂY MÊ HỒI SỨC TOÀN QUỐC 2016
CẤU TRÚC DỮ LIỆU VÀ GIẢI THUẬT
BÀI 29: LỌC DỮ LIỆU TỪ DANH SÁCH DỮ LIỆU
CHƯƠNG 6 CÁC NGUYÊN TỐ DINH DƯỠNG VÀ PHÂN BÓN TRUNG LƯỢNG BÀI 1: CÁC NGUYÊN TỐ DINH DƯỠNG VÀ PHÂN BÓN TRUNG LƯỢNG.
KHAI THÁC THỦY SẢN ĐẠI CƯƠNG
KHOA CÔNG NGHỆ ĐIỆN TỬ VÀ TRUYỀN THÔNG Bộ môn Công nghệ Truyền thông
1. Đổi chỗ trực tiếp – Interchange Sort
CÁC LOẠI MÁY ĐẬP NGHIỀN Chương 2: Các loại máy đập nhỏ
CÁC PHƯƠNG PHÁP XÁC ĐỊNH CHI PHÍ (phần B)
Tổng quan về Hệ điều hành
Phương pháp Nghiên cứu khoa học (SCIENTIFIC RESEARCH METHODOLOGY)
BẢO QUẢN VÀ CHẾ BIẾN TRÀ, CÀ PHÊ, CA CAO
Lớp DH05LN GIÁO VIÊN PHỤ TRÁCH ThS. NGUYỄN QUỐC BÌNH
KỸ NĂNG LUYỆN TRÍ NHỚ ThS. Huỳnh Phạm Ngọc Lâm.
Chương 3. Lập trình trong SQL Server TRIGGER
2D Transformations Các phép biến đổi 2D
Flash profile và MFA Dominique Valentin ENSBANA/CESG Đại học Bourgogne
Module 2 – CSR & Corporate Strategy
SỞ GIÁO DỤC VÀ ĐÀO TẠO ĐIỆN BIÊN TRƯỜNG THPT MÙN CHUNG
Company LOGO CĂN BẢN VỀ MẠNG NGUYEN TAN THANH Xem lại bài học tại
Quản trị rủi ro Những vấn đề căn bản Nguyễn Hưng Quang 07/11/2015 NHẬT HOA IC&T.
TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG CƠ SỞ II TẠI TP. HỒ CHÍ MINH HỘI NGHỊ KHOA HỌC CƠ SỞ II “BÁO CÁO HOẠT ĐỘNG ĐI THỰC TẾ CỦA GIẢNG VIÊN CSII, NĂM HỌC ”
NGHI TH Ứ C XÃ H Ộ I VI Ệ N TH Ẩ M M Ỹ 198 LÀO CAI.
Presentation transcript:

The university of Texas at Dallas Phân tích mô tả và PCA Dominique Valentin ENSBANA/CESG valentin@u-bourgogne.fr Hervé Abdi The university of Texas at Dallas herve@utdallas.edu

Xét lại ví dụ về sữa chua Cấu trúc Độ đặc: consistency of the mass in the mouth Tỷ lệ tan chảy: lượng sản phẩm bị tan chảy dưới một sức ép cụ thể của lưỡi Độ hạt: lượng mảnh nhỏ có trong khối sản phẩm Độ dính vòm miệng: lượng màng mỏng còn sót lại trên bề mặt vòm miệng Các vị cơ bản: Ngọt: đường mía Chua: acid lactic Đắng: caffeine Mặn: NaCl (muối ăn) Hương vị: Nước: vị giống nước lọc Bột: 1 muỗng hương liệu pha trong nước Gỗ: mùi gỗ gọt bút chì Phấn: smecta Sữa: sữa nguyên kem Vỏ bột bánh: vỏ bột bánh thương mại Kem: kem tươi Hazelnut: bột hazelnut Đất: đất Nấm: nấm khô ngâm trong nước

Xét lại ví dụ về sữa chua 9 cảm quan viên 5 loại sữa chua: 3 sữa chua đậu nành 2 sữa chua lên men từ sữa bò Đắng Hoàn toàn không Rất mạnh Mặn Hoàn toàn không Rất mạnh Chát Hoàn toàn không Rất mạnh

Xét lại ví dụ về sữa chua Cấu trúc Bột Đặc bc a ab d ab ab a b b Béo b 0,00 2,00 4,00 6,00 8,00 10,00 soja carrefour sojasun sojade velouté danone leaderprice Intensité moyenne Đặc 0,00 2,00 4,00 6,00 8,00 10,00 soja carrefour sojasun sojade velouté danone leaderprice Intensité moyenne bc a ab d ab ab a b b Béo 0,00 2,00 4,00 6,00 8,00 10,00 soja carrefour sojasun sojade velouté danone leaderprice Intensité moyenne b ab a Tan chảy 0,00 2,00 4,00 6,00 8,00 10,00 soja carrefour sojasun sojade velouté danone leaderprice Intensité moyenne abc c ab

Xét lại ví dụ về sữa chua Vị Ngọt Chua Đắng Chát cd bc a ab ab ab ab 0,00 2,00 4,00 6,00 8,00 10,00 soja carrefour sojasun sojade velouté danone leaderprice Intensité moyenne Chua 0,00 2,00 4,00 6,00 8,00 10,00 soja carrefour sojasun sojade velouté danone leaderprice Intensité moyenne cd bc a ab ab ab ab ab Đắng 0,00 2,00 4,00 6,00 8,00 10,00 soja carrefour sojasun sojade velouté danone leaderprice Intensité moyenne Chát 10,00 a 8,00 a abc abc abc a a a 6,00 c a Intensité moyenne 4,00 2,00 0,00 soja sojasun sojade velouté leaderprice carrefour danone

Xét lại ví dụ về sữa chua Mùi Bột Phấn Hazelnut Kem abc a abc c b b d 10,00 10,00 abc a 8,00 abc 8,00 c 6,00 6,00 b b Intensité moyenne 4,00 d d Intensité moyenne 4,00 b b 2,00 2,00 0,00 0,00 soja sojasun sojade velouté leaderprice soja sojasun sojade velouté leaderprice carrefour danone carrefour danone Hazelnut Kem 10,00 10,00 a 8,00 8,00 6,00 a 6,00 c Intensité moyenne ab ab c c 4,00 ab b Intensité moyenne 4,00 c 2,00 2,00 0,00 0,00 soja sojasun sojade velouté leaderprice soja sojasun sojade velouté leaderprice carrefour danone carrefour danone

Giải pháp: Phân tích thành phần chính -4.5 -3.0 -1.5 1.5 3.0 -2 -1 1 2 Facteur 1 - 61.04 % Facteur 2 - 17.84 % soja bio soja champion Soja leaderprice Soja carrefour Soja bifidus Soja sun sojade Soja délice carrefour velouté danone danone bifidus Leader price

Phân tích thành phần chính (PCA) là gì? Một kỹ thuật thống kê được dùng để chuyển một lượng lớn các biến số tương quan nhau thành một lượng nhỏ hơn các biến số không tương quan gọi là các thành phần chính. Thành phần chính thứ nhất biểu diễn mức độ biến thiên nhiều nhất trong các số liệu, và mỗi thành phần tiếp theo biểu diễn càng nhiều mức độ biến thiên còn lại càng tốt. Kỹ thuật toán học được sử dụng trong PCA được gọi là phân tích giá trị riêng.

Sử dụng PCA khi nào ? Để phân tích các bảng số liệu hai chiều gồm có I quan sát và J biến định lượng Biến số 1 … j … J 1 . i I yij …... ……... Quan sát

Vì sao sử dụng PCA ? Đưa ra một mô tả tổng hợp cho các sản phẩm Để đánh giá sự giống nhau giữa các quan sát, ở đây là các sản phẩm Để đánh giá cấu trúc trong mối quan hệ giữa các biến số, ở đây là các thuộc tính mô tả descriptors Để giảm bớt số lượng các biến số, từ đó có thể biểu diễn các số liệu bằng đồ họa Đưa ra một mô tả tổng hợp cho các sản phẩm

Nguyên tắc chung của PCA Biến số Các thành phần chính 1 … j … J PC1 .. PCk .. PCK 1 . i I 1 . i I Phân tích đường chéo Hoặc phân tích riêng ……... ……... Quan sát …... yij …... Cpik Vòng tròn tương quan Hình chiếu của các quan sát PC2 PC2 + + PC1 Cp1 +

Một ví dụ nhỏ: profile rượu vang Amber Black currant Coconut Leather Musc Goose berry Woody Vanilla Rasberry v1 7.000 3.000 1.000 6.000 9.000 0.000 2.000 v2 5.000 v3 v4 4.000 v5 8.000 v6 v7 v8 v9 v10 v11 v12

Một ví dụ nhỏ: profile rượu vang coconut vanilla woody goose berry rasberry leather black currant amber

Một ví dụ nhỏ: profile rượu vang

Làm thế nào để tìm các thành phần chính? Bước 1: lấy vài số liệu Bước 2: lấy hiệu các giá trị trung bình các biến số Bước 3: tìm các vectơ riêng và các giá trị riêng của ma trận đồng phương sai Bước 4: tìm các thành phần chính bằng cách chiếu các quan sát lên các vectơ riêng Bước 5: tính toán các tải (loading) chẳng hạn như sự tương quan giữa các biến số gốc và các thành phần chính

Ví dụ 2D: bước 1 lấy số liệu 20 từ : Biến 1 = số chữ cái Biến 2 = số dòng dùng để định nghĩa từ trong từ điển

Ví dụ 2D: bước 1 lấy số liệu Số chữ cái của từ Số dòng của định nghĩa

Ví dụ 2D: bước 2 Lấy hiệu trung bình Y = “Chiều dài của từ ” MY = 6 y = (Y −MY) W = “Số dòng của định nghĩa” MW = 8 w = (W −MW)

Ví dụ 2D: bước 2 Lấy hiệu trung bình

Ví dụ 2D: bước 3 tìm các vectơ riêng

Ví dụ 2D: bước 3 tìm các vectơ riêng

Ví dụ 2D: chiếu các quan sát

Ví dụ 2D: chiếu các quan sát

Hệ số tương quan Pearson Ví dụ 2D: tính toán các tải (loadings) Hệ số tương quan Pearson r (W, F1) = 0.97

Hệ số tương quan Pearson Ví dụ 2D: tính toán các tải (loadings) Hệ số tương quan Pearson r (W, F2) = 0.23

Hệ số tương quan Pearson Ví dụ 2D: tính toán các tải (loadings) Hệ số tương quan Pearson r (Y, F1) = -0.87

Hệ số tương quan Pearson Ví dụ 2D: tính toán các tải (loadings) Hệ số tương quan Pearson r (Y, F2) = 0.50

Ví dụ 2D : vẽ vòng tròn tương quan r (W, F1) = 0.97 r (W, F2) = 0.23 Độ dài (số lượng chữ cái) Số lượng dòng của định nghĩa r (Y, F1) = -0.87 r (Y, F2) = 0.50

Làm thế nào để tính phương sai explained variance ? Giá trị riêng % phương sai % phương sai tích luỹ 392 88 88 52 12 100 444 392 444 X 100 = 88%

Giữ lại bao nhiêu thành phần Chuẩn Kaiser. chỉ giữ lại thành phần có giá trị riêng lớn hơn 1 The scree test. Thông thường. giữ lại những chiều mà có thể phân tích giải thích được 0,5 1 1,5 2 2,5 3 3,5 4 5 6 7 8 Khảo sát một vài giải pháp và chọn giải pháp “hợp lý nhất”

Tôi có nên chuẩn hoá số liệu ? Có, nếu số liệu không được đo trên cùng một thang Nếu không thì nó phụ thuộc vào: Chuẩn hoá: cùng trọng lượng cho toàn bộ biến số Không chuẩn hoá: trọng lượng tỷ lệ theo độ lệch chuẩn