Hồi quy PLS Hervé Abdi Đại học Texas, Dallas herve@utdallas.edu.

Slides:



Advertisements
Similar presentations
THIÊN ĐƯỜNG HOA TÌNH YÊU TẠI XỨ NHẬT
Advertisements

GV: Nguyễn Thị Thúy Hiền PHÒNG GD&ĐT PHÚ VANG TRƯỜNG THCS PHÚ THƯỢNG.
GIÁO ÁN PHÒNG GIÁO DỤC VÀ ĐÀO TẠO HUYỆN PHÚ VANG SINH HỌC LỚP 7
AI CŨNG PHẢI HỌC LÀM NGƯỜI
Giáo viên thực hiện: Bùi Thị Hồng Diệu Trung Tâm GDTX Quảng Điền.
Giáo viên d ¹y : Tr­êng THPT V¨n Quan NhiÖt liÖt chµo mõng c¸c thÇy, c« gi¸o vÒ th¨m líp dù giê v ỚI LỚP 12A4 h×nh 12.
CHƯƠNG III: NGÂN HÀNG VÀ CÁC NGHIỆP VỤ NGÂN HÀNG.
PLS Regression Hervé Abdi The university of Texas at Dallas
Kỹ năng Trích dẫn và Lập danh mục tài liệu tham khảo
BÀI 3. ĐƯỜNG THẲNG VÀ MẶT PHẲNG SONG SONG SỞ GD&ĐT ĐIỆN BIÊN TRƯỜNG THCS-THPT TẢ SÌN THÀNG BÀI DỰ THI SOẠN GIẢNG E-LEARNING Chương II ĐƯỜNG THẲNG VÀ MẶT.
Rèn luyện nghiệp vụ sư phạm 3
Giáo viên: Nguyễn Ngọc Thúy Hằng Đơn vị: Trường THPT Lê Quý Đôn
BIỆN PHÁP TRÁNH THAI TỰ NHIÊN ĐỐI TƯỢNG: CĐ HỘ SINH THỜI GIAN: 4 TIẾT.
LOGO QUẢN LÝ LƯU LƯỢNG VÀ ĐIỀU KHIỂN TẮC NGHẼN 1 Giảng viên hướng dẫn: TS Lê Trung Quân Nhóm thực hiện: Trần Thị Mỹ Thú - CH
TRAO ĐỔI KINH NGHIỆM PHƯƠNG PHÁP ÔN LUYỆN & KỸ NĂNG THI TOEIC
CHƯƠNG 3: ĐẠO HÀM VÀ VI PHÂN. Đạo hàm Bài toán mở đầu 1: Xét đường cong y=f(x). t P Q Một điểm P cố định trên đường cong và cát tuyến PQ. Cho điểm Q chạy.
TỔNG QUAN VỀ NGÔN NGỮ LẬP TRÌNH C/C++
Thị trường mới ThS. Nguyễn Văn Thoan
The university of Texas at Dallas
Kính Chào Cô và Các b ạ n thân m ế n !!!!!. HÌNH THỨC CHÍNH THỂ CỦA NHÀ NƯỚC CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM VÀ MỘT SỐ NƯỚC TRÊN THẾ GIỚI. Thuyết trình.
Internet & E-Commerce
SỬ DỤNG EXCEL ĐỂ TRÍCH KHẤU HAO TSCĐ
Bảo mật - Mã hóa dữ liệu Nội dung trình bày :
CHƯƠNG 9 PHẦN MỀM POWERPOINT
Hướng dẫn viết đề cương nghiên cứu
LẬP TRÌNH HƯỚNG ĐỐI TƯỢNG C++
MÔ HÌNH HỒI QUY HAI BIẾN Thế nào là hồi quy? Thế nào là tuyến tính?
Công nghệ phần mềm Các quy trình phần mềm.
Chương 4: Thị trường tài chính
DOM & SAX XML & ADO.NET GVTH: Phạm Anh Phương
NHẬP MÔN VỀ KỸ THUẬT.
© 2007 Thomson South-Western
Phân tích mô tả biến liên tục
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN KHOA VẬT LÝ
Hệ quản trị Cơ sở dữ liệu Giới thiệu
Dược Thảo Lợi Hại Ra Sao Kính thưa quí bạn, slide show nầy nói về những điều cần lưu ý khi tìm đọc các thông tin về các loại thuốc phụ trợ hoặc bổ sung,
Sự tự tụ tiêu Phạm Văn Tiến Lê Minh Tiến Từ Khánh Long
Chương 1: Khái quát về dự án đầu tư.
Ra quyết định kinh doanh
Policy Analysis Tools of the Trade NMDUC 2009.
Quản lý hệ thống file.
Chương 7 Analyzing Consumer Markets and Buyer Behavior Tìm hiểu người tiêu dùng và Phân tích hành vi của người mua.
Con trỏ Bài 8.
Cấu hình đơn giản cho Router
Bài giảng môn Tin ứng dụng
Ring ? Bus ? ? Mesh ? Start ?. Ring ? Bus ? ? Mesh ? Start ?
Môn: Lập trình Hướng đối tượng (Object Oriented Programming)
KỸ THUẬT CHỤP CT ĐỘNG MẠCH CHI DƯỚI
TÀI LIỆU GIẢNG DẠY IC3 GS4 SPARK
Bài 8 (6 tiết): CÂY (TREE) A. CÂY VÀ CÂY NHỊ PHÂN (2 tiết)
HỆ ĐIỀU HÀNH MẠNG.
HỘI NGHỊ KHOA HỌC GÂY MÊ HỒI SỨC TOÀN QUỐC 2016
CẤU TRÚC DỮ LIỆU VÀ GIẢI THUẬT
BÀI 29: LỌC DỮ LIỆU TỪ DANH SÁCH DỮ LIỆU
CHƯƠNG 6 CÁC NGUYÊN TỐ DINH DƯỠNG VÀ PHÂN BÓN TRUNG LƯỢNG BÀI 1: CÁC NGUYÊN TỐ DINH DƯỠNG VÀ PHÂN BÓN TRUNG LƯỢNG.
Chương 4 - CÁC MÔ ĐUN ĐiỀU KHIỂN TRONG HỆ THỐNG CƠ ĐiỆN TỬ
Chương 4 Analyzing Consumer Markets and Buyer Behavior Tìm hiểu người tiêu dùng và Phân tích hành vi của người mua.
Chương 5. GIỚI THIỆU ĐỒ HỌA BA CHIỀU
BẢO QUẢN VÀ CHẾ BIẾN TRÀ, CÀ PHÊ, CA CAO
Lớp DH05LN GIÁO VIÊN PHỤ TRÁCH ThS. NGUYỄN QUỐC BÌNH
KỸ NĂNG LUYỆN TRÍ NHỚ ThS. Huỳnh Phạm Ngọc Lâm.
AUDIO DROPBOX - TUTORIALS
2D Transformations Các phép biến đổi 2D
Flash profile và MFA Dominique Valentin ENSBANA/CESG Đại học Bourgogne
Module 2 – CSR & Corporate Strategy
SỞ GIÁO DỤC VÀ ĐÀO TẠO ĐIỆN BIÊN TRƯỜNG THPT MÙN CHUNG
Company LOGO CĂN BẢN VỀ MẠNG NGUYEN TAN THANH Xem lại bài học tại
Quản trị rủi ro Những vấn đề căn bản Nguyễn Hưng Quang 07/11/2015 NHẬT HOA IC&T.
TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG CƠ SỞ II TẠI TP. HỒ CHÍ MINH HỘI NGHỊ KHOA HỌC CƠ SỞ II “BÁO CÁO HOẠT ĐỘNG ĐI THỰC TẾ CỦA GIẢNG VIÊN CSII, NĂM HỌC ”
Nghiên cứuLập kế hoạch Thực thi giao tiếp Đánh giá.
Presentation transcript:

Hồi quy PLS Hervé Abdi Đại học Texas, Dallas herve@utdallas.edu

Ví dụ: Cảm giác trong miệng (Mouthfeel) là gì? Theo Folkenberg D.M., Bredie W.L.P., Martend M., (1999). Cảm giác trong miệng (mouthfeel): mối quan hệ cảm quan –lưu biến trong thức uống ca cao nóng. Journal of Sensory Studies, 14, 181-195. (Data set courtoisie of Marten, H., Marten M. (2001) Multivariate Analysis of Quality: An introduction. London: Wiley. Tải về từ địa chỉ sau: www.wiley.co.uk/chemometrics Bảng số liệu: Cocoa-ii.mat Mục tiêu. Dự đoán Các thuộc tính cảm quan (mouthfeel): Các biến phụ thuộc (tập Y) từ Các tính chất lý/ hoá/ lưu biến: Các biến dự báo (predictors)/ biến độc lập (tập X)

Ví dụ: Cảm giác trong miệng (Mouthfeel) là gì? 6 Biến dự báo / độc lập (tập X) Các tính chất lý/ / hoá lưu biến %COCOA %SUGAR %MILK SEDIMENT COLOUR VISCOSITY (%ca cao % đường % sữa cặn màu sắc độ nhớt) 10 Biến phụ thuộc (Tập Y) colour cocoa-odour milk-odour thick-txtr mouthfeel Màu sắc mùi ca cao mùi sữa độ đặc cảm giác trong miệng smooth-txtr creamy-txtr cocoa-taste milk-taste sweet Trơn nhẵn mịn vị ca cao vị sữa ngọt 14 Mẫu (n-:không có chất ổn định, n+: có chất ổn định) 1- 2- 3- 4- 5- 6- 7- 1+ 2+ 3+ 4+ 5+ 6+ 7+

X 20.00 30.00 50.00 2.60 44.89 1.86 20.00 43.30 36.70 2.65 42.77 1.80 20.00 50.00 30.00 2.40 41.64 1.78 26.70 30.00 43.30 3.10 42.37 2.06 26.60 36.70 36.70 3.55 41.04 1.97 33.30 36.70 30.00 4.30 39.14 2.13 40.00 30.00 30.00 4.70 38.31 2.26 20.00 30.00 50.00 0.12 44.25 48.60 20.00 43.30 36.70 0.09 41.98 44.10 20.00 50.00 30.00 0.10 41.18 43.60 26.70 30.00 43.30 0.10 41.13 47.80 26.60 36.70 36.70 0.10 40.39 50.30 33.30 36.70 30.00 0.10 38.85 51.40 40.00 30.00 30.00 0.09 37.91 54.80

Y 1.67 6.06 7.37 5.94 7.80 8.59 6.51 6.24 6.89 8.48 3.22 6.30 5.10 6.34 8.40 9.09 7.14 7.04 5.17 9.76 4.82 7.09 4.11 6.68 8.29 8.61 6.76 7.26 4.62 10.50 4.90 7.57 3.86 6.79 8.58 5.96 5.46 8.77 3.26 6.69 7.03 7.96 2.99 6.92 8.71 6.42 5.59 8.93 2.76 7.05 10.60 10.24 1.57 6.51 9.70 4.55 4.62 11.44 1.51 5.48 11.11 11.31 1.25 7.04 9.72 3.42 4.11 12.43 0.86 3.91 3.06 6.97 5.40 9.84 9.99 10.67 9.11 7.66 5.71 8.24 6.02 8.61 3.75 10.01 9.92 10.86 8.64 7.66 4.86 8.71 7.94 8.40 2.95 9.61 9.92 10.84 8.26 8.32 4.09 9.67 9.17 9.30 2.86 10.68 11.05 10.48 8.20 10.40 2.22 6.43 10.46 10.14 1.90 10.71 10.64 9.60 7.84 11.05 2.01 7.02 12.40 11.30 1.18 10.64 11.09 7.24 7.23 11.78 1.65 5.59 13.46 11.49 1.56 11.31 11.36 7.22 6.86 12.60 1.06 4.34

Vì sao sử dụng PLS , PCA và MLR Giới thiệu ngắn

J I Bảng số liệu có I hàng và J cột: PCA, CA, Biplots, v.v... Vẻ đẹp của Euclide …

I J 1 I hàng, J cột các bảng số liệu có I hàng và 1 cột (với J << I): Hồi quy đa biến (Multiple Regression ) Vẻ đẹp của Euclide

I J K I hàng và J cột  các bảng số liệu có I hàng và K cột: PLS, CANDIS, v.v… Vẻ đẹp của Euclide

Vì sao sử dụng PLS ? Để giải thích sự tương tự nhau giữa các quan sát (ở đây là các mẫu ca cao) Để phát hiện Cấu trúc trong mối quan hệ giữa các biến phụ thuộc và biến độc lập Để có thể biểu diễn các số liệu dưới dạng biểu đồ Để dự đoán giá trị của các quan sát mới

Hồi quy PLS là gì ? PLS kết hợp các điểm đặc trưng của Phân tích thành phần chính (Principal Component Analysis - PCA) và Hồi quy đa tuyến tính (Multiple Linear Regression - MLR). Giống PCA: PLS trích lấy các yếu tố (factor) từ X. Giống MLR: PLS dự đoán Y từ X Kết hợp PCA & MLR. PLS trích lấy các yếu tố từ X để dự đoán Y

Sử dụng PLS khi nào? Để phân tích hai bảng số liệu có cùng I số quan sát với J biến dự đoán và K biến phụ thuộc 1 … k … K 1 . i I yi,k ............... ……... Các biến phụ thuộc Các biến độc lập 1 … j … J 1 . i I xi,j …... ……... Số quan sát

Biến ẩn _ latent variables Nguyên tắc chung của PLS: Biến dự đoán X Biến ẩn _ latent variables 1 … j … J t1 … tℓ ... tL 1 . i I 1 . i I NIPALS ……... ……... Số quan sát …... xij …... ti,ℓ tℓ= Xwℓ ℓ= tℓ cT Dự đoán 1 … k … K 1 . i I yi,k ............... ……... Các biến phụ thuộc

PLS: Mặt phẳng các quan sát …... xij ti,ℓ t1 … tℓ ... tL ……... Biến ẩn 1 … j … J 1 . i I X 1 … k … K yi,k ............... tℓ= Xwℓ NIPALS ℓ= tℓ cT Quan sát: tℓ lv2 1 2 4 I lv1 3 i

PLS: Mặt phẳng các quan sát …... xij ti,ℓ t1 … tℓ ... tL ……... Biến ẩn 1 … j … J 1 . i I X 1 … k … K yi,k ............... tℓ= Xwℓ NIPALS ℓ= tℓ cT lv1 lv2 Vòng tròn tương quan lv2 lv1 Mặt phẳng thông thường wℓ & cℓ x y y y y y

PLS: Dự đoán Y từ X 1 … k … K NIPALS ……... ............... yi,k xij ti,ℓ t1 … tℓ ... tL ……... Biến ẩn 1 … j … J 1 . i I X 1 … k … K yi,k ............... tℓ= Xwℓ NIPALS ℓ= tℓ cT Vài biến hoá Ở đây! tℓ= Xwℓ & = tℓ cT = XBpls

PLS: Giải thích Y theo X như thế nào? 1 … k … K Y 1 . i I 1 … k … K ℓ = XBpls 1 . i I So sánh số quan sát (Y) với giá trị dự đoán (Ŷ) RESS (REsidual Sum of Squares) RESS = (Y – Ŷ)2

PLS: Dự đoán Y từ X như thế nào? Với số liệu mới thì sự dự đoán này tốt như thế nào? Cross-validation. Here Jackknife 1 … k … K Y 1 . i I 1 … k … K (-1) = X(-1) Bpls 2 . i I 1 … k … K Y(-1) 1 2 . i I Predict y1 from X(-1) Predict y2 from X(-2) …etc … Predict yI from X(-I)

PLS: Dự đoán Y từ X như thế nào? Với số liệu mới thì sự dự đoán này tốt như thế nào? Cross-validation. Here Jackknife 1 … k … K Y 1 . i I 1 … k … K jack = XBpls 1 . i I So sánh số quan sát (Y) với giá trị dự đoán Jackknifed (Yjack) PRESS (Predicted REsidual Sum of Squares) PRESS = (Y – Ŷjack)2

Câu hỏi lớn trong PLS : Có bao nhiêu biến ẩn? So sánh RESS và PRESS, hoặc sử dụng PRESS. Phương pháp nhanh : Min(PRESS) => Số biến ẩn tối ưu

Trở lại ví dụ về Ca cao Mục tiêu: Giải thích và Dự đoán cảm giác (Y) từ tính chất Lý – Hóa (X)

X 20.00 30.00 50.00 2.60 44.89 1.86 20.00 43.30 36.70 2.65 42.77 1.80 20.00 50.00 30.00 2.40 41.64 1.78 26.70 30.00 43.30 3.10 42.37 2.06 26.60 36.70 36.70 3.55 41.04 1.97 33.30 36.70 30.00 4.30 39.14 2.13 40.00 30.00 30.00 4.70 38.31 2.26 20.00 30.00 50.00 0.12 44.25 48.60 20.00 43.30 36.70 0.09 41.98 44.10 20.00 50.00 30.00 0.10 41.18 43.60 26.70 30.00 43.30 0.10 41.13 47.80 26.60 36.70 36.70 0.10 40.39 50.30 33.30 36.70 30.00 0.10 38.85 51.40 40.00 30.00 30.00 0.09 37.91 54.80

Y 1.67 6.06 7.37 5.94 7.80 8.59 6.51 6.24 6.89 8.48 3.22 6.30 5.10 6.34 8.40 9.09 7.14 7.04 5.17 9.76 4.82 7.09 4.11 6.68 8.29 8.61 6.76 7.26 4.62 10.50 4.90 7.57 3.86 6.79 8.58 5.96 5.46 8.77 3.26 6.69 7.03 7.96 2.99 6.92 8.71 6.42 5.59 8.93 2.76 7.05 10.60 10.24 1.57 6.51 9.70 4.55 4.62 11.44 1.51 5.48 11.11 11.31 1.25 7.04 9.72 3.42 4.11 12.43 0.86 3.91 3.06 6.97 5.40 9.84 9.99 10.67 9.11 7.66 5.71 8.24 6.02 8.61 3.75 10.01 9.92 10.86 8.64 7.66 4.86 8.71 7.94 8.40 2.95 9.61 9.92 10.84 8.26 8.32 4.09 9.67 9.17 9.30 2.86 10.68 11.05 10.48 8.20 10.40 2.22 6.43 10.46 10.14 1.90 10.71 10.64 9.60 7.84 11.05 2.01 7.02 12.40 11.30 1.18 10.64 11.09 7.24 7.23 11.78 1.65 5.59 13.46 11.49 1.56 11.31 11.36 7.22 6.86 12.60 1.06 4.34

Tương quan trong tập X

Tương quan trong tập Y

Tương quan giữa X và Y

Các biến ẩn -The t (latent) variables -0.42 -0.19 -0.34 -0.35 -0.25 -0.17 0.22 -0.20 -0.17 -0.14 0.50 -0.22 -0.13 -0.25 -0.26 -0.11 -0.03 -0.27 0.02 0.33 0.23 -0.36 0.10 0.30 0.41 -0.42 -0.11 0.06 -0.32 0.27 -0.37 0.04 -0.15 0.27 0.19 0.14 -0.08 0.27 0.46 0.03 0.01 0.25 -0.29 0.38 0.07 0.27 -0.02 0.33 0.32 0.25 0.05 -0.22 0.51 0.23 -0.16 -0.50

w 0.61 -0.15 -0.20 -0.46 -0.22 0.09 0.77 0.08 -0.39 0.06 -0.57 0.38 0.01 -0.70 -0.00 0.41 -0.62 0.00 -0.15 -0.62 0.20 0.69 -0.10 0.28

c 0.38 0.12 0.07 0.28 0.38 0.11 -0.07 0.25 -0.37 -0.05 -0.30 -0.57 0.15 0.55 -0.18 0.18 0.27 0.41 -0.25 0.36 -0.23 0.46 0.22 0.10 -0.16 0.53 0.09 0.04 0.38 0.03 -0.28 0.30 -0.37 0.03 0.07 -0.50 -0.33 0.09 0.81 -0.16

Bpls: X to Y (in Z-scores) -0.11 -0.05 0.63 -0.21 -0.36 -0.48 -0.31 -0.09 0.45 -0.18 -0.03 -0.09 -0.13 -0.03 -0.07 0.24 0.15 -0.17 0.04 0.41 0.14 0.15 -0.50 0.24 0.43 0.25 0.16 0.26 -0.50 -0.24 0.32 0.29 -0.80 -0.19 0.19 -0.25 -0.40 0.43 -0.78 -0.33 -1.04 -0.97 1.70 -0.56 -1.10 -0.02 0.06 -1.07 1.54 0.68 0.52 0.5 -0.77 0.71 0.83 0.40 0.42 0.49 -0.65 -0.26

B*pls from X to Y (original units) 79.86 43.18 -52.77 29.23 32.63 6.91 4.32 52.51 -50.26 -19.07 -0.06 -0.01 0.15 -0.06 -0.06 -0.16 -0.06 -0.03 0.12 -0.05 -0.01 -0.02 -0.03 -0.01 -0.01 0.08 0.03 -0.05 0.01 0.11 0.07 0.04 -0.12 0.06 0.07 0.08 0.03 0.08 -0.13 -0.07 0.67 0.31 -0.82 -0.22 0.12 -0.33 -0.34 0.52 -0.84 -0.37 -1.85 -0.88 1.47 -0.54 -0.6 -0.02 0.04 -1.10 1.40 0.66 0.08 0.04 -0.06 0.06 0.04 0.04 0.03 0.04 -0.05 -0.02

RESS & PRESS Keep 4 latent variables 2 50.86 8318.84 3 30.28 8292.23 < min PRESS for 4 1 182.39 8505.47 2 50.86 8318.84 3 30.28 8292.23 4 15.69 8286.95 5 13.00 8299.23 6 11.91 8309.38 Keep 4 latent variables

Plot w & t (1 vs 2)

Plot w & c (1 vs 2)

Vòng tròn tương quan

Kết luận Tài liệu tham khảo hữu ích (contain bibliography): Abdi (2007, 2003) see www.utd.edu/~herve