Download presentation
Presentation is loading. Please wait.
Published byJérôme Léonard Modified over 6 years ago
1
Hồi quy PLS Hervé Abdi Đại học Texas, Dallas
2
Ví dụ: Cảm giác trong miệng (Mouthfeel) là gì?
Theo Folkenberg D.M., Bredie W.L.P., Martend M., (1999). Cảm giác trong miệng (mouthfeel): mối quan hệ cảm quan –lưu biến trong thức uống ca cao nóng. Journal of Sensory Studies, 14, (Data set courtoisie of Marten, H., Marten M. (2001) Multivariate Analysis of Quality: An introduction. London: Wiley. Tải về từ địa chỉ sau: Bảng số liệu: Cocoa-ii.mat Mục tiêu. Dự đoán Các thuộc tính cảm quan (mouthfeel): Các biến phụ thuộc (tập Y) từ Các tính chất lý/ hoá/ lưu biến: Các biến dự báo (predictors)/ biến độc lập (tập X)
3
Ví dụ: Cảm giác trong miệng (Mouthfeel) là gì?
6 Biến dự báo / độc lập (tập X) Các tính chất lý/ / hoá lưu biến %COCOA %SUGAR %MILK SEDIMENT COLOUR VISCOSITY (%ca cao % đường % sữa cặn màu sắc độ nhớt) 10 Biến phụ thuộc (Tập Y) colour cocoa-odour milk-odour thick-txtr mouthfeel Màu sắc mùi ca cao mùi sữa độ đặc cảm giác trong miệng smooth-txtr creamy-txtr cocoa-taste milk-taste sweet Trơn nhẵn mịn vị ca cao vị sữa ngọt 14 Mẫu (n-:không có chất ổn định, n+: có chất ổn định)
4
X
5
Y
6
Vì sao sử dụng PLS , PCA và MLR
Giới thiệu ngắn
7
J I Bảng số liệu có I hàng và J cột: PCA, CA, Biplots, v.v... Vẻ đẹp của Euclide …
8
I J 1 I hàng, J cột các bảng số liệu có I hàng và 1 cột (với J << I): Hồi quy đa biến (Multiple Regression ) Vẻ đẹp của Euclide
9
I J K I hàng và J cột các bảng số liệu có I hàng và K cột: PLS, CANDIS, v.v… Vẻ đẹp của Euclide
10
Vì sao sử dụng PLS ? Để giải thích sự tương tự nhau giữa các quan sát (ở đây là các mẫu ca cao) Để phát hiện Cấu trúc trong mối quan hệ giữa các biến phụ thuộc và biến độc lập Để có thể biểu diễn các số liệu dưới dạng biểu đồ Để dự đoán giá trị của các quan sát mới
11
Hồi quy PLS là gì ? PLS kết hợp các điểm đặc trưng của Phân tích thành phần chính (Principal Component Analysis - PCA) và Hồi quy đa tuyến tính (Multiple Linear Regression - MLR). Giống PCA: PLS trích lấy các yếu tố (factor) từ X. Giống MLR: PLS dự đoán Y từ X Kết hợp PCA & MLR. PLS trích lấy các yếu tố từ X để dự đoán Y
12
Sử dụng PLS khi nào? Để phân tích hai bảng số liệu có cùng I số quan sát với J biến dự đoán và K biến phụ thuộc 1 … k … K 1 . i I yi,k ……... Các biến phụ thuộc Các biến độc lập 1 … j … J 1 . i I xi,j …... ……... Số quan sát
13
Biến ẩn _ latent variables
Nguyên tắc chung của PLS: Biến dự đoán X Biến ẩn _ latent variables 1 … j … J t1 … tℓ ... tL 1 . i I 1 . i I NIPALS ……... ……... Số quan sát …... xij …... ti,ℓ tℓ= Xwℓ ℓ= tℓ cT Dự đoán … k … K 1 . i I yi,k ……... Các biến phụ thuộc
14
PLS: Mặt phẳng các quan sát
…... xij ti,ℓ t1 … tℓ ... tL ……... Biến ẩn 1 … j … J 1 . i I X … k … K yi,k tℓ= Xwℓ NIPALS ℓ= tℓ cT Quan sát: tℓ lv2 1 2 4 I lv1 3 i
15
PLS: Mặt phẳng các quan sát
…... xij ti,ℓ t1 … tℓ ... tL ……... Biến ẩn 1 … j … J 1 . i I X … k … K yi,k tℓ= Xwℓ NIPALS ℓ= tℓ cT lv1 lv2 Vòng tròn tương quan lv2 lv1 Mặt phẳng thông thường wℓ & cℓ x y y y y y
16
PLS: Dự đoán Y từ X 1 … k … K NIPALS ……... ............... yi,k
xij ti,ℓ t1 … tℓ ... tL ……... Biến ẩn 1 … j … J 1 . i I X … k … K yi,k tℓ= Xwℓ NIPALS ℓ= tℓ cT Vài biến hoá Ở đây! tℓ= Xwℓ & = tℓ cT = XBpls
17
PLS: Giải thích Y theo X như thế nào?
1 … k … K Y 1 . i I 1 … k … K ℓ = XBpls 1 . i I So sánh số quan sát (Y) với giá trị dự đoán (Ŷ) RESS (REsidual Sum of Squares) RESS = (Y – Ŷ)2
18
PLS: Dự đoán Y từ X như thế nào?
Với số liệu mới thì sự dự đoán này tốt như thế nào? Cross-validation. Here Jackknife 1 … k … K Y 1 . i I 1 … k … K (-1) = X(-1) Bpls 2 . i I 1 … k … K Y(-1) 1 2 . i I Predict y1 from X(-1) Predict y2 from X(-2) …etc … Predict yI from X(-I)
19
PLS: Dự đoán Y từ X như thế nào?
Với số liệu mới thì sự dự đoán này tốt như thế nào? Cross-validation. Here Jackknife 1 … k … K Y 1 . i I 1 … k … K jack = XBpls 1 . i I So sánh số quan sát (Y) với giá trị dự đoán Jackknifed (Yjack) PRESS (Predicted REsidual Sum of Squares) PRESS = (Y – Ŷjack)2
20
Câu hỏi lớn trong PLS : Có bao nhiêu biến ẩn? So sánh RESS và PRESS, hoặc sử dụng PRESS. Phương pháp nhanh : Min(PRESS) => Số biến ẩn tối ưu
21
Trở lại ví dụ về Ca cao Mục tiêu: Giải thích và Dự đoán cảm giác (Y) từ tính chất Lý – Hóa (X)
22
X
23
Y
24
Tương quan trong tập X
25
Tương quan trong tập Y
26
Tương quan giữa X và Y
27
Các biến ẩn -The t (latent) variables
28
w
29
c
30
Bpls: X to Y (in Z-scores)
31
B*pls from X to Y (original units)
32
RESS & PRESS Keep 4 latent variables 2 50.86 8318.84 3 30.28 8292.23
< min PRESS for 4 Keep 4 latent variables
33
Plot w & t (1 vs 2)
34
Plot w & c (1 vs 2)
35
Vòng tròn tương quan
36
Kết luận Tài liệu tham khảo hữu ích (contain bibliography):
Abdi (2007, 2003) see
Similar presentations
© 2025 SlidePlayer.com. Inc.
All rights reserved.