Download presentation
Presentation is loading. Please wait.
1
基因微陣列分類系統 組 員 : 陳昭瑋 李進旗 何榮倫 陳勇達 指導教授 : 張玉盈 教授
2
Outline 目的 系統簡介 演算法說明 DEMO 2
3
目的 生物資訊是最近非常熱門的一個研究方向 生物資訊其最終目標是要完全了解人類所有 基因的秘密。 生物資訊中,微陣列 (microarray) 是用來了解 基因表現的重要工具。 藉由針對微陣列設計分類系統,可以幫助 醫學界更精準地判斷基因相關的疾病。 3
4
系統簡介 利用微陣列設計分類系統 微陣列 (Microarray) 二維陣列 一維 : 基因 一維 : 條件 陣列所記錄的值,即某個基因在某個 condition 下所表現的程度。 4
5
Classification Classification 是從兩組已知分類結果的資料中, 找出能夠用來區分分類的 classifier ,之後便利 用此 classifier 來預測新資料的所屬分類。 本專題使用的 classifier 為 eJEP 。 A 組 B 組 classifier TEST TEST 的分類結果 5
6
演算法 Preprocessing( 將輸入資料轉換成有用資料 ) P-tree(Pattern tree) Construction and merge Using the P-tree to Mine eJEPs (Essential Jumping Emerging Patterns) Compute similarity by score function 將輸入資料分類到應屬的 Class 6
7
Preprocessing Normal Data Cancer Data NameTest1Test2Test3Label Gene14.3070N Gene26.91.392N Gene311.20.465N NameTest1Test2Test3Label Gene15.5-1.4153C Gene22.70.595C Gene33.8-0.7102C 7
8
NameTest1Test2Test3Label Gene14.3070N Gene26.91.392N Gene311.20.465N NameTest1Test2Test3Label Gene15.5-1.4153C Gene22.70.595C Gene33.8-0.7102C Normal Data Cancer Data NameCut Point >=< Test15a=1a=0 Test20b=1b=0 Test3100c=1c=0 Nameabc Gene1101 Gene2010 Gene3001 Nameabc Gene1010 Gene2110 Gene3110 Normal Class(Class D1) Cancer Class(Class D2) 8
9
Nameabc Gene1101 Gene2010 Gene3001 Nameabc Gene1010 Gene2110 Gene3110 Class D1 Class D2 b a b D1 D2 a c b c Preprocessing 9
10
P-tree Construction and merge A pattern tree (P-tree) is an ordered multiway tree structure. The ordered is item ’ s supports-ration- descending order. Nodes will be merged, which ensures the complete set of eJEPs are generated. 10
11
data class 1={{a,c,d,e},{a},{b,e},{b,c,d,e}} data class 2={{a,b},{c,e},{a,b,c,d},{d,e}} the supports-ratio-descending order: e > a > b > c >d Data class 1={{e,a,c,d},{a},{e,b},{e,b,c,d}} Data class 2={{a,b},{e,c},{a,b,c,d},{d,e}} Construct the P-tree P-tree Construction and merge 11
12
P-tree Construction and merge 12
13
P-tree Construction and merge 13
14
P-tree Construction and merge 14
15
P-tree Construction and merge 15
16
P-tree Construction and merge 16
17
P-tree Construction and merge 17
18
eJEP eJEP 定義 : a b 可以互換 根據定義我們就可以找出 eJEP 這裡定義 μ = 1 ba ab 18
19
e32a22b22c22d22 b02c11d11c11d11 d21 c01d01 d01 d11d11 a10b20c21d21 c10d10c10d10d20 d10 d10 eJEP: {e,a} (1:0) {e,b} (2:0) {e,c,d} (2:0) {a,b} (0:2) 19
20
Similarity Score Function where eJEP(Ci) are all the eJEPs in Ci The eJEPs-Classifier determines the class label as the class where s obtains the largest Ci SUPP(X) 代表 X 在 Class 中出現次數 20
21
Testing Data s = {e, a, b, c} score(D1) = supp( {e, a} ) +supp( {e, b} ) =1+2=3 score(D2) = supp( {a,b} )=2 Thus, the class label of Data s is D1 a b e c a b c d e d e a c d a b e b c d e Class1(D1)Class2(D2) e a e b e c d eJEPs in Class1(D1) a b eJEPs in Class2(D2) 21
22
DEMO 前的說明 Demo 用的 microarray 資料是急性白血病 的分類,有: (1) 急性髓細胞白血病 (AML) (2) 急性淋巴細胞白血病 (ALL) 我們要由系統來偵測出所輸入資料的急性 白血病分類, AML 或者 ALL 。 Microarray 資料來源 : http://www.broad.mit.edu/ 22
23
23 視窗介面
28
DEMO 時間
Similar presentations
© 2025 SlidePlayer.com. Inc.
All rights reserved.