序列分析工具:MDDLogo 961506 謝勝任 961524 林宗慶 指導教授:李宗夷 教授
動機 現今生物序列不斷被解碼,我們可以在各個生物資料庫中抓到序列資訊,但生物序列資料量龐大,我們應先將其做簡易分群,方便後續觀查。
目的 使用一種統計方式來將序列分群,並以網頁方式呈現,使用者亦可下載source code使用。
使用工具 1.Weblogo 2.CHI-square
使用工具(1) Weblogo :一個將序列圖像化的網站, 用其呈現分類後的 樹狀圖,方便使用 者觀查分類後序列 群的特性。
使用工具(2) CHI-square公式: fi=觀察次數 ei=期望次數
使用工具(2)
分析流程 Step1:選擇分類特性,將各特性做成集合。 Step2:輸入序列長度、Central Position、Cluster Size。 Step3:輸入計算特徵分數方法(1.出現次數2.CHI-square)。 Step4:讀入FASTA格式的序列資料。 Step5:將序列依特性做CHI-square 計算,並得到序列各個位置的分數。 Step6:在最高分的位置上,依選擇的特徵計算方式找出特徵集合。 Step7:將找出的位置和特徵集合當作分類依據來分類。 Step8:將分類後的序列儲存。 Step9:重覆step4~Step8 直到序列數量小於Cluster Size。 Step10:程式結束。
分析流程圖
研究結果 分群內容 序列分類樹狀圖
網址 http://140.138.150.149/~s961524/MDD/create.php